全部版块 我的主页
论坛 数据科学与人工智能 人工智能 语音识别
22 0
2026-01-29

BSTC 全称 Baidu Speech Translation Corpus,是一个大型自动同声传译数据集, 用于自动同声传译系统的构建。

该语料库分为训练集、开发集和测试集 3 个子集,每个子集包括:

-声音信号文件,命名为 baidu_XX.wav

-描述文件,包括每个声音信号的描述信息,每个语句由 JSON 格式编码

-补充文档,包括演讲和报告的详细介绍

附件列表

CCMT_2019_BSTC.rar

大小:46.05 KB

只需: 201 个论坛币  马上下载

磁力链接4.51G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群