全部版块 我的主页
论坛 数据科学与人工智能 人工智能 自然语言处理
52 0
2025-10-30

WenetSpeech Yue 是由西北工业大学联合中国电信人工智能研究院、北京希尔贝壳科技有限公司等机构于 2025 年发布的一个用于粤语语音识别(ASR)与文本到语音合成(TTS)的 多维注释大型语音语料库,相关论文成果为「WenetSpeech-Yue: A Large-scale Cantonese Speech Corpus with Multi-dimensional Annotation」,旨在填补粤语领域资源匮乏的空白,推动高质量粤语模型的训练与评估。

该数据集包含约 21,800 小时粤语录音,覆盖 10 个语域,包括:讲故事、娱乐、戏剧、文化、 Vlog 、评论、教育、播客、新闻和其他,适用于粤语自动语音识别(ASR)和文本到语音合成(TTS)模型的训练与评测以及处理真实语言场景中的多样语域和说话风格,同时支持跨域泛化能力的验证与评估。

附件列表

WenetSpeech-Yue.rar

大小:15.45 KB

只需: 101 个论坛币  马上下载

磁力链接,1.46G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群