全部版块 我的主页
论坛 数据科学与人工智能 人工智能 语音识别
21 0
2026-01-29

VoxCeleb2 是一个源自开源媒体的大规模说话人 (Speaker) 识别数据集,由超过 6 千名说话者的一百万条语料组成。由于该数据集是在自然场景中收集的,因此语音片段中不乏笑声、交谈声、频道效果、音乐等干扰。

VoxCeleb2 中的语料是多语言的,说话者来自 145 个国家,涵盖了广泛的口音、年龄、种族和语种。同时该数据集包括音频和视频,也适用于解决可视语音合成 (visual speech synthesis) 、语音分离 (speech separation) 、 face-voice 跨模态转换、视频人脸识别等问题。

附件列表

VoxCeleb2.rar

大小:17.52 KB

只需: 201 个论坛币  马上下载

磁力链接,1.65G

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群