全部版块 我的主页
论坛 数据科学与人工智能 人工智能 语音识别
104 0
2025-12-29

ShiftySpeech 是由约翰霍普金斯大学于 2025 年发布的一个大规模合成语音检测基准,相关论文成果为「ShiftySpeech: A Large-Scale Synthetic Speech Dataset with Distribution Shifts」,旨在研究语音合成检测模型在真实世界中面对「分布漂移」(包括语言、说话人、生成模型、录音条件变化)时的泛化能力。

该数据集包含超过 3,000 小时的合成语音,覆盖 7 个源域,包括阅读风格、播客、 YouTube 等带有背景噪声或非标准录音条件的场景,以及语言差异、说话人年龄、口音、性别等变化。数据涵盖 3 种语言(英文、中文、日文),使用 6 种 TTS(文本转语音)系统和 12 种 vocoder(声码器/波形生成器)生成语音,以构造不同程度的系统分布漂移。

附件列表

ShiftySpeech.rar

大小:3.8 MB

只需: 501 个论坛币  马上下载

磁力链接,389.35G

本附件包括:

  • ShiftySpeech.torrent

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群