ShiftySpeech 语音分布评测数据集

104

收藏 2025-12-29

ShiftySpeech 是由约翰霍普金斯大学于 2025 年发布的一个大规模合成语音检测基准，相关论文成果为「ShiftySpeech: A Large-Scale Synthetic Speech Dataset with Distribution Shifts」，旨在研究语音合成检测模型在真实世界中面对「分布漂移」（包括语言、说话人、生成模型、录音条件变化）时的泛化能力。

该数据集包含超过 3,000 小时的合成语音，覆盖 7 个源域，包括阅读风格、播客、 YouTube 等带有背景噪声或非标准录音条件的场景，以及语言差异、说话人年龄、口音、性别等变化。数据涵盖 3 种语言（英文、中文、日文），使用 6 种 TTS（文本转语音）系统和 12 种 vocoder（声码器/波形生成器）生成语音，以构造不同程度的系统分布漂移。

附件列表

ShiftySpeech.rar

大小:3.8 MB

只需: 501 个论坛币马上下载

磁力链接，389.35G

本附件包括：

ShiftySpeech.torrent

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群