全部版块 我的主页
论坛 数据科学与人工智能 人工智能 语音识别
102 0
2025-12-29

DiaMoE-TTS 是由清华大学联合巨人网络于 2025 年发布的一个面向多方言文本到语音合成(TTS)任务的语音数据集,相关论文成果为「DiaMoE-TTS: A Unified IPA-Based Dialect TTS Framework with Mixture-of-Experts and Parameter-Efficient Zero-Shot Adaptation」,旨在构建统一的方言语音表音体系,支持多方言之间的可迁移语音建模与零样本方言合成研究。

该数据集基于多个开源方言语音资源构建,采用 IPA(国际音标)作为统一表音体系,用于对不同方言语料进行一致的音系标注。数据集的语音来源包括 Common Voice 粤语数据集、 Emilia 普通话语料、 KeSpeech 语料库中的方言语音,以及开源的闽南语语音数据集。在数据处理过程中,所有语音样本均经过统一的音素级表音转换,构建为可跨方言对齐的 IPA 前端标注序列。

附件列表

DiaMoE-TTS.rar

大小:1.2 KB

只需: 101 个论坛币  马上下载

磁力链接,55.66M

本附件包括:

  • DiaMoE-TTS.torrent

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群