全部版块 我的主页
论坛 数据科学与人工智能 人工智能 自然语言处理
65 0
2025-10-30

StepEval Audio Paralinguistic 是由 StepFun AI 团队于 2025 年发布的一个音频副语言理解评估数据集,相关论文为「Step-Audio 2 Technical Report」,旨在评估 AI 模型在语音中理解副语言信息(如性别、年龄、语调、情绪等)方面的能力。

该数据集由 550 个语音样本组成,均匀分布在 11 个任务维度 上:包括性别(gender)、年龄(age)、音色(timbre)、情绪(emotion)、音高(pitch)、节奏(rhythm)、语速(speed)、说话风格(style)、人声活动(vocal)、场景(scenario)与事件类型(event)。其中前 8 项任务基于 400 条公开播客中的中文语音片段采样,后三项任务则分别从 AudioSet(事件)、 CochlScene(环境场景)、 VocalSound(人声类声效)中各采样 50 条音频。所有样本时长均控制在 30 秒以内,统一重采样为 24 kHz,并由专业团队进行自然语言标注。

附件列表

StepEval-Audio-Paralinguistic.rar

大小:5.15 KB

只需: 101 个论坛币  马上下载

两个资源一样随便下载一个即可

本附件包括:

  • StepEval-Audio-Paralinguistic.torrent

StepEval-Audio-Paralinguistic.rar

大小:5.15 KB

只需: 101 个论坛币  马上下载

磁力链接,441M

本附件包括:

  • StepEval-Audio-Paralinguistic.torrent

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群