MCD 多模态代码生成数据集

111

收藏 2025-11-27

Multimodal Coding Dataset（MCD）是由微软研究院、北京大学和南方科技大学提出并于 2025 年发布的一个大规模数据集，相关论文成果为「VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models」。

该数据集包含总计约 59.8 万条/对高质量样本，以指令跟随格式组织，覆盖多种输入模态（文本、图像、代码）与输出模态（代码、答案、解释），适用于多模态代码理解与生成任务。

附件列表

MCD.rar

大小:181.02 KB

只需: 201 个论坛币马上下载

磁力链接，18G

本附件包括：

MCD.torrent

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群