智源研究院成果登上Nature

股市热点 2026-01-29 13:10:29 来源：北京商报作者：网络

AI导读：

智源研究院主导的多模态大模型研究成果在顶级学术期刊Nature上发表，该成果实现了多模态数据的联合训练，并在多个任务上展现出与专用模型相媲美的性能。

北京商报讯1月28日，智源研究院主导的多模态大模型研究成果“通过预测下一个词元进行多模态学习的多模态大模型”正式上线国际顶级学术期刊Nature，预计2月12日刊发纸质版。研究显示，这是我国科研机构主导的大模型成果首次登陆Nature正刊。该研究推出的Emu3模型，核心突破在于仅采用“预测下一个词元”的自回归路线，将文本、图像、视频统一到同一表示空间，通过单一Transformer架构实现多模态数据的联合训练。实验显示，其在文生图、视觉语言理解、视频生成等任务上的性能，可与各类成熟的任务专用模型相媲美。Nature编辑点评指出，该成果证明了自回归路线在多模态领域的通用性，对构建可扩展、统一的多模态智能系统具有重要意义。

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。