AI导读:

字节发布豆包大模型2.0系列,针对大规模生产环境进行优化,加强多模态理解能力,提升视觉推理和空间感知表现,并增强对动态场景的理解能力。

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。在大模型执行长链路复杂任务中,豆包2.0加强了长尾领域知识覆盖,在教育、娱乐、办公等众多场景中,大模型需要理解图表、复杂文档、视频等内容。对此,豆包2.0全面升级多模态理解能力,视觉推理、空间感知、长上下文理解等权威测试均取得业界最佳表现。面对动态场景,豆包2.0增强了对时间序列与运动感知的理解能力,还可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。Agent能力是大模型具备行动力的关键。测试成绩显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平。目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线。