百度发布并上线原生全模态大模型文心5.0正式版
AI导读:
百度发布并上线原生全模态大模型文心5.0正式版,该模型参数达2.4万亿,具备全模态理解与生成能力。应用模型的价值在于实际应用场景中,百度数字人生成技术已广泛应用于直播带货等场景。文心5.0将AI应用带入真实行业与复杂场景,提供高效解决方案。
拒绝“拼接” 告别转译原生全模态理解输出
据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。
应用模型的价值不在模型里而在应用里
基于声音Token的端到端合成大模型由满帧语音token的离散表示来定义token,以MoE大语言模型来建模韵律,基于flow的后处理来描述声音的谱分布,基于Unet的自重构特征的vocoder来描述刻画声音。
百度的数字人生成技术,此前已广泛应用于直播带货等场景,2025年罗永浩数字人直播就曾打破行业纪录。
基于强大的原生全模态统一建模技术,与2.4万亿参数的海量算力,“文心5.0”已具备让AI应用走进真实行业与复杂场景,提供更高效解决方案的能力。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

