AI导读:

中信建投研报称,DeepSeek系列模型在保持优异性能指标的同时,大幅降低训练和推理成本,将显著推动端侧AI产业发展。DeepSeek-V3和DeepSeek-R1模型的成本优势尤为突出,国内物联网模组厂商积极布局端侧AI领域。

每经AI快讯,中信建投最新研报深度解析DeepSeek系列模型的最新进展。报告显示,DeepSeek在维持其卓越模型性能的同时,实现了训练与推理成本的显著下降。具体而言,DeepSeek-V3版本借助2048块H800GPU,成功完成了6710亿参数规模的训练任务,其训练成本仅为557.6万美元,远低于同类水平。此外,DeepSeek-R1模型的每百万输出tokens成本更是低至16元,再次彰显了其在成本控制上的显著优势。

值得注意的是,DeepSeek模型不仅经济高效,还通过生成高质量数据样本,实现了小参数模型的蒸馏,进一步提升了模型的整体性能。这一创新点无疑为AI模型的应用开辟了新路径。

研报进一步指出,DeepSeek系列模型所展现出的高性能、轻量化、低成本特性,将对端侧AI产业产生深远影响。端侧硬件设备作为将大模型能力实物化、落地化的关键环节,其重要性不言而喻。近期,OpenAI首席执行官Sam Altman在接受采访时透露,OpenAI正致力于开发能够替代传统手机的生成式AI专用终端,这一消息无疑为端侧AI的发展注入了新的活力。

在国内市场,物联网模组厂商凭借在端侧AI领域的先发优势,正积极布局相关产业,力求在即将到来的AI浪潮中占据有利地位。DeepSeek系列模型的广泛应用,将有望加速这一进程,推动端侧AI产业的快速发展。

(文章来源:每日经济新闻)