AI导读:

DeepSeek发布关于NSA的纯技术论文报告,加快推理速度并降低预训练成本。民生证券指出,AI算力需求正从训练推动转向推理推动,Deepseek或成算力领域新星。青云科技和润建股份等相关上市公司已引入DeepSeek技术。

据媒体报道,2月18日,Deepseek在社交平台X上发布了一篇关于NSA的纯技术论文报告。NSA作为一种创新的稀疏注意力机制,与硬件高度一致且本机可训练,专为超快速的长上下文训练和推理设计。通过针对现代硬件的优化,NSA不仅加快了推理速度,还降低了预训练成本,同时保持了卓越的性能。在各类基准测试、长上下文任务及基于指令的推理场景中,NSA的表现与完全注意力模型旗鼓相当,甚至更胜一筹。

民生证券指出,DeepSeek等前沿模型的发展正加速AI应用及AIAgent的落地进程,使用量激增进一步推动了AI算力需求的转变,从训练主导迈向推理主导的新阶段。Deepseek或将成为算力领域浩瀚星空中一颗璀璨的新星。微信等国民级应用的加入,进一步放大了模型的使用规模,算力需求随之飙升,特别是推理算力需求迎来爆发式增长,为算力行业带来了前所未有的发展机遇。

据财联社主题库数据显示,相关上市公司中:

青云科技已正式上线其AI算力云服务——基石智算CoresHub,并引入了DeepSeek-R1系列模型。

润建股份携手希姆计算,共同打造了完全自主可控的“算力-算法-应用”全国产闭环生态体系,采用自主研发的AI芯片、编译器、工具链,与DeepSeek实现深度耦合,推出了业内领先的DeepSeek加持全国产算力政务智能体一体机。

(文章来源:财联社)