AI导读:

DeepSeek发布关于NSA的纯技术论文报告,通过优化硬件设计,显著提升了推理速度,降低了预训练成本。民生证券指出,DeepSeek等模型推动了AI算力需求从训练驱动向推理驱动的转变,为算力行业带来重要发展机遇。青云科技和润建股份等相关公司积极参与算力领域。

据媒体报道,2月18日,Deepseek在社交平台X上发布了一篇关于NSA的纯技术论文报告。NSA是一种创新的稀疏注意力机制,与硬件一致且本机可训练,专为超快速的长上下文训练和推理设计。通过针对现代硬件的优化,NSA显著提升了推理速度,降低了预训练成本,同时保持了卓越的性能。在多项基准测试、长上下文任务和基于指令的推理上,NSA的表现甚至超越了完全注意力模型。

民生证券指出,DeepSeek等前沿模型的发展加速了AI应用、AIAgent等的落地进程,使用量的大幅提升推动了AI算力需求从训练驱动向推理驱动的转变。Deepseek只是算力领域广阔星空中一颗璀璨的“小星星”。微信等头部APP接入DeepSeek后,国民级应用模型的广泛使用进一步放大了算力需求,推动了推理等算力需求的爆发式增长,为算力行业带来了前所未有的发展机遇。

据财联社主题库统计,相关上市公司中:

青云科技正式推出了AI算力云服务——基石智算CoresHub,并上线了DeepSeek-R1系列模型。

润建股份与希姆计算携手,共同打造了完全自主可控的“算力-算法-应用”全国产闭环生态。公司采用自主研发的AI芯片、编译器、工具链,与DeepSeek深度整合,推出了业内领先的DeepSeek加持全国产算力政务智能体一体机。

(文章来源:财联社)