DeepSeek发布NSA技术报告,AI算力需求迎来新拐点
AI导读:
DeepSeek发布关于NSA的纯技术论文报告,加快推理速度并降低预训练成本。民生证券指出,AI算力需求正从训练推动转向推理推动,Deepseek或成算力领域新星。青云科技和润建股份等相关上市公司已引入DeepSeek技术。
据媒体报道,2月18日,Deepseek在社交平台X上发布了一篇关于NSA的纯技术论文报告。NSA作为一种创新的稀疏注意力机制,与硬件高度一致且本机可训练,专为超快速的长上下文训练和推理设计。通过针对现代硬件的优化,NSA不仅加快了推理速度,还降低了预训练成本,同时保持了卓越的性能。在各类基准测试、长上下文任务及基于指令的推理场景中,NSA的表现与完全注意力模型旗鼓相当,甚至更胜一筹。
民生证券指出,DeepSeek等前沿模型的发展正加速AI应用及AIAgent的落地进程,使用量激增进一步推动了AI算力需求的转变,从训练主导迈向推理主导的新阶段。Deepseek或将成为算力领域浩瀚星空中一颗璀璨的新星。微信等国民级应用的加入,进一步放大了模型的使用规模,算力需求随之飙升,特别是推理算力需求迎来爆发式增长,为算力行业带来了前所未有的发展机遇。
据财联社主题库数据显示,相关上市公司中:
青云科技已正式上线其AI算力云服务——基石智算CoresHub,并引入了DeepSeek-R1系列模型。
润建股份携手希姆计算,共同打造了完全自主可控的“算力-算法-应用”全国产闭环生态体系,采用自主研发的AI芯片、编译器、工具链,与DeepSeek实现深度耦合,推出了业内领先的DeepSeek加持全国产算力政务智能体一体机。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。