DeepSeek发布NSA技术报告,算力行业迎来新机遇
AI导读:
DeepSeek发布关于NSA的纯技术论文报告,通过优化硬件设计,显著提升了推理速度,降低了预训练成本。民生证券指出,DeepSeek等模型推动了AI算力需求从训练驱动向推理驱动的转变,为算力行业带来重要发展机遇。青云科技和润建股份等相关公司积极参与算力领域。
据媒体报道,2月18日,Deepseek在社交平台X上发布了一篇关于NSA的纯技术论文报告。NSA是一种创新的稀疏注意力机制,与硬件一致且本机可训练,专为超快速的长上下文训练和推理设计。通过针对现代硬件的优化,NSA显著提升了推理速度,降低了预训练成本,同时保持了卓越的性能。在多项基准测试、长上下文任务和基于指令的推理上,NSA的表现甚至超越了完全注意力模型。
民生证券指出,DeepSeek等前沿模型的发展加速了AI应用、AIAgent等的落地进程,使用量的大幅提升推动了AI算力需求从训练驱动向推理驱动的转变。Deepseek只是算力领域广阔星空中一颗璀璨的“小星星”。微信等头部APP接入DeepSeek后,国民级应用模型的广泛使用进一步放大了算力需求,推动了推理等算力需求的爆发式增长,为算力行业带来了前所未有的发展机遇。
据财联社主题库统计,相关上市公司中:
青云科技正式推出了AI算力云服务——基石智算CoresHub,并上线了DeepSeek-R1系列模型。
润建股份与希姆计算携手,共同打造了完全自主可控的“算力-算法-应用”全国产闭环生态。公司采用自主研发的AI芯片、编译器、工具链,与DeepSeek深度整合,推出了业内领先的DeepSeek加持全国产算力政务智能体一体机。
(文章来源:财联社)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。