DeepSeek开源FlashMLA,寒武纪股价创新高
AI导读:
DeepSeek开源周开启,首个项目FlashMLA两小时获超2600个star。FlashMLA针对英伟达Hopper架构GPU优化,显著提升大模型推理效率。寒武纪股价受DeepSeek开源影响大涨,创历史新高。
今天(2月24日),Deepseek开源周正式拉开帷幕。
首个开源项目便是重量级技术——DeepSeek-V3核心技术MLA的升级版FlashMLA。该项目上线短短两小时内,便迅速收获了超过2600个star!

图片来源:Github
据悉,FlashMLA灵感源自FlashAttention 2&3及cutlass项目,专为英伟达Hopper架构GPU优化的高效MLA解码内核,尤其在变长序列场景进行了深度优化,极大提升了大模型推理效率。
FlashMLA速度惊人,在H800 GPU上内存速度上限高达3000 GB/s,计算上限更是达到580 TFLOPS。此外,部署简便,只需满足FlashMLA运行环境要求(Hopper GPU、CUDA 12.3及以上、PyTorch 2.0及以上),即可一键安装。
总之,FlashMLA对英伟达GPU进行了深度优化。

图片来源:X
MLA作为DeepSeek大模型的关键技术创新,备受瞩目,Huggingface技术总监曾多次赞誉。此次DeepSeek慷慨开源核心技术升级版,彰显其诚意。
DeepSeek表示,当前在线服务模块已测试完备,可投入生产。该领域拒绝象牙塔式高傲,推崇车库创业精神与社区共创的创新力量。
众多网友评价:DeepSeek才是真正的OpenAI。

图片来源:X
此前,DeepSeek新模型和技术发布均对美股及A股市场产生巨大影响。
寒武纪(688256.SH)股价在上个交易日20cm涨停,创历史新高;今日盘中最高达795.8元,收盘大涨5.14%,再创新高。
寒武纪股价大涨与DeepSeek开源有何关联?
据DeepSeek分析:
FlashMLA作为混合专家模型(MoE)架构的改进版,需高性能AI芯片支持。寒武纪云端推理芯片(如MLU370)及训练芯片(如MLU590)将直接受益于大模型技术迭代带来的算力需求增长。作为国产龙头,寒武纪或因FlashMLA等技术突破而备受瞩目。
总之,FlashMLA开源或借技术协同效应及市场情绪催化间接推动寒武纪股价,但直接因果关系难以量化。
(文章来源:每日经济新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。