AI导读:

DeepSeek开源周开启,首个项目FlashMLA两小时获超2600个star。FlashMLA针对英伟达Hopper架构GPU优化,显著提升大模型推理效率。寒武纪股价受DeepSeek开源影响大涨,创历史新高。

今天(2月24日),Deepseek开源周正式拉开帷幕。

首个开源项目便是重量级技术——DeepSeek-V3核心技术MLA的升级版FlashMLA。该项目上线短短两小时内,便迅速收获了超过2600个star!

图片来源:Github

据悉,FlashMLA灵感源自FlashAttention 2&3及cutlass项目,专为英伟达Hopper架构GPU优化的高效MLA解码内核,尤其在变长序列场景进行了深度优化,极大提升了大模型推理效率。

FlashMLA速度惊人,在H800 GPU上内存速度上限高达3000 GB/s,计算上限更是达到580 TFLOPS。此外,部署简便,只需满足FlashMLA运行环境要求(Hopper GPU、CUDA 12.3及以上、PyTorch 2.0及以上),即可一键安装。

总之,FlashMLA对英伟达GPU进行了深度优化。

图片来源:X

MLA作为DeepSeek大模型的关键技术创新,备受瞩目,Huggingface技术总监曾多次赞誉。此次DeepSeek慷慨开源核心技术升级版,彰显其诚意。

DeepSeek表示,当前在线服务模块已测试完备,可投入生产。该领域拒绝象牙塔式高傲,推崇车库创业精神与社区共创的创新力量。

众多网友评价:DeepSeek才是真正的OpenAI

图片来源:X

此前,DeepSeek新模型和技术发布均对美股及A股市场产生巨大影响。

寒武纪(688256.SH)股价在上个交易日20cm涨停,创历史新高;今日盘中最高达795.8元,收盘大涨5.14%,再创新高。

寒武纪股价大涨与DeepSeek开源有何关联?

据DeepSeek分析:

FlashMLA作为混合专家模型(MoE)架构的改进版,需高性能AI芯片支持。寒武纪云端推理芯片(如MLU370)及训练芯片(如MLU590)将直接受益于大模型技术迭代带来的算力需求增长。作为国产龙头,寒武纪或因FlashMLA等技术突破而备受瞩目。

总之,FlashMLA开源或借技术协同效应及市场情绪催化间接推动寒武纪股价,但直接因果关系难以量化。

(文章来源:每日经济新闻)