DeepSeek启动开源周,FlashMLA引领技术创新
AI导读:
2月24日,DeepSeek启动“开源周”,首个开源代码库为FlashMLA,专为处理可变长度序列设计。同时,A股市场全天震荡调整,创业板指领跌,港股恒生科技指数也下滑约0.8%。
【导读】市场震荡,Deepseek启动开源周,发布FlashMLA。
中国基金报记者泰勒
大家好,今天A股、港股均遭遇震荡调整,让我们一同看看市场发生了什么。
小幅震荡调整
2月24日,A股市场全天处于震荡调整状态,创业板指领跌。截至收盘,沪指下跌0.18%,深成指下跌0.08%,创业板指下跌0.67%。

市场上共有2778只个股上涨,91只个股涨停,2468只个股下跌。

农业股集体走强,智慧农业、星光农机、东方集团涨停。消息面上,2025年中央一号文件2月23日发布,文件首提“农业新质生产力”。
基建股表现活跃,北方国际、中工国际、北新路桥等个股涨停。


DeepSeek概念股震荡调整,航锦科技、浙文互联跌停,每日互动、青云科技跌幅超过10%。

港股方面,恒生科技指数下滑约0.8%。

近期,白宫发布“美国第一”投资政策备忘录,调整美投资政策,进一步限制中美双向投资。商务部对此表示担忧,并呼吁美方提供公平、透明、稳定、可预期的营商环境。
DeepSeek启动开源周
首个开源代码库为FlashMLA
2月24日,DeepSeek正式启动“开源周”,首个开源代码库为FlashMLA,这是一个针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。

发布重点包括:FlashMLA是DeepSeek针对Hopper GPU优化的MLA解码内核,专为处理可变长度序列设计,已在生产环境中应用。
此项目是DeepSeek V2–V3系列大模型的重要技术创新,旨在降低大语言模型的推理成本,提升响应速度和吞吐量。
FlashMLA在英伟达H800 SXM5 GPU上测试时,达到3000GB/s的内存带宽和580TFLOPS的计算上限。
目前版本支持BF16精度,采用分页KV缓存,确保大模型推理任务高效。
FlashMLA的设计灵感来源于FlashAttention 2&3及英伟达的CUTLASS项目,针对高效注意力计算进行了优化。
FlashMLA适用于长序列文本应用,如聊天机器人、文档分析及实时翻译系统。
未来,FlashMLA有望集成到vLLM、Hugging Face Transformers等开源生态系统中,提升大语言模型的推理性能。
发布的代码包含内联PTX代码,使开发者能更精细地控制GPU执行流程,进一步提升性能。
DeepSeek计划在这一周举办“开源周”活动,并开源五个代码库。
DeepSeek表示,希望分享的每一行代码都能加速行业发展,强调车库创业精神与社区共筑的创新力量。
(文章来源:中国基金报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。