AI导读:

2月24日,DeepSeek启动“开源周”,首个开源代码库为FlashMLA,专为处理可变长度序列设计。同时,A股市场全天震荡调整,创业板指领跌,港股恒生科技指数也下滑约0.8%。

【导读】市场震荡,Deepseek启动开源周,发布FlashMLA。

中国基金报记者泰勒

大家好,今天A股、港股均遭遇震荡调整,让我们一同看看市场发生了什么。

小幅震荡调整

2月24日,A股市场全天处于震荡调整状态,创业板指领跌。截至收盘,沪指下跌0.18%,深成指下跌0.08%,创业板指下跌0.67%。

市场上共有2778只个股上涨,91只个股涨停,2468只个股下跌。

农业股集体走强,智慧农业、星光农机、东方集团涨停。消息面上,2025年中央一号文件2月23日发布,文件首提“农业新质生产力”。

基建股表现活跃,北方国际、中工国际、北新路桥等个股涨停。

DeepSeek概念股震荡调整,航锦科技、浙文互联跌停,每日互动、青云科技跌幅超过10%。

港股方面,恒生科技指数下滑约0.8%。

近期,白宫发布“美国第一”投资政策备忘录,调整美投资政策,进一步限制中美双向投资。商务部对此表示担忧,并呼吁美方提供公平、透明、稳定、可预期的营商环境。

DeepSeek启动开源周

首个开源代码库为FlashMLA

2月24日,DeepSeek正式启动“开源周”,首个开源代码库为FlashMLA,这是一个针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。

发布重点包括:FlashMLA是DeepSeek针对Hopper GPU优化的MLA解码内核,专为处理可变长度序列设计,已在生产环境中应用。

此项目是DeepSeek V2–V3系列大模型的重要技术创新,旨在降低大语言模型的推理成本,提升响应速度和吞吐量。

FlashMLA在英伟达H800 SXM5 GPU上测试时,达到3000GB/s的内存带宽和580TFLOPS的计算上限。

目前版本支持BF16精度,采用分页KV缓存,确保大模型推理任务高效。

FlashMLA的设计灵感来源于FlashAttention 2&3及英伟达的CUTLASS项目,针对高效注意力计算进行了优化。

FlashMLA适用于长序列文本应用,如聊天机器人、文档分析及实时翻译系统。

未来,FlashMLA有望集成到vLLM、Hugging Face Transformers等开源生态系统中,提升大语言模型的推理性能。

发布的代码包含内联PTX代码,使开发者能更精细地控制GPU执行流程,进一步提升性能。

DeepSeek计划在这一周举办“开源周”活动,并开源五个代码库。

DeepSeek表示,希望分享的每一行代码都能加速行业发展,强调车库创业精神与社区共筑的创新力量。

(文章来源:中国基金报)