AI导读:

9月29日,DeepSeek-V3.2-Exp发布并开源,引入稀疏Attention架构。海光信息宣布其DCU实现无缝适配,大模型算力零等待部署,验证了DCU的高通用性及技术优势。

  9月29日,Deepseek-V3.2-Exp正式发布并开源,该模型创新性地引入了稀疏Attention架构,大幅提升了计算效率。同日,海光信息宣布其DCU(深度计算单元)已实现与DeepSeek-V3.2-Exp的无缝适配,并通过深度调优,使得大模型算力能够“零等待”部署。海光信息强调,基于GPGPU架构的强大生态优势,以及编程开发软件栈DTK的独特特性,DeepSeek-V3.2-Exp在海光DCU上展现出了优异的性能表现。这一成果不仅验证了海光DCU的高通用性、高生态兼容度,更彰显了其自主可控的技术优势,为人工智能算力领域的发展注入了新的活力。

(文章来源:科创板日报)