清华大学开源大模型推理引擎“赤兔Chitu”,助力AI芯片应用
AI导读:
清华大学高性能计算研究所与清华系科创企业清程极智联合开源大模型推理引擎“赤兔Chitu”,该引擎首次实现非英伟达Hopper架构GPU及国产芯片上原生运行FP8精度模型,特别针对市场迫切需求,将DeepSeek-R1 FP8模型无损高效部署在存量英伟达GPU上。
清华大学高性能计算研究所翟季冬教授团队携手清华系科创企业清程极智,共同开源了大模型推理引擎“赤兔Chitu”。这一创新引擎首次实现了在非英伟达Hopper架构GPU及各类国产芯片上的原生运行FP8精度模型,标志着我国在AI芯片应用领域的重大突破。本次开源的版本特别针对当前市场最迫切的需求,即将Deepseek-R1 FP8精度模型无损且高效地部署在存量英伟达GPU上,为AI模型的高效运行提供了有力支持。团队还透露,针对多款国产芯片特别优化的版本也将陆续推出,进一步推动国产芯片在AI领域的应用与发展。
(文章来源:科创板日报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。