谷歌推出内存压缩算法TurboQuant 搅动存储板块
AI导读:
谷歌推出内存压缩算法TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用。该技术的推出搅动了存储板块,引发市场关注。
周三美股开盘后,在大盘情绪尚可的背景下,存储板块却反向走弱。截至发稿,美光科技跌3.57%、闪迪跌4.12%,西部数据和希捷科技也一同下跌。对于今日的市场异动,有多处信源均将矛头指向了谷歌。AI巨头早些时候推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该技术可实现约6倍的键值缓存内存压缩效果。此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。对于最新变化,富国银行TMT分析师Andrew Rocha解读称:“随着上下文窗口不断扩大,KV缓存中的数据存储规模呈爆炸式增长,从而推高对内存容量的需求。而TurboQuant正是在直接压缩这一成本曲线。如果该技术能够得到广泛采用,这对内存成本曲线而言将是利好。”Rocha同时表示,这项技术可能影响未来对内存容量规格的需求判断。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

