AI导读:

谷歌推出内存压缩算法TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用。该技术的推出搅动了存储板块,引发市场关注。

  周三美股开盘后,在大盘情绪尚可的背景下,存储板块却反向走弱。截至发稿,美光科技跌3.57%、闪迪跌4.12%,西部数据和希捷科技也一同下跌。对于今日的市场异动,有多处信源均将矛头指向了谷歌。AI巨头早些时候推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant。根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该技术可实现约6倍的键值缓存内存压缩效果。此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。对于最新变化,富国银行TMT分析师Andrew Rocha解读称:“随着上下文窗口不断扩大,KV缓存中的数据存储规模呈爆炸式增长,从而推高对内存容量的需求。而TurboQuant正是在直接压缩这一成本曲线。如果该技术能够得到广泛采用,这对内存成本曲线而言将是利好。”Rocha同时表示,这项技术可能影响未来对内存容量规格的需求判断。