AI导读:

3月26日,谷歌发布新算法TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用,该技术实现6倍键值缓存内存压缩效果,并在英伟达H100加速器上测试最高性能提升8倍。受此影响,计算机内存与存储类股票普遍下跌。

3月26日,据中国证券报,近期,谷歌发布文章介绍新算法TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用。该技术可实现约6倍的键值缓存内存压缩效果。在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。受此影响,计算机内存与存储类股票普遍下跌。