谷歌全新压缩算法冲击存储板块

2026-03-26
阅读量 847

据闪德资讯获悉,谷歌近日公开名为“TurboQuant”的全新压缩算法,能够大幅降低人工智能系统对内存容量的需求。

受此消息影响,存储板块普遍下跌。

据谷歌研究发布的报告,TurboQuant是一种无需训练的压缩算法,无需训练即可将大型语言模型的KV缓存量化至3-bit,且保持模型准确度不变。

在英伟达H100 GPU测试中,其性能比未量化方案提升8倍,KV缓存内存占用压缩至少6倍,有效缓解AI算力瓶颈。

随着上下文窗口的增加,KV缓存已成为内存的主要瓶颈。

谷歌指出,传统向量量化方法虽能缩小缓存体积,但会产生额外内存开销,每个数值需多存储约1到2-bit的量化常数,随着上下文窗口增大,这些开销会显著累积,部分抵消压缩效益。

TurboQuant通过两阶段流程消除上述开销。

图片

受此消息影响,美光科技25日下跌3.4%,创3月6日以来收盘新低,跌幅居费城半导体指数成分股之首。

闪迪同步下跌3.5%,希捷科技下跌2.59%,西部数据下跌1.63%,整体存储板块受到明显冲击。

点击此处关注获取最新资讯!

f328f6db93164f84bb23c090c28e7db.png88c1a0acd98aa6023fcbfa1f2ebf421.png


1.本文整理自网络,如有侵权,请联系删除。

2.所刊内容仅代表作者观点,非闪德资讯立场。

我的评论

登录后评论

最新评论

渠道报价
查看更多

D4/32G-D4 3200

  • 一年
  • 半年
  • 三个月
  • 一个月

微信订阅

APP下载

存储未来,赢得先机

18126200184

Copyright©2008-2026 闪德资讯 版权所有 粤ICP备18080549号-1

粤公网安备 44030402002744号