关闭广告

存储涨价之后,如何让AI走向数据?丨ToB产业观察

钛媒体APP425人阅读


国家数据局数据显示,从2024年到2026年,中国日均Token调用量从1000亿飙升至140万亿(截至2026年3月),两年增长超过千倍,而在这组数据的背后,体现了AI正在从实验室里的模型训练,全面进入生产生活中的应用落地。

过去以“数据保存”为核心使命的存储设备,如今被赋予了“数据赋能”的全新职责——它不再是被动承载数据的“容器”,而是主动参与数据处理、支撑AI高效运转的“核心枢纽”。

对于存储行业来说,这个拐点带来的不是温和的增量增长,而是一场全面重构。在这场重构的背后,不再是让数据走向AI,而是让AI走向数据。

存储架构迎来“基因重组”

“原来的企业存储是做数据保护,现在AI存储的第一目标是效率提升——如何充分满足GPU对于数据的需求,而不让它空转”,浪潮信息存储产品部副总经理郭海峰用这样一句话概括了存储使命的根本性变化。

这不仅是产品定位的调整,而是整个技术架构的“基因重组”。郭海峰指出,传统企业级存储是“通算架构”——以CPU为核心,数据需要由CPU进行路径解析、从内核态进行复制和转发,再传给GPU进行计算。这种架构在服务关系型数据库和传统应用时运转良好,但当它面对智算时代的GPU集群时,效率极为低下:如果存储成为瓶颈,昂贵的GPU就会空转。

数据可以说明问题的严重性。IBM大中华区存储事业部总经理吴磊告诉笔者,如今GPU部署动辄百卡、千卡、万卡规模,投资以亿甚至十亿计,“1%的闲置就意味着上亿元的浪费”。无独有偶,郭海峰同样曾公开表示,存储和网络在整个智算系统中可能只占5%-10%的成本,但如果GPU空转,这5%-10%的成本就会毁掉其余90%以上的投资回报。

为了满足当前企业对于算力利用率的需求,存储也迎来了“基因重组”的新阶段。目前来看,从软件和硬件两个层面切入,都可以优化整体存储架构。这个过程中,浪潮信息与IBM就是很好的两个方面的代表。比如,浪潮信息在其新发布的A9000系列产品中就采用了“全链路免锁零拷贝的用户态AI原生并行架构”,将数据传输路径从内核态切换到用户态协议栈,实现端到端的免拷贝,将延迟从传统的毫秒级降至微秒级,单节点带宽达到160GB/s(行业主流水平为60GB/s至80GB/s)。

在软件层面的架构变革背后,暗含着一条更深层的技术主线,那就是KV Cache。在AI推理场景中,为了加速模型响应、避免重复计算,系统需要将键值对缓存保留在高速存储中。但随着上下文窗口的急剧扩大,KV Cache的规模已经远远超出了GPU显存(HBM)和本地DRAM的承载能力。郭海峰向笔者详细解释了这一技术逻辑:通过PD分离(Prefill与Decode分离),利用GlobalCast技术和“双路径”设计,将空闲的带宽整合利用,显著缩短首Token产生时间。浪潮信息公布的数据显示,通过Agent Memory外置存储架构,A9000可将首Token延迟(TTFT)降低97%,Token吞吐量提升超过20倍。

与之相对,IBM则从另一个维度切入。IBM推出的Storage Scale并行文件系统在万卡集群中支撑高频的checkpoint数据落盘,确保数据能够在极短时间内写入存储,充分释放GPU的计算效率。

除了“软件”层面的优化之外,IBM还在其自研的第五代闪存核心模块(FlashCore Module 5)的每块NVMe闪盘上嵌入一颗专用芯片和高性能处理器,实现硬件级的压缩、去重和加密。吴磊透露,这一设计可以将压缩比做到1:5,并且因为压缩在盘上完成,不会对存储控制器的性能造成影响。

种种技术的变化都揭示了AI时代存储架构的另一个重要方向:存储不再只是数据的被动容器,而是具备感知和计算能力的主动节点。

涨价是暂时的,效率优化才是关键

当存储节点不再是被动容器,而是进化为承载KV Cache、主动参与计算卸载的智能枢纽之时,业界对高带宽、低延迟存储介质的依赖便呈指数级攀升。这种由架构变革催生的庞大缺口,直接投射在了上游供应链的产量倾斜与价格博弈之上。

据多方数据显示,2026年第一季度DRAM内存合约价涨幅达90%-95%,NAND Flash闪存合约价涨幅达55%-60%。这轮涨价潮的直接推手是AI——大模型训练和推理需求井喷,DRAM和NAND原厂将大量产能从消费级产品转向高利润的企业级AI产品,TrendForce预测,2026年第二季度NAND闪存合约价将继续大幅跳升70%至75%。

但吴磊与郭海峰不约而同地认为,存储涨价是一时的,真正需要关注的是效率优化。郭海峰提到,有的企业将存储迁移到高带宽方案后,GPU利用率提升了15%——“用不到整个项目10%的钱采购存储,把卡的利用率提升了15%”。吴磊则算了一笔更直观的账:通过FCM的1:5压缩技术,用户在涨价后开启压缩功能,实际可用容量的单位成本甚至比涨价前更低。

然而成本优化远不只是一个压缩比的问题。存储行业正在经历的,是对“数据应该放在哪里”这一根本问题的重新思考。传统企业级存储中,“热、温、冷”数据分层管理已经是成熟理念,但AI时代的分层逻辑远比过去复杂。

这时候,五层存储体系也就应运而生了,其出现是AI给存储行业带来的最直观的结构性变化。按照业界通行的分类:第一层是HBM(高带宽内存),第二层是本地DRAM,第三层是本地SSD,第四层是传统企业级外置存储。而在第三层和第四层之间,现在出现了一个“3.5层”——这是一个专门服务于推理场景的外置缓存层。

为什么需要3.5层?郭海峰向笔者解释道:“3.5层是为了效率,放弃一定的可靠性,数据比是1:1,大不了数据丢了重新算,但不能牺牲效率。”这与第四层传统存储“数据保护优先”的理念形成了鲜明对比。无独有偶,吴磊也给出了类似的判断:“全用HBM当然最好,但HBM太贵了。”在经济学约束下,分层是必然选择。

而在五层存储体系分层的影响下,“磁带存储”这个“古老”的存储技术又一次成为了企业性价比之选。据吴磊介绍,过去几年多家大厂已部署EB级甚至10EB级的磁带库,包括百度智能云在底层的冷数据存储。LTO联盟由IBM、HPE和Quantum联合推动,LTO-10已实现40TB原始容量,2.5:1压缩比下可达100TB,未来LTO-11可达70TB、LTO-12可达110TB。吴磊提供了一个实用视角:磁带机械臂从最远端抓取数据大约需要一分五十多秒,但如果一个数据三个月甚至六个月才访问一次,两分钟的等待完全可以接受。

让AI走向数据

这一轮存储行业的变革不仅仅是五层存储体系所能完整体现的,而是映射出了一个更为深层的变化,传统的“让数据走向AI”模式已经不能满足当前用户的需求,让AI走向数据将取而代之。

在传统数据使用模式中,AI应用是“索取方”:应用发起请求,存储响应。这种模式在小规模、低频次场景下可行,但面对EB级数据、百万并发请求时,完全不可持续。更致命的问题是数据一致性的崩塌。吴磊用一段生动的比喻描述了这一困境:“我们每个人可能好几个TB的照片、视频,企业是几百个TB、几百个PB,甚至EB级的时候,哪一个副本数据说出来的是真话,哪个副本数据说出来的是假话?”

面对此,IBM给出的解决方案是内容感知存储(Content-Aware Storage,CAS),结合单一数据副本和即时感知数据变化的机制。其核心理念是:数据发生了变化,模型能够即时感知,而不是通过繁琐的副本生产和传输来同步。吴磊强调:“过去部分厂商出于销售目的建议客户扩容升级。存储管理员疲于应对报告和迁移。现在有了AI智能体,可以把所有数据分析完,一次性做出决策,甚至可以做到跨洲的数据迁移。”

这意味着存储的角色从被动的数据仓库转变为主动的数据编排平台。而这个解题思路似乎已经行业的一个共识。IBM提出的内容感知存储核心理念与浪潮信息提出的“AI Data Platform”概念有着许多相似之处。郭海峰告诉笔者,“AI Data Platform”概念强调的是数据不是静态的“湖”,而是“一条不断流淌的河流,不断有数据进来,不断去处理、清洗、打标和再优化,重新训练模型”。这种动态的数据管理逻辑,与传统的“存下来以后再说”的思路有着本质区别。

从产业视角看,“让AI走向数据”正在催生新的产业协同模式。浪潮信息利用全栈能力(从底层算力到上层平台)为合作伙伴提供基础设施,郭海峰将其形容为“搭台唱戏”——浪潮信息搭台,伙伴唱AI这场戏。IBM则宣布与英伟达进一步扩大合作,在GTC 2026上展示了深度集成方案:Storage Scale System 6000可提供10PB高性能存储,用于支撑GPU原生分析引擎,IBM同时计划于2026年第二季度初在IBM Cloud上提供英伟达Blackwell Ultra GPU。

但这一切的最终落点仍然是人。吴磊在沟通会上反复强调:“AI是一个工具,不能代替人,它没有情感,它没有办法做决定,最终做决定的是人类。”无论是浪潮信息让GPU“不空转”,还是IBM用AI智能体让存储管理员管理数十个同构或异构节点,终极目标都是将人从繁琐的运维中解放出来,将注意力投向创新。

IBM商业价值研究院的调研显示,76%的CEO对自己企业的IT架构“非常自信”,但43%的CIO感到焦虑。这种认知落差恰恰说明,AI时代的数据基础设施挑战,远比表面看到的更复杂。“让存储融入平时的业务中,而不是让业务等存储”——金鑫这句总结,或许是这个时代对存储行业最朴素也最关键的要求。

回望过去两年,存储行业经历了从波澜不惊到惊涛骇浪的转变。当全球AI总支出逼近万亿美元量级,当Token成本的每一次下降都直接影响大模型的经济可行性,存储不再只是技术的终点,而正在成为AI价值链条中不可或缺的一环。

(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瑞典拉普兰:凛冽北境的万物平衡之道

时尚COSMO 浏览 1826

女子刚分的新房开着条缝 进门后发现地上有烧纸的灰烬

1818黄金眼 浏览 6070

工行、建行:暂停办理投资金部分业务

央视财经 浏览 2311

中科大团队实现AI图表数学逻辑理解

科技行者 浏览 2390

无人机集群“画出”千亿基建赛道!低空视觉经济如何重构传媒与城市空间

华夏时报 浏览 1787

体系决胜 长安汽车从300万辆进击全球TOP10的"增长逻辑"

网易汽车 浏览 485

俄三防部队司令遇袭身亡案调查结束 细节披露

每日经济新闻 浏览 2697

全球最大稳定币遭质疑 标普将评级降至“最差一档”

财联社 浏览 2147

博主:此前杨瀚森屡屡被DNP时,很多当地球迷都要求退季票

懂球帝 浏览 1919

51岁何炅自曝出现衰老焦虑,坦言精力大不如前

安海客 浏览 2616

这些才是最适合普通人的穿搭!上衣修身、一衣多穿,大方简约

静儿时尚达人 浏览 630

女子代购海外"不老药" 疑遭职业打假人起诉"退一赔十"

大风新闻 浏览 9484

国内首个海上可复用火箭基地开工 发射成本对标SpaceX

澎湃新闻 浏览 6475

坚持10年做这件小事,我收获了太多

黎贝卡的异想世界 浏览 2506

章泽天这次翻车,真的不冤

独立鱼 浏览 1739

猫头鹰联手Prusa推出经典棕色、米色3D打印PLA耗材

IT之家 浏览 1857

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

Yuki女人故事 浏览 1539

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 1349

疯狂推新,营收大涨27%!小熊电器“翻身”

侃见财经 浏览 2627

泸天化“三合一”高管王斌因个人原因辞职,总经理傅利才暂代财务总监、董秘职务

红星资本局 浏览 1211

男子花3万多网购2400克银条空欢喜 付款次日店铺清空

红星新闻 浏览 6686
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1