川观智库研究员 朱炜琳
今年以来,AI推理大模型爆火,让以它为底座的AI智能体走进大家的生活,并逐渐从辅助工具向决策伙伴演变。但一些痛点难点也随之而来:传统存储架构已无法满足AI智能体对实时推理的需求,大量可以用于智能体训练的优质数据因存储能力不足而流失。前不久,华为在《智能世界2035》报告中就做出预测:数据将成为推动人工智能发展的“新燃料”,2035年AI存储容量需求将比2025年增长500倍,占比超过70%,存储范式将发生改变。AI推理的普及正倒逼存储技术向高性能、智能化与定制化升级,这一转型不仅是技术迭代,更是支撑AI智能体规模化落地的战略基石。
一方面,存储效能不足导致算力资源利用率低。赛迪顾问的最新研究《从训练为主到推理落地,存储市场的变与不变》指出,智能体推理流程中,算力资源利用率低的主因并非计算能力欠缺,而是部分存储系统响应不及时导致数据加载延迟,拖累整体效能。加上AI智能体对多模态数据治理复杂度飙升,进一步凸显存储短板。智能体输入涵盖文本、图像、音频等非结构化数据,传统方案难以统一索引。此外,还有更严峻的数据安全挑战,随着AI智能体落地政务、金融、医疗等领域,数据安全和合规要求变得更加严格,对存储系统的安全性要求更高。
另一方面,数据存储量与数据产量形成巨大鸿沟,“应存未存”正成为AI智能体演化升级的卡点。中国信息通信研究院近日发布的《先进存力中心研究报告》指出,2024年我国数据产量达41.06ZB。在全球占比超四分之一,但留存率仅2.8%,较2023年下降3.15%,且“应存未存”现象仍然存在。同时,存储空间利用率也从2023年的59%升高至61%,表明剩余可用存储空间被进一步压缩。而AI智能体的演化训练正需要大量优质数据支持,因此,持续强化存力建设已成为避免数据价值大规模流失、促进AI智能体等行业发展的关键举措。
针对以上困境,急需与之配套的先进存储技术和存力设施。综合两份报告观点,需要数据存储服务厂商和顶层设计协同发力。
对厂商而言,需要持续推进针对AI智能体需求的存储技术研发。强化低延迟、智能运维研发。用户可以按场景选型,根据业务的数据量级、扩展需求、响应速度要求等进行适配推理需求的存储产品选型。厂商与用户协同提升存储设施的市场化应用能力。
顶层设计方面,中国信通院建议将先进存力中心纳入新基建专项规划,助力构建全国一体化数据市场。如在“东数西算”工程中增设存力枢纽;突破量子存储等前沿技术,降低高性能存储能耗;构建带有行业应用特点的高质量AI训练数据集等。
版权声明:
1、天府评论所登载文稿均仅代表作者个人观点,不代表天府评论立场。
2、作者投稿确系本人原创作品,严禁剽窃、转投他人作品,若由此引起任何法律纠纷,与天府评论无关。
3、作者向天府评论投稿时,就已表明同意四川在线全权使用本稿件。
4、欢迎网络媒体转载天府评论文章,转载时请注明来源及作者。
5、欢迎传统媒体转载天府评论文章,请与编辑联系获取作者联系方式,并支付稿费与作者。
6、传统媒体转载不支付作者稿费,网络媒体转载不注明来源及作者,天府评论将追究相关法律责任。