川观智库研究员 徐也晴
随着人工智能大模型的迅速普及,越来越多的企业开始将其部署在业务当中。全球管理咨询公司麦肯锡的一项最新调查显示,超过四分之三的受访企业表示,所在组织已在至少一个业务环节部署人工智能。
值得一提的是,麦肯锡的这项调查也显示了企业的招聘倾向,即在已部署AI的企业中,半数受访者称未来一年企业需要更多数据科学家,也就是能够帮助收集、分析和解释大量数据来解决复杂业务问题的专家。
算力、算法、数据是人工智能的三要素,为什么数据科学家在当下更受欢迎?近日,上海大数据联盟等机构联合发布的《大模型重构大数据产业发展白皮书(2025)》(以下简称《白皮书》)表示,当前文本数据的优势正被快速消耗殆尽,而图像、音频、视频、操作日志等将成为企业竞争的关键资源,如何将这些数据转化为高密度、低噪声的向量语义表达,将决定企业模型的推理深度与决策敏捷度。
除此之外,《白皮书》还强调,企业拥有模型并不等于拥有了智能。未来企业之间AI能力的差距就在于是否构建了灵活、动态、可反馈的数据流调度机制。其中就包括数据预处理的智能性、特征抽取的自动化、训练数据的实时更新机制,以及语义知识图谱的在线演化能力等等。也就是说,数据的质量、表示能力和流动效率,正在定义模型的“智能边界”。
中国计算机学会原理事长、CCF计算机博物馆馆长梅宏表示,没有数据就不可能有智能,大模型能力的天花板也是由数据来定义的。眼下,如何更好地释放数据要素价值,构建高效的数据生态体系,已成为学界业界共同的课题。对此,《白皮书》也强调,在大模型时代,谁能率先构建高质量、可流通、可信任的行业级数据集群生态,谁就能在模型竞争中占据数据资源的制高点。
版权声明:
1、天府评论所登载文稿均仅代表作者个人观点,不代表天府评论立场。
2、作者投稿确系本人原创作品,严禁剽窃、转投他人作品,若由此引起任何法律纠纷,与天府评论无关。
3、作者向天府评论投稿时,就已表明同意四川在线全权使用本稿件。
4、欢迎网络媒体转载天府评论文章,转载时请注明来源及作者。
5、欢迎传统媒体转载天府评论文章,请与编辑联系获取作者联系方式,并支付稿费与作者。
6、传统媒体转载不支付作者稿费,网络媒体转载不注明来源及作者,天府评论将追究相关法律责任。