川观智库研究员 徐也晴
近日,国家数据局印发的《数字中国建设2025年行动方案》要求,加强交通、医疗、金融、制造、农业等重点领域数据标注,建设行业高质量数据集。
高质量数据集的建设依赖数据标注。清华大学数字政府与治理研究院等单位联合发布的《智能数据标注产业发展观察报告》(以下简称《报告》)指出,智能数据标注成为行业升级的关键路径。
《报告》解释,智能数据标注指的是通过人工智能辅助标注、自动化质检、合成数据生成等技术,来提升效率与质量的一种标注手段。国家信息中心等机构联合编制的《高质量数据集建设及运营前沿报告(2025年)》也提到,要建设专业化数据标注基地,并通过运用智能标注工具、组建专业标注团队等,为人工智能训练输送高质量数据资源。
为什么“智能数据标注”最行?《报告》认为,尽管数据标注产业规模在不断扩大,但它仍然面临许多挑战。比如,资金实力有限的中小企业面临生存竞争挑战、用工需求波动大、传统人工标注模式面临根本性变革等等。因此,深度的“人机协作”模式成为了数据标注行业的主流趋势,也就是智能工具处理可规范化的基础工作,而人工则专注于垂直领域和把控质量等环节。
随着大模型技术的普及和具身智能等未来产业的兴起,高质量标注数据的需求将持续增长。《报告》指出,未来,数据需求方将会越来越重视数据质量、场景多样性和可扩展性。对此,智能标注企业需要进一步强化技术研发,深化行业应用,优化标注流程,培养高素质人才队伍,为人工智能产业提供强大的数据支撑。
值得一提的是,中国电子信息产业发展研究院日前发布的《2025高质量数据集研究报告》显示,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展新阶段。
版权声明:
1、天府评论所登载文稿均仅代表作者个人观点,不代表天府评论立场。
2、作者投稿确系本人原创作品,严禁剽窃、转投他人作品,若由此引起任何法律纠纷,与天府评论无关。
3、作者向天府评论投稿时,就已表明同意四川在线全权使用本稿件。
4、欢迎网络媒体转载天府评论文章,转载时请注明来源及作者。
5、欢迎传统媒体转载天府评论文章,请与编辑联系获取作者联系方式,并支付稿费与作者。
6、传统媒体转载不支付作者稿费,网络媒体转载不注明来源及作者,天府评论将追究相关法律责任。