·投稿联系邮箱:scolpl@163.com
天府评论>>川观智库>>正文

省内需求潜力巨大,但本地企业为何找不到本地客户?|三问数据标注产业③潜力篇

http://www.scol.com.cn  (2025-09-21 23:00:00)  来源:四川在线  编辑:张杨
作者:投稿邮箱:scolpl@163.com


编者按:数据标注产业,属于少数有大意义的“小产业”


说它小,是因为全国市场规模预计今年也到不了300亿元,业内仅有几家上市企业,且其年营收都不超过5亿元。但就是以这般小体量,它却能吸引到国家多部委发专文支持,原因很简单:AI大模型训练亟需高质量数据,而数据标注是高质量数据供给的一个关键环节


数据标注本质上是将人类知识转化为机器可识别的语言,为AI大模型学习提供“教材”。去年,国家数据局公布了首批7个承担全国数据标注基地建设任务的城市名单,四川省成都市入选。如今试点基地建设已满一年,产业在蓉发展如何?川观智库在专题调研过程中发现了一些值得关注的新情况、新变化。而要深入了解它们,可以从对三个新现象的追问开始。


川观智库研究员 熊筱伟

川观智库研究员一线走访时发现,多数受访数据标注企业的省内客户是“零”或“极少”

综合受访者观点,“客户多来自省外”这个现象本身不是问题,但它的确反映出四川在挖掘省内数据标注需求方面仍有巨大潜力,在推动数据标注服务人工智能产业发展方面仍有不少工作可做。为此,川观智库研究员从现象出发进行了调查。



Part.1

为什么感觉缺本地客户?

省内需求相对较小,供需对接缺乏渠道

受访9家在蓉数据标注企业当中,4家省内客户数量为零;3家有少量省内客户,但占年营收比例均不超过20%;仅2家有半数或以上相关客户来自省内

四川乐为科技有限公司负责人表示,客户全部来自省外,他也为之纳闷,“我们去参加全国(数据标注)行业会议,现场客户都是省外的。”同样没有省内客户的成都小咖邦智能科技有限公司负责人说,去年和今年他参加了不少省内活动,“相互一问,发现大家都是乙方,现场愣是一个甲方都没有。”

为什么会缺省内客户?受访者观点主要集中在以下两点:

一是认为省内需求小。有受访者谈到,数据标注需求遵循“二八原则”——约80%需求来自头部企业,20%需求来自创业公司。而和沿海省市相比,四川缺乏人工智能和互联网巨头,所以数据标注需求相对较少。

综合受访企业反馈情况,绝大部分客户是来自北上广深的头部互联网和人工智能企业。一家头部数据标注企业表示,目前国内客户约81%来自互联网和人工智能行业,7%来自汽车,6%来自智能手机,2%来自机器人,其他则来自半导体等行业。多位受访者表示和商汤、搜狗等头部企业在川机构谈过合作,对方均提出供应商选择要由总部决定。

二是认为省内客户少,供需对接不足。成都市汇众天智科技有限责任公司总经理骆靖元认为目前缺乏信息渠道和对接渠道,“我们也不知道往哪儿去找(省内)客户。”多数受访企业也提到类似观点。



Part.2

如何更好释放省内需求?

加快对公共数据的开发利用,解决申请难、流程较长等问题

该如何看待“省内需求小”这一观点?

川观智库研究员了解到四川3家人工智能链主企业的情况(今年首批公布共9家),其中2家表示,由于所处研发阶段等原因,暂无大量数据标注需求;成都考拉悠然科技有限公司则是自建团队。此外,从事人工智能辅助外科手术相关系统研发的成都与睿创新科技有限公司也自建了约30人的全职数据标注团队。该公司首席科学家秦典提到,一是考虑数据安全问题,二是对团队专业性和稳定性有较高要求。如果能有长期稳定服务的外部专业团队,未来也可以洽谈合作。

此外,前述省内客户过半的2家企业分别是成都优易智数科技有限公司、四川智成云逸信息技术服务有限公司。前者总经理金守超表示,公司深耕四川市场时间较长(2017年在蓉成立),目前年营收约一半来自省内,主要来自成都做大模型算法的科技公司,“客户多,但单子都不大,很多是每个月一两万元、连续做几个月。”

但与此同时,受访企业普遍谈到,当前四川数据标注需求的潜力巨大。一方面,在人工智能时代,各行各业包括传统制造业都可能产生数据标注需求。要激发这一潜力,需要加大智改数转工作力度。另一方面,对公共数据的开发利用,尤其是交通、医疗等公共数据如向社会开放,将迅速催生出众多应用场景,进而释放巨大的数据标注需求。

对于后者,四川智成云逸信息技术服务有限公司的数据标注客户几乎全部来自四川。其负责人表示,目前主要与省内运营商合作,承接地方政府项目中的数据标注业务。

然而受访者也普遍反映,目前公共数据开放仍较为有限。川观智库研究员了解到的一份成都市相关研究材料显示:公共数据在“数据不出城”的政策限制下,面向市场化的应用场景难以获取原始数据资源开展标注

即便经过脱敏等处理、允许向社会开放的公共数据,目前也存在申请难、流程较长等问题。有企业表示,申请智慧城市场景相关数据流程走了约3个月,直接导致项目延期交付。受访者建议能由相关部门牵头疏通相关堵点难点。

至于“供需对接不足”,成都数据集团相关负责人建议,希望有关部门牵头建立供需撮合官方渠道,组织全市层面数据标注供需对接会等活动,并表示由该集团牵头建设的市级数据标注公共服务平台“蓉数·智能数据标注生成管理平台”将进一步强化“线上+线下”供需对接功能。另有受访者建议,探索制定并定期向社会发布数据标注的需求清单。