今天(13日),国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》。
什么是“数据标注”?简单理解,就是给文本、语音、图片、视频等等各种各样的数据“打标签”。本次印发的文件是国家层面首次对数据标注这一新兴产业进行系统谋划。
年均复合增长率将超20%
数据标注产业向知识密集型转变
自动驾驶、低空经济、智能制造、智慧医疗等领域都离不开数据标注。据测算,2023年我国数据标注产业规模达800亿元左右。
本次发布的《意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力水平显著提升,产业规模大幅跃升,年均复合增长率超过20%。培育壮大数据标注产业,对于推动人工智能创新发展具有重要支撑作用。
清华大学计算社会科学与国家治理实验室执行主任 孟庆国:高质量数据短缺,是我们一些大模型发展过程中遇到的瓶颈,数据标注就是对数据进行筛选、清洗、分类、标记等各种加工处理,能产生高质量的数据集,让机器读得懂、学得快、训得好。现在的一个新趋势是,数据标注自身的自动化、智能化程度也在明显提高,与此同时,细分领域变多,也需要金融、交通、能源、医疗等一些背景的专业人才,数据标注正在逐步从传统的劳动密集型向知识密集型产业转变。
《意见》还提出,建设成效显著、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态。目前,我国已确定成都、沈阳、合肥、长沙等7个城市承担数据标注基地建设任务。
突出需求牵引和创新驱动
释放公共数据、企业数据标注需求
欢迎转载,转载请注明来源:石河子零距离
编辑:张兰兰
编审:焦亚峰 刘伟
欢迎来稿,投稿邮箱:shzrmtzx@163.com