人工智能大模型发展遇到数据短缺瓶颈 国家出台《数据标注产业意见》

文摘   2025-01-16 14:01   河北  

数据标注通过对数据加工处理,以提升数据供给质量,推动人工智能发展。国家发展改革委13日发布消息,国家发展改革委、国家数据局等部门近日印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。

业内专家认为,高质量数据短缺是当前人工智能大模型发展中遇到的瓶颈。数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业,能够产生高质量的数据集,让机器读得懂、学得快、训得好。

意见提出培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地。此前,我国已确定成都、沈阳、合肥、长沙等7个城市承担数据标注基地建设任务

针对当前人工智能对于公共数据标注需求越来越多的情况,意见提出释放公共数据标注需求,深化人工智能在政务服务、城市治理、乡村振兴等领域应用,编制公共数据标注目录,依法依规有序推动公共数据标注与开发利用。

为增强创新驱动,意见提出支持软硬一体、自主可控的数据标注领域关键设备研发。在优化支撑体系上,意见提出加大财税金融支持力度,各地区各部门可结合实际,统筹安排数据产品和标注服务采购费用;同时加强标注人才队伍建设,制(修)定人工智能训练、数据标注相关职业国家职业标准。

国家发展改革委等部门关于促进数据标注

产业高质量发展的实施意见

发改数据〔2024〕1822号

各省、自治区、直辖市及计划单列市、新疆生产建设兵团发展改革委、数据管理部门、财政厅(局)、人力资源社会保障厅(局):
  数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对于提升数据供给质量,推动人工智能创新发展具有重要支撑作用。为促进数据标注产业高质量发展,现提出以下意见。
  一、总体要求
  以习近平新时代中国特色社会主义思想为指导,深入落实党的二十大和二十届二中、三中全会精神,完整准确全面贯彻新发展理念,统筹发展和安全,以促进数据开发利用、赋能经济社会发展为主线,着力培育数据标注新业态,布局数字科技新赛道,构建产业国际竞争新优势。发展数据标注产业坚持有效市场和有为政府相结合,坚持系统谋划和重点突破相结合,坚持开放协作和安全发展相结合的工作原则,充分发挥我国海量数据规模和丰富应用场景优势,强化需求牵引和创新驱动,加快生态培育。到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。
  二、深化需求牵引
  (一)释放公共数据标注需求
  深化人工智能在政务服务、城市治理、乡村振兴等领域应用,编制公共数据标注目录,依法依规有序推动公共数据标注与开发利用。支持公共数据赋能实体经济发展,在现代农业、智能制造、信息服务等重点领域发掘公共数据标注需求。支持跨部门、跨地区、跨层级公共数据融合应用,鼓励政府部门和企业协同开展政务大模型所需数据的标注和训练。推动数据标注服务纳入政府采购范畴。
  (二)挖掘企业数据标注需求
  支持数据要素赋能产业转型升级,深挖企业生产管理全流程数据标注需求。实施“国有企业数据效能提升行动”,加大企业数据开发利用,释放企业数据标注需求。加强交通、医疗、金融、科学、制造、农业等重点行业领域数据标注,建设行业高质量数据集,支撑人工智能在行业领域的应用赋能。围绕医疗健康、人力资源、数字贸易、自动驾驶、低空经济等场景,以业务创新拉动数据标注需求。
  三、增强创新驱动
  (三)开展关键技术攻关
  依托国家重点研发计划、国家科技重大专项等,加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用。支持多模态标注、标注审查、质量评估、基于思维链的专家标注等智能化工具研发。支持建设集数据、模型、工具、场景为一体的数据标注创新平台,推动数据标注技术融合创新。支持软硬一体、自主可控的数据标注领域关键设备研发。
  (四)健全数据标注标准
  围绕数据标注关键环节,结合文本、图像、视频、语音等多模态数据标注需求,建立数据标注标准体系框架,制定数据标注技术、质量、能力等国家标准。聚焦重点行业领域,加快制定相关行业数据标注标准,促进协同创新。
  (五)打造高水平创新载体
  培育建设数据标注领域重点实验室、技术创新中心等,加强基础研究和前沿技术探索。支持数据标注企业联合上下游企业、科研机构等建立产教融合创新平台、协同创新基地等,加快科技成果转化和应用落地。鼓励数据标注相关企业和科研机构等参与开源社区建设,推动创新资源共建共享。
  四、培育繁荣生态
  (六)着力壮大经营主体
  培育一批数据标注龙头企业,鼓励通过资源整合、并购重组等方式做大做强,推动数据标注企业规模化、标准化、集约化发展。支持和鼓励科技创新型数据标注企业承担基础研究、技术攻关、产业应用等重点任务,提高产业链协同创新水平。培育一批深耕行业的数据标注瞪羚企业、独角兽企业。推动数据标注中小企业与人力资源、金融服务、合规咨询等第三方机构精准对接,助力企业快速发展。
 (七)积极完善产业生态
  畅通数据采集、标注、人工智能应用产业链,推动数据标注产业上下游协同发展。支持数据标注龙头企业和第三方机构等建设数据标注开源平台,助力中小企业发展。培育一批人力资源、供需对接、国际合作、法律审计等服务数据标注的第三方机构,完善数据标注产业生态。
  (八)强化带动引领作用
  鼓励和支持数据标注基地先行先试,打造一批科技水平高、资源集聚强、辐射带动广的典型样板。开展数据标注领域的创新论坛、场景案例征集、学术交流等活动,遴选数据标注优秀案例。鼓励举办数据标注创新大赛等赛事,强化数据标注创新成果推广与场景拓展。
  (九)深化国际交流合作
  开展数据标注科技人才国际交流。深化数据标注领域技术及产业国际合作。支持企事业单位牵头制定数据标注国际标准。依托我国数字基础设施优势,鼓励国内企业承接数据标注国际业务。
 五、优化支撑体系
  (十)加大财税金融支持力度
  落实研发费用加计扣除、高新技术企业税收优惠等政策。鼓励有条件的地方加大数据标注产业的支持力度。各地区各部门可结合实际,统筹安排数据产品和标注服务采购费用。充分利用各地发放的数据券、算法券和算力券等,降低数据标注企业成本。鼓励各类产业基金、专业投资机构加大数据标注产业投资力度,引导社会资本有序参与。
  (十一)提升标注公共服务能力
  建设数据标注公共服务平台,加强标注产业动态监测,提升产业资源汇聚、供需对接和风险管理等能力。按照规范化接入和互联互通要求,打造全国数据标注公共服务“一张网”。
  (十二)加强标注人才队伍建设
  以人才项目计划和科技项目等为抓手,培育和引进高端专业人才。制(修)定人工智能训练、数据标注相关职业国家职业标准。深化产学研融合,鼓励行业联盟、高校、科研院所与企业建立长期合作机制,加大数据标注实践项目、继续教育和公共实训基地建设合作力度。依托行业组织、院校、社会培训评价组织等开展数据标注相关职业技能等级认定。支持数据标注领域职业资格与职业技能等级衔接互认,畅通人才发展通道。支持分层次建设数据标注人才库,强化产业人才支撑。
  (十三)促进标注产业安全发展
  建立健全数据标注安全性风险识别、监测预警、应急响应等相关规范,落实数据标注全过程相关主体的安全责任。合理保护数据标注企业在数据流通过程中形成的相关权益。加强数据标注隐私保护、人工智能对齐、安全评估能力建设。
 六、加强保障措施
  国家发展改革委、国家数据局、财政部、人力资源社会保障部统筹推进数据标注产业发展工作,动态掌握产业发展情况,做好数据标注产业谋划和重大问题研究,指导地方出台配套政策。各地方、各部门要加强数据标注产业支持力度,统筹资金、数据、人才等各类要素资源,支持好配套建设及设施运行保障。开展政策宣传和解读,加大典型案例推介,凝聚行业共识,营造数据标注产业发展良好氛围。

国家发展改革委

国 家 数 据 局

财  政  部

人力资源社会保障部

2024年12月26日


全国高校人工智能与大数据创新联盟

全国高校人工智能与大数据创新联盟(简称:高校联盟)是由清华大学、浙江大学、中南大学、东北大学、上海工程技术大学、重庆邮电大学、东北林业大学、佛山科学技术学院、曲阜师范大学、黑龙江大学、海豚大数据科技等全国54家高校、企业共同发起,于2018年5月26日在北京中国科技会堂正式成立。迄今为止,联盟发展会员300多家, 覆盖全国20多个省市。联盟由一批积极投身于“人工智能、大数据、区块链”教育事业的高校、科研机构、企事业单位和个人自愿组成的公益性、全国性学术交流服务平台。中国工程院原常务副院长、中国工程院院士潘云鹤、中国科学院院士陈国良、中国工程院院士李伯虎担任联盟名誉理事长,中国工程院院士谭建荣担任联盟理事长。联盟工作接受工信部、国家网信办等政府部门行政管理和业务指导。联盟主要工作是推进产教融合、校企合作、协同育人。(加盟微信13651193492)


华算人工智能研究院

华算人工智能研究院全称是“山西省华算人工智能研究院有限公司”,是经山西转型综合改革示范区管理委员会批准,于2023年10月在太原成立的第一批专业研究人工智能、赋能数字经济产业发展的独立法人组织。华算人工智能研究院依托全国高校人工智能与大数据创新联盟专家委员会及理事会资源,按照山西省委省政府、山西转型综合改革示范区管理委员会发展人工智能、数字经济的系列文件精神和工作计划,将研究院打造成为山西省发展人工智能、数字经济的示范应用推广平台,同时面向全国开展人工智能业务。华算人工智能研究院名誉院长由中国工程院院士李伯虎担任。研究院内设AI产业学院共建中心、实训实习就业中心、实验室建设中心、专家智库等6个职能部门。欢迎加入华算人工智能研究院专家智库,共同赋能高校AI人才培养及产教融合事业发展。


高校区块链专委会

全国高校人工智能与大数据创新联盟区块链专委会(简称:高校区块链专委会),是由北京大学、浙江大学、武汉大学、西南财经大学、北京交通大学、郑州大学、贵州大学、桂林电子科技大学、山西农业大学、佛山科学技术学院、陕西师范大学、中国网安、海豚大数据科技等全国40多家高校、企业和机构共同发起,于2019年12月7日在广东省佛山市正式成立。目前发展高校及企业会员70多家。中国工程院院士、浙江大学教授陈纯担任高校区块链专委会名誉顾问;福州大学教授蔡维德、中国计算机学会区块链专委会主任斯雪明教授、中国人民银行数字货币研究所副所长狄刚担任高校区块链专委会名誉主任;北京大学信息科学技术学院区块链中心主任陈钟教授担任高校区块链专委会主任。高校区块链专委会主要工作是促进高校区块链教育,为高校区块链专业建设及学科发展提供专家咨询服务。


高校元宇宙专委会

全国高校人工智能与大数据创新联盟元宇宙专业委员会(简称:高校元宇宙专委会),是由清华大学、湖南大学、浙江大学、四川大学、汕头大学、河北金融学院、保定市元宇宙协会、英伟达中国、海尔衣联网研究院、海豚大数据科技(天津)有限公司等全国20多所高校、企业和机构共同发起,于2022年11月5日在北京正式成立。中国工程院院士、计算机软件与虚拟现实领域专家赵沁平担任高校元宇宙专委会名誉顾问;中国工程院院士、北京航空航天大学电气与自动化学院名誉院长、中国航天科工集团有限公司科技委高级顾问李伯虎担任高校元宇宙专委会名誉主任;清华大学信息国研中心可信软件和大数据部常务副主任邢春晓担任高校元宇宙专委会主任委员。目前已发展高校及企业会员30多家。高校元宇宙专委会主要工作是促进高校元宇宙教育、加强校企合作、推动元宇宙专业建设及学科发展,为元宇宙教育教学提供专家咨询服务。


高校数字经济专委会

全国高校人工智能与大数据创新联盟数字经济专业委员会(简称:高校数字经济专委会),是由华算人工智能研究院、清华大学、北京大学、中国人民大学、中国社会科学院信息化研究中心、四川大学、北京外国语大学、北京科技大学、北京工业大学、北京语言大学、北京化工大学、北京联合大学、北京物资学院、北京印刷学院、西藏民族大学、河北金融学院、重庆财经学院、苏州城市学院、北京中关村软件园、百度、海豚大数据科技等全国60多家高校、企业和机构共同发起,于2024年1月12日在北京正式成立。清华大学经济管理学院教授姜旭平、北京大学信息管理系教授赖茂生、中国社会科学院信息化研究中心主任姜奇平、中国科学院大学经济与管理学院教授吕本富担任高校数字经济专委会主任委员。高校数字经济专委会主要工作是促进高校数字经济专业建设及学科发展,推动产学研合作,为高校数字经济专业教育教学提供专家咨询服务。

联盟“资料图书馆”

左右滑动查看更多







微信咨询

说明:转载文章和图片均来自公开网络,推送文章除非无法确认,都会注明作者和来源,如有侵权请联系删除。

往期精彩文章(单击就可查看):

. 2024全国535所普通高校人工智能专业教育教学综合实力排行榜
. 2024全国775所高校数据科学与大数据技术专业教育教学综合实力排行榜
2024全国76所高校智能医学工程教育教学综合实力排行榜
. 2024全国217所高校智能科学与技术专业教育教学综合实力排行榜
2024全国79所高校区块链专业教育教学综合实力排行榜
. 2024全国252所高校大数据管理与应用专业教育教学综合实力排行榜
. 2024全国336所高校智能制造工程专业教育教学综合实力排行榜
. 2024全国366所高校机器人工程专业教育教学综合实力排行榜
. 2024全国224所高校数字经济专业教育教学综合实力排行榜
2024全国224所高校数字经济专业教育教学综合实力排行榜
2024全国964所高职高专院校大数据技术专业教育教学综合实力排行榜
. 2018全国高校人工智能与大数据教育教学创新论坛暨北大创新评论峰会在京成功举办
. 2019第二届全国高校人工智能大数据教育教学创新论坛暨教材出版研讨会在京成功举办
. 2020第三届全国高校人工智能大数据区块链教育教学创新论坛在京成功举 
. 2021第四届全国高校人工智能大数据区块链教育教学创新论坛在京成功举办
. 2022第五届全国高校人工智能大数据区块链教育教学创新论坛在京成功举办
. 赋能知识图谱20人 2019赋能中国人工智能知识图谱20位标杆人物
. 习近平:培养人工智能高端人才 是教育的重要使命
. 元宇宙2021年度中国领军人物榜单揭晓
. “ 优秀教材建设奖”获奖人员名单及获奖理由 2021年度全国高校人工智能大数据区块链优秀教材建设奖揭晓
. 两会好声音:20位代表委员提案人工智能 新基建新风口带来哪些新机遇?
. 教育部发布全国高等学校名单(普通高校2688所,成人高校268所)
. 施一公:无论什么学科,最不重要的素质是智商
. 教育部印发《高等学校区块链技术创新行动计划》在高校布局一批区块链技术创新基地
. 斯坦福大学——人工智能本科4年课程清单

. 信息量巨大!美国终于公开了《2016-2045年新兴科技趋势报告


高校大数据与人工智能推进联盟
全国高校人工智能与大数据创新联盟是普及人工智能大数据区块链知识,推广人工智能大数据区块链技术与应用、创新高校服务的学术团体和服务平台。
 最新文章