什么是AI语料?
人工智能语料,简称AI语料,是指用于训练和改进人工智能模型的数据集合,这些数据可以涵盖文本、语音、图像以及视频等多种类型。
AI语料的根本作用在于助力AI系统理解和模拟人类的行为与思维方式。具体而言,AI语料的应用非常广泛,像机器翻译、语音识别、情感分析、聊天机器人、文本摘要、自动问答系统,通过不断优化和扩充语料库,提高AI的准确性和效率,丰富的实例、对话,帮助机器学习算法掌握自然语言的处理能力,实现分类、翻译、内容生成等等
随着国内大模型的持续升级,对AI语料需求增加,目前国内一些AI语料企业,已经开始把内容卖给大模型公司,或与大模型公司合作训练。
12月18日,深圳市工业和信息化局印发《深圳市打造人工智能先锋城市的若干措施》,内容包括:
1:发放“训力券”、“模型券”、“语料券”:
1)每年发放最高5亿元“训力券”,降低人工智能模型研发和训练成本,按不超过服务合同金额的50%,给予最高1000万元资助,对初创企业提高资助比例至60%。
2)每年发放最高1亿元“模型券”,降低人工智能模型应用成本,按不超过模型购买费用的30%,给予最高200万元资助。
3)每年发放最高5000万元“语料券”,促进语料开放共享和交易,推动数据要素市场建设。
AI语料概念——净利润增长最高的5家企业
第一家:
每日互动
净利润同比增长:1125.09%
所属概念数量:23个
华为概念、快手概念、、比亚迪概念、数据安全、空间计算、机器人概念、AI语料、智谱AI、鸿蒙概念、抖音概念(字节概念)等等
公司亮点:
专业的数据智能服务商,服务对象包括人民日报、京东等数十万APP,数据智能服务商,为商业主体提供丰富的数据智能产品、服务与解决方案,赋能各行业数字化升级。
第二家:
普联软件
净利润同比增长:148.36%
所属概念数量:15个
区块链、小米概念、信创、数字经济、华为鲲鹏、AI语料、人工智能、智慧政务、数据要素、AIGC概念等等
公司亮点:
国内较早全面熟悉掌握 XBRL标准体系及关键技术的厂商,2023 年,公司在技术平台一期建设项目的基础上不断优化完善和创新,形成了公司新一代研发技术平台--云湖平台。公司基于通用大模型和云湖平台相关语料,训练研发了智能代码助手。
第三家:
新开普
净利润同比增长:142.99%
所属概念数量:40个
人脸识别、蚂蚁金服概念、华为概念、在线教育、智能电网、水利、元宇宙、养老概念、人工智能、华为鲲鹏、网络安全、鸿蒙概念、AI语料、机器人概念、华为盘古等等
公司亮点:
智慧校园、智慧政企软件产品综合服务商,新开普在人工智能领域积极探索,并逐步建立了自己的AI语料库,用于支持智能服务和产品的研发。
第四家:
同方股份
净利润同比增长:112.01%
所属概念数量:52个
军工、网络安全、国产操作系统、富时罗素概念、机器人概念、人工智能、机器视觉、工业互联网、华为昇腾、AI语料、华为概念、储能、鸿蒙概念等等
公司亮点:
公司是以清华大学为依托的科研成果产业化平台,旗下知网是中国学术资源最全面、最权威、最专业的数字化出版机构,知网中文语料来源可靠、标注规范、权威专业、更新及时,可以训练出在专业知识领域具备更好中文表达能力的AI模型。
第五家:
海天瑞声
净利润同比增长:111.80%
所属概念数量:20个
人工智能、语音技术、数据存储、ChatGPT概念、小米概念、无人驾驶、数据安全、AIGC概念、AI语料、智谱AI、抖音概念(字节概念)等等
公司亮点:
中国语音类基础数据服务行业的市场份额排名前五,AI训练数据的研发设计、生产及销售业务。
第一家:
深圳瑞捷
市净率:2.07
所属概念数量:16个
数据中心、碳中和、数字经济、数据存储、数据要素、人工智能、水利、AI语料概念等等
公司亮点:
国内建设工程质量与安全风险第三方评估咨询业务的开拓者之一,瑞捷基于AI识别技术、人工智能语义分析、图数据库等技术,构建了以企标字典数据库和知识库为核心的两大数据库,作为瑞捷的数字底座,为客户服务、产品研发、行业分析提供大数据支撑。同时在AI人工智能应用方面,公司正在研发瑞捷知识管理平台,用于公司知识沉淀及管理,并利用数字人技术实现对内对外的赋能。
第二家:
深桑达A
市净率:3.36
所属概念数量:40个
安防、生物安全、数据中心、绿色电力、数据安全、国产操作系统、体育产业、元宇宙、人工智能、AI语料、低空经济、华为鲲鹏、智谱AI、中芯国际概念等等
公司亮点:
中国电子集团旗下,洁净室净化工程级别最高已达到国际领先标准,洁净室市占率国内居前。公司开展数据安全与数据要素化工程建设,培育形成数据资源、数据元件和数据产品三级市场,以促进数据的安全流通与高效配置,打通以数据要素为核心的数据资产链与价值链。
第三家:
新国都
市净率:3.08
所属概念数量:33个
NFC、微信概念、物联网、移动支付、腾讯概念、芯片概念、汽车电子、人工智能、AIGC概念、多模态AI、AI语料、鸿蒙概念等等
公司亮点:
基于金融POS机的入口优势,拓展电子支付业务,公司控股子公司上海拾贰区建立了多语言语料库用于提升自身模型适用性,未来计划与各版权方合作,进一步扩大语料库的来源从而丰富语料库内容,暂未有其他布局及用途。