首批人工智能技术基准评测榜单发布

健康 2024-11-18 20:40 广东

Artificial Intelligence Industry News

随着国内大模型纷纷进入到各领域的训练、服务和应用，针对大模型对场景应用的能力评测变得越来越有指导意义。在相关部门的支持下，鹏城实验室、广东省人工智能产业协会、广州数据交易所、广东联通、数据堂（北京）科技股份有限公司联合发起了大模型应用评测的战略合作，并邀请联通（广东）产业互联网有限公司、广电运通集团股份有限公司、广州云从人工智能技术有限公司、中科紫东太初(北京)科技有限公司、开普云信息科技股份有限公司、北京北大英华科技有限公司、京华信息科技股份有限公司、广州视源电子科技股份有限公司、摩诃脉动、深圳市未来清研科技有限公司等10余家国内各领域大模型公司参与场景应用评测。

本次评测方式

1.客观题：通过程序对比大模型的回答结果与标准答案，统计和分析两者一致的比例，获得大模型在不同领域回答的准确性并给出评测结果。

2.主观题：采用triple-check人工评测的方式，评测人员分为独立三组，比对问题和模型回答，同时参考人工标注的标准答案进行评分，最终评测结果取三组的平均分。评分细则如下：

面向政务、教育和法律

三个重点应用场景

政务场景例题

（1）主观题：在经济全球化的大背景下，地方经济如何通过创新驱动实现可持续发展，包括具体的策略、实施计划、预期挑战及解决方案，进行深入分析和规划。

（2）主观题：我村党员***从2023年5月20号开始违章建筑300平方左右钢架房，我们已多次向**城建办反应，给予反馈是勒令停工，反复反应，给予答复都是一样的。至今钢架棚已经修建完工！2023年10月19日又开始切砖垒高墙，望领导明察，给我们普通老百姓主持公道。

法律专场例题

（1）主观题：未经同意录音录像合法吗？

（2）多选题：《中华人民共和国监察法》规定,监察对象对 (____) 进行报复陷害的依法给予处理。

选项：A.控告人 B.检举人 C.证人 D.监察人员

教育专题例题

（1）选择题：某公司有员工A、B、C、D、E，他们分别负责不同的工作。已知A负责市场部，B负责财务部，C负责人力资源部，D负责研发部，E负责生产部。如果市场部需要与研发部合作，那么最有可能需要与E合作的是（）

选项：A.A B.B C.C D.D

广东省人工智能产业协会联合鹏城实验室、广州数据交易所、广东联通、数据堂共同发布首批人工智能技术基准评测榜单。

详情请垂询:

李先生

020-36660930

END

会员动态 | 热烈欢迎广凌科技加入广东省人工智能产业协会

会员动态 | 热烈欢迎MediaComm美凯加入广东省人工智能产业协会

行业报告丨2024中国生成式人工智能应用与实践展望白皮书（附下载）

关于举办2024年广东省人工智能训练师职业技能竞赛的通知

2024大湾区科学论坛人工智能分论坛暨第五届中国（广东）人工智能高峰论坛在广州南沙召开

AI行业代表共话产业创新发展之路：2024中山大学人工智能—数字经济产业联盟大会采访回顾

智推力之旅：走进广汽集团汽车工程研究院报名开启！

首批人工智能技术基准评测榜单发布

2024大湾区科学论坛人工智能分论坛成功举办；清华AI蛋白工程模型登Nature子刊；百度推出小度AI眼镜|一周热点第71期

广东省人工智能产业协会第一批首席人工智能官（CAIO）正式诞生！

协会专家库丨广州大学网络空间安全学院教授徐光侠

广东省人工智能产业协会实习生招聘启事【长期有效】

职称评审 | 关于2024年度广东省人工智能工程技术人才职称评审继续教育相关事宜的通知

会员动态 | 热烈欢迎扬程电子加入广东省人工智能产业协会

未来学家展望2025年十大人工智能趋势

“未来之后”AI4S第三届国际高峰论坛诚邀您出席！

产业报告丨探索AI新纪元：大模型技术如何重塑未来世界？（附下载）

28万户！广东人工智能组织机构规模领跑全国

2024大湾区科学论坛-人工智能分论坛暨第五届中国（广东）人工智能高峰论坛报名开启！

会员动态 | 热烈欢迎广州盖德（泰克教育）加入广东省人工智能产业协会

共庆中大世纪华诞，2024中山大学人工智能—数字经济产业联盟大会隆重召开

智推力之旅：走进广州赛意信息科技股份有限公司报名开启！

2024科学智能峰会在北京召开；CoreWeave 签下170亿美元合同；小鹏发布AI机器人Iron|一周热点第70期

2024年粤港澳大湾区人工智能产业大会圆满落幕，各大媒体聚焦报道！

智能政策 | 广州市天河区出台多项政策措施，以促人工智能行业大模型产业高质量发展

中山大学百年校庆：人工智能-数字经济校友产业联盟大会报名开启，共探AI与数字经济新发展

会员动态 | 热烈欢迎新烨数码加入广东省人工智能产业协会

AI高层次人才存量不足，高校纷纷抢滩人工智能教育

新技术开辟就业新空间，“广东省人工智能训练师职业技能等级证书”在BAIC人工智能产业大会上正式颁发！

会员动态 | 热烈欢迎小窗智能加入广东省人工智能产业协会

行业报告丨人工智能（AI）在制造业的应用现状调研报告(附下载）

BAIC人工智能产业大会：12位院士齐聚，共探AI赋能产业新篇章

赋能产业发展，粤港澳（南沙）人工智能产业赋能与创新中心成立

Gartner发布2024年中国技术成熟度曲线：复合式AI是中国企业最务实的选择，大语言模型即将步入成熟期

2028年全球AI支出将达6320亿美元；苹果AI正式上线；波士顿动力Atlas进厂实现全自动打工|一周热点第69期

首批66个广东省人工智能典型应用案例在2024年粤港澳大湾区人工智能产业大会发布

你Pick哪个“AI+”案例？广东人工智能赋能千行百业案例征集活动投票开启

会员动态 | 热烈欢迎东信时代加入广东省人工智能产业协会

2024人工智能十大前沿技术趋势展望发布

职称评审 | 关于做好2024年度职称评审工作的通知

2024年度广东省人工智能产业协会科学技术奖正式颁发！

行业公告 | 广东：征集人工智能终端产品、行业大模型和应用解决方案的通知

BAIC人工智能产业大会“人工智能+制造”主题论坛：推动AI与制造业深度融合

《2024年广东省人工智能产业发展白皮书》在BAIC人工智能产业大会上正式发布！

聚焦“AI+教育”：BAIC人工智能产业大会共话智能化教育新未来

「智推力」2024年度广东人工智能风云榜重磅发布！

AI赋能文化新篇章——BAIC人工智能产业大会“AI+文化”主题论坛圆满举行

会员动态丨趣丸科技联合港中大（深圳）开源首个语音大模型，效果全球领先跻身第一梯队

2024粤港澳大湾区人工智能产业大会圆满举办；马斯克旗下xAI发布首个API；科大讯飞发布星火4.0Turbo|一周热点第68期

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉