CCF 大模型安全挑战赛获奖队伍公示！

学术 2024-10-20 22:28 浙江

Datawhale赛事

主办单位：中国计算机学会（CCF）

大模型技术蓬勃发展，大模型应用潜在的安全风险与隐患也日益凸显，引起国内外广泛关注和担忧。确保大模型准确响应用户指令并保证输出内容的安全合规性，对于其在实际业务场景中的应用至关重要。

赛事概况

针对前述问题，中国计算机学会（CCF）作为主办单位，中国计算机学会大模型论坛执行委员会（CCF FoLM）作为承办单位，携手清华大学基础模型研究中心举办了CCF 大模型安全挑战赛活动。本届挑战赛自 2024 年 6 月 20 日启动，2024 年 8 月 6 日截止。挑战赛设置两个赛道任务：「通用的大模型目标劫持」和「内容安全检测器的红队攻击」，吸引了来自全国各地的数十所高校、科研院所及相关企业共计「679」支参赛队伍。

获奖情况

本次赛事奖金池总计人民币 30 万元，每个赛道分别设置 15 万元。具体获奖情况如下所示：

赛道 1：「通用的大模型目标劫持」

赛题背景：确保大模型准确响应用户指令，对其在实际业务中的应用至关重要。然而，大模型面临任务指令被劫持的风险，即通过在初始任务指令后添加劫持指令，令模型放弃初始任务而执行特定劫持任务，严重影响其可用性

赛题描述：主办方为大模型设定初始任务，参赛者需要设计攻击指令进行劫持，使大模型放弃初始任务而执行主办方指定的目标任务。

获奖团队：

赛道 2：「内容安全检测器的红队攻击」

赛题背景：对大模型生成内容进行安全检测，是确保其安全输出的重要环节。然而，随着大模型语言能力的增强，其可能通过丰富的语言技巧生成隐式的不安全内容，绕过内容安全检测，导致不安全输出

赛题描述：参赛者自主构建 query-response 的单轮对话，诱导内容安全检测模型误判对话回复的安全性

获奖团队：

颁奖仪式

颁奖仪式将于「10月26日」于浙江横店举行的 CNCC2024-大模型的安全与超级对齐论坛举行，届时论坛主席及来自相关支持单位的嘉宾将为获奖队伍颁发证书，并对他们的优异表现给予表彰。

CNCC2024-大模型的安全与超级对齐论坛由 CCF 大模型论坛常务委员、清华大学黄民烈教授；中国人民大学严睿教授担任共同主席，汇聚了来自各个领域的专家学者，共同探讨大模型及超级智能所面临的安全挑战与对齐问题。与会专家将分享最新研究成果，交流实践经验，致力于推动大模型技术的安全发展和负责任的应用。

组织信息

主办单位：中国计算机学会（CCF）
承办单位：CCF 大模型论坛执行委员会（CCF FoLM）
联合承办：清华大学基础模型研究中心
协办单位: OPPO 广东移动通信有限公司、蚂蚁技术研究院、北京并行科技股份有限公司、北京无问芯穹科技有限公司
平台方：阿里天池、HackingGroup

有任何疑问，请联系大赛组委会：llmsafetycomp@yeah.net

关于 2024 年中国计算机大会（CNCC）

2024 年中国计算机大会（CNCC）将于 10 月 24-26 日在浙江省东阳市横店举办，大会主题为“发展新质生产力，计算引领未来”。

CNCC 是一个宏观论述技术趋势的大会，具有规格高、规模大、内容丰富等特点，会议形式包括大会特邀报告、大会论坛、技术论坛、特色活动及展览。

CNCC2024 汇聚图灵奖获得者、两院院士、国内外顶尖学者、知名企业家等亲临大会，展望前沿趋势，分享创新成果。ACM、IEEE CS、IPSJ、KIISE 等国际计算机组织的代表也多次获邀现场参加这一盛会。

感谢所有参赛者的积极参与以及各支持单位的鼎力支持，期待大家相聚CNCC2024-大模型的安全与超级对齐论坛，共同为大模型的安全治理贡献力量！

一起“点赞”三连↓

http://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247685579&idx=1&sn=ae3a1d8fb5128539da5384bf3d0ab133

Datawhale

一个专注于AI领域的开源组织，汇聚了众多优秀学习者，使命-for the learner，和学习者一起成长。

最新文章

上海交大教授建议：Datawhale给开源AI通识课新命名

火了！一份AI领域的经典论文清单！

2025 QS 亚洲大学排名公布！197所中国高校上榜！

谷歌2024博士奖学金名单公布

微软 AI CEO 清华演讲全文（建议收藏）

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

线下百校联动，AI线下共学活动开放报名

2025冬季科创营报名启动

导师：自己每天科研工作近10小时，都觉得不够。研究生们：每天工作不够5小时，拿什么去竞争？

李飞飞团队新作：空间智能版ImageNet来了！

大模型2.0读书会来了！融合学习与推理的大模型新范式

教授何恺明在MIT的第二门课！

知名开源项目阿里官宣停更，太痛了

ACL 2024亮点：RAG技术进展与论文解析

组队学习首次开放许愿啦！下个月想学什么，听你的

报名开启 | 11月8日 Google活动来华师大了

实测讯飞智作，一张照片定制属于自己的数字人

十一月组队学习来了！

Datawhale公益组，帮孩子找到兴趣和热爱

《OPEN AI通识课》重磅发布！Datawhale 联合浙江大学智海 Mo 平台

刚刚，阿里全球数学竞赛决赛结果公布！姜萍违反预选赛规则未获奖

沈向洋在青年科学家50²论坛的演讲全文：关于大模型的10个思考

时代变了！英伟达纳入道琼斯指数，英特尔被取代

库克：我从乔布斯那里学到的

阿里、京东、鹅厂、小米不同职级薪资待遇一览表

Runway CEO喊话：我们不是一家 AI 公司

马斯克正在用他的方法「拯救世界」

神秘模型“小熊猫”一夜霸榜，疑似中国制造

本周六，北京中关村见！

Claude喜提清华物理特奖得主，学物理的都去搞大模型了？

薅优惠GPU算力机会来了！

一篇具身智能的最新全面综述！（下）

一篇具身智能的最新全面综述！（上）

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

今年的1024，一些有趣的AI观察

稚晖君玩了个大的：开源人形机器人全套图纸+代码！

论文发表难！OpenAI又有高管走了，还发了长篇离职信

10月29日，上海阿里见！

Datawhale AI+X高校行于复旦大学圆满举行！

值得去的20家IT公司及薪资（杭州篇）

实验室一块GPU都没有怎么做深度学习？

卷疯了！美国AI博士生「人手10篇顶会」

华为不同职级薪资待遇一览表

李飞飞最新访谈：AI十年，她所看见的世界

本周五，合肥见！

CCF 大模型安全挑战赛获奖队伍公示！

陶神回应：AI还无法达到他12岁时的水平

又一外企巨头在中国裁员了

4所高校、1000+师生受益，9月AI+X高校行圆满举行！

Yann LeCun最新万字演讲：致力于下一代AI系统，我们基本上不做LLM了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉