点击蓝字,关注我们
8月30日下午,2024年国家网络安全宣传周上海地区活动徐汇区大模型主题分论坛在上海“模速空间”创新生态社区举行。论坛以“大模型浪潮下的安全挑战”为主题,深入剖析了当前大模型技术飞速发展背景下,信息安全所面临的严峻考验。
据会议透露的数据,截至目前,全国范围内已有188个大模型成功完成了备案,这其中,上海共备案了34个,而徐汇区更是以其卓越的科研实力,占21个,全国26款大模型服务完成登记上线,上海市共20款,其中徐汇7款。除此之外上海还有两批次共计17款大模型正处于紧张的备案流程之中。
模型为什么要备案?
《生成式人工智能服务管理暂行办法》第十七条指出,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。
大模型备案的安全评估是依据《互联网新闻信息服务新技术新应用安全评估管理规定》,《互联网新闻信息服务新技术新应用安全评估管理规定》中所指的互联网新技术新应用是指用于提供互联网新闻信息服务的互联网站、应用程序、论坛、博客、微博客、公众账号、即时通信工具、网络直播以及其他具有新闻舆论属性或社会动员能力的创新性应用(包括功能及应用形式)及相关支撑技术,大模型属于规定所指的新技术新应用范畴。
2月29日,全国网络安全标准化技术委员会正式发布的《生成式人工智能服务安全基本要求》(以下简称“《基本要求》”)。《基本要求》作为大模型备案的配套指引,其第9章“安全评估要求”对备案所需安全评估应涵盖的要点进行逐一细化,第8章“其他要求”及附录A则是对于安全评估材料必备附件的细化要求。
大模型备案流程一览
(1)报请属地网信办,拿到备案表;
(2)企业根据表格及评估要点准备填写材料;
(3)企业内部展开评估,编写相关材料,准备测试账号;
(4)材料附件及测试账号提交属地网信办审核;
(5)属地网信办材料审核及技术测试审核通过后,属地上报中央网信办;未通过,修改材料或调整模型能力后再次提审,具体调整哪方面根据属地网信反馈进行;
(6)中央网信办进行材料复审及技术评审,通过,企业下发备案号;未通过,需重新进行上线备案。
大模型备案材料一览
大模型上线备案表,包含以下具体内容:
1)基本情况:模型名称、主要功能、适用人群、服务范围等。
2)模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。
3)服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。
4)安全评估:基本情况、评估情况。
5)自愿承诺:承诺所填信息真实性,并签字确认。
6)附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。
(2)安全评估报告:提交的报告应包含语料安全评估、模型安全评估以及安全措施评估,并应在评估报告中形成整体评估结论。每一类评估的要求可参考《基本要求》中的具体条款。
(3)模型服务协议:一般包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交。
(4)语料标注规则:包括标注团队介绍、功能性及安全性标注细则,标注流程等。
(5)拦截关键词列表:总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。
(6)评估测试题集:
1)该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。
2)测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。
3)测试题建议是“问题”(包含主谓宾),不可只是短词、长文章。
4)生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。
备案注意事项
1.在准备备案材料时,务必直接从官方网站下载所有所需的表格和指南,避免从非官方途径获取文件,以免因版本差异导致内容不一致,影响备案流程的顺利进行。
2.若需将纸质标准文档转化为电子版进行填报,切记保持原始文件的完整性和准确性,不可擅自删改、调整原有内容或格式,确保电子文档与纸质版完全一致。
3.提交的所有备案信息应基于事实,做到真实、客观且公正,坚决杜绝任何虚假陈述或与实际情况不符的描述,维护备案资料的严肃性和可靠性。
4.对于利用第三方开源模型作为基础,进行二次开发形成自家大模型的情况,务必在“模型研制”章节详细列出所用开源基座的具体信息,包括但不限于模型名称(精确到B级别)、备案单位、备案时间、备案编号以及采用的模式(如商业合作或免费开源)。在介绍训练数据时,只需聚焦于新增部分,同时确保训练和推理所需算力资源、并发服务等能力与模型规模相匹配。
5.一旦完成备案并获得备案号,企业有责任在其官方网站或其他公开渠道的显著位置,明确标示该备案号,以便公众查阅和监督,彰显透明度和合规性。
关于我们:
算法备案超过200个项目经验,国内算法备案第一梯队,大模型备案也有多个成功案例,欢迎沟通交流。