扫码订阅《中国信息安全》
邮发代号 2-786
征订热线:010-82341063
开展模型训练的合理使用
生成式人工智能全生命周期主要阶段包括模型训练、应用运行和模型优化等阶段,涉及开发者、服务提供者、服务使用者等多方主体。模型训练阶段涉及大量数据收集、数据清洗、分词后用于模型训练和验证。生成式人工智能的数据来源主要分为两个部分:第一部分为生成式人工智能的训练数据库,内容几乎涵盖所有能收集到的人类数字化信息,包括公共数据、网络信息、数字化图书、自媒体对话数据集、报纸杂志、科学论文等,可能遭遇知识产权瓶颈;第二部分为生成式人工智能在服务用户的过程中所收集和输出的信息,也就是人工智能合成数据收集,可以减少知识产权风险。生成式人工智能的治理应顺应技术发展给社会生产带来的变化,改变原有的“技术支持者—服务提供者—内容生产者”的监管体系,构建“基础模型—专业模型—服务应用”的生成式人工智能分层治理体系。
人工智能生成内容的著作权问题
《民法典》规定网络服务提供者责任承担的一般原则,即网络服务提供者无须为用户利用网络服务的侵权行为承担责任,但对于其知道或应当知道的网络用户侵权行为应及时采取必要措施以避免损害扩大。在人工智能面向终端用户提供服务的场景下,生成内容是算法自身基于对人工智能服务使用者输入内容的理解,通过算法生成的方式完成。由于人工智能需要利用现有作品进行模型训练,通过依赖训练作品形成的算法模型产生人工智能生成内容,不可避免的携带训练作品的记忆或痕迹,可能呈现出训练作品的某些元素、特征、风格等。如果人工智能生成内容与训练作品在表达上构成实质性相似状况,则可能存在侵权风险。目前我国《著作权法》中著作权属主体不包括人工智能模型,因此人工智能模型本身是否能够成为《著作权法》保护的主体存在争议。在当下的司法实务中,通常是由生成式人工智能的使用者向法院请求著作权保护的方式进行维权。北京互联网法院近期针对人工智能生成图片作品(AI绘画图片)著作权侵权纠纷作出一审判决,认定人工智能生成的图片作品体现了原告的智力投入,具备“智力成果”要件和“独创性”要件,应当认定为作品,受《著作权法》保护,体现了人工智能绘画作品保护的司法创新。人类大量投入研发、优化的人工智能算法生成的内容应当被认定为满足“创造性”的要求。法院认可自然人对其利用人工智能绘画大模型生成图片在符合一定条件下享有知识产权,有利于保护和强化人在人工智能产业发展中的主导地位,鼓励人们使用人工智能软件创作更多高质量作品,促进新技术、新业态的健康发展。该判决填补了人工智能技术快速发展导致《著作权法》保护滞后的空白。
(来源:人民邮电报)
分享网络安全知识 强化网络安全意识
欢迎关注《中国信息安全》杂志官方抖音号
《中国信息安全》杂志倾力推荐
“企业成长计划”
点击下图 了解详情