双语动态 | 索尼音乐发函人工智能公司,版权成为AI训练“拦路虎”?

文摘   2024-05-21 01:01   重庆  
随着人工智能大模型如火如荼发展,互联网数据已经成为AI训练的主要数据来源,但近期索尼音乐向全球700多家从事人工智能业务的公司发函,警告他们在没有获得明确授权的情况下,不得使用索尼音乐的版权元素训练人工智能大模型,对已经发生的侵权行为,公司将保留追溯权利,这些公司包括OpenAI、微软、谷歌等。在AI训练的过程中,我们应如何处理数据版权问题,目前全球范围内的主流做法又是怎样的呢?


01
事件
近期,索尼向数百家人工智能公司和音乐流媒体平台发出了信函,警告不要“未经授权使用”SMG(索尼音乐集团)内容,包括专辑封面、元数据、音乐作品和歌词,用于“人工智能系统的培训、开发或商业化”,索尼认为这种做法剥夺了公司及其艺术家的控制权和正当赔偿为他们的创意作品。索尼音乐在发给 700 多家公司的信中表示,它们“有理由相信”收件人“可能已经未经授权使用”了其音乐。

(It has "reason to believe" that the addressees "may already have made unauthorized uses" of its music.)

索尼音乐的投诉反映了人工智能模型出现以来一直激烈争论的问题,这些模型接受了哪些数据的训练?以及他们是否寻求使用这些数据的许可?目前主流的人工智能如ChatGPT、Sora、Suno等大模型,其数据主要来源于网络的文本、视频与音频,但这些数据仍处于“黑箱”状态,而这些互联网公司未公开的数据,正在成为人工智能发展存在的隐患,索尼音乐的这一举动反映生成式人工智能引发的版权侵权焦虑和法庭案件。



02
国内措施
随着AI发展态势的上升,在我国AI版权案件也在逐渐增加,出现了“AI视听作品侵权案”“AI声音侵权案”等首例案件,对于人工智能公司侵权问题,我国也出台了相应的法律条令。2023年8月15日起实施的《生成式人工智能服务管理暂行办法》第七条指出:生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,涉及知识产权的,不得侵害他人依法享有的知识产权,涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。



03
国外措施

在全球范围内,人工智能公司的数据侵权在不断出现,美国音乐行业在积极游说联邦立法,保护艺术家的声音和图像免遭未经授权的人工智能使用;部分欧洲国家,其鼓励版权所有者公开声明其内容禁止用于数据挖掘和人工智能培训,除非存在特定的许可协议;欧盟即将出台的世界首部《人工智能法案》要求所有通用人工智能模型必须遵守严格的文档和透明度要求,包括公开披露所使用的训练数据的详细摘要的义务,遵守版权所有者的选择退出,并确保所有数据的使用符合欧盟版权法。




目前世界各国对于AI训练过程中的版权问题都在不断出台法令加强监管,尤其是服务提供商的侵权行为,新的法案与条例的出台,如《人工智能法案》可能成为全球AI治理和监管格局的一个“分水岭”,其影响或将超出欧盟的边界,甚至为全球AI治理建立新的标准。


END

推荐阅读>>>>>
近十年“新闻传播+版权”的国家社科基金项目整理好啦!
论文荐读 | 版权制度如何保护主流媒体的新闻权益
媒知科普 | @所有人 版权宣传周来啦!网上“冲浪”的你小心别踩坑


编辑:张   宇

主编:韩玉珂


新传春田
探索媒介版权的精彩世界!本公众号汇聚了媒介版权领域的最新资讯、学术观点、相关政策等,为广大读者提供通俗易懂的案例分析,引领您深度解读媒介版权的前沿信息。关注我们,分享热点,掌握新知!
 最新文章