首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
诉讼频发!AI训练“盗用”版权内容,建立共享数据库迫在眉睫?
科技
2025-01-20 22:11
广东
👆👆👆
重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为
★
星标,否则很可能看不到推送了......
AI很强,但并不能无中生有。
AI具备的能力,本质上来自算法和训练大模型所用的数据,数据的数量和质量会对大模型起到决定性作用。此前OpenAI工作人员表示,因没有足够多的高质量数据,Orion项目(即GPT-5)进展缓慢。不得已之下,OpenAI招募了许多数学家、物理学家、程序员原创数据,用于训练大模型。
AI公司在数据方面面临的难题远不止于此,因频频侵权造成的版权问题,正困扰着AI公司。大型AI公司有足够的资源和精力应对侵权问题,小公司一旦收到大量起诉,很可能遭受灭顶之灾。
版权,AI行业的又一块绊脚石
自从ChatGPT诞生,版权之争就已开启。最初反对AI的人以画师为主,AI公司用他们的作品训练大模型,又抢了他们的工作。但当时AI大模型训练所需的数据量不够大,不至于得罪太多人,画师群体规模小,能够发出的声音和起到的效果有限。
可AI大模型功能不断强化能力的同时,对于数据的需求量也与日俱增。
除了公开的科学论文,AI公司还会抓取社交平台上的帖子、媒体发布的新闻报道等信息。社交平台上的帖子还好说,要求不是特别严格,可媒体上的新闻报道却存在版权。
(图源:豆包AI生成)
2024年11月底,加拿大《多伦多星报》及旗下的五家媒体,向OpenAI发起诉讼,称其在未经允许的情况下从加拿大媒体抓取内容训练大模型,要求OpenAI为使用的新闻报道每篇支付2万加元(约合人民币10万元),总金额估计有数十亿加元。
面对《多伦多星报》的指控和天价赔偿要求,OpenAI自然矢口否认,并发表声明称训练AI大模型以公开数据为基础,以公平使用和国际版权原则为依据,对于创作者是公平的。
不只是加拿大媒体,美国的The Intercept、《纽约时报》、Raw Story、AlterNet ,印度的ANI,以及德国版权机构GEMA等,都曾起诉过OpenAI。
因视频生成和音频生成大模型日渐成熟,AI公司引发的版权问题也愈发严重。2024年6月,美国唱片协会起诉了Suno和Udio两家AI音乐公司。
国内AI行业存在相同的问题,例如位列中国AI大模型六小龙之一的MiniMax,因未经授权使用爱奇艺的素材训练海螺AI,日前遭遇爱奇艺起诉,被索赔10万元。
(图源:MiniMax)
更有甚者,不但侵犯作品的版权,还侵犯了公众人物的肖像权。例如著名的AI孙燕姿、AI雷军事件,某些网友利用AI合成技术让孙燕姿演唱各种歌曲,让雷军“口吐芬芳”。2024年4月23日,国内首例AI生成声音人格侵权案宣判,被侵权的殷女士获胜,侵权公司赔偿其25万元,总算给创作者们一丝安慰。
OpenAI面对侵权起诉时,虽表示训练AI大模型以公开数据为基础,但公开并不意味着数据无版权。
摄影师拍摄的图片、编辑创作的文章等内容,都存在版权,放任AI公司随意抓取,无疑是在侵害创作者的利益。
长此以往,创作者的创作热情和信心难免受到打击,减少内容创作。如此一来,训练AI大模型的数据也将更加捉襟见肘,影响到AI行业的正常发展。
如何维护创作者的合法权益、打击侵权行为,已成为AI行业必须解决的问题。
成立“共享数据库”势在必行
前段时间国内AI公司DeepSeek基于数据蒸馏方案,以其他AI大模型为教师模型,训练出了参数量和占用资源更少,且训练成本极低的DeepSeek-V3大模型。但因回答用户问题时自称“ChatGPT”,DeepSeek-V3遭遇OpenAI CEO山姆·奥特曼嘲讽。自认为没有侵权加拿大媒体的OpenAI,面对其他AI公司对他们可能存在的侵权行为却表现得十分不满。
无论山姆·奥特曼如何否认,OpenAI侵权的行为已经坐实,且侵权问题在整个AIGC行业普遍存在。
为处理更多、更复杂的问题,未来先进AI大模型的参数还会不断增加,对于数据量的需求也会越来越高。
尤其是视频生成和音频生成大模型的到来,侵权行为将更加广泛、更加频繁。
(图源:豆包AI生成)
解决版权纠纷源头上需要相关部门制定相应的法律法规,限制AI公司侵权,保护创作者的权益。2022年12月印发的《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》,对待AI公司使用互联网公开内容的态度是,淡化所有权、强化使用权,如涉及商业使用,则需要向创作者支付费用。
2024年11月19日在西安举办的中欧数字环境下版权保护研讨会上,主办方强调将以《中华人民共和国著作权法实施条例》为修订契机,完善制度设计,保护著作人的合法权益。
中国版权协会理事长阎晓宏表示,从技术角度来看,使用有版权的作品要公布版权信息,原则上要获得作品的授权,但实际上是做不到的。究其原因,
企业训练AI大模型的数据来源过于复杂,媒体的新闻报道、个人发布的帖子、科研机构的论文、各大公司报告等,很难一一统计和申请授权。
因而还需要全球互联网企业、学术研究机构联合起来,打造一个共享数据库,对互联网上公开的数据进行标注,明确版权归属。
AI公司需要数据时,必须与互联网公司和学术研究机构成立的联盟合作,商谈能够调用哪些数据、需要支付多少成本。互联网公司联盟在打造共享数据库的同时,也要与创作者沟通合作,取得创作者的授权并支付相应的费用后,才能将内容加入数据库中。
(图源:豆包AI生成)
这样一来,掌握大量数据的互联网公司将承担起“中间商”的责任,同时与创作者和AI公司对接,即保障了创作者可以获取收益,本身也能从中抽取一定的利润。
对于腾讯、百度、字节跳动、FaceBook、X等国内外互联网公司而言,还多出了一条信息变现渠道。
AI公司虽要花钱购买数据,但抓取数据的难度大幅降低,获取数据的渠道也会增多,反而能够减少一部分成本。
OpenAI工作人员吐槽数据不够用,实际是公开且易获取的数据不够用了。互联网宛如一座冰山,只有三分之一浮在水面上,剩下的三分之二则藏在水底。唯有AI公司愿意付出相应的成本,才能够利用这部分数据训练大模型。
健全的数据共享机制,是AI的基石
OpenAI前员工Ilya Sutskever曾表示,数据是AI的化石燃料,而这份燃料即将耗尽,但我们只有一个互联网,最大化数据的时代已经过去了。再加上原定2024年中后期面世的GPT-5迟迟未能完成训练,不少人已在怀疑,人类社会的数据不够支撑AI行业进入下个阶段。
事实上,人类社会每时每刻都在产生新数据,《全国数据资源调查报告》显示,2023年中国数据产生总量高达32.85ZB(泽字节),平均每天产生900亿GB数据。
(图源:豆包AI生成)
在网络渗透进我们生活、办公、娱乐等各个领域,并覆盖全球接近70%人口的今天,用于训练AI大模型的数据不够用是个伪命题。对于AI公司而言,难点在于如何将有效数据提取出来。
相关部门提供法律基础、互联网巨头合力打造数据库,筛选有效数据并保障创作者权益,无疑是最省时省力的方案。过去AI企业不缺数据,又想着吃独食,没有打造共享数据库的意识。
如今形势发生变化,易获取的数据不足以支撑AI行业进入下个阶段,唯有所有企业消除隔阂齐心协力,方能渡过数据量不足的难关。
在元宇宙、区块链、3D打印、常温超导、人工智能等诸多被认为可能是第四次工业革命导火索的产业中,目前看来最有希望引领人类开启第四次革命的就是人工智能和与其相关的机器人产业。
为了推动和规范行业发展,2024年10月21日的德国数字峰会上,德国施瓦茨数字公司和德国铁路公司宣布成立“欧洲数据中心”,旨在为AI公司训练大模型提供数据支持。
该会议结束后仅一个月,中欧数字环境下版权保护研讨会就在西安召开,表明中欧相关部门和企业有意合作,共同构建AI行业发展基石。
相信在全球诸多国家、企业的合作之下,未来数据将不再是困扰AI公司的难题。内容创作者在提供数据帮助AI公司训练大模型的同时,也将能够从中获利,告别频繁被侵权却拿不到任何收益的时代。
关注&设星标,两步不失联
👇👇👇
2024科技大盘点:
1、24年最伟大10款科技产品榜单出炉:款款王炸,AI为王!
2、
雷科技编辑2024买了啥?手机、耳机最受宠,可穿戴无人问津?
手机行业的2024:
1、2024年十大爆款手机:款款都凶残,国产厉害了
2、24年国产手机赢麻了!苹果三星全面溃败
3、2024旗舰手机盘点:影像和AI才是今年的关键词
4、千元机,逆袭了!!!
5、2024年,线下手机彻底杀疯了!
6、
2024年,细分手机杀疯了!
7、果味手机,彻底火了!!!
8、
2024年手机狂卷创新:十大技术起飞,一切为了“更实用”
9、手机影像卷疯了!九大趋势下,安卓全面碾压iPhone
10、2024年,年度最无用的手机设计!
11、24年手机配置开倒车!摄像头减少、屏幕变小,连充电都慢了!
智能硬件的2024:
1、2024年,无线耳机杀疯了!
2、2024年的运动相机:大疆GoPro影石斗法,“御三家”死磕产品
3、智能清洁的2024:七大硬核技术突破,产品创新空间依然巨大
4、2024年平板电脑卷疯了:AI强化生产力,告别“泡面盖”
5、2024年教育硬件大爆发!5款经典产品,款款AI驱动
6、2024年智能眼镜杀疯了!不只是AI,还有这七大变化
7、智能手表2024的五大趋势:健康、AI、颜值、续航……
8、2024年度电视盘点:MiniLED成白菜价,国产旗舰狂卷画质
9、2024年年度游戏机出炉!性能升级成大主题,“移动时代”来了
PC行业的2024:
1、2024年8大年度PC榜单出炉:靠设计创新,用AI破局
2、PC DIY的2024:从低迷中走出,大厂纷纷押注AI
AI软件的2024:
1、2024年十大国产大模型盘点:款款超能打,黑马却是这家?
2、
九大年度APP出炉!要么AI原生应用,要么AI重塑应用
3、
AI输入法谁最强?2024年度大模型输入法榜单来了!
科技公司的2024:
1、苹果的2024:产品平庸,AI遇阻,生态墙倒塌!
2、高通骁龙的2024:从移动之王到智能世界的基石
3、联发科的2024:甜点芯守基本盘,旗舰芯冲高端,靠AI赢麻了
智能汽车的2024:
1、2024十大爆款神车出炉!比亚迪占了一半,智能化还只是小众需求
2、自主五常销量公布:比亚迪赢麻了,25年五常变四强?
3、2024智驾风云榜:华为小鹏争霸,“蔚小理”加速,老车企转身
4、2024年汽车十大技术趋势盘点:智能化成了潮水的大方向
5、25年车圈淘汰赛加速!哪吒、远航危险了,微小型车被逼上绝路?
汽车公司的2024:
1、2024,比亚迪活成“卷王”
2、2024年,鸿蒙智行彻底杀疯了!!!
3、2024深蓝汽车赢麻了!多亏了华为?
4、小鹏汽车的2024:上演教科书式逆袭,四面出击下忧患犹存
5、理想的2024:Mega出师不利,卖车、智驾、出海步步为营
智能Pro
关于AGI、大模型、数智化的一切。
最新文章
狂砸400亿买卡!字节重注AGI,张一鸣有何阳谋?
15万字,看透科技圈的2024!!!
福利价69元!「灯芯绒卫裤」软糯抗皱耐磨,穿上秒变大长腿,有型有温度...
AI贺卡、手机主题齐上阵,手机厂商春节营销卷疯了!
狂砸3.6万亿组建巨鳄联盟!OpenAI猛虎下山,谁赢麻了?
福利价119元!通勤上学百搭「保暖裤」过年回家,秋裤绒裤都省了...
别等小米NAS了!一款软件让PC秒变NAS:体验到底如何?
以实用价值跑通AI商业化 未来智能获数千万元新融资
锤子手机要再次回归了?罗永浩爆出的大瓜有点炸啊
仅百元!新年「三合一冲锋衣」现1折清仓,性价比绝了!实在是太太好穿了...
诉讼频发!AI训练“盗用”版权内容,建立共享数据库迫在眉睫?
79元福利价,新年活动手慢无!原价1000+「哈灵顿风夹克」,真维斯正品直发!
突发!赵明去职CEO,荣耀要靠AI了?
仅百元!新年「三合一冲锋衣」现1折清仓,性价比绝了!实在是太太好穿了...
春节返乡准备带什么?全网最强数码年货清单来了!
苹果最强芯片曝光!超越M4 Ultra,瞄准AI PC?
支付宝再度掀起集五福大战!春晚红包下半场怎么打?
新年福利价69元!性价比高「盖毯」当沙发毯、空调毯,温柔9色!绝对超值...
翻译软件迎接小红书泼天“洋流量”:百度、有道、谷歌哪家强?
讯飞星火4.0 Turbo大升级:这一次,数学能力远超GPT-4o?
福利价89元!秋裤再见!今冬巨暖的「羊羔裤」版型好、显腿长,保暖一件搞定!
ChatGPT任务模式上线!体验太炸裂,智能体要爆发了?
仅百元!新年「三合一冲锋衣」现1折清仓,性价比绝了!实在是太太好穿了...
小米NAS,终于来了!!!
L3级自动驾驶能上路了!25年无人出租车要爆发了?
手机AI大乱斗!小米/荣耀/OPPO/vivo,谁家最能打? | 视频
福利价仅75元!新年上新「真维斯CLUB棉服」,52年国际品牌棉服,男女同款...
AI生成病毒曝光!黑客零门槛时代,只有AI才能对抗AI攻击?
外国人在CES上,围观爱奇艺大剧 | 视频
单挑华为?小米新机猛得一塌糊涂!
CES 2025收官,雷科技报道团凯旋!40+内容,10万+字,AI硬科技超全集锦来了
福利价89元!秋裤再见!今冬巨暖的「羊羔裤」版型好、显腿长,保暖一件搞定!
8万步暴走CES,我们总结了9个关于AI硬科技未来的答案
智能清洁狂卷CES:追觅机械手炸场,云鲸拼体验,还有一匹黑马
充电产品狂卷CES:自带线、全场景和屏显,三大趋势已明
芯片巨头狂卷CES:AMD、英特尔一起给AI PC再添一把火
CES上的汽车科技:车企集体押注AI,终将成为AI公司?
CES上AI投篮机、AI手杖火了,AI硬件终于开窍了?
瞄准沉浸式体验,索尼这项黑科技在CES 2025杀疯了?
miniPC成CES 2025上的一道风景线,能否干翻Mac mini?
福利价79元,男生必备「都市休闲胸包」容量超大,巨能装,非常好用...
绿联AI NAS炸场CES!NAS 2.0时代来了!
QD-OLED颤抖吧!RGB-Mini LED来了
PC厂商狂卷CES:联想猛攻AI,ROG、雷神与机械死磕电竞
汽车黑科技狂卷CES:智舱和智驾狂秀肌肉,整车智能未来已来?
CES上的可穿戴:智能手表手环遇冷,智能戒指成了大爆款
这才是真的“卷”!联想发布全新卷轴屏笔记本 | CES直击
OpenFit 2发布!骨传导之王韶音,成为开放式耳机先锋
百元入!乐途爆火⌈户外鞋⌋,跑鞋底安在户外鞋上,仿佛给脚上弹簧!
用了讯飞星火智能体,我的“年终”焦虑有救了
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉