马斯克的X’ Grok-1大模型预训练:在9个欧盟国家遭受举报!
百科
2024-08-16 22:23
阿根廷
Twitter(现已更名为“X”)是马斯克的大本营,GroK是X的AI计划之一。而现在,数据保护组织noyb对X也发起了挑战。noyb认为,X已开始非法使用欧盟/欧洲经济区 6000 多万用户的个人数据来训练其 AI 技术(如“Grok”),而无需征得用户的同意。与 Meta(最近也不得不停止在欧盟进行 AI 训练)不同,Twitter 甚至没有提前通知其用户。最近在欧盟关于X的新闻是,2024 年 8 月 8 日,爱尔兰数据保护委员会 (DPC) 对 X 同意暂停处理其欧盟/欧洲经济区用户公开帖子中包含的个人数据表示欢迎。而早在2024 年 6 月 14 日,爱尔兰DPC 就已对 Meta 暂停使用欧盟/欧洲经济区成年人在 Facebook 和 Instagram 上分享的公开内容训练其大型语言模型的决定表示欢迎。但这两个欢迎没能阻止noyb对Grok提出九个跨国家的投诉。根据X披露,Grok 是一项新的增强搜索功能,可供 X Premium 和 Premium+ 用户使用,由 xAI 最先进的大型语言模型 (LLM) (Grok-1) 提供支持。Grok 受到《银河系漫游指南》和《钢铁侠》中的贾维斯的启发,旨在以诙谐幽默的方式回答几乎所有问题,同时提供有用且富有洞察力的回答。Grok 具有叛逆的性格和对人类的外部视角,使其成为一个独特而有趣的伙伴。Grok-1 利用下一个标记预测模型权重(预测最有可能跟随给定文本序列的单词或符号的模型)来了解如何执行某些任务。与当今大多数 LLM 一样,Grok-1 已由 xAI 预先训练,训练内容包括截至 2023 年第三季度来自互联网公开来源的各种文本数据,以及由人工审阅的 AI 导师审阅和整理的数据集。Grok-1 尚未在 X 数据(包括公开的 X 帖子)上进行预先训练。Grok在声明中披露:“为了不断改善您的体验,我们可能会利用您的 X 帖子以及您与 Grok 的用户互动、输入和结果进行训练和微调。这也意味着当您与 Grok 互动时,您的互动、输入和结果可能会用于训练和增强系统的性能。作为 Grok 的用户,您可以灵活地控制如何使用您的帖子以及您与 Grok 的互动、输入和结果来训练和微调底层模型。下面您可以看到如何通过管理 X 上的隐私设置来选择退出。”我仔细查看了Grok的声明,开关至少需要四步进入,默认打开的状态。noyb认为,爱尔兰 DPC 采取了半心半意的监管行动,认为但从口头听证会中了解到,DPC 并没有质疑这种处理本身的合法性。DPC 似乎担心所谓的‘缓解措施’和 Twitter 缺乏合作。DPC似乎在边缘采取行动,但回避了核心问题。在第一次听证会期间,爱尔兰 DPC 已与 Twitter 达成和解(通过所谓的“承诺”),暂停使用欧盟数据对该算法进行进一步训练。但是,爱尔兰 DPC尚未就合法性做出任何决定,许多问题仍未得到解答。例如:已经输入系统的欧盟数据发生了什么,Twitter 如何(正确地)分离欧盟和非欧盟数据?为此, noyb已向九个国家(奥地利、比利时、法国、希腊、爱尔兰、意大利、荷兰、波兰和西班牙)的数据保护机构提交了 GDPR 投诉,以确保充分解决围绕 Twitter 人工智能训练的核心法律问题。参与诉讼程序的其他欧盟 DPA 越多,爱尔兰 DPC 完成其案件的压力就越大,Twitter 也面临着真正遵守欧盟法律的压力。noyb的投诉列出了至少违反 GDPR 第 5(1) 和 (2)、6(1)、9(1)、12(1) 和 (2)、13(1) 和 (2)、17(1)(c)、18(1)(d)、19、21(1) 和 25 条的行为。noyb主席 Max Schrems 表示:“过去几年,我们看到了 DPC 无数次执法不力和不全面的情况。我们希望确保 Twitter 完全遵守欧盟法律,该法律至少要求在这种情况下征求用户的同意。 ”为了处理个人数据,Twitter 必须依赖 GDPR 第 6(1) 条规定的六个法律依据之一。虽然合理的选择是选择同意,但 Twitter(与 Meta 非常相似)声称,它拥有凌驾于用户基本权利之上的“合法利益”。在有关 Meta 使用个人数据进行定向广告的案件中,这种做法已被法院驳回。
AI实践派
算法备案,大模型备案,数据出境,AI合规