跟上像人工智能这样快速发展的行业是一项艰巨的任务。因此,在人工智能可以为你做到这一点之前,这里简要总结了机器学习领域的最新故事,以及我们没有单独报道的值得注意的研究和实验。
顺便说一句——TechCrunch 计划很快推出一份人工智能简报。敬请期待。
本周在人工智能方面,投资巨头 Alden Global Capital 旗下的八家著名美国报纸,包括《纽约每日新闻》、《芝加哥论坛报》和《奥兰多哨兵报》,起诉 OpenAI 和微软侵犯了这两家公司使用生成式人工智能技术的版权。他们和《纽约时报》对 OpenAI 的持续诉讼一样,指责 OpenAI 和微软未经许可或补偿就窃取他们的知识产权,以建立和商业化 GPT-4 等生成模型。
“我们花费了数十亿美元在我们的出版物上收集信息和报道新闻,我们不能允许 OpenAI 和微软扩大窃取我们作品的大型科技剧本,以牺牲我们的利益为代价建立自己的业务,”负责 Alden 报纸的执行编辑 Frank Pine 在一份声明中表示。
鉴于 OpenAI 与出版商的现有合作关系以及其不愿将其整个商业模式建立在合理使用论点上,该诉讼似乎可能会以和解和许可协议告终。但是,其他内容创作者的作品在没有报酬的情况下被卷入模型训练中,该怎么办?
OpenAI 似乎正在考虑这个问题。
OpenAI 超级对齐团队的科学家 Boaz Barak 共同撰写的一篇最近发表的研究论文提出了一个框架,以“按比例向版权所有者补偿他们对 AI 生成内容的贡献”。如何补偿?通过合作博弈论。
该框架使用称为 Shapley 值的博弈论概念来评估训练数据集中的内容(例如文本、图像或其他数据)对模型生成内容的影响程度。然后,根据该评估,确定内容所有者的“合法份额”(即报酬)。
假设您有一个使用四位艺术家的作品训练的图像生成模型:John、Jacob、Jack 和 Jebediah。您要求它以 Jack 的风格画一朵花。使用该框架,您可以确定每位艺术家的作品对模型生成的艺术作品的影响,从而确定每位艺术家应获得的报酬。
然而,该框架有一个缺点——计算成本高昂。研究人员的解决方法依赖于报酬估计,而不是精确计算。这会让内容创作者满意吗?我不太确定。如果 OpenAI 有一天将其付诸实践,我们肯定会发现。
以下是过去几天值得关注的其他一些 AI 故事:
微软重申禁止使用面部识别:Azure OpenAI 服务(微软完全托管的 OpenAI 技术包装器)的服务条款中添加了更多语言,更明确地禁止美国警察部门“使用或为”警察部门使用集成进行面部识别。
AI 原生初创公司的性质:AI 初创公司面临的挑战与典型的软件即服务公司不同。这是 Glasswing Ventures 创始人兼执行合伙人 Rudina Seseri 上周在波士顿的 TechCrunch 早期活动上传达的信息;Ron 有完整的故事。
Anthropic 推出商业计划:AI 初创公司 Anthropic 正在推出一项针对企业的新付费计划以及一款新的 iOS 应用。团队——企业计划——为客户提供更高优先级的 Anthropic Claude 3 系列生成 AI 模型访问权限以及额外的管理员和用户管理控制。