研究透视:生成式AI-根本没有什么“真”开源 | Nature评述

文摘   2024-11-30 03:57   北京  
近日,美国 康奈尔大学(Cornell University)David Gray Widder等,在Nature上发表评述文章,探讨了“开放open”人工智能 artificial intelligence (AI)。关于“开放”人工智能的声明,往往缺乏精确性,经常忽略对大规模人工智能开发和部署的大量行业集中审查,并且经常错误地将从自由和开源软件引入的“开源”理解应用于人工智能系统。

目前,强大的参与者,正在试图利用“开放”人工智能一方面有利于创新和民主,另一方面不利于安全的主张以制定政策。在制定政策时,定义很重要。

为了让这场辩论更加清晰,研究了人工智能开放性主张的基础,并对人工智能是什么以及人工智能的“开放性”能提供什么和不能提供什么进行了实质性分析:研究模型、数据、劳动力、框架和计算能力。

还强调了“开放”人工智能的三个主要功能,即透明性、可重用性和可扩展性,并且观察到,最大限度的“开放”人工智能,在现有模型的基础上进行某种形式的监督和实验。然而,研究发现,开放本身并不会干扰人工智能的权力集中。

在关键方面Open AI与开源软件不同。不同于开源软件,识别 AI 系统中的危害和缺陷,需要的不仅仅是开放权重和可访问的应用程序编程接口 (API) 或开放许可的 AI 模型(如 Meta 的 LLaMA 模型系列)。

ChatGPT 的工作原理是应用生成式预训练转换器 (GPT) 模型,这些模型是在大量文本数据上训练的,其中大部分是从网络上抓取的。这些 GPT 模型是 ChatGPT 客户端特定软件套件的一部分,其中包括 Web 客户端以及 iOS 和 Android 应用程序,每个应用程序都需要离散的库和专业知识来维护,并且需要熟练的人员来维护。

文献链接

Widder, D.G., Whittaker, M. & West, S.M. Why ‘open’ AI systems are actually closed, and why this matters. Nature 635, 827–833 (2024).

https://doi.org/10.1038/s41586-024-08141-1

https://www.nature.com/articles/s41586-024-08141-1

本文译自Nature。

来源:今日新材料

声明:仅代表译者观点,如有不科学之处,请在下方留言指正!



推荐阅读

大模型行业,根本没有什么“真”开源?

今日新材料
中国材料研究学会每日发布新材料最新动态。
 最新文章