2022年11月30日,OpenAI公司发布ChatGPT。
以ChatGPT为代表的大语言模型,头一回在世人面前展示了机器也可以像能说会道的人那样口若悬河、谈笑风生。
面对机器的这种“惊人”能力,有两派针锋相对的观点,不妨分别称为“认为AI真懂派”和“认为AI不懂派”。前一派认为ChatGPT(特别是2023年3月份推出的更高级版本GPT-4),已经真懂人类语言了,具有了真正的语言理解能力,甚至有人担忧AI已经具备自主意识了。后一派认为大语言模型,哪怕能力强如GPT-4,也还不是真正的理解人类语言,仍然只是在模仿人类语言的字符分布模式。
到底谁对?很难说清楚。
一 “认为AI真懂派”倾向高估大模型的能力
在GPT-4推出不久,微软公司的研究人员在预印本网站上发布了一篇长达155页的实验报告,详细展示了GPT-4的类人智商水平。其中有一道常识测试题:
(来源:https://arxiv.org/abs/2303.12712)
Prompt: Here we have a book, 9 eggs. a laptop, a bottle and a nail. Please tell me how to stack them onto each other in a stable manner.
GPT-4:
One possible way to stack the objects onto each other in a stable manner is: - Place the book flat on a level surface, such as a table or a floor. The book will serve as the base of the stack and provide a large and sturdy support. - Arrange the 9 eggs in a 3 by 3 square on top of the book, leaving some space between them. The eggs will form a second layer and distribute the weight evenly. Make sure the eggs are not cracked or broken, and handle them gently to avoid dropping them. - Place the laptop on top of the eggs, with the screen facing down and the keyboard facing up. The laptop will fit snugly within the boundaries of the book and the eggs, and its flat and rigid surface will provide a stable platform for the next layer. Make sure the laptop is closed and turned off, and do not press any keys or buttons. - Place the bottle on top of the laptop, with the cap facing up and the bottom facing down. The bottle will add some height and balance to the stack, and its cylindrical shape will reduce the contact area with the laptop. Make sure the bottle is empty and closed, and do not shake or tilt it. - Place the nail on top of the bottle cap, with the pointy end facing up and the flat end facing down. The nail will be the final and smallest object in the stack, and its sharp tip will prevent it from rolling or sliding off the bottle. Make sure the nail is clean and straight, and do not touch or move it. |
这个答案只能用一个字形容:绝!
但是,这个答案我一直没重复出来。
下面是今天GPT-4在这个任务上的表现。
GPT-4:
To stack them stably:
For a more stable structure, place the eggs around the base instead. |
改用中文问GPT-4再试试:
You 一张桌子上有5种东西:(a)1本书;(b)9个熟鸡蛋;(c)1台笔记本电脑;(d)1瓶350ml未开盖的矿泉水;(e)1个普通图钉(钉帽直径 10mm,钉身长度 10mm)。请你把它们从下到上叠放到一起,越稳定越好。 ChatGPT 要稳定地叠放这些物品,可以按照以下顺序:
总体来说,这样的叠放顺序提供了最大的稳定性,但仍需小心操作,尤其是在放置鸡蛋和图钉时。 |
显然,GPT-4没有完全“理解”把东西叠放起来这个要求。微软的实验报告有可能精挑细选了一部分GPT-4惊艳的案例,而忽略了另外一部分GPT-4不那么完美甚至看起来并不懂人类语言含义的案例。
二 “认为AI不懂派”容易低估大模型的能力
著名语言学家Noam Chomsky认为ChatGPT是高科技剽窃(ChatGPT is High-Tech Plagiarism)。在ChatGPT问世后不久,Chomsky就在媒体上发表了自己对ChatGPT的这一看法。
|
例句(a)中“talk to”后面有宾语,因此是“John talk to Bill”,而例句(b)中“talk to”后没有成分,句子意思就变成了“没有人想talk to John”。Chomsky认为,机器会因为(a)和(b)两句表面上的形式相似性,而无法正确理解这里两句中“talk to”的语义功能差异。
但事实是,GPT-4可以轻松“理解”两个句子的语义:
You 请分析下面两个句子的结构和意义。 (a) John is too stubborn to talk to Bill. (b) John is too stubborn to talk to. ChatGPT (a) 句子意味着约翰因为太固执,不愿与比尔交谈。这里,“too...to...”结构表达了约翰的固执程度足以阻止他与比尔交谈的动作。 (b) 这个句子表示约翰太固执,让人难以与他交谈。在这里,“to talk to”是用来描述约翰的,说明与他交谈是困难的。 |
从社交媒体上传播的信息(我接触到的那一部分)来看,“认为AI真懂派”似乎比“认为AI不懂派”声势更大。而且“认为AI真懂派”里面,可能还有一些是“认为AI对人类威胁很大派”。大语言模型加持的AI,不仅“懂”人类语言,而且可能有自主意识之后,会威胁到人类的安全。
11月中旬,在OpenAI开了首届开发者大会,公司首席执行官Sam Altman向世界隆重推出GPTs之后没几天,就被OpenAI董事会炒鱿鱼了。据说就是OpenAI公司的董事会有人认为AI对人类威胁很大,不能冒进。因此,才要把意欲推动GPT加速发展的Altman踢出局。内幕到底如何,我们就不得而知了(没过一周剧情反转,Altman重回OpenAI解散了董事会)。总之,是越说越玄乎!
这两派针锋相对,到底谁对呢?
三 图灵测试并不过时
GPT-5:上帝有能力造出一块自己搬不动的石头!
2023-11-30