出口成章的文盲的AI,只会听说不识字却是真智能,硬核解构大模型的思维过程
文摘
2024-10-06 07:02
广东
专栏 | AI 研习社
微信公众号 | 远远远
作者 | 远远
英文:illiteracy,意思是没有文字读写能力的人,是一种技能缺陷,而中文却翻译成文盲。人们都知道,盲是失明看不见东西,一种生理缺陷。技能缺陷是可以后天学习的,没有读写能力可以学,看看电视剧看看电影,基本上也能认很多字,而生理缺陷通常无法恢复。
“文盲”这种将技能缺陷套上生理缺陷的词,常常让人不舒服。
在中国古代,叫做“白丁”,这些叫法,都充斥着卖弄学识的知识分子对没有经过读写教育的人的鄙视。
有的人读过几年书,就带着一种傲气;有的人字认得很多,但做事总没安好心。相反,许多不识字的人,为人处世却好着呢。卖弄学识,鄙视他人的心态才是恶心、寒碜、吃相难看。每个人都知道,我们使用一种语音的模式在思考,脑海中有一种声音,那种脑中无形的声音和对事物的概念,那是每个人智慧的源泉。就像小编在输入这些文字时,也是脑中的声音思考后才打下的文字,是脑中的声音模式在思考,这样的思维过程应该每个人都一样吧。人工智能也应该能够通过声音的模态进行思考,因为声音会直接传达更多的信息,能听出鸟叫、风声、流水,人们说话的语气、语调、音色等,声音可以更快速的获得更多的信息。
目前的AI技术能够实现这种思维过程吗?有的,OpenAI发布了新的语音交互模式,现在正在逐步向用户开放,早在今年OpenAi的春季发布会,也就是2024年5月14日就已经演示过令人震撼的新的chatGPT-4o,代号中的o,代表onmi,全能的意思。
这是一种多模态的模型,不只能理解图像、视频,新的语音模式可以直接理解语音,在发布会的演示中,新模式具有更快的响应,响应速度已经达到人们平时聊天对话一样快。不再依附与文本解析,智能程度更像真人,这种工程实现是新的尝试,效果还不错,直接用语音进行训练的方法,超脱了传统的文本方法,其底层架构原理和文本一样,让大部分技术狂热分子惊呼"还能这么玩","Transformer 架构原来这么强","有希望实现AGI","ASI也指日可待"像人,从结构上实在太像人了,庞大的大模型参数和计算机神经网络跟生物大脑实在太像了,同一个大模型,不同的参数会负责不同的模态,这么多参数协同工作可以理解多模态,理解我们的这个世界。个人认为,理解了就是理解了,你问一个人是否理解某样东西,他会怎么回答,你并不知道他的回答是在背答案还是真的理解了。传统的人工智能就是记录着各种各样的答案,机械式的回应用户的问题,那样肯定不算理解,只是对答如流的机器罢了。而AI模型的理解是构建在无数的参数下的,这些参数就是理解的表现。比如你提到苹果,模型参数会知道你说的苹果是什么?你让大模型寻找房间里的苹果,但他识别了一个苹果,告诉你这就是,那一刻,是模型这个庞杂的结构在起作用,而不是数据,就已经算理解了。模型让我想起了结构主义,结构主义者认为这个世界是结构在起作用,事物之间的联系就是结构,结构起着决定作用,小到有形的联系-机械结构,大到由个体组成的社会结构,结构是事物的生命。
模型就是这样一种结构,就像人类的神经元网络,你单独拿出一个神经元来看,看不出什么门道,而神经元构成的神经网络结构才能反映功能本质。
在结构主义者看来,结构在他们心中就像道家人心中的道那样,打败所有围棋的AI,是一种结构,是一种理解了围棋的结构,是已经被实现的。试想一下,一个可以预测经济的结构可以告诉你明天哪支股票会涨,理论上也是存在的,但只是这种结构还没有工程实现。
某些复杂的结构,确实是比人类更加理解了某些东西,但他们都有一个特点,只会告诉你结果,无法告诉你为什么会是这个结果。围棋AI模型结构会告诉你下哪里胜率会高,却无法告诉你下这胜率为什么比下那高。人的理解是有上限的,目前在特定领域,AI对事物的理解已经超越了人类,在模型结构给出的结果和其展现的强大能力面前质问这种结构的理解不是真正的理解,就像爱因斯坦亲自教你广义相对论,你指着他说你懂个屁的相对论,那不是可笑嘛。
为什么人们一开始使用文本来训练AI模型?那只是因为互联网上最多的文本,这是一种路径依赖。现在有大量的视频和语音数据,当然可以用这些信息和数据训练出更加理解这个世界的AI模型。
如果一开始人们就使用声音数据进行训练,就会出现不识字的AI,不识字没关系,其思维结构更加接近人,就像一个不识字的人一样能听懂、理解并用声音进行反馈。
然后再像教学生一样教AI读写能力,我相信那将是个学霸。话说回来,不管怎么样的一种发展路径,还是要依靠市场,现在人们还是偏向使用文本进行人机交互,人们的需求与认可、应用的落地、可用且超预期的应用能力,才是一个行业发展的最大动力。AGI是人工智能达到一般人类智能水平的阶段,ASI是达到超越所有人类智力水平的阶段,理论上来说,都不遥远。
这个言出法随的时代,AI越来越像人,而能力上又超过人。只要告诉AI要做什么,就能把事做得漂亮。AI绘图已经完胜大部分的设计师了,只要告诉AI画什么,怎么构图,怎么改就能做出很好的效果图与设计图,使用AI的设计师工作效率倍增。
想起从前人们苦学计算机,头发大把大把地掉,没完没了修bug,以后的人们也不再需要做这种工作了,计算机终于自己可以给自己写代码了。