本文部分内容节选及编辑自微软中国首席技术官韦青书评
《人,比我们想象的要强大》
这轮“生成式人工智能热潮”已经持续近两年,但AI技术和应用的发展并非一蹴而就。在经过人工神经网络及深度学习等AI技术的多年发展和积累后,早在Microsoft Build 2022开发者大会上,微软就已宣布Azure OpenAI及GPT-3等“大语言模型”技术服务上线,那时距离革命性的ChatGPT正式发布还有足足半年。因此,多年来,我们一直在见证、深度参与、并有力推动了生成式AI的技术研发及应用大爆发。但在技术研发之外,我们更时刻关心AI技术与人的关系。
早在2019年,微软便率先发布了第一版“负责任的人工智能”(Responsible AI)标准及原则。伴随着AI技术的发展,至今已拓展为符合“公平性、可靠性和安全性、隐私和安全性、包容性、透明度和问责制”这6项原则的生成式AI系统框架。这不仅是研发者对AI技术和应用的规范,更是我们对AI与人的关系、AI如何对人类社会起积极作用的探讨。而作为集人类多种智慧、学科、技术的前沿技术,AI技术也始终值得更多跨领域、跨专业的探讨,帮助我们超越当下主流认知及技术局限,去认知和理解AI技术。
近日,一本分析和预测人工智能等指数型新技术将如何推动人类社会变革的书籍——《奇点更近》中文版正式出版,作者为曾被比尔·盖茨称为“我认识的最擅长预测人工智能未来的人”、未来学家、计算机科学家雷·库兹韦尔。微软中国首席技术官韦青受邀为本书作万字书评,带大家从本书浩瀚的思维与知识入手,以更多元的视角理解和运用今天与未来的AI。
以下内容节选及编辑自微软中国首席技术官韦青书评
《人,比我们想象的要强大》
库兹韦尔用了两本书,一本是出版于二十年前的《奇点临近》,一本是这本《奇点更近》,洋洋几十万言,无非想告诉我们一件事:讨论了这么多年的奇点时刻,真的快要到了!它的来临速度与冲击力,远比原来预想的还要迅猛与激烈!
01
奇点将至,为什么我们
比以往任何时候更需要
「负责任的人工智能」?
库兹韦尔在两本有关“奇点”的作品中,都在强调我们所面临的其实都是有关信息的问题。无论我们探讨的是“数字化”、“智能化”还是“信息化”,最终都是人类文明型态从农业文明、工业文明、再到信息文明后所面临的挑战与机遇,其本质是在理解、掌握和利用“物质-能量-信息”宇宙三要素之间的关系与转化。在这个通讯发达和信息爆炸的时代,大家不缺各类“标准”答案,缺的是适合我们自身情况与条件的问题和针对这种问题的“合适”答案。因此,我们每一个人都需要建立起与信息时代相匹配的辩证思维、批判精神与实践能力。
诺贝尔经济学奖与图灵奖双料得主赫伯特·西蒙(中文名为司马贺)曾经强调,“信息过载的时代也是注意力稀缺的时代”。由于数字化媒体的普及和通讯技术的发达,再加上因为生成式人工智能技术的进步而导致的机器生成内容泛滥,人类为了高效沟通而建设的通讯网络中已经被远超全体人类所能够处理和理解的海量信息所淹没。其中“真-假-虚-实”内容交相纠缠在一起,每一条讯息在每时每刻都在试图争夺人类的关注度,而获得关注度的捷径就是对于现象的夸大其辞,甚至是无中生有。
在这种信息传播的逻辑下,从人类利益而言,我们需要的不是海量信息,是能够真实与正确表征世界的信息,和能够以高效和准确的方式承载能够被人类接受、消化与理解的有益知识。从社会发展角度而言,为了保障人类社会能够进化至以信息健康流通为代表的下一个文明发展阶段,人类社会需要提升对于“真-假-虚-实”信息的鉴别能力,建立起覆盖信息全生命周期的验证与确认机制,保证人类社会中流通的信息在生成、传播与接收过程中的真实性与及时性。否则,如果任凭机器生成信息的泛滥,人类社会极易陷入谣言横行、真相缺失的混乱窘境。
那么,我们应该如何在未来确保数据和信息的产生与人类及社会利益一致呢?人们时常以“新一轮工业革命”来指称这一轮的技术进步,这种定义方式虽然能够描述了这一轮信息技术进产生的巨大影响和作用,但不足以表明这一轮信息技术对于人类思想、文明传承以及国家、民族、企业与个体生存与发展基本范式产生的巨大冲击。与其将这一轮的技术进步称之为一场工业革命,更加符合其本意的说法或许应该是一场文明的重构。借用库兹韦尔的技术进化“加速回报定律”的思路,人类将因为智能计算机器的参与而面临一个双倍指数增长的变革时代,其变化的速度与彻底性,是人类在其发展历史中首次遇到的如此巨大挑战与机遇。
▲计算速度与成本示意图
因此,在这样的信息爆炸的环境之下,我们应更深入地理解信息与物质和能量最大的不同在于,信息需要流通,它只有在流通的过程中方能通过信息接收方思想与意识的改变而产生现实的作用。根据DIKW(即Data数据-Information信息-knowledge知识-Wisdom智慧)信息金字塔理论,承载信息的数据只有在转化为知识后才能够产生对人类社会的影响。
没有意义的数据是没用的数据:数据十分重要,被比喻为“数字经济的石油”。这种比喻的本义指的是石油的确很重要,但是其本身并没有太多直接用处,需要依托化工产业,被提炼为柴油、汽油方能为机器使用。同样的道理,数据看似重要,但是数据中所蕴含的信息量更为重要。这就需要在生成和收集数据之前,对数据进行有效建模,使得数据能够表征物理世界中的某种现象,产生相关的意义,而这种意义就是信息的价值。此外,未经流通应用的数据是没有价值的数据:富含意义的多维度数据经过综合处理后才能够产生有效的知识。在实际应用中,任何一个群体与个体都无法具备足够多富含意义的多维度数据,也就难以实现数据转化为知识后的高效应用,这就需要全社会,尤其是跨行业、跨部门之间形成顺畅的数据流转机制。
因此,我们在积极研发和落地各类令人兴奋的生成式人工智能技术及应用的同时,还较早地预判并提出、践行“负责任的人工智能”,确保信息生产过程和结果中的公平性、可靠性和安全性、隐私和安全性、包容性、透明度和问责制,既是对信息爆炸、AI技术带来的新一轮信息革命的应对,也是让信息和数据为全人类产生可控价值的重要手段。
02
我们是否该相信AI
意味着我们是否该相信人类自己
在我看来,起码在目前阶段,机器通过对数据的计算所表现出来的,更多是按照DIKW信息金字塔的理论所定义的知识的层面。知识是分立的,专业的,深入的,形而下的;智慧是综合的,融汇的,深刻的,形而上的。
但对于知识能力与智慧能力的混淆,加之工业文明下的教育体系更重视培养人类的知识获取与记忆能力,而低估了人类智慧涌现与升华能力,因此当机器体现出远超人类的知识能力以后,人类便开始丧失了自信。再加上如果人类自我束缚,仅依靠博闻强记、精确执行的机械力来体现自身的价值,而不是通过创新试错、天真烂漫的本性发挥人类的特长,人类的世界迟早会被具备同类而又更为优秀知识能力的机器所吞噬。
所以,当人类理解人机融合历史潮流中所面临的真正问题——人机关系问题,理解了未来的智能学习机器大都会学习到人类的整体知识,人类需要充分理解知识与智慧关系,才有可能分清人与机器的关系。尽管人类对这个领域尚未充分研究、理解与掌握,但是有一点很确定,它与语言能力有关,与符号学有关,与实体-表象-精神有关,也与波普尔的世界三元组或皮尔斯的符号表征三元——即与物理世界、精神世界和符号世界相关。虽然这些能指符号看似与所指的现象一致,但可能都是虽有实空的假象。那么,对于机器而言,它到底学到了什么?对于人类而言,何为智慧?何为真相?何为真实?
打开这条思路之后,感兴趣的读者就可以在这种跨界思路中继续探索,使我们在智慧的海洋面前更加谦卑,更加坚定继续在无尽宇宙内探索真相的决心与信心,让我们认识到在人类技术发展到这么初级的阶段就尝试下这么多断言,可能操之过急。人类在发展的过程中被逼入一个墙角,有可能是绝境,也有可能在墙角深处有一个小门,正等待我们努力地推开,或许在这个即将被我们打开的小门背后,隐藏着人类继续探索宇宙奥秘的星辰大海。
这种理解,也是本书中所提及的“宇宙进化第六阶段”的另一种解读。当然,这是我的解读,如统计学家乔治·博克斯所言:“所有的模型都是错误的,只不过有一些是有用的”,重要的不是我的解读,也不是库兹韦尔的解读,而是你自己的解读,那么,你的观点是什么呢?
关注「微软科技」公众号,并在本文评论区留下
你在阅读本文后对「AI」的定义和理解,
我们将抽取 3 位幸运读者赠送
韦青老师特别推荐的
《奇点更近》新书一本。
🔥 预告:我们即将举办新书分享会直播活动
敬请关注【湛庐文化】 及 【微软科技】 视频号
锁定直播预约!