以下文章来源于Web3天空之城 ,作者天空之城城主
文:Web3天空之城·城主
在这场最新的斯坦福课堂访谈里,谷歌前CEO 埃里克·施密特(Eric Schmidt)深入探讨了人工智能的发展方向、全球科技竞争的未来,以及这些技术如何在短期内对社会、经济和国家安全产生深远影响。施密特回顾了他在科技行业的多年经历,分享了对未来几年人工智能技术突破的预见,并讨论了这些突破如何塑造企业、国家间的竞争格局,尤其是在美国与中国的较量中。
施密特特别强调了技术进步背后的复杂因素,如计算能力的提升、新算法的开发以及市场对智能系统的无限追求。他还讨论了人工智能对劳动力市场、数据隐私、反垄断以及国家安全的潜在影响,并提出了如何在这种快速变化的环境中保持竞争优势的建议。
城主特别指出的是,作为长期为米国国防部服务的施密特,他的言论立场是需要鉴别的,相信读者一定能自行理解。
人工智能的短期突破与深远影响:
施密特预测,未来一到两年内,人工智能将迎来重要突破,尤其是在上下文窗口扩展、AI代理和文本到操作这三个领域的结合。这些技术进步将使人工智能系统能够更有效地处理复杂任务,超越当前的局限性。这种进步将不仅仅局限于技术领域,而是会深刻影响社会各个层面,包括教育、医疗、政府和商业。他强调,这些技术的发展可能带来的变革性影响,甚至可能比社交媒体的崛起对社会的影响更为深远。
全球科技竞争中的中美博弈:
施密特详细分析了美国和中国在人工智能领域的激烈竞争。他指出,美国目前在技术、人才和资源方面领先,但要维持这一优势,需要持续的高额投资和国际合作,特别是与加拿大等盟友的合作,以确保能源和资源的可持续供应。他强调,AI的未来不仅仅是技术竞赛,还是一场国家之间的战略博弈,涉及到国家安全、经济竞争力以及全球领导地位。施密特警告,美国需要加大投入,以应对中国在AI领域的迅速崛起,并保持在这一领域的全球主导地位。
科技巨头的垄断与创新挑战:
在讨论当前科技巨头的主导地位时,施密特指出,NVIDIA等公司在AI领域的垄断地位得益于其强大的技术能力和资本优势。他提到,虽然市场上存在竞争者,但挑战这些科技巨头的地位需要巨额投资和技术创新。他还对这些巨头如何在未来继续推动技术创新表示担忧,认为资本密集型的AI开发可能会导致软件开发模式的根本变化,从开源转向闭源,从而进一步巩固巨头的垄断地位。
人工智能对社会和劳动力市场的冲击:
施密特探讨了人工智能对社会、经济和劳动力市场的潜在影响。他认为,虽然AI技术可能会取代某些重复性工作,但它也会增强高技能工作的重要性,推动人们在复杂任务中的生产力提升。他还对人工智能可能带来的社会不平等表示担忧,指出富裕国家将从AI中获得更多利益,而贫穷国家可能会被甩在后面。此外,施密特呼吁加强对AI的监管,以应对数据隐私、知识产权和错误信息传播等问题。
对抗性人工智能与安全挑战:
施密特特别提到对抗性人工智能的潜在威胁,预测未来可能会有专门设计的AI系统用于攻击和破坏其他AI系统。这种发展将为安全性和伦理带来新的挑战。施密特建议,科技界和政府需要合作,研究如何防范这些风险,并制定相应的法规和技术标准,以确保人工智能的安全和可信度。他还提到,这一领域的研究将成为未来科技发展的一个重要方向,并可能在大学和研究机构中得到更多关注。
B站传送:【精校】谷歌前CEO Eric Schmidt 斯坦福课堂访谈 2024.8-哔哩哔哩】
https://b23.tv/VilTkTd
=Web3天空之城全文整理版=
主持教授:
今天的嘉宾无需多做介绍。我第一次见到Eric是在大约25年前,当时他以Novell首席执行官的身份来到斯坦福商学院。从那时起,他在谷歌担任重要职务,从2001年开始,并在2017年加入Schmidt Futures。此外,他还参与了许多其他项目,大家可以查阅相关资料。所以Eric,如果可以的话,我就从那开始吧。
首先,你认为人工智能在短期内的发展方向是什么?我想你将其定义为未来一到两年。
施密特:
事情变化得太快了,我觉得每六个月我都需要就即将发生的事情发表一次新的演讲。这里有一群计算机科学专业的学生,有谁能给班上的其他人解释一下“一百万个token上下文窗口”是什么吗?请说出你的名字,并告诉我们它的作用。
学生:基本上,它允许你用一百万个标记或一百万个单词进行提示。
施密特:
所以你可以问一个百万字的问题。Anthropic是20万token,要到一百万,等等。你可以想象OpenAI有一个类似的目标。
这里有人能给出AI代理的技术定义吗?再说一次,计算机科学。
学生:AI代理可能是以某种方式行动的东西。它可能是在网络上调用东西,代表你查找信息。它可能是沿着这个思路的许多不同的东西。在一个过程中有各种各样的事情。
施密特:所以代理是执行某种任务的东西。另一个定义是它是一个LLM、状态和记忆。再来,计算机科学家,你们中有人能定义“文本到动作”吗?
学生:不是将文本转换成更多文本,而是让AI根据此触发操作。
施密特:
另一个定义是Python语言。我从未希望看到一种编程语言存活下来。AI中的一切都是用Python完成的。刚刚出现了一种名为Mojo的新语言,看起来他们终于解决了AI编程问题,但我们会看看它是否真的能在Python的主导地位下存活下来。
还有一个技术问题。为什么NVIDIA价值2万亿美元,而其他公司却在苦苦挣扎?
学生:技术答案是,大多数代码都需要使用目前只有NVIDIA GPU支持的CUDA优化来运行,因此其他公司可以做任何他们想做的事情,但除非他们有10年的软件经验,否则你不会拥有机器学习优化。
施密特:
我喜欢将 CUDA 视为 GPU 的 C 编程语言,这个想法让我感到满意。CUDA 成立于 2008 年。尽管我一直认为它是一种糟糕的语言,但它却占据了主导地位。还有一个值得注意的见解:有一组开源库针对 CUDA 进行了高度优化,而其他任何库都没有做到这一点。所有构建这些技术堆栈的人在讨论中完全忽略了这一点。这些库在技术上被称为 VLLM,还有许多类似的库也针对 CUDA 进行了高度优化,这使得竞争对手很难复制。
那么,这一切意味着什么呢?明年,你将看到非常大的上下文窗口、代理和文本到操作的应用。当这些技术大规模交付时,它们将对世界产生巨大的影响,远超社交媒体带来的影响。原因如下:在上下文窗口中,你可以将其用作短期记忆,我对上下文窗口的长度感到震惊。技术上的原因与服务和计算的难度有关。短期记忆的有趣之处在于,当你输入信息并询问问题时,比如阅读 20 本书并将书的文本作为查询,然后询问它们的内容,它会忘记中间部分,这与人类大脑的工作方式相似。
关于代理,现在有些人正在构建 LLM 代理,他们通过阅读和理解化学等领域的知识,然后进行测试,并将其重新添加到他们的理解中。这非常强大。第三个方面是文本到行动。我给你举个例子:假设政府正在试图禁止 TikTok。如果 TikTok 被禁止,我建议你对你的 LLM 说以下的话:为我复制 TikTok,将我的偏好放入其中,在接下来的 30 秒内制作这个程序并发布它,然后在一小时内,如果它没有流行起来,就做一些类似的事情。这就是命令。你可以看到这有多强大。
如果你可以从任意语言转换为任意数字命令,这在本质上就是这个场景中的 Python。想象一下,地球上的每个人都有自己的程序员,他们实际上做他们想做的事情,而不是那些不按要求工作的程序员。这里的程序员知道我在说什么。想象一个不傲慢的程序员实际上做了你想做的事,而你不必付出高昂的代价。而这些程序员的供应是无限的。
教授:这一切将在未来一两年内发生?
施密特:
很快。以上三件事,我确信将在下一波浪潮中同时发生。所以你问还会发生什么。每六个月我都会波动一次,所以我们处于奇偶振荡状态。目前,前沿模型(现在只有三个)与其他模型之间的差距似乎越来越大。六个月前,我确信这种差距正在缩小,因此我在一些小公司上投入了大量资金。然而,现在我对此不太确定了。
我正在与一些大公司进行对话,他们告诉我,他们需要100亿、200亿、500亿甚至1000亿美元的资金。星际之门项目需要1000亿美元,非常困难。我的好朋友Sam Altman认为,这可能需要大约3000亿美元,甚至更多。我向他指出,我已经计算了所需的能量。
为了全面公开,我在周五前往白宫,告诉他们我们需要与加拿大成为最好的朋友。因为加拿大人民真的很好,他们帮助发明了人工智能,并且拥有大量的水力发电资源。因为我们作为一个国家没有足够的力量来完成这一目标。另一种选择是让阿拉伯国家资助这个项目。我个人很喜欢阿拉伯人,我在那里花了很多时间,但他们可能不会遵守我们的国家安全规则。而加拿大和美国是我们都同意的三巨头之一。
因此,在这些价值1000亿到3000亿美元的数据中心中,电力开始成为稀缺资源。
顺便说一句,如果遵循这种推理,你可能会问我为什么要讨论CUDA和NVIDIA?如果3000亿美元全部流向NVIDIA,你就知道在股市上该怎么做了。不过,这不是股票推荐,我不是许可方。
教授:
部分原因是我们将需要更多的芯片,但英特尔从美国政府获得了很多资金。AMD正在尝试在韩国建立晶圆厂。
施密特:
如果你的任何计算设备中有英特尔芯片,请举手。垄断就到此为止。
教授:
但这就是重点。他们曾经确实垄断过,现在NVIDIA已经垄断了。那么这些是进入壁垒吗?
说到CUDA,还有其他选择吗?前几天我和Percy Lange聊过。他正在TPU和NVIDIA芯片之间切换,这取决于他能接触到什么。这是因为他别无选择。
施密特:
如果他有无限的资金,今天他会选择NVIDIA的B200架构,因为它更快。我不是在暗示——有竞争是件好事。
我和AMD的Lisa Su谈过很久。他们已经构建了一个可以将CUDA架构转换为他们自己架构的东西,称为Rokam。它还没有完全发挥作用,但他们正在努力。
教授:
你在谷歌工作了很长时间,他们发明了Transformer架构。感谢那边的杰出人士,比如Peter、Jeff Dean以及所有人。目前,OpenAI似乎已经失去了主动权。在我看到的最新排行榜中,Anthropic的Claude位居榜首。我曾询问过Sundar,但他并没有给我一个非常明确的答案。也许你对那里的情况有更尖锐或客观的解释。
施密特:
我已经不再是谷歌的员工了。谷歌在工作与生活的平衡上更注重让员工早点回家和在家工作,而不是一味追求胜利。相比之下,初创公司之所以成功,是因为员工拼命工作。虽然这样说可能有些直白,但事实是,如果你们从大学出来创办公司,并想与其他初创公司竞争,就不能让员工每周只来一天。
教授:在谷歌的早期,微软也是如此。
施密特:
现在看来,在我们的行业中,长期以来,公司总是通过真正有创意的方式赢得胜利,并主宰某个领域,而不是进行下一次转型。这是有据可查的。我认为创始人是特别的,他们需要掌控一切,尽管与他们共事可能很困难,因为他们对员工施加很大压力。尽管我们不喜欢埃隆的个人行为,但看看他从员工那里得到了什么。我曾与他共进晚餐,他当时在飞行。我在蒙大拿州,而他那天晚上10点要乘飞机去参加午夜与x.ai的会议。想一想。
不同地方有不同的文化。台积电给我留下了深刻印象。他们有一条规定,刚毕业的博士生,即优秀的物理学家,要在工厂的地下室工作。你能想象让美国的物理学博士这样做吗?不太可能。这是不同的职业道德。
我对工作的严格要求是因为这些系统具有网络效应,所以时间非常重要。而在大多数企业中,时间并不那么重要,你有很多时间。可口可乐和百事可乐仍将存在,它们之间的竞争将继续进行,一切都是冷冰冰的。当我与电信公司打交道时,典型的交易需要18个月才能签署。没有理由花18个月来做任何事情,应该尽快完成。我们正处于增长和收益最大化的时期,但这也需要疯狂的想法。
例如,当微软与OpenAI达成交易时,我认为那是我听过的最愚蠢的想法。将你的人工智能领导层外包给OpenAI和Sam及其团队?这太疯狂了。在微软或其他任何地方,没有人会这样做。然而今天,他们正在成为最有价值的公司,当然在苹果身上针锋相对。苹果没有好的人工智能解决方案,但看起来他们让它奏效了。
学生:
在国家安全或地缘政治利益方面,人工智能将如何发挥作用,尤其是在与中国的竞争中?
施密特:
作为一个人工智能委员会的主席,我对此进行了深入研究。我们撰写了一份大约752页的报告,总结如下:我们目前处于领先地位,并需要保持这种优势,这需要大量资金支持。我们的主要客户是参议院和众议院,这也促成了CHIPS法案和其他类似政策的出台。
如果前沿模型和一些开源模型继续发展,可能只有少数公司能够参与这个领域的竞争。哪些国家具备这样的能力?这些国家需要资金充足、人才济济、教育体系强大,并且有获胜的意愿。美国和中国是其中的两个主要国家。至于其他国家是否能参与其中,我不确定。但可以肯定的是,在未来,美国和中国在知识霸权上的竞争将是一场重大斗争。
美国政府基本上禁止了NVIDIA芯片出口到中国,尽管他们不愿公开承认这一点。我们在亚DUV芯片方面拥有大约10年的技术优势,即亚5纳米芯片。这一优势让我们领先中国几年,这让中国非常不满。这一政策是由特朗普政府制定,并得到了拜登政府的支持。
教授:国会是否听取你们的建议并进行大规模投资,显然CHIPS法案是一个例子。
施密特:
此外,我们还需要建立一个庞大的人工智能系统。我领导着一个非正式、临时、非法律的团体,成员包括一些常见的业内人士。去年,这些成员提出了成为拜登政府人工智能法案的理由,这是历史上最长的总统指令。
我们曾经讨论过一个核心问题:如何检测一个已经学会了但你不知道该问什么的系统里的危险?换句话说,系统可能学到了一些不好的东西,但你不知道该如何询问它。比如,它可能学会了如何以某种新的方式混合化学物质,但你不知道如何问它。为了解决这个问题,我们在给政府的备忘录中建议设定一个阈值,我们称之为10的26次方,这是一种技术计算量度。超过这个阈值,企业必须向政府报告他们的活动。欧盟为了确保它们的不同,将10的25次方设为10。但这些数值已经足够接近了。我认为所有这些区别都会消失,因为现有的技术将会被淘汰。技术术语称为联合训练,基本上是指可以将各个部分合并在一起。因此,我们可能无法保护人们免受这些新事物的伤害。
教授:
有传言称,OpenAI必须这样训练,部分原因是功耗问题。没有一个地方是他们这样做的。
让我们谈谈正在发生的一场真正的战争。我知道您积极参与乌克兰战争,特别是关于“白鹳”计划,以及您用价值500美元的无人机摧毁价值500万美元的坦克的目标。这如何改变战争?
施密特:
我为国防部长工作了七年,试图改变我们管理军队的方式。我不是特别喜欢军队,但它非常昂贵,我想看看我是否能有所帮助。我认为,我基本上失败了。他们给了我一枚奖章,所以他们可能把奖章颁发给失败者或其他什么人。但我的自我批评是,什么都没有真正改变,美国的制度不会导致真正的创新。
所以我决定和您的朋友塞巴斯蒂安·特伦(他曾是这里的教员)以及一大群斯坦福人一起创办一家公司。这个想法基本上是做两件事:在这些本质上是机器人战争的战争中,以复杂而强大的方式使用人工智能;第二件事是降低机器人的成本。现在你可能会想,为什么像我这样的善良自由主义者会这样做?答案是,军队的整个理论就是坦克、大炮和迫击炮,而我们可以消灭它们。我们可以让入侵一个国家(至少是陆路入侵)的惩罚基本上不可能实现。它应该消除那种陆战。
教授:
这是一个非常有趣的问题。它是否让防守比进攻更具优势?你能区分吗?
施密特:
因为我去年一直在做这件事,我学到了很多关于战争的知识,我真的不想知道。关于战争,你需要知道的一件事是,进攻总是有优势,因为你总能压倒防御系统。因此,从国防战略的角度来看,你最好拥有一个非常强大的进攻,以便在需要时使用。我和其他人正在构建的系统将做到这一点。由于系统的运作方式,我现在是一名持牌军火商。所以我是一名计算机科学家、商人、军火商。我很遗憾地说。这是个进步吗?我不知道。我不建议你在职业生涯中从事这个。我会坚持从事人工智能。由于法律的运作方式,我们私下进行这项工作,在政府的支持下,这一切都是合法的。它直接进入乌克兰,然后他们开始打仗。不谈所有细节,情况相当糟糕。我认为,在五月或六月,如果俄罗斯人按照预期进行建设,乌克兰将在失去整个国家的过程中失去一大块领土。情况相当糟糕。如果你认识Marjorie Taylor Greene,我建议你将她从你的联系人列表中删除。因为她就是那个阻止了数十亿美元资金用于拯救一个重要民主国家的人。
教授:
接下来,我想讨论一个有点哲学性的问题。去年,你和亨利·基辛格以及丹·赫滕洛赫共同撰写了一篇关于知识本质及其发展方式的文章。前几天晚上,我也讨论过这个问题。在历史的大部分时间里,人类对宇宙的理解是神秘的,直到科学革命和启蒙运动的到来。在你的文章中,你提到现在的模型变得如此复杂和难以理解,以至于我们真的不知道它们内部发生了什么。我引用理查德·费曼的话:“我不能创造的东西,我就不理解。”前几天我看到了这句话。但现在人们正在创造他们可以创造的东西,却并不真正了解其内部运作。知识的本质是否在某种程度上发生了变化?我们是否必须开始只接受这些模型的表面,而它们无法向我们解释?
施密特:
我想举一个青少年的例子。如果你有一个青少年,你知道他们是人类,但你无法完全弄清楚他们在想什么。然而,我们在社会上设法适应了青少年的存在,他们最终会摆脱这种状态。这是一个严肃的问题。因此,我们可能会拥有无法完全描述的知识系统,但我们了解它们的界限和能做什么的极限,这可能是我们能得到的最好的结果。你认为我们会了解这些限制吗?如果我们能做到这一点,那就很好。
我的小组每周开会的共识是,最终会出现所谓的对抗性人工智能,实际上会有公司雇佣你并付钱来破坏你的人工智能系统。就像红队一样。与今天的人类红队不同,你将拥有整个公司和整个人工智能系统行业,他们的工作是破坏现有的人工智能系统并找到它们的漏洞,尤其是那些我们无法弄清楚的知识。这对我来说很有意义。对于斯坦福大学来说,这也是一个很棒的项目。如果你有一个研究生,他必须弄清楚如何攻击这些大型模型之一并了解它的作用,那么这将是构建下一代的重要技能。因此,将两者结合起来是有意义的。
教授:
现在,让我们回答一些学生的问题。后面有一位同学,请说出你的名字。
学生:
你之前提到过,这与现在的评论有关,让人工智能真正做你想做的事。你刚才提到了对抗性人工智能,我想知道你能否更详细地阐述这一点。看起来,除了计算能力显然会增加,你可以得到更高性能的模型,但让它们做你想做的事情的问题,似乎部分没有得到解答。
施密特:
好吧,你必须假设当前的幻觉问题会减少,随着技术的进步等等。我并不是说它会消失。然后你还必须假设存在功效测试,所以必须有一种方法来知道这件事是否成功。在我提到的TikTok竞争对手的例子中,我并不是建议非法窃取他人的音乐。如果你是硅谷的企业家,你会怎么做呢?希望你们都是硅谷的企业家。如果你的产品成功了,你会雇佣一大群律师来处理后续问题。但如果没有人使用你的产品,那么即使你窃取了所有内容也无关紧要。当然,不要引用我的话。
硅谷通常会进行这些测试并处理后续问题。这是常见的做法。我认为,你会看到越来越多的性能系统,甚至更好的测试,最终是对抗性测试,这将把它控制在一个框架内。这个专业术语叫做思路链推理。人们相信在未来几年内,你将能够生成一千步的思路链推理,就像制作食谱一样。你可以运行它,实际测试它是否产生了正确的结果,这就是系统的工作方式。
学生:
总的来说,你对人工智能进步的潜力非常乐观。我很好奇,是什么推动了这一进步?是更多的计算能力吗?是更多的数据吗?是根本性的还是实际的转变?
施密特:
答案是以上所有。投入的资金数额令人难以置信。我基本上投资了一切,因为我不知道谁会赢,而我跟随的资金数额如此之大。部分原因是早期的钱已经赚了,而那些不太了解的人必须拥有人工智能组件。现在一切都是人工智能投资,他们无法分辨出差异。
我将人工智能定义为学习系统,即真正学习的系统。我认为这是其中之一。第二点是,现在出现了一些非常复杂的新算法,它们有点像后Transformer。我有一个朋友,也是我长期的合作伙伴,发明了一种新的非Transformer架构。我在巴黎资助的一个小组声称也做了同样的事情。那里有大量的发明,斯坦福大学也有很多研究。最后一点是,市场相信智能的发明有无限的回报。假设你向一家公司投入了500亿美元的资金,你必须从智能中赚到很多钱才能偿还这笔钱。我们可能会经历一些巨大的投资泡沫,然后它会自行解决。过去一直如此,现在也可能如此。
教授:你之前提到,领导者正在拉开与其他人的距离。
施密特:
现在,法国有一家叫Mistral的公司,他们做得非常好。我显然是一名投资者。他们已经制作了第二个版本,他们的第三种模式很可能是封闭的,因为它太昂贵了。他们需要收入,不能免费提供他们的模式。我们行业中关于开源与闭源的争论非常激烈。我的整个职业生涯都建立在人们愿意以开源方式分享软件的基础上。我的一切工作都是基于开源的。谷歌的大部分基础也是建立在开源之上。我所从事的工作主要集中在技术领域。然而,巨大的资本成本可能会从根本上改变软件的构建方式。
我对软件程序员的看法是,他们的生产力至少会翻倍。目前有三四家软件公司正在尝试实现这一目标,我在这段时间里投资了所有这些公司。他们都在努力提高软件程序员的生产力。我最近遇到了一家非常有趣的公司,名为 Augment。我常常想到一个程序员,他们说这不是我们的目标。我们的目标是那些拥有数百万行代码的100人软件编程团队,没有人知道发生了什么。这是人工智能的一个非常好的应用。他们会赚钱吗?我希望如此,但这里有很多问题。
学生:
一开始,你提到上下文窗口扩展、代理和文本到操作的组合将产生难以想象的影响。首先,为什么这种组合很重要?其次,我知道你不是预言家,无法预知未来,但你为什么认为它超出了我们的想象呢?
施密特:
我认为主要是因为上下文窗口可以让你解决新近性问题。目前的模型需要大约18个月的时间来训练,包括六个月的准备、六个月的训练和六个月的微调,因此它们总是过时的。而通过上下文窗口,你可以输入最新发生的事情,并在上下文中询问有关哈马斯-以色列战争的问题,这非常强大,使其变得像谷歌一样最新。
在代理的情况下,我可以举个例子。我成立了一个基金会,为一个非营利组织提供资金。我不太懂化学,但有一个名为 ChatCrow 的工具,这是一个基于大型语言模型的系统,可以学习化学。他们运行这个系统来生成有关蛋白质的化学假设,然后实验室连夜进行测试,系统就会学习。这对化学、材料科学等领域是一个巨大的促进剂。这是一个代理模型。
我认为,只要有很多廉价的程序员,就可以理解文本到动作的概念。我认为我们不明白当每个人都有自己的程序员时会发生什么。这也是你的专业领域。我不是在谈论简单的任务,比如打开和关闭灯。我想象另一个例子,假设你不喜欢谷歌,你可以说,为我建立一个谷歌的竞争对手。是的,你个人可以这样做。为我建立一个谷歌的竞争对手,搜索网络,构建用户界面,制作一个好的副本,并以有趣的方式添加生成式人工智能。在30秒内完成,看看它是否有效。很多人认为,包括谷歌在内的现任者很容易受到这种攻击。
教授:
现在,我们来看看。Slido 发送了许多问题,其中一些已经被上传。去年我们曾讨论过如何阻止人工智能影响舆论和传播错误信息,尤其是在即将到来的选举期间。
施密特:
我们需要考虑短期和长期的解决方案。在即将到来的全球选举中,大多数错误信息将出现在社交媒体上,而社交媒体公司目前的组织能力不足以有效监管这些信息。例如,TikTok被指控偏爱某种虚假信息,尽管我没有证据。我认为我们面临一团糟的局面。
国家需要学习批判性思维,这对美国来说可能是一个艰巨的挑战。有人告诉你某事并不意味着它是真的。
教授:
我们是否会走得太远,以至于一些真实的事情也无人再相信?有些人称之为认识论危机。现在,埃隆·马斯克说他从未做过某些事情,但如何证明呢?
施密特:
我们可以用唐纳德·特朗普的例子来说明。我认为我们的社会存在信任问题,民主可能会因此失败。对民主的最大威胁是错误信息,因为我们在这方面变得非常擅长。
当我管理YouTube时,我们遇到的最大问题是人们上传虚假视频,导致人员死亡。我们有一个不死亡政策,试图解决这个问题令人震惊且可怕。这是在生成式人工智能出现之前。
教授:
我没有好的答案,但有一个技术问题似乎可以缓解这种情况,那就是公钥认证。当乔·拜登讲话时,为什么不使用类似SSL的数字签名?名人、公众人物或其他人是否可以拥有公钥?
施密特:
这是一种公钥形式,提供某种确定性,就像我将信用卡发送到亚马逊时,我知道这是亚马逊。
我曾与Jonathan Haidt合作发表了一篇论文,但没有产生影响。他是一个非常好的沟通者,而我可能不是。我的结论是,系统并没有按照我们所说的那样组织。首席执行官通常在最大化收入,为此他们要最大化参与度,而最大化参与度的方式是最大化愤怒。算法选择愤怒,因为这会产生更多收入,因此人们倾向于支持极端的东西。这在各个方面都是一个问题,必须得到解决。
在民主国家,我对TikTok的解决方案是基于我们之前私下讨论过的内容。当我还是个孩子的时候,有一种叫做平等时间规则的东西。TikTok 实际上并不是一个社交媒体平台,而更像是一种电视形式。美国的每个 TikTok 用户每天平均使用该应用90分钟,并制作200个视频,这个使用量非常大。虽然政府没有实施平等时间规则,但这可能是一个值得考虑的方向,需要某种形式的平衡。
学生:
首先是关于劳动力市场的经济影响。这个影响比最初预期的要慢,尤其是在劳动力市场方面。还有关于客服人员的问题。你认为学术界是否应该获得人工智能补贴,或者应该与大公司合作?
施密特:
我一直在努力推动大学建立数据中心。如果我是计算机科学系的教员,我会因为无法与研究生一起开发算法进行博士研究而感到沮丧,因为我被迫与公司合作。而这些公司在这方面并不够慷慨。很多教职员工花费大量时间等待谷歌云的积分,这种情况很糟糕。我们希望美国的大学能够在这方面取得成功,因此我认为让他们获得这些学分是正确的做法。
关于劳动力市场的影响,我会听取真正专家的意见。作为一名业余经济学家,我相信大学教育和高技能任务会有好的前景,因为人们会使用这些系统。我认为这些系统与以往的技术浪潮没有本质区别。危险的工作和不需要人类判断的工作将被取代。
学生:
关于从文本到行动的转变及其对计算机科学教育的影响?我认为计算机科学教育应该适应时代变化。
施密特:
我假设本科生中的计算机科学家总是会有一个程序员伙伴。当你学习第一个for循环时,会有一个工具成为你的天然伙伴。教授会讲解概念,而你会通过这种方式参与其中。
学生:关于非Transformer架构的讨论,我认为状态模型是一个被讨论的方向,但现在更多关注的是上下文。
施密特:
我对数学的理解不够深入,但我很高兴这为数学家创造了就业机会,因为这里的数学非常复杂。基本上,这些是进行梯度下降和矩阵乘法的不同方法,目标是更快更好。正如你所知,Transformers是一种同时进行乘法的系统方法。这是我的想法。它与此类似,但数学不同。让我们看看。
学生:
你在关于国家安全的论文中提到,今天中国、美国和其他国家的情况。从下一个集群往下的十个国家,要么是美国盟友,要么有可能成为美国盟友。我很好奇你对这十个国家的看法。他们有点像中间人,不是正式的盟友。他们有多大可能加入保护我们安全的工作?是什么阻止了他们加入呢?
施密特:
最有趣的国家是印度,因为顶尖的人工智能人才都来自印度,来到了美国。我们应该让印度保留一些顶尖人才,不是全部,但有一部分。而且他们没有我们这里丰富的训练设施和项目。在我看来,印度在这方面是一个摇摆不定的国家。日本和韩国显然是我们的阵营。台湾软件很糟糕,所以这行不通。硬件很棒。而在世界其他地方,没有很多其他好的选择。欧洲因为布鲁塞尔而搞砸了,这不是什么新鲜事。我花了10年时间与他们抗争。我非常努力地让他们修改欧盟法案。他们仍然有各种限制,使我们在欧洲进行研究非常困难。我的法国朋友把所有时间都花在了与布鲁塞尔的斗争上。作为我的私人朋友,马克龙正在为此努力奋斗。所以我认为法国有机会。我认为德国不会来,其他国家也不够强大。
学生:
我知道您是一名受过训练的工程师,我认为您被称为编译器。鉴于您设想的这些模型所具有的功能,我们还应该花时间学习编码吗?
施密特:
是的,因为归根结底,这是老生常谈的问题,如果你会说英语,为什么还要学习英语?你会学得更好。你确实需要了解这些系统是如何工作的,我对此深有体会。
学生:
我很好奇您是否探索过分布式设置。我之所以问这个问题,是因为,当然,制作一个大型集群很困难,但 MacBook 功能强大。世界各地有很多小型机器。那么,您认为在家折叠或类似的想法是否适用于训练这些系统?
施密特:
是的,我们已经非常认真地研究过这个问题。因此,算法的工作方式是您有一个非常大的矩阵,并且您基本上有一个乘法函数。所以可以把它想象成来回反复。而这些系统完全受到内存到 CPU 或 GPU 的速度的限制。事实上,下一代 NVIDIA 芯片已将所有这些功能整合到一个芯片中。芯片现在太大了,以至于它们都粘在一起了。事实上,封装非常敏感,封装和芯片本身都是在洁净室中组装的。所以答案看起来超级计算机和光速,尤其是内存互连,真的占了上风。我认为目前分割大型语言模型(LLM)暂时不太可能。
教授:
Jeff Dean 去年在一次演讲中提到,可以将模型分为不同的部分,分别训练后再联合起来。
施密特:
但要实现这一点,需要拥有上千万个这样的模型,提问的速度也会变得非常慢。他提到需要8台、10台或12台超级计算机来实现这一目标,但这并不在他的级别上。
学生:
关于数据隐私的问题,我了解到纽约时报曾起诉OpenAI使用他们的作品进行训练。
施密特:
我认为未来可能会有很多类似的诉讼,最终会达成某种协议,比如规定使用某些作品需要支付一定比例的收入,就像音乐行业的ASCAP和EMI那样。这种模式虽然看起来有些过时,但我认为最终会这样运作。
学生:
在AI领域,似乎有一些公司在主导市场,并且与反垄断法规关注的大公司有重叠。
施密特:
我曾在职业生涯中参与过微软的拆分案,但最终没有成功;我也为谷歌不被拆分而努力过,但同样没有成功。因此,我认为趋势是不被拆分。只要这些公司不成为像约翰·洛克菲勒那样的垄断者,政府就不太可能采取行动。
这些大公司之所以占据主导地位,是因为只有他们有资本建立数据中心。我有朋友里德和穆斯塔法,他们做出了将业务拆分给微软的决定,因为他们无法筹集到数百亿美元的资金。至于具体的数字,可能需要让里德来告诉你。
学生:
最后,我想知道这些发展对那些不参与前沿模型开发和计算的国家会有什么影响。
施密特:
富裕国家会变得更富,而贫穷国家只能尽力而为。这实际上是一场富国的游戏,需要巨大的资本、技术人才和强大的政府支持。在全球范围内,许多国家面临着各种各样的问题,尤其是在资源匮乏的情况下。他们需要找到合作伙伴,与他人合作以解决这些问题。
教授:
我记得我们上次见面时,你正在AGI House参加黑客马拉松。我知道你花了很多时间帮助年轻人创造财富,并对此充满热情。对于那些正在为课程写商业计划或在职业生涯中撰写政策提案或研究提案的人,你有什么建议吗?
施密特:
我在商学院教授相关课程,你应该来听听。我对你们展示新想法的速度感到震惊。
在我参加的一次黑客马拉松中,获胜团队的任务是让无人机在两座塔楼之间飞行。他们在一个虚拟的无人机空间中,使用Python生成代码,并在模拟器中成功完成了任务。优秀的专业程序员可能需要一两个星期才能做到这一点。我认为快速制作原型的能力非常重要,因为创业者面临的部分问题是速度。如果你不能在一天内用这些工具制作出原型,你就需要重新考虑,因为这正是你的竞争对手在做的事情。
因此,我最大的建议是,当你开始考虑创办公司时,写一份商业计划是可以的。事实上,你可以让电脑为你写,只要它是合法的。尽快使用这些工具制作你的想法的原型非常重要,因为在其他公司、大学或你未曾去过的地方,可能有人在做同样的事情。
教授:非常感谢。
版块介绍 — 产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
推荐阅读
Reading
2、观察|“兼济天下”与“产业繁荣”:从中法联合声明看中国的“AI力”
3、智能背后的电能保障:GPU算力集群能源挑战的全球视角与中国应对
4、产业之声 | 阿里调研:生成式AI在电商场景的应用、前景与挑战
6、阿里云内部全面推行AI写代码,未来20%代码由通义灵码编写
9、安全治理与能力发展兼顾并重,Claude 3对中国大模型发展有哪些启示
10、【“人工智能+”深度案例】从智能工厂到ChatBI,雅戈尔的“智能+”实践
14、《自然·医学》刊登中国科学家关键突破:癌症筛查的黄金时代准备就绪
16、【观点】阿里妈妈万相实验室首发上线 电商进入AI上新新时代
20、产业之声 | 为AI供电-超万卡GPU算力集群的算电协同与零碳发展
- END -