OpenAI联合创始人、总裁格雷格·布洛克曼休假了,但这似乎并没有给他带来放松的机会。
//
我在高中毕业后的间隔年里开始认真地编程。我读过图灵的《计算机与智能》,并受到了编写代码的想法的启发,这些代码可以理解我作为代码作者所无法理解的东西。我开始编写聊天机器人——这能有多难呢?
我设法开发出了一个可以非常逼真地谈论天气的机器人。但无论我怎么看,似乎没人有办法让我的机器人真正发挥作用。
我很快就搁置了对聊天机器人的追求。我决定专注于创建能够产生真正影响的系统,从那时起我就一直在这样做。
大学
在大学里,我发现了一个吸引我研究人工智能的领域:编程语言。我很高兴编译器或静态分析器能够以我无法理解的方式“理解”程序,然后应用这种理解来做一些非常有用的事情(例如生成快速代码或证明正确性)。
我一直想抽出时间研究编程语言。但我也总是被新的创业想法(通常很糟糕)和与之合作的新人(通常都很不错)分散注意力。我最初在哈佛大学学习,后来转学到麻省理工学院,试图让自己周围一直都是可以向我学习并能与我一起创造有用东西的人。
大三的时候,我决定在校期间尝试创业是没有意义的。相反,我打算与创业的人见面,随着时间的推移,找出哪些方法可行,哪些方法不可行。与此同时,我终于开始了我的编程语言研究,从一位教授那里获得了研究资金,并招募了一些朋友参与静态缓冲区溢出检测项目。
几周后,帕洛阿尔托一家尚未成立的创业公司联系了我。通常我会直接丢弃这封电子邮件,但我决定开始与创业公司会面。我和团队一拍即合,我知道他们正是我一直在寻找的那种人。所以我离开了学校,从未真正让我们的缓冲区溢出检测器发挥作用。
Stripe
那家公司就是现在的 Stripe。我帮助它从 4 人规模扩大到 250 人,在我离开后的一年里,公司在没有我任何帮助的情况下继续扩大到 450 多人。
当我考虑离开时,主要是因为我觉得公司发展得很好,无论有没有我,它都会继续做伟大的事情。我最关心的是与优秀的人一起工作,创造一些了不起的事情——但开发人员的基础设施并不是我想用余生去解决的问题。
然而,有一个问题我可以想象我会用余生去快乐地解决:让人类走向安全的人类级人工智能。很难想象有什么比成功创造人工智能更令人惊叹和产生积极影响的事情,只要它以一种好的方式完成。
离开 Stripe
在我最终决定离开之前,帕特里克让我去找萨姆·奥特曼谈谈。他说萨姆拥有很好的局外人视角,见过很多处于类似境况的人,可能会对我应该做什么提出很好的建议。
和 Sam 交谈了五分钟后,他告诉我我已经准备好离开了。他说如果他能帮我想出下一步计划的话,就告诉我。
我回答说,人工智能是我的首选(而且它绝对是我的人生目标)。但是,我还不确定现在是否是合适的时机,也不确定我做出贡献的最佳方式是什么。
他说:“我们一直在考虑通过 YC 建立一个人工智能实验室。我们应该保持联系。”
初步探索
大约一两周后,我离开了 Stripe,开始深入研究人工智能,试图更好地了解该领域正在发生的事情。即使只是从 Hacker News 上发布的帖子(例如char-rnn)来看,也很明显,人们对人工智能,尤其是深度学习的热情和活动越来越多。但我以健康的怀疑态度对待这个领域:我想确保事情真的在发挥作用,然后再深入研究。
我的第一个目标是弄清楚深度学习到底是什么。结果发现这出乎意料地困难。例如,deeplearning.net只是说“深度学习是机器学习研究的一个新领域,其目的是使机器学习更接近其最初的目标之一:人工智能”——这听起来很令人兴奋,但描述性不强[1]。
幸运的是,我有几个在人工智能领域工作的朋友,Dario Amodei和Chris Olah。我向他们寻求一些指点,他们给了我一些很好的入门资源。其中最有用的是Michael Nielsen 的书,读完之后,我在Kaggle上练习了我新学到的技能。(我甚至在第一次比赛中一度排名第一!)
引火
一路走来,我不断遇到人工智能领域的超级聪明人,并与大学里的一些最聪明的朋友重新建立了联系,比如Paul Christiano和Jacob Steinhardt,他们现在都在这个领域工作。这是一个强烈的信号。
我研究得越多,就越相信人工智能将会带来影响。深度学习能力令人印象深刻:例如,我们现在可以非常准确地对图像中的物体进行分类(尽管有 2014 年的XKCD),语音识别已经变得非常好,我们可以生成令人惊讶的逼真图像。话虽如此,这些技术还很新,尚未改变任何人的生活方式:它们目前的影响仅限于支持某些产品功能。
我记得我曾经跟一位曾经开发过 Facebook News Feed 的朋友说过这句话。他对此表示怀疑。“简单的算法,大量的数据。”每个人都在兜售很酷的新 AI 算法,但实际上,如果你只是扩大逻辑回归的规模,它就会非常有效。然后我从口袋里掏出谷歌翻译应用,将其设置为飞行模式,并演示了它如何将摄像头下的文本直接翻译到图像上。他对此印象深刻,并承认简单的算法对此无济于事。(它主要是但不是 100%深度学习,但这不是重点——重点是它有效。)
最初的火花
6 月份,Sam 给我发信息问我是否已经想好下一步该做什么。我告诉他我目前的计划是明年创办一家人工智能公司。我们通了电话,他提到他们正在推进 YC 人工智能项目。我问 Sam 这个实验室的目的是什么。
他说:“打造安全的人类水平的人工智能。”
那一刻,我知道他是我创办下一家公司的合适合作伙伴。如今很少有人敢于明确尝试构建人类级别的人工智能。我意识到,有时候,一项努力只需要有人大胆地宣布目标,然后合适的人就会加入他们。
晚餐
大约一个月后,萨姆在门洛帕克安排了一次晚宴。出席者有达里奥、克里斯、保罗、伊利亚·苏茨克维尔、伊隆·马斯克、萨姆和其他几个人。
我们讨论了该领域的现状、距离人类水平的人工智能还有多远、需要做些什么才能达到这一水平等等。讨论的焦点是什么样的组织能够最好地确保人工智能有益。
显然,这样的组织必须是非盈利性的,不能有任何竞争性激励来削弱其使命。它还需要处于研究的前沿(正如艾伦·凯所说,“预测未来的最好方法就是创造未来”)。而要做到这一点,它需要世界上最好的人工智能研究人员。
那么问题来了:是否有可能从零开始创建一个拥有最优秀人工智能研究人员的实验室?我们的结论是:这显然并非不可能。
这是我第一次见到 Elon 和 Ilya,我对他们两人的印象非常深刻。Elon 的求知欲让我印象深刻,他非常乐于征求他人的意见,并认真倾听他们的意见。另一方面,Ilya 则是一个坚实的基础:他是一位技术专家,知识渊博,视野开阔,总是能够深入研究当前系统的局限性和功能的细节。
晚餐结束后,萨姆载我回城。我们都认为在这里开始做点什么似乎值得。我知道,只有有人愿意全身心投入,弄清楚到底是什么,谁会参与其中,这件事才会发生。我自愿加入进来。
所以第二天我又要再一次创造一些有影响力的东西。
脚注:
[1]我请 Ilya 提出一个好的定义:
监督式深度学习的目标是解决几乎所有“映射X到Y”形式的问题。X可以包括图像、语音或文本,也Y可以包括类别甚至句子。将图像映射到类别、将语音映射到文本、将文本映射到类别、将围棋棋盘映射到好棋步等非常有用,其他方法无法做到这一点。
深度学习的一个吸引人的特点是它很大程度上与领域无关:在一个领域学到的许多见解可以应用于其他领域。
在底层,模型构建了抽象层。这些抽象层可以完成工作,但很难理解它们究竟是如何做到的。模型通过使用极其简单但又神秘有效的反向传播算法逐渐改变神经网络的突触强度来学习。因此,我们可以用很少的代码行构建出非常复杂的系统(因为我们只编写模型和学习算法,而不是最终结果)。
END.
延伸阅读