深度|Databricks CEO阿里谈AI炒作:目前AI处于炒作周期的顶峰,客户更喜欢小模型

文摘   2024-11-26 07:15   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态

本文访谈内容整理自Databricks CEO Ali Ghodsi接受The Logan Bartlett Show Youtube频道专访,公开发表于2024年11月22日。原始内容参考:https://www.youtube.com/watch?v=pAcF3GV4ygM

Databricks CEO Ali Ghodsi接受The Logan Bartlett Show专访

内容导读

本文主要围绕Ali Ghodsi对人工智能现状、未来发展趋势以及Databricks公司战略的观点展开。

关于AI的现状和未来:

  1. ChatGPT时刻如同iPhone时刻:  ChatGPT的出现标志着AI从专业领域走向大众消费级应用的转折点,类似于iPhone引发的智能手机革命。 但这也会导致“每个问题都有一个AI”的现象,最终会走向专业化和整合。

  2. 模型联合和复合AI系统:  单纯追求大型模型的规模法则将面临边际收益递减。未来AI发展方向是模型联合,构建由多个小型、专业模型组成的复合AI系统,每个模型擅长特定任务,并通过协同工作提升整体性能和可解释性。这种方法更易于调试和改进,且成本更低。

  3. AI炒作周期: 目前AI处于炒作周期的顶峰,未来将会出现幻灭的低谷,随后才会出现真正改变游戏规则的应用。

  4. 数据的重要性:  数据是AI的核心竞争力。拥有独特数据优势的公司才能在AI时代保持领先。

  5. 大公司与创业公司:  大公司拥有数据优势,但行动迟缓;创业公司行动迅速,可能在特定领域取得突破。未来将出现这两种情况并存的局面。

  6. 通用推理的路径:  通往更全面推理的路径并非通过构建单一巨型模型(AGI),而是通过构建擅长特定任务的专业模型并进行联合。规模法则的收益递减使得这种方法更有效。

关于Databricks的战略和发展:

  1. 专注于特定任务的AI:  Databricks观察到,客户更青睐小型、高效的模型,这些模型能够出色地完成特定任务,而不是通用大型模型。

  2. 数据策略至关重要:  企业应用AI的关键在于制定正确的数据策略,整合和管理好数据。

  3. 寻找并利用自身的数据优势:  企业应专注于利用自身数据优势,开发具有竞争力的AI应用。

  4. 解决组织内人员问题:  大型企业应用AI需要统一战略,避免部门间冲突和权力之争。

  5. 从开源到商业化: Databricks早期专注于开源,后来转向商业化,并取得了成功。这需要果断决策和对未来趋势的准确判断。

  6. 独特的招聘策略: Databricks采用独特的招聘策略,注重候选人的“追求真相”精神,并通过“曲线救国”式背景调查和实际工作测试来评估候选人。

  7. 构建AI数据库:  Databricks的目标是成为未来所有AI应用的底层AI数据库。

关于领导力和公司文化:

  1. 早期培养领导者:  尽早培养领导者,建立信任关系,为公司长期发展奠定基础。

  2. 追求真相的文化:  Databricks注重追求真相的文化,这体现在招聘、晋升和决策等各个方面。

  3. 努力工作是成功的关键:  Databricks提倡努力工作的文化,认为成功离不开持续的努力。

  4. 果断决策和应对变化:  在公司发展过程中,要果断做出决策,及时调整战略,应对变化。

Databricks CEO Ali Ghodsi简介

阿里·戈德西(Ali Ghodsi)是数据分析和云计算领域的杰出人物,他作为Databricks的首席执行官,领导着这家在Apache Spark技术基础上发展壮大的公司。Databricks 致力于简化大数据处理和分析,其产品被广泛应用于各个行业。

戈德西并非仅仅是一位企业领导者,他还是一位技术专家。 他参与了Apache Spark项目的早期开发,对该项目的成功贡献良多。Spark的出现,极大地简化了大规模数据处理的复杂性,而戈德西正是推动这一技术普及的关键人物之一。

在创立Databricks之前,戈德西在加州大学伯克利分校担任计算机科学博士后研究员,并与Spark项目的主要贡献者们紧密合作。 他深厚的技术背景以及对数据分析领域的深刻理解,让他能够带领Databricks 持续创新,不断拓展其产品功能,并满足不断变化的市场需求。

戈德西的领导力使得Databricks 成为大数据分析领域的领导者之一,其在云端数据湖仓方案上取得了显著的成功,为全球众多企业提供了高效、可靠的数据分析平台。 他不仅是一位成功的企业家,更是一位推动数据技术发展的重要人物。

访谈全文

主持人Logan Bartlett:  在本期节目中,你将听到我和Ali Ghodsi的对话。Ali是Databricks的联合创始人兼首席执行官,这是一家估值超过500亿美元的公司。Databricks处于我们今天所见人工智能革命的中心。Ali和我讨论了人工智能的现状,以及他在基层看到的现象,他对即将出现的模型联合的看法,以及他对未来几年人工智能的展望。我们还谈到了Databricks的创立,他最终成为首席执行官的历程,以及他今天运营公司所遵循的不同运营原则。这是一次非常有趣的对话,现在就让我们来听听Ali的分享。

Ali,感谢你的参与。当然。你从2013年就开始从事人工智能工作,与Databricks一起?

Ali Ghodsi:  对,和Databricks一起。在此之前,我们在伯克利,也从事人工智能工作。你到底是什么时候开始的?我认为是2009年。我们从2009年到2010年就开始参与了。Spark最初的创建是为了参加Netflix竞赛,竞赛内容是:他们给你所有这些电影,你必须进行推荐。他们会,你知道,我想会给赢家一百万美元或五十万美元。所以我们在比赛中获得了最高分。与另一个团队一起。

主持人Logan Bartlett:  所以你现在已经从事人工智能15年了。显然,它最初被认为是一个利基领域,也许是学术性的,而今天我们显然处于一个非常不同的阶段。我很好奇,当ChatGPT出现,似乎从企业和商业用途转变为主流消费者应用的那一刻,这是否改变了你对人工智能的看法?

Ali Ghodsi:  并没有真正改变。我认为它从2013、14、15年就开始改变了。我只是不明白为什么人们没有真正进入人工智能领域。你知道,在2014年,我记得我和公司许多人就我想称之为人工智能的事情进行过辩论。他们说,不,那不真实。你愿意称之为机器学习吗?是ML。我说,看,一旦这些东西成为主流,你它就不会被称为ML,对吧?他们说,不,但这不准确。人工智能是机器人技术。我从未理解为什么它不是一件更大的事情。它有点深奥,机器学习AI。在2022年11月,这一切都说得通了,但它震撼了所有人的程度让我感到震惊。

主持人Logan Bartlett:  确实令人震惊。这让你感到意外吗?在过去的15年里,你有没有回顾过一些对你来说具有突破性意义,但对主流来说并非如此的时刻?

Ali Ghodsi:  是的,我的意思是,当我们开始的时候,人们并没有真正将机器学习用于广告技术以外的其他方面。它确实是广告投放,你知道,点击率,日志点击流来投放广告等等。所以我会说,2014年、15年,当我们说大型企业开始将这些东西用于更有趣的事情时,比如Expedia如何列出酒店。你如何对酒店列表进行排名,为他们带来了巨大的收入增长。这是一个改变游戏规则的时刻。再生元公司发现了某种疾病的基因DNA标记物,他们正在研发药物,你可以开始看到哇,这对许多公司来说确实有很大的影响,这是一件大事,但我会说2018-19年,我们开始看到自然语言处理的突破出现,你知道,GPT-2等等,它已经非常令人惊叹了,所以很明显图灵测试很快就会在几年内被打破。所以,你知道,有很多这样的时刻。但是,谁能预料到全世界都会以这种方式醒来,这将成为每天的头条新闻呢。

主持人Logan Bartlett:  是的,难以置信。我听说你将ChatGPT时刻比作iPhone时刻。你能比较一下这个比喻及其对应用程序的影响,以及企业或用户应该如何看待人工智能吗?

Ali Ghodsi: 是的,我的意思是,当iPhone发布时,每个人都意识到智能手机革命将会是什么样子。随后立即发生的事情是,地球上的每个公司都说,我们必须构建大量的应用程序。我们必须构建我们自己的iPhone应用程序。所有公司都在构建应用程序,出现了一阵热潮。但是,这些应用程序真的有意义吗?他们构建的许多应用程序,你知道,我开玩笑说,这就像为你的iPhone构建一个手电筒应用程序。但几年后,iPhone本身就内置了手电筒

我认为2023年是每个人都想说,嘿,我在我们公司拥有AI。我是AI负责人。我是生成式AI。很多聊天机器人被开发出来,你知道,就像在2007年或2008年那样,“每个问题都有一个应用程序”,现在将会有一个专门解决这个问题的AI公司。例如,人们为人力资源文档构建了聊天机器人。你可以问,你知道,你的陪产假或产假政策是什么?一家公司正在开发这个。然而,对于一家公司来说,自己开发这个是没有意义的。更有意义的是有一个SaaS应用程序来解决这个问题,每个人都可以购买它。

有点像,我们正处于这样一个时刻,很多人都在说,嘿,我们要为所有事情构建我们自己的手电筒应用程序或任何聊天应用程序。现在,我们慢慢地看到正在构建的公司和正在开发的应用程序将进行专业化,我们都将利用它们。我认为我们才刚刚开始。

主持人Logan Bartlett:  为了更进一步地阐述这个比喻,你认为最终是否会在最终客户和人力资源系统之间出现去中介化,即本地人工智能业务会接收自然语言接口,而Workday、ADP或其他任何后端公司将不再充当与用户的接口?

Ali Ghodsi:  有可能。我认为这种动态正在发挥作用,在这个人工智能时代,数据极其重要。那么,为什么每个人都不应该构建自己的聊天应用程序呢?好吧,你知道,你真的应该问问自己,作为一家公司,你的竞争优势是什么?你能做到的独特的事情是什么,而你的行业中没有其他人能够做到?每个人都可以调用OpenAI的LLM。所以你只是在调用,你知道,GPT-4或5或6。这不会有帮助。那么它有什么呢?通常它会回到数据或某种客户关系。但通常是数据,你必须拥有一些其他人没有的数据优势。这就是问题的关键。

大型公司,那些老牌公司,他们拥有这种数据优势,对吧?他们拥有客户,并且正在收集大量数据。所以问题是,他们能否利用这种数据优势,并整合人工智能,进行必要的创新?另一方面,我们之前在这个浪潮中已经看到,会有这些聪明的创始团队,他们完全以不同的方式思考问题。他们会崛起,他们会以老牌公司无法做到的一种方式来做事。他们行动迟缓,无法做到。

我认为我们将会看到这两种情况。我认为我们将看到很多公司创业公司失败,就像99年互联网即将到来的时候一样。但我们也会看到一些公司成为下一个谷歌、Facebook等等。然而,我认为我们也会看到一些老牌公司,它们实际上弄清楚了如何利用它们拥有的数据,并进行必要的投资来破解密码。我们将看到这两种情况。

这究竟是如何发生的,你知道,我会更看好创业公司,说实话,而不是大公司。很有趣。大公司行动太慢了。如果你有一个杀手级应用程序,你可以让数据飞轮运转起来,你可能会收集到关于它的数据并增加使用率。然后你将拥有足够的数据优势来做到这一点。如果大公司没有关注,事情发展得太快,在你意识到之前,就为时已晚。

主持人Logan Bartlett:  关于AI,您认为我们现在正处于炒作周期的哪个阶段?

Ali Ghodsi: 我认为我们会看到这种情况。我认为我们并没有处于幻灭的低谷。坦白说,我认为我们正处于顶峰。很快我们会看到越来越多的公司业绩不佳。我认为会有这样的说法:AI这玩意儿完全是夸大其词,什么都没有,模型质量不行,根本不管用,不值得,这些公司等等。所以,我认为我们很快就会走向那个阶段。但之后,我认为那些公司会开始推出真正改变人类的游戏规则的应用。

主持人Logan Bartlett: 好消息是加密货币又回来了,所以人们可以在两者之间来回切换。我们现在正在录制,大概是24年11月初,关于规模法则以及我们可能正在达到某些极限并出现边际收益递减的报告有很多,对此您有什么看法?

Ali Ghodsi: 是的,我的联合创始人Matei Zaria和我一起发表了一篇研究论文,关于复合AI系统,我们这么称呼它。这篇论文可能在六个月前甚至更久以前就发表了。它实际上预测了这一点,它基本上说的是,为了真正获得最后一点质量提升,并真正提升其他方面,我们需要构建这些由许多部分、许多组件协同工作的代理系统。

特别是,能够根据你想要执行的特定任务评估整个AI系统的质量,这一点将非常非常重要。就拿我刚才举的那个愚蠢的例子来说,人力资源文档问答,你如何解答员工关于人力资源文档的问题?不是你如何通过律师资格考试或医学考试,不是通用人工智能,而是这个具体的。只有当我们有了这种评估方法,我们才能开始构建这些代理系统,才能开始进行爬山法,并不断提高特定任务的质量。我们称这些为复合AI系统。

这些系统还将利用许多工具,并将结合经典机器学习,因为经典机器学习具有更好的数值计算能力。它在处理数字和计算方面要好得多,例如自然预测等等。这就是我们所说的复合AI系统。这些系统的优点在于,当它们运行出错时,你可以调试哪个代理出了错。你可以确定推理步骤在哪里断裂,然后改进它。你可以做得越来越好,参与这种爬山法,不断提高模型或AI系统的质量。

相比之下,规模法则涉及预先构建这些巨大的模型。你等六个月让一个模型问世,它可能不擅长预测某些东西,可能是因为它在数值计算方面不够好。那时,你甚至不知道为什么它不好。无法确定,“嘿,它为什么把这件事弄错了?”它可能只是进行了一系列矩阵乘法和注意力层,然后出现了一些不准确的结果。你可能会想,“我不知道。让我们用更多的数据训练一个更大的模型。”

采用这些更具代理性的推理时间工作流程似乎容易得多。所以这很有道理。我认为会有很多创新。

主持人Logan Bartlett:  您认为这是否意味着模型类型和各自擅长能力的联合?

Ali Ghodsi: 是的,我认为你会构建在特定任务上非常非常优秀的AI系统。我们一直都在看到这一点。我们的客户通常想要一遍又一遍地做同样的事情。例如,他们拥有海量数据,例如他们拥有包含证券交易所申报文件的数据库,对吧?或者他们是一家保险公司,他们拥有所有这些保险文件。他们希望反复对海量数据执行相同的任务。

对他们来说,关键在于我能在特定任务上达到多高的质量?他们不需要擅长AGI(通用人工智能)。重点是如何持续有效地执行此任务,以及你能否以最低的成本执行?因为他们会大规模地执行此任务,这将花费很多钱。因此,专门设计一个在这个特定任务上非常非常优秀的系统是有意义的。一个通用的巨型模型通常成本太高,实际上它可能表现得也不好。即使更大的模型可能更聪明,它也不会擅长客户需要的重复性任务。

我们一直都在看到这一点。Databricks的一个令人惊讶的发现是,我们有各种规模的模型。你可以使用LLAMA 405或具有50亿参数的模型。然而,总的来说,我们从小规模模型中获得的收入更多。这让我很惊讶,因为按模型计算,你预计在一个更大的模型上会赚更多的钱,它使用更多的GPU和资源。然而客户更愿意采用更大的模型,将它们提炼到尽可能小的尺寸,同时仍能提供足够好的质量,然后只使用它,因为它可以节省他们的钱。总的来说,我们实际上从小模型中赚到了更多的钱。

所以,是的,我认为这种趋势会继续下去。你也会在日常生活中看到这种现象。例如,在人类所做的所有任务中,你需要对于每项工作都使用陶哲轩吗?你是否为每项任务都聘请了地球上最聪明的人?许多工作是重复性的,通常一个标准的、足够的模型就足以胜任手头的任务。利用一个更有效的模型来满足特定要求而不过度使用资源是有意义的。

主持人Logan Bartlett:  您如何看待通用推理的概念,或者说通往,也许不是AGI,而是更全面理解和推理的路径,这种推理支持这些不同的模型?您认为我们正在接近一个阶跃式发展,还是认为我们已经达到了一定的平台期,现在主要取决于数据和不同的功能领域?

Ali Ghodsi: 我的意思是,看看规模法则,它就像对数尺度。所以向右移动,我们将继续向右移动。是的,这意味着我们将获得改进的智能。但是,你知道,下一个1000倍不会像之前的1000倍那样产生那么大的收益。此外,你知道,我们的一位研究人员指出了这一点,在过去的11年中,我们在解决这个问题上投入的计算能力提高了1亿倍。在接下来的几年里,我们不可能获得同样的提高。我们将改进它,但不会那么多。你知道的,根本没有足够的能量计算可以投入进去。而且我们不会有足够的数据。

例如,Llama是在15万亿个token上训练的。那是多少,是网络规模的10倍?我们会将数据量增加100倍,1000倍吗?获取那些高质量的数据,似乎只是,变得非常昂贵。构建这些复合AI系统,这些代理系统要容易得多,你实际上可以调试并真正擅长这项任务。所以是的,我认为速度会放慢。

我还认为,很多事情人们会说,看,我们将真正破解代码,并提出那个超级AGI,这需要某种递归自改进循环。我不认为会发生这种情况,因为下一个模型更昂贵,需要更多的人。你必须更加小心。我相信,如果你说,嘿,GPT-5将花费1美元,并且创建它只需要一秒钟。如果我们朝这个方向发展,那么你可以看到,好吧,那么它可以自行衍生,我们可以应用遗传算法,做很多,然后选择最好的,等等。

但我们不是朝这个方向发展。恰恰相反。就像,我们将建立一个非常专业的 数据中心。我们将在一年的时间里构建一个模型。我们将非常小心。会有很多人参与。所以我没有水晶球,但我猜想,在未来很多年里,我们需要人工参与,我们需要这些东西是可以验证的。就像我们在汽车或飞机自动驾驶仪中看到的那样,我们希望有人参与进来,可以验证它不会偏离错误的方向。它只是在加速他们今天的工作。我认为为此,我们将使用更多这些代理系统。

主持人Logan Bartlett:  听起来像是很多铅弹,并没有什么银弹出现在地平线上。当人们谈论500亿美元的模型,或者,你知道的,投入所有这些资金时,我确信这对你们的业务来说非常有利,因为人们都在考虑这些。但是你认为我们刚才讨论的所有这些,是否意味着这有点好高骛远,并且随着人们谈论这种规模的模型,收益递减过于乐观呢?

Ali Ghodsi:  再说一次,我没有水晶球。也许他们是对的,如果他们是对的,那真是太棒了。在预测这些事情上,你们历史上做得相当不错。我认为他们的推理是合理的,就像,“嘿,我们正在创造AGI,任何代价都值得,成本无关紧要,稀释也无关紧要。你们的经济模型已经过时了,我不在乎它们,因为看看我们创造了什么。”如果你真的做到了,这对我来说是有道理的。但我可能更倾向于持怀疑态度。

花费这么多钱,我想我太像一个运营公司的管理者了,需要考虑增长率、客户终身价值、客户获取成本等等,包括运营利润率。我认为,如果你必须花费这么多钱来开发一个模型,然后你必须对该模型进行推理才能收回训练该模型所需的投资,那么现在看来,在你甚至收回训练模型的成本之前,它就已经商品化了,而且某个地方肯定有更好的版本。

因此,从经济角度来看,现在这样做根本不可行。似乎对于那些特定的任务来说,创建这些复合代理系统的成本是值得的,而且投资回报率很高。为什么不这样做呢?它可以创造很多价值并继续这样做。然后,也许当其中一个实验室拿出那个超级模型时,我们会感到惊讶。但我持怀疑态度。我认为会存在一个障碍。我们必须克服一些巨大的障碍才能达到那个能够获得准确结果并可靠运行的完全自主系统。我们现在冻结了模型开发。

主持人Logan Bartlett:  你认为我们现在拥有的AI能力是否足以在某个时刻赶上所有工具、应用以及我们所看到的兴奋和前景?或者你认为我们正在讨论的更小众、更专业的模型中的这些增量改进,我们需要不断改进才能赶上我们本来可能取得的潜力?

Ali Ghodsi:  绝对的。我认为,人类是这里最长的木板。如果没有人使用这些东西,它就完全没用。你甚至想不出那个超级AGI。如果没有人使用它,它就无关紧要。人类改变他们在这些公司中的所有行为、习惯、流程等等需要很长时间,这非常非常困难。所以我认为,就我们现在所拥有的而言,还有巨大的未开发潜力,它尚未应用于每个工作场所、每个职能、每个流程以及我们正在做的所有事情。我认为我们甚至可以通过我们讨论过的那些技术来改进我们今天所拥有的东西。所以我认为,即使我们冻结它,我们说,“就是这样,实际上,我们不知道如何创建一个更好的单一模型,这是我们在未来20年里所能看到的最好的。”我认为这将对经济以及我们能够做什么产生巨大的影响。所以我仍然会对此极其乐观。这与我的一贯看法是一致的。

主持人Logan Bartlett:  从你的角度和视野来看,你有没有看到一些对于普通听众来说可能不直观的事情,他们关注所有这些事情,但你能像10年前一样清晰地看到,你就像,“嘿,为什么没有人,为什么没有人关心这个AI?”有没有其他的见解,也许不是那么大的量级,但一些你认为可能在几年内成为主流或被广泛理解,但现在却被低估的事情?

Ali Ghodsi:  今天?是的,我的意思是,我认为这是你专注于任务的问题。我已经说过了。你将任务集中在那些今天耗费你大量金钱的重复性工作上。如果你只是提高了这些特定任务的可靠性,这对这些组织来说就是巨大的改进,而且是相当具有变革意义的。我们实际上还没有获得这种好处。这些用例现在正在开发中,人们正在构建它们,它们还没有投入生产,还没有对所有使用这些东西的公司产生影响,但这指日可待。这几乎可以肯定会出现。可能需要两到三年我们才能看到它,然后我们才能看到它的影响。事实上,我担心或怀疑,在那之前,我们可能会遭遇幻灭的低谷,然后这些用例才会落地,我们会看到正在这样做的公司。所以你已经可以看到它正在酝酿之中,只是还没有投入生产。

主持人Logan Bartlett:  你有没有看到人们使用Databricks或其他系统的一些用例让你特别兴奋?回到你10年前所说的再生元公司的类比。也许今天你们在现场看到的一些事情让你感到兴奋,或者让你特别期待?

Ali Ghodsi:  未来可能发生的事情?在每个垂直领域,在每个行业,我们都看到了许许多多的用例。例如,在金融服务领域,有大量的理财顾问。现在,我们为我们的一个客户(一家大型银行)自动生成个性化建议。这些建议是定制的,并考虑了客户的所有情况,包括他们的财富状况。因此,他们可以提供量身定制的指导。这一趋势影响了数千名现在正在利用这项技术的顾问。

在保险领域,筛选大量文件以评估风险的能力变得越来越重要。模型阅读数据非常快,但生成文本的速度较慢。有趣的是,阅读任务与文本生成的频率之间似乎至少存在十比一的比例。用户与模型交互以阅读信息的数量是生成输出的十倍甚至一百倍。这种差异常常被忽视,因为人们往往关注生成的文本,而文本通常要小得多。

承保是另一个我们看到重大进步的领域。许多公司正在深入研究美国证券交易委员会(SEC)的备案文件,以提取有意义的信号并识别阿尔法。这一趋势在整个金融领域都很普遍,我们还在医疗保健领域看到了许多新兴用例。例如,电子病历通常包含大量手写信息,而能够在这些数据中找到结构非常有价值。这些用例展现了大量的潜在应用。

总的来说,在所有行业中,我们经常观察到数百个这样的用例。然而,许多用例尚未完全投入生产或集成到劳动力中,这突显了在各个领域进行创新和提高效率的巨大机会。

主持人Logan Bartlett: 你觉得阅读与写入的比率会一直保持在这个水平吗?你是否观察到任何趋势,例如阅读量相对于写入量有所增加?或者你认为在某个时刻,写作和内容创作最终会赶上阅读和总结?

Ali Ghodsi:  很难预测,因为,你知道,作为人类,我们会阅读多少内容呢?我们的阅读速度很慢,而 AI 可以快速处理大量信息并从中获取上下文,这很有意义。因此,阅读与写入的比率可能会进一步扩大。如果我们能更快地完成这项工作,这就是未来的发展趋势。从我们的数据来看,这种趋势越来越明显。

主持人Logan Bartlett: 当你为大型企业或小型企业提供咨询,帮助他们了解如何在组织内应用 AI 和自动化技术,并如何继续深入探索这条道路时,你是否会反复强调一些关键要点?比如,如果你能告诉所有客户,组建团队的方法,或者思考问题的方法,你会怎么说?你有没有什么框架、基本原则或其他想法?

Ali Ghodsi: 首先,必须制定正确的数据策略。许多公司现在都想跳过这一步,直接跳到 AI 应用。数据团队一直在努力组织和保护公司数据,将数据集中到一个地方以便访问,而不是将其分散在不同的孤岛中。这是一个漫长的过程,而且尚未完成。这项工作并没有出现在财富 500 强公司的 CEO 雷达上;它可能是一个比较冷门的议题,也许只与 IT 部门有关。现在,在 ChatGPT 出现之后,CEO 们开始意识到:“我需要 AI。它具有改变游戏规则的意义。我现在看到了它的价值,我自己也用过它。给我 AI。” 然而,他们似乎跳过了这个至关重要的步骤。回到基础非常重要。数据至关重要。如果你的数据管理不好,你就无法在 AI 领域取得成功。

第二点,要根据自身的数据优势,集中精力于想要追求的 AI 应用场景。对于你的公司来说,你的数据优势是什么?我经常在与客户的交谈中发现自己会建议他们:“也许不要做这个项目。” 当他们兴奋地谈论他们的计划时,说:“我们非常兴奋并准备好了;我们会付给你很多钱”,我会解释说我们需要考虑他们在那个背景下的竞争优势。很可能已经有其他人开发出了满足他们设想的应用。因此,必须关注你确实拥有竞争优势的领域,而这些优势源于你的数据。专注于具体的应用案例至关重要,因为我们希望我们的客户能够成功。只有这样,我们才能长期成功。

第三个方面是解决大型组织中固有的人员问题。许多人在争夺公司内部 AI 的所有权,宣称“我是我们公司 AI 的所有者”等等。在这些大型组织中,找到一种方法来统一战略至关重要。我知道这很枯燥,但这通常是管理大型团队最难的部分——这么多不同的人朝着不同的方向前进,每个人对使用哪个供应商、实施哪种模型、招聘哪些人才以及优先考虑哪些项目都有不同的想法。如果你能让一个人集中决策权,而不是让各个部门进行政治斗争,就能简化流程并加快进度。

通常,这个人将是相关部门的负责人,并担任变革推动者。他们做出的决定可能并不总是受欢迎的,但他们的作用是就简化数据处理以及解决安全和隐私问题(这通常是每个人的心头大事)做出艰难的决定。同样重要的是要关注那些对组织真正重要的用例。这方面与技术本身一样重要。虽然我非常关心技术,并且经常沉迷于技术细节,但组织动态同样至关重要。项目可能会缺乏资金支持,在安全方面停滞不前,或者由于部门间的冲突而无法继续推进。我们需要克服这些问题。这就是为什么我说需要几年时间才能看到这方面取得显著进展的原因。

主持人Logan Bartlett:  当你思考这个领域以及你之前提到的“复合”这个词,指的是什么?复合数据,等等?复合智能体系统。你认为哪些领域值得探索?有很多风险投资公司涉足推理或评估等领域。当你考虑 Databricks 公司可能进入的不同领域时,你是如何评估这些市场的?

Ali Ghodsi: 追求新的机会是有意义的,特别是对我们来说,因为我们认识到客户已经将所有数据存储在 Databricks 上。他们信任我们处理安全和隐私问题,这促使我们探索相邻领域,在那里我们可以提供他们可能在其他地方找不到的额外价值。这通常围绕他们拥有的数据的治理展开,确保到位适当的保护措施。

例如,一个客户的聊天机器人遇到了问题,它推荐的是竞争对手的汽车而不是他们自己的汽车。这突出了建立保护措施以防止此类事件发生的重要性。此外,公司必须解决个人身份信息 (PII) 的处理和即将出台的 AI 法规。Databricks 非常适合标准化这些要求,从而能够自动创建文档以符合新兴法规。通过实施这些保护措施,我们可以增强所用模型的功能和安全性。

此外,由于数据已经掌握在我们手中,我们能够创建一个数据循环,从而实现持续改进。当客户使用该模型时,我们可以生成评估结果并自动将其反馈,使模型随着时间推移变得更智能。这将创建一个对我们和我们的客户都有利的良性循环。

关于初创公司,我相信他们应该专注于应用,因为那里的 AI 领域将在未来创造巨大的价值。我们希望成为支持他们进行数据处理、治理和 AI 应用的基础设施。这个领域充满了创造力,虽然不可能预测哪些应用会成功,但必须记住,预测下一个大型平台,就像 2000 年的 Facebook 或 Twitter 一样,是具有挑战性的。我们的目标是为这些初创公司提供强大的基础设施,使他们能够在我们平台之上构建他们的 AI 系统,并在这个充满活力的环境中促进他们的发展。

主持人Logan Bartlett: 如果我们稍微回顾一下 Spark 早期,我们谈到了 Netflix 竞赛等等。我听说你们在早期试图销售这项技术,但没有找到买家。你能回顾一下那个早期的故事吗?比如,你看到了什么?你又是如何把它发展成商业产品的?

Ali Ghodsi:是的,我们的观察是,早在2009年或2010年,硅谷科技公司就已经开始利用人工智能了。我们看到了Facebook在做什么,看到了Google在做什么。很明显,基于数据进行AI开发将成为最重要的事情。

当时,每个人都专注于进行基本的、回顾性的分析,我们称之为商业智能(BI),它只关注过去。例如,“我上周的收入是多少?”他们能够非常快速地做到这一点,为此感到兴奋。但我们提出的问题是:“你下周的收入会是多少?”——这就是AI。当时,人们对AI的兴趣并不高。

我们四处推广这项技术,因为我们只想进行研究。然而,让人们真正看到这一点非常困难。你可能还记得那个词语,“Hadoop大战”,“Hadoop时代”。要吸引任何人关注这些事情,简直是不可能的。

正是在这种略微绝望的情绪下,我们创建了公司,并说:“如果我们自己不做,就没有人会做了。”我还记得我们最早的一位客户,我们对他们说:“这是开源的,拿去吧,我们不想靠这个赚钱。”他们说:“不行,你必须向我们收费,因为我们需要一家企业来支持它。”

那时我们才意识到,好吧,需要一家企业来运营这项业务。没有其他人会去做,我们可能必须自己做。

主持人Logan Bartlett:对于这些厂商来说,问题仅仅是单纯的关注度不够,还是从数据结构的角度来看,需要发生一些变化才能让市场发展到能够实现你们想要他们做的事情的程度?

Ali Ghodsi:我认为存在炒作周期,每个人都只关注某件事。那个时代是Hadoop的炒作周期,他们对此着迷。我们无论如何也无法告诉他们,AI更有趣。这就像,你打开报纸,所有内容都只关于Hadoop。现在也一样,对吧?我认为市场就是这样运作的。要创建一家成功的公司,你必须押注当时不被大家看好的事物,并且你必须押对。对我们来说,那就是AI、云计算和开源。这些是我们感到兴奋的事情,但当时并没有多少人对此感到兴奋。事实上,有人告诉我们,这行不通。所有数据都将保留在本地,开源无法盈利,等等。所以,我认为现在的情况也类似,对吧?

主持人Logan Bartlett:我听说过一个故事,说一位客户要出价,我不知道是七位数还是八位数,来让你开发产品的本地版本。而在你可能可以使用这笔钱的时候,你拒绝了。当时你肯定可以用上这七位数或八位数的资金,或者无论是什么数额。你是认为这是你正在构建的不可避免的道路,因此除了这条路之外的一切都是沿途的干扰,还是怎么回事?

Ali Ghodsi:这是一个哲学性的决定。是的,完全是这样。我们的观点是,我们必须对其他人都不相信的事情进行不对称押注,并且我们最好押对。这是唯一的方法。如果我们要做本地部署并做其他人都在做的事情,那么会有比我们更大的公司来做这件事。然后这就会失败,不会成功。

所以,是的,在我2016年担任CEO的第一个月左右,一家最大的银行告诉我:“你需要把这些东西部署到本地。”我说:“不,我们不会那样做。”他们问:“多少钱?”我回答道:“多少钱什么?”他们说:“我们愿意付你多少钱?”我重复说:“我们不会那样做。”他们出价500万美元,我说:“我们不会那样做。”然后他们出价1000万美元,我又说:“我们不会那样做。”最后,他们出价2000万美元,“我现在就给你2000万。”

在2016年,我想我们那年的收入是1000万美元。所以2000万美元的收入很多。但我们的想法是,如果你做本地部署,他们是一家规模更大的公司。所以我们必须进行我们相信的不对称押注,并继续加倍押注。

然后,一旦这个赌注成功,我们就会足够大,以至于其他人难以赶上我们。正如我所说,现在在AI和大型语言模型时代,也会发生类似的事情。我认为你必须选择一些你认为与市场其他部分不同的东西,然后押注它,然后希望你押对了。

主持人Logan Bartlett:在你回顾这段旅程时,我听说过一个故事,你对Ben Horowitz在将Databricks发展成一个商业产品方面给予了很大的肯定。你能讲讲这个故事吗?通常我不允许提及其他风险投资公司,但我认为这是一个有趣的故事,他实际上是在推动你们放眼长远,将其发展成一个商业产品。

Ali Ghodsi:是的,我的意思是,我们是从研究实验室出来的。我们真的只想募集20万或40万美元的种子资金,然后编码一两年。是他大力推动我们进行A轮融资,并且他希望成为独家投资者。我们实际上对此并不太兴奋,但他给了我们一个无法拒绝的价格。他说,放手去做。当时他给了我们1400万美元,那是当时一大笔钱。我知道现在不算多。他说,全力以赴,积极进取,颠覆市场,放眼长远。你知道,他对Databricks的愿景总是比我们大几个数量级。无论我们对Databricks怀有什么宏伟的愿景,他总是领先几个数量级,并积极推动我们,说:“不,不,不,你想得太小了,太小了。”我认为他也真的相信这一点。所以这从早期就奠定了基调。

主持人Logan Bartlett:对我们来说。因为早期的创始人们,我不知道你还记不记得这些数字,当时的具体数字是多少?

Ali Ghodsi: 那么,公司的赌注是什么?当我们创建公司时,我们围坐在桌旁,问自己:“嘿,公司最好的结果是什么?”我想,当我们环顾四周时,我们想到的数字大约是1.5亿美元的退出,或者2亿美元。甚至有人建议2.5亿美元。所以我们当时就是这样想的。Ben立刻说:“不,不,肯定是数十亿美元;我们会做到的。”当我们达到那个点时,感觉这很容易成为一家千亿美元的公司。而且,你知道,现在,我们身处何地,他说这肯定需要考虑万亿美元。

我也要感谢Marc Andreessen。在一次会议上,我认为是在2017年初,他问我们:“你们最大的瓶颈是什么?”我们回答道:“嘿,我们招不到工程师。我们无法从Facebook和谷歌招到工程师;他们太贵了。”他思考了一会儿,说:“那么,问题是什么?FAANG是问题吗?”我回答说:“是的,FAANG是问题。”然后他建议道:“好吧,所以你只需要把自己添加到这个名单中。它需要成为FAANGDB。”就这样;他接着说别的了。

在那次会议之后,我们意识到他是对的。我们实际上只需要提供高薪并招聘这些人,成为这些科技巨头的竞争者之一。这确实改变了我们的思维方式。我们回去改变了我们的薪酬和招聘方式,所有这些都是基于他的一句话。

主持人Logan Bartlett:  我很好奇,从战术层面来说,我的意思是,这听起来非常理想化,很棒。但在改变薪酬待遇或着眼更大的目标方面,你们接下来做了什么?

Ali Ghodsi: 我们直接回去,将工程师的薪酬调整到市场上第90百分位的水平。我们进行了计算,评估了这将花费我们多少钱。我们能否做到这一点?这对公司来说是否负担得起?稀释程度会是多少?这已经是很久以前的事了。当我们进行计算时,惊讶地发现我们实际上负担得起,而且这是可持续的。

作为数据公司,我们仔细分析了数据。我们发现,股权补偿本质上是你的市值除以员工人数。这就是你用股权支付员工时的股权丰富程度。许多公司拥有大量员工,事实证明,我们实际上比最初认为的更富有。考虑到我们的市值除以员工人数,结果表明,提供这种类型的薪酬完全在我们力所能及的范围内。

让我们进一步探讨一下。随着这项战略开始生效,我们能够招聘到以前无法吸引的人才。这些新员工加入后彻底改造了我们的产品。我们大大提高了Databricks的产品功能发布速度和创新周期。这一改进帮助我们逐渐开始脱颖而出。如果你在2017年与我们交谈,我们会是数百家初创公司中的一家。

这些细微但重要的变化促使我们放眼长远,设定更高的目标。然而,我们审慎地进行了这些改进;我们不想过度冒险,耗尽我们的资源。我们的目标是在方法上谨慎和具有战略性。

主持人Logan Bartlett:  关于Databricks成立于2013年?对吗?在最初的几年里,你不是CEO。你在旅程的最初几年里都在做什么?是什么促使你接任并成为CEO?

Ali Ghodsi:  是的,我当时负责产品和工程,我很喜欢这份工作。实际上,在这个阶段,这很有意义,因为你创业的头两三年会做什么?当你创办一家初创公司时,你想要实现产品与市场匹配,打造一个真正有效的产品。所以这就是我们的重点。我们如何找到一个想要使用这个产品的客户?然后我们如何找到一个想要重复使用它的客户?然后我们如何找到一个重复使用并为此付费的客户?所以这就是头两三年的重点。我们利用Spark进行技术创新,在2015年取得了爆炸式增长,在那时,我们感觉自己已经成功了,但我们没有任何盈利模式,所以在15年我们经历了一段艰难时期,我们必须弄清楚,如果我们无法盈利,也许这里什么都没有,公司经历了一段时间的反省,然后我们说,让我们对一些事情进行一些重置,重新思考一些东西,并在2016年重新开始,所以你们可以在2016年看到我们,我们做了一系列改变,这些改变实际上开始帮助我们实现盈利。

主持人Logan Bartlett:  最初,你是临时CEO,还是在他们还在与其他潜在外部候选人洽谈时就担任CEO?

Ali Ghodsi:  首先,我从传闻中听说他们在面试其他人。所以我发现,好吧,他们实际上正在面试其他外部人员。你当时是CEO吗?不,但他们说,嘿,你想当CEO吗?我说,当然。然后我发现,好吧,他们实际上正在面试其他人。好吧,他们没有告诉我这件事。但最终我意识到,好吧,我想我是CEO了。他们已经向公司宣布了。我是CEO。我负责运营。但我有点,你知道的,我的薪酬没有变化。我很快就了解到,嘿,我实际上是临时CEO。我不知道。后来事实证明,实际上这只是一个试用期。然后最终,我会说一年后,我认为他们真的考虑:我们要选他。

主持人Logan Bartlett:  所以当你在2016年上任时,你关注了三件事。听起来货币化也是其中之一。但是你能说说这三件事是什么吗?我想是提升管理团队、改变客户类型的重点以及货币化。

Ali Ghodsi: 是的,企业销售,完全转向企业B2B。我们是PLG模式(产品主导增长)。我知道它现在仍然很火爆,每个人都想建立PLG公司,但我们通过两三年的艰难经验了解到,PLG并不真正有效。它可能只适用于极少数公司。这是一件很棒的事情——我们仍然使用PLG模式。但你猜怎么着?如果你想销售一个数据平台,你想管理大型组织中最敏感的数据,你需要获得该组织的认可。没有人会仅仅刷一张信用卡就开始向你提供他们的数据,并且你会成功。因此,PLG模式在这种模式下根本行不通。在B2B领域中,这很难。如果你要与大型企业签订巨额合同,PLG可能行不通,而且确实行不通。

所以,首先,我们全力投入企业销售。我们之前曾尝试过这种PLG产品主导增长模式。第二件事是提升管理层。我们提升了整个高管团队。高管团队中的每个人都是新的。我基本上组建了一个拥有更多经验的新高管团队;他们知道自己在做什么。我们更倾向于经验,而不是仅仅依靠能够独自解决问题的聪明博士。相反,我们引进了从事销售20到30年的人,或者在Oracle大规模做过营销并了解营销方式的人。这确实有助于执行,因为我会说我们在市场营销策略方面比较薄弱。我们在产品创新和研究方面非常出色,因此这些变化确实有所帮助。

然后,我们在开源方面的创新方式发生了变化。仅仅开源所有东西并免费提供是行不通的。我们需要专有的秘密武器,而不仅仅是将其提供给大型云服务提供商。这对于改变也至关重要。如果你是一家来自学术界的纯粹开源公司,实施起来就很难;很难让你的所有员工都完全致力于这一转变。然而,这是成功的唯一途径。如果我们没有做出这样的转变,我们就不会生存下来。

主持人Logan Bartlett:  在你负责产品时,你是否持有这些观点,并且你已经准备好这样做?还是有一些反思最终导致了这些?

Ali Ghodsi: 是的,我认为2015年我们表现不佳。当时的情况有点像,好吧,我们正在尝试产品驱动增长 (PLG)。很显然,它没奏效,对吧?我们不想追求企业级B2B业务,因为我们在这方面并不擅长,也缺乏必要的经验。然而,我们在2015年底的收入达到了160万美元。考虑到我们原本可能只有150万到160万美元的收入,我们意识到一名企业销售人员只需通过一个客户执行主管 (AE) 就能销售一百万或一百五十万美元的软件。所以,我们想,为什么不雇三个试试呢?我们有什么损失呢?这个想法在2015年底变得尤为强烈。

我们面临的另一个问题是,无论我们在创新周期中做了什么,那些大型云服务提供商都会立即复制我们的产品。他们会采用我们的创新成果,并在其基础上增加一些额外功能。结果,他们总是将自己定位为“足够好”的供应商。客户会说:“你们的创新很棒,但我也能从大型云服务提供商那里获得。” 他们通常会先尝试大型云服务提供商,因为他们已经与这些公司签订了合同,获得了安全认证,并且已经进行了投资。他们会想,“如果不够好,我再回来找你们。”

很明显,我们需要有效地阐明我们的独特价值主张。我们必须证明,“是的,你可以去那里,但你得不到XYZ。”这意味着要突出我们提供的而他们没有的独特功能和优势。如果我们无法清晰表达这一点,那么我们就无法为我们的销售人员提供任何可以销售的东西。此外,很明显,我们缺乏关键的经验。总的来说,2015年的困境使我们清楚地认识到,我们必须尝试一些新的方法,而这三个方向似乎是可行的选择。

主持人Logan Bartlett: 我的意思是,最有可能成为“单向门”的是许可或盈利模式的转变。我认为这与那些某种程度上非常坚持开源原则的人的文化大相径庭。这是一个经过认真讨论的决定吗?还是只是直接宣布的?嘿,伙计们,我们必须这样做才能建立业务。

Ali Ghodsi: 我认为在我接手的时候,我对需要做的事情比较强势。但这在内部引起了很大的争论。我把它讲得很清楚。我想我用了这样一个比喻,我说,嘿,我们有一把枪,只剩下一颗子弹了。我们不会做一千件事。我们只剩下一颗子弹了。我们最好瞄准目标,然后击中它。如果我们做不到,我们就完了。所以我明确表示,我们要做的事情事关生死存亡。我认为当我让大家清醒过来的时候,因为,你知道,在创业初期,你很兴奋,你在做事情。但如果没有人明确告诉你,嘿,我们实际上会在几年内倒闭。这并不全是好事,仅仅因为我们有很高的估值。我认为大家开始统一思想,并开始思考,好吧,有哪些方法?

主持人Logan Bartlett: 我们实际上可以做到这一点。这些方法很快就在业务中体现出来了吗?还是花了好几个季度?

Ali Ghodsi: 不,我认为工程师很快就开始思考了,而且我向他们明确表示,你们构建这个很棒。它现在也确实可以在大型云服务提供商的云平台上使用了。那么,差异化在哪里呢?说真的。我非常直白地向他们解释并分享了我的想法。我们拥有极高的透明度文化,以使其真正清晰明了。让他们购买并让他们自己理解我们无法获胜。如果我们继续这样下去,我们注定会失败。而且,你知道的,他们很快也就明白了。我们想在这里获得成功,所以他们开始提出创新,也许我们不需要开源……

主持人Logan Bartlett: 现在,当你考虑扩展到新产品时,我听说你实际上会为每个产品建立不同的团队。随着你需要扩展和迭代这些不同的团队,你在产品管理和组织方面学到了什么?

Ali Ghodsi: 是的,我认为当你创建一个从零到一的产品时,你必须做的事情与你在公司最初的两三年里做的事情相同。一旦你的员工超过150人,更不用说数千人了,任何公司都有很多流程。所以你必须削减这些流程,说,看,对于新产品,你不需要满足所有安全要求。你不需要所有的流程;只需要一个小型核心团队,能够快速迭代。

首先,找出你在早期创业公司中有哪些创新型人才。把他们安排到项目中。这些人不一定擅长在公司发展壮大后领导成熟的产品。你必须有一个这样的核心人物,你围绕他建立一切,并让他负责;他们开始构建该产品。然后你让他们快速迭代。让他们摆脱大公司遵循的迭代周期,而是让他们进入更快、更小的周期。

鼓励他们在内部开发循环和外部开发循环中进行迭代,这个循环要非常非常快,并且只关注获取用户和实现产品与市场匹配。一旦发生这种情况,你就可以把它移回母公司。理想情况下,如果你可以的话,你甚至可以在整个产品之外进行操作。

所以,我们现在有一个叫做Genie的产品,它允许你用英语提问,它可以立即回答。它理解你所有数据的语义;我们称之为数据智能。它理解你的数据,然后编写程序来提问,并直接给你答案。为了知道它没有产生幻觉,你实际上可以看到它在幕后是如何编写代码的等等。

这个产品,我们实际上是在Databricks代码库之外完全构建的。它没有满足任何典型的流程。我们只是快速迭代,在常规之外进行操作,几乎就像一家创业公司一样。只有当我们看到结果真的很好,人们喜欢它的时候,我们才经历了痛苦的重写过程,并将它转移到母公司。所以在这一点上,它几乎就像一次收购,你必须将其集成到整个系统中并使其安全。

主持人Logan Bartlett: 所以你会让人们自主决定不共享基本组件,或者你们是否正在使用某种,我不知道,单点登录或底层的云结构,你会让人们完全自主地去做。然后你会回来协调它。

Ali Ghodsi:  一旦产品真正找到了市场契合点,就立即在单独的代码仓库中进行开发。把它放在独立的GitHub仓库里,与大型系统分开,快速迭代是最重要的,因为这就是创业公司的工作方式。作为一家创业公司,你的运作速度是普通公司的三到四倍。我见过,我们也做过收购。如果你衡量一下,创业公司的速度是像Databricks这样的公司的三到四倍。我认为我们发展很快,也很有创新性,但仍然需要三到四倍的时间。为什么?这是因为安全流程、法律审批、以及确保产品在所有云平台和所有环境中都能正常运行。最拖慢速度的是,你拥有成千上万的客户,你无法进行回归测试。所以你必须解放新产品,否则你的进展会太慢。这就是我们现在看到的,说实话,那些真正的大公司都是这么运作的,他们的速度太慢了。这就是为什么生态系统中会有创业公司存在。所以你必须重建你在创业初期的那种环境。

主持人Logan Bartlett:  我很想知道,你现在担任CEO大约九年了,对吗?回顾你的领导风格,你如今看起来像是Databricks的典范领导者,这似乎是你一直以来的工作方式。我假设你的领导风格在这段时间内也在某种程度上发生了变化。你有没有什么想对当初刚开始担任CEO的自己,或者你最早作为创始人的自己说的话?

Ali Ghodsi:  是的,我认为你应该尽早培养领导者,建立与几位你精心培养的领导者的信任关系,并持续这样做。因为你十年后会发现,我有许多很棒的联合创始人仍然活跃并参与公司运营,我们几乎是合作伙伴关系,一起管理公司。但这样的人并不多,即便我们有近8000名员工,真正能帮你一起发展壮大业务的人又有多少呢?很难找到那些你可以建立信任并一起发展壮大公司的领导者。所以我会更积极地投入更多精力到这方面,并始终在公司寻找这类人才。我们之前太忙于执行,可能没有太注意这一点。所以这是我会做得不同的一点。

第二点不同之处是,当出现那些难以抉择的权衡决策时,比如我们是否要采用本地部署等等,我会做一个更面向未来的赌注。不要太担心它对财务或收入的影响,不要让短期主义占据上风。现在说起来容易,但在早期,当公司成功与否远未明朗时,风投会问你进展如何?你开董事会会议,他们关注你的收入目标。他们非常痴迷于此:情况如何?是不是呈指数增长?看起来怎么样?你与行业其他公司相比如何?

要持续对未来下注,不要被那些数字牵着鼻子走。这是我给出的另一条建议,因为我们走了很多弯路,这些弯路并没有什么价值。我们当时就知道这是捷径,但感觉值得一试,因为如果我们走捷径,这将带来很多收入。我现在会避免许多这样的捷径。要倾向于未来而不是现在。当然,也许这与路径依赖有关,我这么说只是因为我们现在处于这样的位置。如果我们做了我所说的那些事情,我们可能不会成功。但我仍然觉得,总的来说,我们本可以在未来的赌注上更有远见。

主持人Logan Bartlett:  我觉得你专注于赋能组织内的各个领导者,让他们被授权为组织做出最佳决策,而不是你作为每个部门的中心枢纽。这是一个恰当的问题吗?

Ali Ghodsi:  我认为两者都有。我认为我也会事无巨细地管理他们。

主持人Logan Bartlett:  也许他们会不同意。是的,他们可能不会说,嘿。你怎么看待一个能够做出跨组织的最终决定的中心人物与更去中心化和……之间的张力?

Ali Ghodsi:  个体赋权对于清晰度和一致性至关重要。当一个人负责一项任务时,通常会带来更清晰的愿景和方向。这种关注可以带来更一致的结果,这对团队和组织都有好处。然而,这样做也有缺点:只有一个控制点可能会减慢流程并造成瓶颈。它也可能让团队成员感觉被边缘化,从而降低他们的积极性。因此,在决策和授权方面取得平衡至关重要。

随着时间的推移,建立信任有助于确定组织的哪些部分可以完全委托给他人,因为他们可能擅长你可能不擅长的领域。重要的是不要假装比团队中的其他人更好;相反,要认识到他们的优势。此外,必须确定需要作为领导者更深入参与的领域。一些职责是你的CEO角色所独有的,例如解决冲突和制定战略决策。

随着时间的推移,你可能会注意到产品领域和领导者工作的重叠,他们从事类似的项目。尽管你努力通过诸如“找出如何统一这一点”之类的指示来统一他们的方法,但他们可能难以独立实施这些更改。在这些情况下,你必须介入并引导他们朝着一个具有凝聚力的战略前进。明智地运用你作为CEO的权力,因为它会影响流程的管理方式,并可能对创建简化的产品做出重大贡献。

对于一个真正简单且统一的产品,通常由一个人来领导这项工作是最有意义的。但是,必须保持警惕,以防止团队内部出现瓶颈和延误。通过保持开放的沟通渠道并确保职责明确,你可以营造更有效的的工作环境,同时也能赋能你的员工。

主持人Logan Bartlett:  在你看来,为什么愿意一遍遍地说同样的事情是CEO工作的重要组成部分?

Ali Ghodsi: 我觉得大家没有注意你在说什么。你知道,我们都很忙,都关注着自己的生活。我甚至没注意到你说的这件事,我根本没在听,或者也许你说了,但我没真正听进去。当时我在玩手机,那天工作还出了问题,我还在处理其他事情。所以我并没有真正理解,并没有真正吸收。所以很多时候,你得跟别人说三遍同一件事,然后他们才会注意到,然后他们会把它复述给你,就好像那是他们想出来的主意一样。这很好,我认为关键在于重复,但我尝试过用不同的方式重复。不要总是用同样的方式重复,那样会很无聊,很老套。挑战一下自己,换个角度来表达。找到一个客户,说出你想说的话,或者使用一个稍微不同的案例。使用不同的幻灯片,制作新的幻灯片。你会惊讶地发现,人们第一次并没有真正理解,他们会说:“哇,你刚才说的太棒了!” 即使你心想:“这和我一个月前说的一模一样,我只是稍微润色了一下。”

主持人Logan Bartlett: 我认为这非常重要。追求真相,我认为这是你的价值观之一,对吗?你如何在实践中贯彻这一点?或者说,这如何体现在公司文化中?

Ali Ghodsi: 对于你们来说,确保在招聘过程中测试求职者对真相的追求。其实,问一些问题并不难,比如,“你犯过的最大的错误是什么?”或者“告诉我你什么时候犯过真正的错误?你真的不愿意录用谁?你为什么犯那个错误?当时的情况是怎么样的?” 逼问他们,一直逼问他们,直到他们感到不舒服。

他们是不是开始找借口?例如,“我真的很不想录用这个人,但我的老板让我录用他,这是一个糟糕的决定。我知道这一点,但这确实是我的错误;技术上来说,这是我老板的错误。”继续逼问他们,你可以在面试过程中,实际上就能看出一个人是否在追求真相并诚实,或者他们是否试图掩盖真相。

所以这是第一点。第二点,不要提拔那些不追求真相的公司员工。如果你犯了雇佣他们的错误,至少确保你不要提拔他们。在公司晋升过程中,确保你正在真正评估公司文化价值观。认真去做。拥有文化价值观很容易,但你在晋升过程中评估它们了吗?

我有一个表现非常出色的明星员工;他们推动了业务发展。他们应该晋升吗?你不想成为这样的人:“等等,我们可以看看他们是否追求真相吗?”如果他们没有,你可能会想:“让我们不要提拔他们。”你会觉得,你疯了吗?这个人对公司产生了巨大的影响。

是的,但他们并不追求真相。然而,如果你说你想把这作为公司文化,你就必须在晋升过程中真正执行它。然后,当然,在极端情况下,我们可能不得不与他们分道扬镳。你也必须这样做。你不能让那些不符合公司文化的人留在公司。

主持人Logan Bartlett: 我也是这么认为的。你花30%到40%的时间在招聘上,对吗?你提到的一件事是,在招聘高管时,你会不断寻找保持联系的机会,并建立许多不同的联系点。你能谈谈这背后的理念,或者你如何去做吗?是的,我认为……

Ali Ghodsi: 我认为更重要的理念是,我不相信面试,因为我认为有些人面试表现很好,但实际上能力很差;而有些人面试表现很糟糕,但他们可能非常优秀。所以我认为面试是一个信息量很大的通道,你无法从中获得太多有价值的信息。那么你可以做什么呢?其中一个方法,也就是你提到的那个方法,我们也使用其他方法,那就是我试图让候选人实际去做这份工作。我们常常认为,在编程方面,我们可以这样做;我们可以要求他们编写一些程序。然而,我相信我们也可以将这种方法应用于其他工作。如果你正在招聘一位市场主管,那就与他们一起解决当前市场上存在的问题,无论是什么问题。如果是人员问题、网页问题或产品市场定位挑战,都要与他们一起努力。晚上给他们打电话,早上给他们打电话,一起解决问题;让他们像公司员工一样完成工作。通过这种方式,你就能很好地了解他们是否融入公司文化,是否与公司步调一致。他们能否胜任这份工作?尤其要关注公司中运作不佳的部分,因为这些正是你希望他们来解决的问题。如果他们能够解决这些问题,那么很明显他们是一个不错的选择。

所以我宁愿这样做,也不愿进行传统的面试,只是问他们那些他们可能已经练习过的问题,比如“说说你最大的弱点”。这是我们在招聘过程中做的一件重要的事情。

我相信的另一个方面是“曲线救国”。我认为你应该提前使用“曲线救国”的方法。不要通过很多猎头公司,他们会让你经历一个漫长的流程,让你见各种各样的人。他们经常想走流程,他们甚至会为你做背景调查,我认为这是一个很大的错误。你应该提前进行背景调查。在我见到一个人之前,我已经了解了很多关于他们的信息。

我发现,如果你对候选人的前任老板进行5到10次“曲线救国”式的背景调查,你实际上会在某些方面更了解这个人——有时甚至比他们自己更了解。你会深入了解他们经历的事情以及三位或四位目睹了他们在以前工作中经历的人的视角。鉴于他们独特的视角,他们可能无法完全理解每个人对他们情况的看法。因此,我相信“曲线救国”非常重要。

最后,看看他们的职业轨迹。他们去过哪里?他们取得过显著的成就吗?他们跳槽太频繁了吗?这是我们在招聘过程中强调的三个方面。

主持人Logan Bartlett: 你“曲线救国”式背景调查的技术是什么?你是否喜欢问一些特定的问题,或者有没有什么方法可以避免别人不愿说坏话?那么你如何深入挖掘以确保你获得的是实际的高质量的信息。

Ali Ghodsi: 是的,这真的取决于你跟谁说话,每个人都不一样。你可以立即看出有些人不会告诉你真相。他们只会说好话,或者他们什么也不想说。所以,你知道,就是这样。你只需要继续,结束通话。

我想我在这里透露了我的方法,所以它以后可能就不好用了。但是,我认为,如果你能找到那种愿意敞开心扉的人,我喜欢做的一件事就是让他们对这个人有多好进行排名。不要只是问他们从1到10的分数,然后听到他们说10分;而是要真正问他们,“它排名第一还是第二?你接触过多少这样的人?” 深入挖掘。谁是第一名,谁是第二名?顺便说一句,你也应该追求那些候选人。

然后,让他们和你一起经历一些场景。例如,问他们做得好的事情,或者告诉我一些出错的事情。给我一个场景。那个场景是什么样的?你必须真正突破界限,直到他们感到不舒服。我已经做过很多次了,他们会回电话问我,“这是怎么回事?” 你想发现有些人非常坦率;他们是直言不讳的人,会告诉你全部真相,而其他人则不会。

候选人提供的正面参考,与之有些相似,但有点相反。绝大多数正面参考实际上是候选人接下来要雇佣的人。如果是一个经理,他们实际上是在给你一份他们即将雇佣的人员名单。这也很有用,因为你可以面试这些人来衡量他们即将雇佣的候选人的质量。

偶尔,你可能会发现正面参考也会告诉你真相,并揭示事情的真相。当我做这些参考时,我并不是特别寻找“你有什么缺点,我可以用来取消你的录用?” 我只是想了解完整的画面。你会有缺点,你也会有优点;在我们决定录用你之前,我们想了解完整的画面。这就是我们正在努力的方向。对于一些高管,在做出招聘决定之前,我已经做了多达15次这样的“曲线救国”式背景调查。

主持人Logan Bartlett:作为领导者,你必须在不同的职能领域提升自己,其中之一是企业销售。我不认为你之前有这方面的经验。你是如何学习这个领域的?我认为你可能是借鉴了最佳实践,或者将从不同组织那里收集到的方法整合起来,构建了自己的模型。也许你可以谈谈学习一个新的领域或学科的方法,以及如何做到这一点。

Ali Ghodsi:我的做法?是的,首先,我要说的是,我们聘请了Ron Grisco,他带领我们从几乎零的年经常性收入 (ARR) 发展到现在的超过20亿美元,实际上是30亿美元。所以他表现非常出色。

主持人Logan Bartlett:是的。你欣赏他什么?

Ali Ghodsi: 是的,我认为他非常聪明。我认为他与许多销售人员不同,他是典型的企业级B2B销售人员。他不是工程师类型;他是销售领导者的经典原型,充满热情,能鼓舞人心,让每个人都充满干劲。所以,他具备这一切。这很棒。这是我们不了解或不具备的东西。他拥有大型企业销售经验,因为有很多销售人员面向中小型市场(SMB)销售,但他实际上曾向真正的大型企业销售产品。这也是我们一无所知的事情。他的思维非常宏大。当他来的时候,他说:“哦,我们要签订1000万美元或1亿美元的合同。”我们当时想,没人会为Databricks支付1000万美元。这是我们的想法。所以这也很有用。

但他也很理性,非常聪明,并且遵循第一性原理。所以两者是相容的。他拥有工程学位,所以他就像独角兽一样,能理解我们的语言,能理解我们,并且非常聪明,但他同时也具备我们无法理解的另一套技能。所以这次招聘非常重要。我们花了一年时间才聘请到他。我们筛选了很多候选人,我认为我们最终成功了。这有点运气成分。

我要说的另一件事是,在招聘过程中,就像我们花了一年时间招聘一名销售人员一样,要非常重视高管招聘流程。这是一个学习过程;你基本上是在学习优秀的销售主管应该是什么样的。所以,与所有顶级销售主管交谈并深入了解他们。注意倾听,并在面试中利用他们的经验,因为我不相信只靠面试就能找到合适的人。正如我所说,要将面试过程作为一个学习机会,了解优秀销售人员在你们组织中是如何工作的。

与20个人交谈后,你就能对“这就是它应该的样子”、“这就是他们正在做的事情”、“所有优秀的人才似乎都有这些共同点”、“这就是关键所在”有一个很好的了解。你可以更深入地了解,然后在幕后过程中,你就能找出谁是谁。你可以找出这个行业中你无法雇佣的顶级人物。尝试与他们交流,向他们学习,并与他们建立关系,或者让他们担任顾问。所以,要把自己放在这样的心态中:嘿,你要去大学学习。这就是这个过程。你不是专家,所以要相信这个行业里最优秀的人。尝试找到这个行业里最优秀的人,然后与他们合作。

主持人Logan Bartlett:在为Databricks招聘时,你是否有一些独特的优先考虑事项,或者你在组织内部取得成功的员工类型有什么独特之处?在Databricks?

Ali Ghodsi: 是的,所以我们的文化原则已被反向设计来准确回答你的问题。

主持人Logan Bartlett:所以你们不是从原则开始,而是反其道而行之。你们是从成功人士开始,然后总结出原则。

Ali Ghodsi:成功和失败的案例都有。好的,我们也关注那些简历完美但最终表现不佳的人。为什么?我们回头分析,发现我们无法就招聘标准达成一致。“我与这10个人共事过,他们很棒。”而我们会说,“不,这不像我们的标准。”这是一个很大的问题。所以要提高标准,不要妥协。我们宁愿错过真正优秀的人才,也不愿错误地录用不优秀的人。这是很痛苦的,我们吃过亏才明白这个道理。

追求真相:许多来自大公司的管理人员都有这种态度,你知道,一切都很顺利。“我掌控全局,我的团队负责这件事,我们正在努力,这是一个不错的幻灯片,向上管理,这里没什么可关注的。”但这对我们不起作用。这就是追求真相原则的由来。我们真的需要知道,什么地方出了问题?你的团队中哪些人表现不佳?我们做得不好的是什么?我们在哪些方面没有满足客户的需求?所以这是第二个原则。

第三个原则是“我以前做过,我知道怎么做,这就是更大、更好的公司如何做的,我们应该这样做”。这不是第一性原理思维。我们需要准确地知道怎么做以及为什么,并且要从第一性原理出发做出每一个决定。所以,遵循第一性原理成为了另一个文化原则。

我们的文化原则是在Databricks取得成功的秘诀。管理人员经常在最后,在我们握手并聘用他们之前问我:“嘿,你认为我在这里会成功吗?你认为需要什么?”我的意思是,这非常简单。我发誓,阅读文化原则。如果你真的遵守这些原则,你就会成功。当然,结果需要很好,但你在这里会做得很好。

如果这些内容与你产生共鸣,那么让我们现在就讨论一下,因为这将会是一个问题。这些确实是公司的原则。我们的文化原则不像你想挂在墙上的那些有抱负的酷炫的东西;它们是根据以往经验得出的,是真正有效和无效的经验总结。

主持人Logan Bartlett:在寻找Databricks内部或外部人才时,我认为那些有点“不服输”精神的人很重要。你是否会在谈话中试图挖掘这一点?你会问哪些类型的问题?

Ali Ghodsi: 是的,我的意思是,那些真正克服重重困难、努力奋斗的人,他们拥有毅力。Ron在2015年11月销售面试中说过的一句话我至今记忆犹新,他说:“嘿,如果一笔交易失败了,我想要知道原因,因为地球上没有人能赢得那笔交易。我知道这在人类能力范围之外,因为我已经尽了一切人类所能做的事情来赢得那笔交易。”

这是他随口说的一句话,很明显,这个人会全力以赴。当然,与他谈判聘用他的过程非常痛苦。所以,这也再次证实了,好吧,他可能非常擅长这份工作。你不会想要一个在为自己谈判薪酬方面很糟糕的销售主管。

你想弄清楚是否有某些人有需要证明的东西。他们是在向你证明什么,还是他们对现状非常满意?如果他们很满意,那么这可能行不通。这很可能适用于那些有点“缺陷”的人——就像我们所有人一样。我们都有需要证明的东西,我们会竭尽全力。我们会尽我们所能,你可以在面试中找出这一点;这并不难。

主持人Logan Bartlett: 你提到要拼命工作。我觉得这种努力工作的精神曾经过时了一段时间,现在又重新流行起来。我很好奇,你提到过类似这样的话:你从未见过不努力工作就成功的人。你能详细解释一下这个观点吗?

Ali Ghodsi: 在研究领域,在学术界,那些获得过令人惊叹的奖项的天才教授们,你可能在研究方面非常聪明,也许不需要努力工作。但所有我遇到的人都比我们更努力。这让我们很震惊。他们每天24小时都在工作。在工业界也是如此。所以我从未见过仅仅敷衍了事却非常成功的人。你会发现有些人很有天赋,但他们并不成功。成功必须伴随极其努力的工作。

所以从Databricks成立的第一天起,我们就秉持这个理念,从未偏离,无论这种精神是否流行。我们从第一天起就拥有非常努力工作的企业文化。我们一直保持着这种文化,并且表示,我们有远大的目标。为了实现这些目标,我们将极其努力地工作。如果你不想这样做,因为你可能还有家庭或生活中其他想做的事情,这完全可以理解,但也许Databricks不适合你。

所以这在Databricks一直都是如此。事实上,在调查中,我们的工作与生活平衡得分并不理想。而且,你知道的,我试图坦诚相待。我们并不想让工作与生活平衡变得非常糟糕。我们实际上会关注那些得分很低的团队,并努力改变现状。我们确实在这些团队中取得了改进。但我同时也坦诚地表示,我并不想成为行业内工作与生活平衡得分最高的公司。我们不会那样获胜。就这么简单。

现在,我也努力做到这一点。所以我不想让任何人比我更努力。所以我必须让自己也努力工作。这必须是可持续的。我的意思是,我已经做了十年甚至更长时间了,我希望员工也能做到这一点。如果他们真的筋疲力尽,无法坚持很多年,那不是我想要的。我希望他们能够可持续地工作,然后我们才能一起取得伟大的成就。

如果他们做不到,也没关系。别介意,你知道的,或者也许在他们人生的某个阶段,他们想这样做,但不想一直这样做。这也没关系。

主持人Logan Bartlett: 我们公司在发展壮大过程中遇到的最困难的事情之一是,那些曾经让你取得成功的人,开始质疑他们是否还能带你走向旅程的下一步。听起来,当你成为CEO时,你做出了提升许多领导层的决定。我相信在此过程中,你一直留着Ron,并且他也在他的岗位上不断发展,但我相信你肯定也决定在其他职能部门进行升级。你是如何做出这个决定的呢?嘿,也许是时候和那些曾经做得很好的人分道扬镳了,但你可能需要新人来接手,带你走向更高的层次?

Ali Ghodsi: 我认为你必须对自己诚实。首先,你什么时候知道,你知道,我认为我们多少知道有一些信号,但我们就是不想看到真相。我们想忽略它,因为它太难了;这个人和你一起建立了公司。所以你不想承认,但内心深处,你知道,深深地,深深地,你知道。所以一旦出现这种情况,就要立即认识到并面对真相。要对自己诚实。至少作为一名高管,不要自欺欺人。

好吧,一旦你知道了,现在你必须采取行动。我发现,如果你能向对方解释清楚,并让他们明白事情确实行不通,那就最容易了。不要仅仅把它当成事情是否有效的问题;你赢了还是输了?专注于这一点,如果他们意识到,“嘿,好吧,我输了,”那么,让我们讨论一下原因。然后我认为其他一切都会变得简单得多。就像,好吧,那我们对你怎么办呢?

所以在你意识到,好吧,我输了,事情不太行得通之后——有很多原因。好吧,让我们想办法让这件事行得通。然后你可以改变,把谈话引导到,好吧,对你来说,对你的职业生涯来说,什么才是最好的?我想帮助你。我希望你成功。我发现,有一些新的角色可以让那些人继续大放异彩。

我遇到过一些人,你知道的,在那个职位上,事情已经行不通了。我们找到了一个新人来领导它,或者,你知道的,你进行分层或者其他什么,但你会为这个人找到一个新的角色,而他们在这个角色中大放异彩,并且表现出色。事实上他们会更快乐。你知道的,过一段时间后,他们会说:“啊,Ali不再因为事情行不通而烦我了,”你知道的。其次,当我成功的时候,我比每天都在想“事情行不通”的时候要快乐得多,每一天都很糟糕。

所以我实际上发现,许多这样的人,你可以让他们留在公司。但是,如果他们只是敷衍了事,并且不再感兴趣,你也要和他们分道扬镳。他们只是留恋过去那些美好的日子。你也最好和他们分道扬镳。别浪费他们的时间。以及我们的时间。

主持人Logan Bartlett: 在我们结束之前,如果有人在几年后听到这段话,我们正在展望未来,你声称自己没有水晶球,但我认为你在这方面很擅长,在Databricks周围的世界或你们正在运作的事情中,有哪些元素你认为在未来五年即将成为可能?仅仅是那些让你每天都兴奋地起床工作的事情,以及你认为我们即将看到的潜力,也许是在行业层面,甚至不是在公司层面。

Ali Ghodsi: 是的,我认为将会发生的是,我们将看到我们今天看到许多事情将会被颠覆。未来将会出现针对这些事情的AI应用程序。我们甚至不知道它们会是什么样子。但它们的核心都需要什么?

就像在过去10、20、30或40年中,应用程序需要什么?它们需要一个Oracle数据库作为底层。你知道的,玩笑话是,你把所有的复杂性都放在数据库里,然后你就在上面构建工作流程和UI,遵循两层或三层模型。我认为在未来,你需要一个AI数据库作为底层。

如果你有一个AI数据库,你就可以将所有事务数据、所有分析和AI模型集成在一起,然后你就可以在上面创造奇迹。我相信我们将看到这个AI领域中这些应用程序的生态系统正在被构建,它们都需要一个AI数据库作为底层。

这基本上就是Databricks。Databricks本质上是一个AI数据库。我们不这样称呼它;我们不这样营销它,但从根本上说,它底层是一个AI数据库。每个应用程序都需要它——地球上的每个公司都需要它。我希望我们能够成为未来为所有这些应用程序提供动力的公司。当然也会有其他公司这样做,但这是我们的目标。我认为我们已经看到了这种发展的苗头。

主持人Logan Bartlett:  关于这件事的发生,我很好奇,想详细了解一下,比如这件事发生的种子,你是看到了一些特别令人兴奋的用例,还是仅仅是客户?

Ali Ghodsi:  你看,在同一个领域,他们需要安全地进行海量日志处理并检测零日攻击。这正是Databricks的看家本领——内置AI的实时海量日志处理。在可观测性领域也是如此。你需要观察你的日志处理过程,了解指标,检测异常等等。在客户360领域,CDP和了解你的客户正在做什么,情况也一样。你知道,你需要从许多不同的地方收集海量数据,然后对其进行遥测。这是巨大的数据处理工作。你需要实时完成它,需要使用AI来获取洞察力。我认为这些领域中的每一个都将建立在一个AI数据库的基础之上。我希望我们可以成为为所有这些领域提供动力的AI数据库。我认为这种颠覆性变革将在未来两到四年内发生。

主持人Logan Bartlett:  这真是令人兴奋。非常感谢您参与这次访谈。

参考资料: https://www.youtube.com/watch?v=pAcF3GV4ygM,公开发表于2024-11-22

关注公众号后设🌟标,掌握第一手AI新动态

往期精选

  1. 黄仁勋专访:OpenAI在大模型混战中达到“逃逸速度”
  2. 李飞飞与Justin深度解读空间智能:数字世界需要三维表征,才能与现实世界融合
  3. PayPal创始人彼得·蒂尔:人类科技停滞源于原子方面的进展远慢于比特
  4. 谷歌联合创始人布林:巨头们打造的“上帝模型”几乎可以理解一切
  5. 马斯克:AI将使商品和服务的成本趋近于零
  6. Karpathy最新专访:人形机器人、特斯拉、数据墙与合成数据


瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章