我的生存意志,强过了想杀死我的人
这就是黄仁勋和英伟达的故事。
1963年黄仁勋出生于台南。父亲黄兴泰是空调公司的工程师,毕业于成功大学。黄兴泰学业成绩优异,毕业后进入开利冷气公司台湾分公司工作,他在黄仁勋四岁的时候获得了一个赴美培训的机会。
在美国的所见所闻,让他下定决心带孩子接受更好的教育——把兄弟俩送往美国读书。黄仁勋妈妈负责教英语。一本字典,一天十个词,就这样完成了俩兄弟的英语教学。
1972年黄兴泰带着一家人移居泰国,他觉得是时候送黄仁勋去美国了。因为家庭经济原因,夫妻俩给只能他找一所便宜的寄宿学校。这所学校实际上是一个问题少年集中地。9岁的黄仁勋,拥有一个17岁刚刚从监狱放出来的室友。
黄仁勋后来回忆说,“每个孩子都有刀,而同学更是满身刺青”。在学校里,黄仁勋因为年龄小、英语不流利,经常收到欺负。他负责打扫全校宿舍的厕所。虽然困难重重,但黄仁勋并没有屈服。
1974年,夫妻俩终于有足够的钱搬到美国。黄仁勋毕业后与父母一同迁居俄勒冈州,开始在公立学校上学。他白天上课,放学后去餐馆打工,以补贴家用和学费。为了赚更多的钱,他还经常去乒乓球场擦地板。
1979年,因为学习成绩优异,黄仁勋在高中时连跳2级,16岁时便考上了俄勒冈州立大学的电气工程专业。很快他便成为了学校最优秀的学生之一。大学一年级时,黄仁勋遇到了洛莉·米尔斯(Lori Mills)。他们是电子工程基础方面的实验室搭档,五年后成了夫妻,并育有两个孩子。
1984年,黄仁勋毕业加入了AMD,担任微处理器硬件工程师。此时的AMD大概想不到,这个新员工未来会成为自己强劲的对手,黄仁勋因此获得了“金牌卧底”的称号。他在AMD研究1兆赫CPU芯片,这在当时看来速度已经很快了。黄仁勋却还是觉得慢。
现在,他制造出了世界上最快的芯片。黄仁勋在AMD工作的同时,利用晚上时间攻读斯坦福大学的电气工程硕士学位。
同年,第一台Mac电脑发布,开启了个人电脑的新时代。
1985年,黄仁勋在LSI Logic担任核心硬件设计总监。LSI是世界上最早的专用集成电路公司之一,专门为其它公司定制设计芯片,这恰恰是黄仁勋最想做的。他先是在工程部门工作了两年,随后主动申请调到销售部门,并在销售部门工作了六年。
1992年,花了八年时间,黄仁勋终于在斯坦福大学完成了硕士学位。
1993年,《侏罗纪公园》上映,这是首次大规模使用计算机生成图像(CGI)技术来制作真实感极强的恐龙效果,电影轰动全球。随之而来的是市场对3D图形的巨大需求。黄仁勋、克里斯(Chris )和柯特(Curtis )看到了3D图形的市场未来。
三个人商量好一起制作一款可以加速普通PC的芯片,使3D图形能够用于消费类硬件PC。这样,用户在个人电脑上便可以玩游戏,而不是一定要在任天堂或专用系统上。
这一年,黄仁勋30岁。三个人用4万美元创办了英伟达,在竞争残酷且利润微薄的市场中生产计算机图形芯片。拥有技术、销售和管理三重背景的黄仁勋,顺理成章接下总裁兼首席执行官之位。
当时的硅谷,很多风投投资了90 家初创公司,让它们去研发 3D 显卡。最终存活下来的只有两家:英伟达和 ATI(后被AMD收购),如今英伟达拥有独立GPU的83%市场份额。
1995年英伟达推出了第一款图形处理器产品NV1。黄仁勋与日本游戏大厂世嘉合作开发图形引擎,原本计划基于四边形技术。然而,随着Windows 95的发布和Direct3D图形接口的采用,黄仁勋意识到他们的方向与市场主流的三角形标准不符。NV1显卡未能被游戏开发商广泛接受。
由于NV1销量不佳,英伟达的现金流迅速枯竭,陷入严重财务危机,几乎面临倒闭。黄仁勋不得不裁掉 70% 的员工,仅剩下约 35 人。公司的资金只够支撑九个月,所有留下来的人都明白,他们必须在这九个月内,从零开始设计并交付一款全新芯片,而正常的芯片设计周期远远超过这个时间。这几乎是一个“不可能完成的任务”。
几乎所有的条件都对他们不利,很难想象还有人能设想出一条出路。要是其他公司,早就放弃了。但黄仁勋不同,他绝不愿意就此认输。他坚定地表示:“我们不会这样结束。”
今天,当黄仁勋谈到英伟达的企业文化时,他总会强调“知识的诚实(intellectual honesty)”是文化的基石。他所说的正是这一次的危机。在英伟达的企业文化中,知识诚实意味着在经过评估后若发现决策方向错误,就应该立刻认错并改变。
“如果我们想要生存,就必须彻底抛弃过去的设想。”
1996年,黄仁勋改变英伟达的技术标准方向,公开表示将完全支持微软Direct 3D API标准。
当技术发展得如此之快时,如果你不重新定义自己,你就正在慢慢走向死亡。而且你死亡的速度就是摩尔定律的速度——这是我们所知最快的速度。
1997年,互联网刚刚普及,距离互联网泡沫破裂还有几年。
这个时期,游戏市场分成了两部分:一是标准化的主机市场,确保所有游戏都能运行;二是 PC 硬核游戏市场,尽管规模小,但收入潜力巨大,因为玩家愿意为性能支付高昂的费用。
英伟达开始了解市场需求。这一次他们明白了性能对消费者来说的重要性。他们发现,消费者愿意在性能上做出妥协。英伟达推出了RIVA 128图形芯片。RIVA 128图形卡在发布后四个月内销售了 100 万块。给英伟达带来了巨大的收入。
黄仁勋深刻意识到,在这个行业快速意味着什么。从这一年开始,英伟达每六个月就能在相同的价格区间内推出性能翻倍的硬件。而根据摩尔定律,芯片的性能通常需要 18-24 个月才能翻倍。
图形计算的动态性就像摩尔定律一样:无论当前性能多好,永远不够好。十年后,游戏画面将让今天的画面显得可笑。这就是摩尔定律的魅力:人们总是追求更高的性能。
这也是为什么黄仁勋带着英伟达进行三次彻底转型:冒着巨大风险赌上一切。因为如果不这么做,英伟达就会成为那 90家失败的公司之一。
1998年是英伟达发展的关键年份之一。这一年,英伟达从一家初创公司发展为全球显卡行业的重要参与者,同时也面临激烈的市场竞争和技术挑战。
英伟达依然没有摆脱财务危机。台积电当时的董事长张孝威曾说英伟达经常延迟付款,最后甚至累计了数百万美元的欠款。他去找黄仁勋,要求设定一个信用总额上限。黄仁勋却表现得相当自信,说:“请你们不要这样对我们,因为将来我们会是你们最大的客户!”
1999 年英伟达推出了 GeForce 品牌,并称其为“GPU”的开创者。GPU 的工作是以尽可能快的速度、最高或预设的分辨率,将3D 数据渲染为 2D 图像,显示在屏幕上。GPU 的并行性使其非常适合处理图形任务,比如每秒 30、60 或 120 次点亮屏幕上的像素,而游戏的逻辑大多仍在 CPU 端运行。
英伟达在纳斯达克挂牌上市,黄仁勋拥有3.6%股权,身价升至高达5亿美元,被财富杂志评为全美40岁以下最富有的人之一。同年被安永会计师事务所评为年度高科技企业家。
2000年,黄仁勋以7000万美元的现金和100万股英伟达股票,收购了竞争对手3DFx。
英伟达与微软展开合作。微软当时正在秘密开发一个名为 Xbox 的项目,微软找到英伟达,希望其成为 Xbox GPU 的关键供应商。他们签订了一份价值每年 5 亿美元的重大合同,前期支付 2 亿美元预付款。基于他们正在研发的一款卓越的新型 GPU,由英伟达来提供一款改良版的芯片。
1999年1月,英伟达的收入为1.58亿美元。
2000年达到了3.75亿美元,增长了两倍。
2001年,微软发布Xbox,英伟达迎来爆发式增长。Xbox的成功帮助英伟达在游戏GPU行业的发展中确立了稳固的地位。英伟达收入达到了14亿美元,成为最快达到这一里程碑的半导体公司。
与微软的合作虽然为英伟达带来了大量的收入,但也意味着低利润率。微软为英伟达提供了每年5亿美元的收入,那时,英伟达的整体年收入仅为10亿美元,微软显然从中获得了很大的话语权。
2002年,新发布的GeForce FX因性能低于预期、功耗过高而被市场批评。这是英伟达在技术研发上的一次重大失误。英伟达与ATI在显卡市场上的竞争非常激烈。尽管ATI在某些方面取得了技术领先,但英伟达通过降价策略保持了产品的热销。
2005年,随着竞争对手的赶超,英伟达的增长开始放缓。英伟达年收入接近28亿美元,但净利润仍然较低。这一年,ATI被AMD收购,成为英伟达的主要竞争对手。AMD收购ATI花了大约60亿到70亿美元,并且投入了大量资源。AMD把ATI视作一个重大的产品线,全力推动。
2006年,英伟达推出了并行计算平台和编程模型“CUDA”,目的是押注科学计算。CUDA是什么?它是一个完整的开发框架,旨在实现你想要的任何GPU计算。人们可以自己与开发者建立关系,并通过标准接口访问英伟达的芯片。创建属于英伟达的开发者生态系统,这对公司来说意义重大。
同时,英伟达做了一个非常昂贵的决策——从当时来看是一个巨大的投资决策——确保每一个出厂的 GPU 都完全支持 CUDA。
今天,有 5 亿个支持 CUDA 的 GPU 供开发者使用,CUDA 已经成为所有 AI 应用程序的基础。
这一年,Intel宣布进军GPU市场,推出了Larrabee项目,英伟达面临了更大的挑战。Intel作为长期的竞争对手,试图涉足GPU领域,这让英伟达的高性能计算赌注显得尤为重要。
2007年,黄仁勋年薪为2460万美元,成为全美第61位最高薪CEO。
2008年的全球金融危机对科技行业造成了深远的影响,消费需求下滑,资本市场紧缩,许多科技公司面临盈利压力和裁员的困境。英伟达也未能幸免,直面利润下滑和市场份额的挑战,与老东家AMD之间的竞争日益激烈。
英伟达的市值一度达到约200亿美元,之后股价暴跌了80%。一个科技公司股价跌了80%,即便是在金融危机时期,也意味着他们几乎是被“踢出局”。
我们从事的行业必须不断重塑自己。除非进行无情的自我审视,并彻底结束并重振业务,否则不可能保持领先。
尽管面临经济困难,黄仁勋坚持对研发的高投入,继续推动GPU技术的突破。这种长期视角使得英伟达在危机后能够迅速反弹。
他在危机期间加大了对CUDA架构和Tesla GPU产品的投入,这为日后英伟达的AI计算和数据中心业务奠定了基础。
2010年代初,这是一个转型和挑战并存的时期。英伟达在传统显卡市场面临AMD的激烈竞争。特别是AMD凭借其Radeon HD系列在性价比和性能上对英伟达的GeForce显卡形成了强大冲击。
公司的增长一直不怎么样,可能年增长只有10%左右,英伟达处于停滞状态。
面对传统显卡市场的瓶颈,英伟达开始将重点转向高性能计算和专业图形领域。这一转型在之后的AI、大数据和深度学习浪潮中带来了回报。
2011年,英伟达再次未能按预期盈利,股票再次下跌了50%。历史又一次上演。英伟达又陷入了困境,但黄仁勋依然没有放弃。
2012年,人工智能迎来了一个“爆炸性”的时刻。AI训练中使用的计算量呈现指数级增长。据OpenAI的研究,从2012年到2018年,最大的AI训练运行中使用的计算量增长了30多万倍,平均每3.4个月翻一倍。这一增长速度远远超过了摩尔定律,后者的翻倍期为2年。
这背后有很大一部分是因为英伟达的技术进步。英伟达的GPU大幅提升了AI模型的训练速度,缩短了产品开发周期。
它的GPU因其并行计算能力在AI模型训练中效率远超CPU,开始被广泛用于模型训练,逐渐成为深度学习的主流选择。英伟达通过其GPU和CUDA软件在AI芯片市场占据了70%到95%的市场份额,确立了其在AI芯片市场的领导地位。
CUDA 推出前,英伟达作为一家商品化显卡制造商,毛利率只有 24%,现在却达到了 70%。
2019 年 8 月,英伟达训练了当时最大的基于 Transformer 的语言模型 Megatron。这是一个拥有 83 亿参数的模型,运行在 512 台 GPU 上,训练了 9 天。当时,这样的训练成本接近 50 万美元。
2020 年,他们完成了一项史上最棒的收购之一,而且当时几乎没人意识到它的重要性。他们以 70 亿美元收购了一家来自以色列的奇特小型网络公司——Mellanox。Mellanox 的主要产品是一种叫做 InfiniBand 的技术。
InfiniBand 是什么?它是以太网的一种竞争标准,是数据中心机架之间传输数据的方式。2020 年时,每个人都觉得以太网就足够了。为什么需要比以太网更高的机架间带宽?难道有哪种应用需要每秒 3200 Gb 的数据传输?
事实证明,如果你试图将数百个甚至更多 GPU 联网为一个计算集群来训练一个大规模的 AI 模型,是的,你确实需要非常快的数据互联。
2021年11月,黄仁勋积极布局元宇宙。英伟达在升级后的“云宇宙”云平台Omniverse Cloud上使用14秒成功渲染的“数字假人”引发了轰动。车机芯片也是英伟达布局的重点,无论是奥迪、丰田还是特斯拉都在借助英伟达研究无人驾驶。这一年,黄仁勋入选“福布斯中国·北美华人精英TOP60”。
2022 年 9 月,英伟达发布了一个非常令人惊讶的公告:一款新芯片。但不仅仅是新芯片,而是一个全新的芯片类别,叫作 Grace CPU。英伟达要制造一款 CPU。这简直是异端啊!
这些 Grace CPU 并不是为你的笔记本电脑设计的。它们是作为整个数据中心解决方案中的 CPU 组件,完全从零开始设计,用于与这些庞大的 GPU 集群配合运行。
2023 年 5 月,英伟达报告了他们 2024 财年第一季度 的业绩——这一季度收入环比增长了 19%,达到了 72 亿美元。由于数据中心对生成式 AI 计算的需求空前高涨,英伟达股票暴涨。
在那一季度,英伟达的总收入达到 135 亿美元,环比增长 88%,同比增长超过 100%。其中,数据中心业务收入为 103 亿美元,占总收入的绝大部分。对于一个五年前几乎不存在的业务板块来说,这一成绩是巨大的。这一板块的收入环比增长 141%,同比增长 171%。103 亿美元。
2023年5月,因为人工智能热潮,英伟达市值首度达到1兆美元,成为第8家市值达到1兆美元的公司,同时黄仁勋身价与2022年相比已经翻倍达到350亿美元。9月8日,黄仁勋被评为全球AI领袖。
2024年2月,黄仁勋当选美国国家工程院院士。同月因为英伟达市值上升使黄仁勋超越钟睒睒成为全球华人首富,在彭博亿万富豪指数升至第21位。
2024年5月,英伟达第一季财报显示其营收强劲增长,加上人工智能浪潮对GPU的需求增加,英伟达股价因此大涨而成为全球市值第2大的公司,仅次微软,黄仁勋也因此身价超过千亿美元,排名福布斯全球富豪榜第11名。
以上是黄仁勋职业生涯中的关键年份和事件,看他如何从学生时代一步一步走到科技行业领袖位置。
英伟达的成功很大一部分来源于他们没有死,至少有四次他们应该死了,但他们没死。部分原因是英伟达的战略非常聪明,部分原因是运气好。很大一部分原因是因为黄仁勋能够“坐下来”忍受这份痛苦,并且有信心会搞定。
“市场会来,我不会宣布游戏结束”。
在每次快死的时候,英伟达都及时进行了转型,总结一下这三次重要的转型:
1. 从游戏图形芯片到GPU的转变:
黄仁勋在早期参与世嘉游戏机项目失败后,意识到公司需要转型。这次战略性撤退为公司未来的发展奠定了基础,英伟达开始专注于图形处理器(GPU)的研发。
2. 创建CUDA编程模型:
黄仁勋曾说,创建CUDA编程模型是一个漫长且充满挑战的过程,这个项目花费了超过20年的时间。CUDA平台的推出,允许开发者们将英伟达提供的算力应用于图形以外的目的,这标志着英伟达从图形处理向并行计算的扩展。
3. 深度学习与人工智能的革命:
黄仁勋果断地将英伟达的核心技术应用于人工智能领域,开发出了用于深度学习的GPU。这一转型使英伟达在AI和机器学习领域处于领先地位。2012年AlexNet的成功,标志着人工智能革命的开始,英伟达的GPU在这一过程中扮演了重要角色。(关于AlexNet也是一个非常有意思的话题,大家感兴趣的话以后写一期)
你通过做别人做不到的事情来建立一家伟大的公司,而不是通过与别人争抢大家都能做的事情来成功。
这三次转型不仅展示了黄仁勋的远见卓识和领导力,也体现了英伟达在技术创新和市场适应性上的强大能力。通过这些转型,英伟达成功地从一个游戏图形芯片公司发展成为全球领先的AI和数据中心解决方案提供商。
英伟达的员工总数为2.6万人。对比之下,微软的员工人数是22万,但市值只是英伟达的两倍。换句话说,英伟达的每名员工对应的市值是微软的5倍。由此可见,他们员工的效率极高。
过去 10-15 年间英伟达的核心竞争动力之一,是与 英特尔(Intel) 的较量。
英特尔曾试图打压英伟达。当时英特尔控制着主板市场,并垄断最重要的芯片——CPU。它的战略是将其他所有芯片整合到主板上,或者直接生产那些芯片。在英伟达身上,他们也尝试过这些策略,但英伟达勉强撑了下来。
后来在数据中心领域,英特尔长期主导市场。PCI Express(由英特尔所在的PCI-SIG联盟制定) 一直是数据中心的连接标准,而英伟达不得不接受这个现实。但他们没有在 10 年前就直接宣布:“我们也要做 CPU 了。”他们一直等到时机成熟。黄仁勋有非常长远的耐心。
(在写这篇文章期间,英特尔CEO Pat Gelsinger 突然退休了,并且辞去了公司董事会职务。英特尔董事会认为Pat Gelsinger未能有效地带领公司追赶英伟达。同时,英特尔2024年第三季度的业绩刷新了英特尔的亏损纪录,净亏损高达166亿美元)
以前英伟达只能接入别人的服务器。后来,他们开始制造自己的服务器,接入别人的机架、机房和架构。接着,他们又开始制造整排整排的服务器机架。按照这个发展趋势,下一步他们可能会直接运行自己的整栋服务器建筑,不再依赖任何其他系统。
他们之所以能够做到这一点,是因为他们在行业发展之前的 10 年就已经投资,且拥有惊人的创新能力,能够创造真正突破性的技术,还对市场前景判断得非常准确。没有这些前提,他们的成功是不可复制的。
ChatGPT推出次年的第一季度,英伟达数据中心收入超越英特尔(Intel),并在接下来的六个季度持续走高,和英特尔之间的差距越拉越大。2024年第三季度,英伟达数据中心收入为308亿美元,是两年前的八倍;同期英特尔数据中心收入从2022年第三季度的43亿美元,下滑至2024年第三季度的33亿美元,降幅约23.26%。
现在英伟达已经完全垄断了这个行业。他们不仅仅提供硬件,还提供完整的软件生态系统。开发者和客户无法轻易转向其他平台,因为 CUDA 和其他工具已经深深嵌入他们的工作流程中。
黄仁勋61岁了,但他的动力和远见让人感觉他还能再干 30 年。
“无论是什么,像我们一样全力以赴去追求它,跑吧!不要慢慢走。”