(关注公众号并设为🌟标,获取最新人工智能资讯和产品)
全文约9,000 字,阅读约需 18 分钟
在一次深度对话中,Waymo联合首席执行官Dmitri Dolgov回顾了自动驾驶技术从实验室迈向现实的历程。作为谷歌2009年孵化的"司机"项目,Waymo已经从一个内部实验发展成为独立的自动驾驶公司,目前在旧金山、洛杉矶、奥斯汀和凤凰城等多个城市每周提供超过10万次付费乘车服务。
Dolgov指出,尽管人工智能技术,特别是Transformer和视觉语言模型(VLM)的发展令人振奋,但要实现真正安全可靠的完全自动驾驶仍面临诸多挑战。"就像登山一样,"多尔戈夫形象地描述道,"当你到达一个峰顶后,以为到了终点,结果才发现前面还有更多的山脉。"在技术路线选择上,Waymo采取了硬件与软件并重的策略。他认为,先进的传感器配置就像人类驾驶员的良好视力一样重要。正如人类即使在视力不完全理想的情况下也可以驾驶,但最佳的驾驶体验需要清晰的视觉感知,自动驾驶系统同样需要优质的硬件基础。同时,人工智能技术的突破,特别是Transformer和大模型的应用,为系统赋予了强大的决策能力。
这种硬件与AI的协同优势,让Waymo能够应对复杂的驾驶环境,在各种天气条件和高密度城市场景中保持可靠运营。然而,要达到远超人类的安全标准,整个行业仍需要持续的技术创新和优化。
文稿整理
主持人: 大家好,欢迎收听《No Priors》。今天我们邀请到了Waymo的联席CEO Dmitri Dolgov。Dmitri,非常感谢你今天能来参加我们的节目。
嘉宾Dmitri Dolgov: 谢谢你邀请我来,非常高兴参与。
一、Waymo的发展历史
主持人: 那么我们可以从自驾车在谷歌的历史开始谈起吗?你是如何开始参与这项工作的,这些年又是如何发展的呢?
Dmitri Dolgov: 我从事这一领域已经有一段时间了,大约18年了。我是在2006年左右开始的,那时正是DARPA(美国国防高级研究计划局)举办“大挑战赛”的时期。DARPA当时组织了一些比赛,称为“大挑战赛”,目的是推动自动驾驶车辆的研究。第一次“大挑战赛”的任务是开发一辆可以在沙漠中自动行驶的汽车,要完成约100英里的行程。虽然当时没有团队成功完成,但这个比赛推动了不少进展。之后,他们又重复了一次挑战,并且有团队成功了。随后,DARPA又发起了“城市挑战赛”,设置了一个模拟的城市环境,模仿公共道路驾驶的场景。我参与的就是这个城市挑战赛,当时我是斯坦福大学团队的一员。这一经历让我看到自动驾驶的未来和巨大的潜力,从那时起我就没有回头,一直专注于这个领域。
主持人: 所以这也为你后来的发展奠定了基础,对吧?
Dmitri Dolgov:是的。2009年,我们在谷歌开始了这个项目。当时只有一个小团队,后来逐渐发展壮大,最终成为现在的Waymo。2017年初,我们正式成立了Waymo这家公司。
主持人: 我注意到很多自动驾驶领域的关键人物和公司似乎都来自相似的背景,像是斯坦福大学的Sebastian Thrun实验室,以及其他一些实验室。这种行业背景和人员的渊源很有意思,感觉这个行业确实是一个小圈子。
Dmitri Dolgov: 确实如此,业界真的很小。当时参与自动驾驶研究的CMU(卡内基梅隆大学)团队和斯坦福团队中的一些人,后来就在2009年加入谷歌,一起开始了这个项目。我刚开始参与这个领域时,很多人觉得我们在做“疯狂”的事,因为那时很多深度学习的进展还没有发生,比如像AlexNet还没有出现。可以说那时几乎没有相关的技术基础。
主持人: 所以很多人当时都认为你们的项目很“疯狂”,你们自己会不会也觉得这是一个疯狂的冒险?
Dmitri Dolgov: 我们确实听到很多人说我们“疯了”,他们觉得这不可能实现。说实话,我们自己也不确定是不是在冒傻的风险。我们一度甚至怀疑自己是“有点疯狂”还是“彻底疯狂”了(笑)。在探索这个问题时,我们有时会以开放性的研究项目来对待它,而不是一个有明确终点的产品。
主持人: 所以这个项目最初是一个开放性探索,而不是一个有明确目标的产品,对吗?
Dmitri Dolgov: 可以这么说。我们在谷歌的早期阶段确实是以研究的心态在做这个项目,但是我们也相信自己可以让它成功。而一旦成功,它对世界的积极影响将是巨大的。最初我们几乎没有太多数据可以参考,因此很难估计这个问题会有多复杂,需要多久才能实现。
主持人: 当你们开始时,心里有没有一个预设的完成时间?
Dmitri Dolgov: 我不确定当时是否有具体的日期。不过我们的确在最初几年没有考虑产品或者目标日期,首先是去探索这个领域。为了达成这个目标,我们给自己设定了一些里程碑,重点在于原型设计、学习和理解。两年后,我们发现这项技术确实有潜力,于是开始讨论产品的可行性。当时我们设想的第一个产品是一种高级驾驶辅助系统。
主持人: 是什么时候决定完全转向全自动驾驶的?
Dmitri Dolgov: 大概是在2013年左右。当时我们在核心技术上取得了更多进展,意识到全自动驾驶才是正确的方向。我们决定不再满足于驾驶辅助系统,开始全力追求完全自动驾驶。
主持人: 现在Waymo每周提供大约10万次的自动驾驶乘车服务,相当于每年约500万次。是什么让这个项目突然实现了这样的增长?
Dmitri Dolgov: 你说得对,确实有一个明显的跃升 如果我们回顾一下过去的历程,从2013年开始我们决定全力推进,到今天Waymo每周提供10万次行程,每周行驶超过一百万英里,规模在不断扩大。比如,2015年我们实现了一个“从零到一”的突破,那时我们第一次将一辆无人驾驶车投入道路测试,这就是我们第三代系统,包括传感器和计算机硬件套件,安装在一款定制的“萤火虫”车辆上,实现了完全无人驾驶。接下来的演变是第四代驾驶系统,部署在Pacifica小型货车上,完全自动驾驶模式,并于2020年在亚利桑那州Chandler市向公众开放。当时的重点是技术成熟,建立驾驶系统和评估机制,定期更新,与真实用户互动,收集反馈并不断迭代。
第四代的目标并不是为了扩大市场规模,而是完善技术。随后我们决定转向第五代驾驶系统,也就是今天你在凤凰城、旧金山、洛杉矶和奥斯汀等城市的车队中看到的版本。选择亚利桑那州作为测试地点,而不是加州,是因为亚利桑那州的复杂性适中,足够让我们学习和规避风险,同时也可以进行系统开发。在开发过程中,我们追求的是解决最困难的问题,例如高密度环境和恶劣天气条件的驾驶。因此,在2020年我们决定在Chandler市部署,并逐步推进系统开发。
二、无人驾驶出租车
主持人: 在选择部署城市时,你们考虑了哪些标准?
Dmitri Dolgov: 在第四代系统时,我们选择了复杂度适中的部署区域,确保可以进行端到端的测试,帮助我们学习并规避风险。而在系统开发方面,我们会追求最复杂的场景,比如高密度环境和极端天气。因此,旧金山成为了我们之后的选择,它是一个很适合学习和进步的市场。同时,我们还在凤凰城市中心进行测试,这里的路况具有高速度的特点,从而给我们提供了更多的开发和评估维度。
主持人: 你们认为第五代系统的突破点在哪?
Dmitri Dolgov: 最主要的突破在于硬件和AI,每一代硬件的进步都让系统变得更强大、更简单。比如Transformers模型的引入在最近一次升级中发挥了巨大作用。在这之前的突破是卷积神经网络(比如2013年的AlexNet),虽然它让我们取得了很大进展,但还不足以支撑完全自动驾驶。随后一系列技术进步,例如Transformers、模型规模的增大以及计算能力的提升,结合了数据引擎和飞轮机制的改进,让我们在训练和评估系统时能够同步推进。
主持人: 那么你们是如何进行内部评估的?这与监管机构的安全评估有何不同?
Dmitri Dolgov: 这是个很大的问题 但我很高兴你提到这个话题,因为这是一个极其重要且非常困难的问题。我们总是在讨论如何构建自动驾驶系统,但事实上,这其中涉及两个问题:一是如何构建这个系统,二是如何评估它。这两个方面是相辅相成的。我们首先要明确我们关心的评估指标,然后收集支持这些指标的数据——我们实际上有上百种指标。接下来还需要大量的基础设施,比如仿真系统。一些内容可以通过开放式仿真进行评估,但有些则需要封闭式仿真,因此我们需要建立一个真实且可扩展的仿真系统来支持这些评估。
所有这些指标指导了我们对系统的开发,帮助我们不断改进Waymo的人工智能系统和自动驾驶系统。接着,我们会进行验证和评估。我们把这整套评估方法称为“安全框架”。比如在城市环境下行驶的里程数,或在特定城市的安全表现,相较于人类驾驶员而言,我们的表现如何?我们对此很自豪。到目前为止,我们在全自动驾驶模式下已经行驶了数千万英里,如今每周行驶超过一百万英里。我们有足够的数据表明,我们的安全水平已经优于人类驾驶员。
主持人: 你们有将这些数据公开吗?
Dmitri Dolgov: 有的。我们最近在安全中心(Safety Hub)上发布了一些最新的数据。基于2200万英里的全自动驾驶行驶里程,我们将Waymo的表现与人类驾驶员的基准进行了对比,不同的碰撞情境和严重程度都有涉及。数据显示,在低严重度的碰撞情境中,我们的表现大约是人类的两倍好,而在严重度更高的情境中,这个差距会进一步扩大。例如在涉及安全气囊部署的碰撞中,我们的表现优于人类六倍。
三、无人驾驶安全
主持人: 听起来非常令人印象深刻。那在监管方面,你们认为应该采取怎样的态度呢?
Dmitri Dolgov: 我们的目标是确保这项技术能够使道路更加安全。我们一直与监管机构保持积极的对话,并且已经获得了所有必要的许可,以便按计划扩大我们的规模。我们内部的思路是,这一过程需要透明、负责任且逐步推进。这项技术是全新的,产品也与传统的不同。我们每周的行驶里程已经达到一百万英里,但我们认为,推广的速度需要是逐步建立信任的过程,而不是一蹴而就。
主持人: 既然你们已经证明了这项技术的安全性,那为什么不加快推广速度呢?
Dmitri Dolgov: 我们正在以指数级的速度扩展。比如从五万英里到十万英里的行驶里程,我们只用了三个月的时间。但美国每年所有车辆行驶的总里程大约是三万亿英里,这个距离还很长。因此,我们认为推广过程需要循序渐进,以便建立公众信任。
主持人: 未来在技术上最大的变化会是什么?我们最近请Andrey做客节目,他认为Tesla的路径更偏向于软件驱动,而Waymo则更加注重硬件,你怎么看?
Dmitri Dolgov: 这是一个很好的对比。我认为AI是核心,比如Transformer和大模型的应用是让我们走到今天的重要突破。而硬件也很重要,因为我们需要在物理世界中运行。我们车上的硬件实际上是一个优势。就像人类驾驶员一样,视力良好是驾驶的基础,即使视力稍差或缺乏深度感知,驾驶仍然可以勉强进行。
所以,硬件的作用就像人类驾驶员的视力一样至关重要。即使你闭上一只眼睛或者视力不是20/20,仍然可以勉强开车,但效果肯定不如视力完全良好的情况下好。同样地,我们的硬件和传感器配置让自动驾驶系统能够在复杂的物理环境中“看得清楚”。我们始终认为,硬件和AI的结合能够为自动驾驶提供坚实的基础。现在我们处在一个前所未有的技术发展阶段,将Waymo的AI与广泛的世界知识相结合,并且让这一系统具备实时评估和高安全性。这不仅让我们能够处理更复杂的驾驶环境,也为我们在各种恶劣天气和高密度城市环境中提供了可靠的支持。所以,我们认为硬件和软件都至关重要,且二者之间是相辅相成的关系。
在过去几年里,我们一直处于一种没有完全破解难题的状态,时常假设某种技术突破会带来什么样的效果。就像登山一样,当你到达一个峰顶后,以为到了终点,结果才发现前面还有更多的山脉。我们在这个过程中也有类似的感受,行业通常会经历这样的过程。但当你真的破解了这个难题,并拥有了评估方法后,就进入了一个完全不同的阶段,可以着手优化和扩展。
主持人: 在优化过程中,你们会将传感器系统简化作为一个重要优先项吗?
Dmitri Dolgov: 是的,每一代硬件都会在提升能力的同时大幅简化,成本也会随之下降。比如从第四代到第五代的系统,就实现了一个显著的跨越。而现在我们在开发第六代系统,重点是进一步简化和降低成本,同时提升用户体验。当然,还有规模经济的效应。我们使用的硬件组件大多都是相对通用化的产品,随着规模的增加,成本自然会降低。
主持人: 就我理解,人类驾驶员只需通过非常简单的视觉系统就能驾驶,而自动驾驶系统使用了多种类型的传感器。你们有评估需要多少数据或什么类型的数据才能达到理想性能的框架吗?
Dmitri Dolgov: 我们现在已经破解了自动驾驶系统的核心问题,并具备了评估机制,可以用数据来回答这个问题。我们一开始是基于人类的驾驶方式,人类只依靠两只眼睛和视觉系统就能勉强开车,但视力越差,驾驶的能力也会受到影响。而我们的自动驾驶系统使用了视觉、摄像头、激光雷达、雷达等多种传感器,这些传感器的数据互为补充,并且各自带来了不同的物理特性优势。
主持人: 你们如何确定每种传感器的重要性?可以通过去除某些传感器进行测试吗?
Dmitri Dolgov: 以前这是一个理论上的问题,我们只能假设需要多少数据或传感器。而现在,我们可以通过实际数据来回答这个问题,比如我们可以去除某个传感器或加入噪声,观察系统的表现会如何。如果我们去除激光雷达或雷达,甚至只用摄像头来驾驶,就像人类用单眼或模糊视力驾驶一样,系统的表现肯定会下降。关于在完全自动驾驶的情况下,系统的表现是否能达到安全标准呢?在完全自动驾驶和大规模负责任的部署情况下,答案是否定的。如果你改变了一些输入条件,比如仅限小规模部署,或是有驾驶员协助,那么配置的要求可能会有所不同。在这种情况下,可能可以简化某些传感器系统,因为有驾驶员在场负责安全。但是,在我们的高标准全自动驾驶环境下,需要多种传感器组合来确保安全。
四、大规模商业化落地
主持人: 你提到,由于摄像头的分辨率、动态范围、清洁度等特性不同,系统的操作点会有所调整。但根据项目目标和产品的实际需求,操作点的选择可能会有所不同。如果我们展望一两年,Waymo已经解决了核心问题,下一步就是扩展规模。从商业角度来看,你是否认为大规模的自动驾驶出租车业务是近期的主要目标?还是有其他类型的部署值得探索?这对我来说就像是一个资本支出问题,是否有其他重要的渠道?
Dmitri Dolgov: 没错,叫车服务是我们的主要方向。我们专注于技术和产品,并从用户中学习,每天都在赢得信任,同时我们也在建立合作伙伴生态系统。这是我们当前的重点。虽然这并不是我们唯一的方向,但我把Waymo视为一家技术公司,我们正在构建一种可推广的Waymo驾驶系统,目标是成为全球最值得信赖的驾驶系统。我们不仅仅希望在叫车服务中部署这个系统。美国每年行驶的总里程超过三万亿英里,而全球则超过十万亿英里。我们的愿景是将Waymo的驾驶系统应用于不同的商业产品和应用中,甚至可能跨越不同的出行模式。
主持人: 你们会考虑将系统授权出去,还是会为不同的使用场景自行制造车辆?
Dmitri Dolgov: 我们一直没有进入制造车辆的业务,而是与合作伙伴合作。这项任务太重要了,机会也巨大,因此我们不想单独完成。我们会建立生态系统来追求这些不同的商业应用。你会看到我们在叫车服务中建立了合作,我们不制造自己的车辆,而是与一级供应商(Tier 1)、OEM(原始设备制造商)合作,还与其他公司在运营和网络方面协作。
主持人: 你认为未来十年或二十年,汽车拥有权会有什么变化吗?随着无人驾驶叫车服务的普及,人们可能会像以前选择Uber那样转向自动驾驶,而不再购买或拥有汽车。
Dmitri Dolgov: 我认为,随着技术成熟和不同产品模式的部署,这种趋势会越来越明显。即使在今天的一些密集城市地区,已经出现了这种趋势。比如在旧金山或纽约,许多年轻人不再热衷于拥有汽车。在这些地区随着自动驾驶技术的普及,这一趋势会更加明显并继续发展。
主持人: 我之所以问这个问题,是因为我记得大约八九年前,自动驾驶领域的许多人都认为这种转变即将到来。当时有很多关于城市环境如何改变的讨论,比如停车场的位置、城市外停车和在适时自动派车的问题。你怎么看待这种转变的规模和时间?
Dmitri Dolgov: 我不想对具体时间框架做出预测,但我认为这个愿景是正确的。安全是最重要的,接着是可达性,一旦实现了大规模部署,就能带来这些益处。而且,当你达到这种规模时,可以更好地利用土地资源。不再需要大量停车场来停放90%时间闲置的个人车辆,确实可以做得更好。这些益处实际上来自规模的扩大。我们一直以来的首要目标是安全,这也是我们的使命和愿景。随着规模的扩大,我们开始逐渐接近实现这个目标。如今我们已经积累了数千万英里的行驶数据,每周行驶超过一百万英里,安全基准的统计数据也愈发清晰。这让我们能够真正谈论具体的安全益处,比如减少道路上的伤害和事故。这是我们的主要目标,而除此之外,我们也能获得一些附加的好处。
主持人: 在这样的环境下,你认为传统汽车制造商的角色会是什么?毕竟汽车的功能是把人从A点运送到B点,类似于叫车服务,但有不同的舒适等级。然而,如今一个庞大的产业是围绕个人购买乘用车建立的,包括工业设计、品牌等等。比如说,在湾区你真的需要一辆福特猛禽吗?你怎么看待这种趋势的变化?
Dmitri Dolgov: 我们把自己定位为“驾驶员”的构建者,而这个“驾驶员”可以驾驶不同类型的汽车。无论是适合城市叫车的汽车,还是适合货物运输或长途旅行的车辆,我们都需要不同的车型和不同的形态。因此,这对我们与传统汽车制造行业来说是相辅相成的。
主持人: 有观点认为,既然已经通过改变驾驶员和车辆来改进自动驾驶环境,是否还需要对基础设施进行改变?比如在公共交通方面,有些形态的推广确实需要公共部门的参与。
Dmitri Dolgov: 的确,基础设施和可持续发展对我们来说都很重要,安全仍然是首要的。事实上,最近我们宣布了一个新计划,鼓励人们在我们运营的城市乘坐Waymo去公共交通枢纽,这样大家都能从中受益。
五、无人驾驶服务体验
主持人: 关于汽车的内部设计,你怎么看?比如Amazon收购的Zoox公司,他们将车内设计为类似伦敦出租车的布局,座位面对面排列,去掉了方向盘和其他驾驶控制装置。你认为未来的自动驾驶叫车服务中,这种乘客体验会是什么样子?
Dmitri Dolgov: 围绕乘客设计汽车是非常合理的。过去我们设计汽车主要是围绕驾驶员,但在Waymo的系统里,我们的核心是乘客体验。我们在第六代Waymo驾驶系统和车辆设计上进行了许多工作,确保汽车更宽敞、平整的地板、较低的入口、滑动侧门等都是为了乘客方便乘坐。当然,面对面的座位设计可能会让一些人晕车,所以目前还没有采用这种布局。未来的汽车设计重点将更多围绕乘客,而不是驾驶员。未来的布局可以有很多创新,比如我一直想要一辆后座有Peloton健身设备的车,这样通勤时也可以锻炼。这个想法不错!如果车里有健身设备,你就能在一个封闭的环境里运动,尤其是在加州,骑车的话还是有些风险的(笑)。
主持人: 我就想要个不那么奇特的设计,比如稳定的网络环境,能在车里开视频会议,看起来不会很奇怪。
Dmitri Dolgov: 没错,现在我们的团队成员越来越多地从Waymo车辆上加入会议了。实际上,你提到的隐私问题也是我们常开玩笑的一部分。如果车里没有其他人,你可以在里面开会、打电话,甚至把喜欢的音乐放到最大音量,而不用担心与他人共享空间带来的尴尬。这其实是我们产品预期的一个好处之一,我们也确实收到了用户的积极反馈。
主持人: 扩展覆盖范围是将服务提升到每周数十亿英里的关键因素,那么你认为当前的瓶颈主要是什么?是车辆数量的问题,还是用户的信任问题?
Dmitri Dolgov: 主要还是在于信任的建立。我们的方针一直是负责任和逐步推进,在每一步都要赢得信任,并保持透明的对话。这项技术是全新的,产品也与以往不同,用户需要时间来适应。这种信任是难以建立的,但却很容易失去。所以我们在扩展时非常谨慎。
主持人: 这让我想到过去电梯操作员的角色。电梯最早有专人操作,而去除电梯操作员也是一个大变革,人们需要时间来适应自动化的电梯。技术发展中人们对其接受度的变化是很有意思的。那么你提到Waymo的目标是构建一个通用的驾驶系统,是否有机会将其扩展到其他形式的机器人中?
Dmitri Dolgov: 在驾驶部分,我们确实设计了一个可推广的系统,第五代驾驶系统和AI的通用性都表现得非常好。我们通过广泛的数据来构建这个系统,在达到我们设定的性能要求后,就可以逐步部署到适合的领域和区域。此外,关于超越自动驾驶的其他应用,有些问题本身具有基础性。比如感知技术,它不仅可以用于车辆,也可以应用于其他在物理世界中运行的系统。我们在AI实时系统和安全关键系统上的研究可以为其他领域提供参考。所以,这些研究不仅限于车辆,而是能拓展到许多需要仿真评估的机器人应用中。很多机器人应用,特别是超越自动驾驶的领域,都需要一个可靠的、可扩展的仿真系统,而我们在这方面的工作也是可以借鉴的。不过目前我们还是聚焦于自动驾驶这一主要任务,因为我们认为专注是非常重要的。
六、完全无人驾驶难题
主持人: 我想回到一个技术性的问题。你曾提到要专注于完全自动驾驶的难题,但我注意到很多从Waymo和谷歌项目出来的团队选择了看似更简单的应用场景,比如长途卡车运输和本地配送。你认为在这些应用中能吸取哪些经验吗?
Dmitri Dolgov: 这是个很好的问题。我认为,完全自动驾驶和规模化的完全自动驾驶,与驾驶辅助系统之间的差异是巨大的。比如,长途卡车运输可能看似更简单,但如果我们谈论的是完全自动驾驶,那么两者的复杂性仍然存在差异。我们可以选择较低速的应用场景,比如本地配送,或者在高速公路上运行的卡车应用,但这也只是二阶的复杂性差异而已。
自动驾驶的核心复杂性依然存在。比如,你要解决的根本问题在于如何构建一个可推广并且安全的驾驶系统,并设定极高的安全标准。现实世界充满了噪音和复杂性,人们在道路上可能会做各种不可预测的事情,这需要系统能够实时做出决策,这些决策中的每一秒都至关重要。这就是AI面临的难题。如果是在高速公路上,虽然情况可能更加结构化,但仍会遇到各种突发情况,比如施工区域、掉落的物体、事故车辆等。高速公路上的突发情况可能出现得更少,但由于速度较快,严重性往往更高。比如前方车辆掉落的物体,或者事故车辆突然失控旋转,这些都是实际驾驶中会遇到的情况。因此,虽然在某些场景下自动驾驶看起来更简单,但如果追求完全自动化和大规模应用,这种复杂性依然存在,无法跳过核心难题。
主持人: 所以从高级驾驶辅助系统到完全自动驾驶的差异在于“9的数量”,对吧?即系统的可靠性和稳定性。
Dmitri Dolgov: 没错,这涉及到问题的本质。比如2009年我们刚开始时,设定的目标是让车子在旧金山湾区的十条不同路线中行驶100英里,无需任何干预。当时只有十几个人,用了18个月时间才完成这个目标。当时没有ImageNet、没有卷积网络、没有Transformer,也没有大模型,用的计算资源也很有限。这看似简单的目标其实已经非常困难,技术进步虽然让入门更容易,但问题的复杂性在于如何应对“长尾”现象。
主持人: 随着技术进步,比如Transformer和大模型的出现,你认为是否可以更快地实现自动驾驶的进展?
Dmitri Dolgov: 确实,Transformer和视觉模型(VLM)的强大性能令人惊叹。如今,你可以用几乎现成的Transformer模型接受图像或视频输入,并给出文本提示,输出行动决策。只需微调一点数据,模型就可以从摄像头数据生成行驶轨迹,性能会非常出色,甚至让人觉得不可思议。但是,问题在于这是否足够安全,能否达到完全无人驾驶的级别,并且拥有远超人类的安全记录?答案是否定的。每一轮技术突破都让我们看到系统的潜力,但要做到全面安全还需要更多的努力。
主持人: Waymo的迭代周期是像许多其他AI公司一样,通过评估发现问题并收集更多数据来改进,还是仍然在做一些架构上的改进?
Dmitri Dolgov: 我们两者都有。在数据层面上,我们确实会持续收集数据,迭代模型,同时也在架构层面进行一些改进。
主持人: 你刚提到数据收集和理解哪些表现不足之处,以及构建整个数据和评估的飞轮。这是核心部分,但这里有一些细微差别。究竟是什么架构?训练方法又是什么呢?
Dmitri Dolgov: 最简单的方法是一个端到端的模型,仅基于模仿人类驾驶员的行为进行训练。你使用简单的传感器,输入像素数据,输出驾驶行为,通过这种方法逐步模仿人类驾驶员。这样的模型进展很快且理解清晰。你可以平衡数据,找出表现不佳的地方,模拟更多类似的场景,不断调整。然而,这种方法在模拟驾驶辅助系统中可能有效,但在完全自动驾驶中会遇到瓶颈。要实现完全自动驾驶,除了简单的模拟数据和传感器模拟,还需要使用合成数据和闭环模拟,单纯模仿是行不通的。
主持人: 所以,虽然“数据飞轮”的核心仍然有效,但内部的具体操作可能会有所不同。我们现在处于什么阶段?未来会走向何方?
Dmitri Dolgov: 回顾这些年的历程,我现在比以往任何时候都更加兴奋。将近二十年了,这个愿景一直在那里,但我们曾面临许多重大问题,比如能否构建出符合标准的系统?能否找到合适的评估方法?人们会愿意使用吗?我们能否以商业上可行的方式来实现?现在,我们证明了我们可以实现这一目标,并对我们的安全记录感到自豪。用户反馈也非常积极,我们看到这项技术具有经济可行性。因此,对未来我充满期待。接下来就是优化、扩大规模,将这项技术带给更多人。
主持人: 真的非常激动人心。感谢你今天加入我们的节目!
Dmitri Dolgov: 感谢你们的邀请!
原视频链接:https://www.youtube.com/watch?v=d6RndtrwJKE&t=4s&ab_channel=NoPriors%3AAI%2CMachineLearning%2CTech%2C%26Startups
素材来源官方媒体/网络新闻
不只是算法,我们在创造改变生活的可能。您是否曾想过AI技术能为您的事业带来突破?现在,这个机会就在眼前,欢迎扫描下方二维码或点击链接填写AI需求,来和我们聊聊。
https://kawecob6a7k.feishu.cn/share/base/form/shrcn9i5HkwtHpkQNaV1bDqjt8f,会有相关负责人联系及时您,请留意您的微信和邮箱信息。
往期回顾
1、[OpenAI首席产品官Kevin Weil分享公司最新AI产品路线图,并透露其在AI行业中保持领先策略]
3、[微软CEO纳德拉演讲:AI革命引发汇丰和麦肯锡等大企业抢占商业先机,人类将步入无处不在的AI代理世界]
3、[彭博社专访Runway CEO:现场讲解AI视频技术,并手把手教学如何用AI秒生精美视频]
想象一个世界,AI不再是遥不可及的科技,而是每个人的得力助手。我们将科技与创新想法完美融合,探索无限可能!
告别昂贵服务和缺人烦恼,再见漫长交付周期
无限创意,分分钟生成专业级产品
感受 AI 带来的全新工作体验!
欢迎各大品牌方、媒体、企业和个人等
请联系负责人微信:Milo-1101
--END--