编者按:9月13日,在广东省智能交通协会、赛文交通网联合主办的“车路云一体化发展论坛”上,广州市交通运输局新经济专班负责人苏奎作了《自动驾驶系统怎样安全才算安全,人类的经验和英国立法的启示》主题报告。
苏奎表示,自动驾驶的安全性是最重要的优势,自动驾驶的发展过程中,安全性是最重要的考量因素。随后介绍了当前世界主要国家的安全准入标准及其设置思路,并着重介绍了英国立法的启示,最后分享了对于人类驾驶员准入经验的相关思考。自动驾驶的安全性是最重要的优势
汽车交通对人类造成了极大的安全威胁。相关数据显示,每年全球约有135万人死于道路事故。每天几乎有3700人在涉及汽车、公共汽车、摩托车、自行车、卡车或行人的交通事故中丧生。其中超过一半的死者是行人、摩托车手或骑自行车者。据估计,交通事故伤害是全球所有年龄段死亡的第八大原因,也是5至29岁儿童和年轻人死亡的主要原因。相关研究表明,人是最大的危险源,超过90%的事故是由人为错误引起的。交通事故致死事故中,32%由酒驾导致,31%由超速驾驶导致,16%由分心驾驶导致,11%由恶劣天气条件导致。如果车辆感知技术能够比人类更好地“看到”周围环境并更快地做出反应,这将显著减少伤亡,因此,安全性是自动驾驶最大的优势。但是,自动驾驶真的像想象中的那么安全吗?2023年12月,Waymo公司发布的安全研究报告表明,Waymo无人驾驶汽车发生车祸导致人员受伤的概率相较人类驾驶员降低85%;发生需要向警方报告的车祸的概率比人类驾驶员低了57%。同时,Waymo统计了截至2023年10月所有自动驾驶系统的行驶里程,共计超过约1149万公里,仅发生3起导致伤害的事故。以每百万英里碰撞率的指标比较,人类司机是2.78起事故,而Waymo无人驾驶汽车仅为0.41。由于Waymo的无人驾驶技术还处于发展过程中,技术还不是非常成熟,其研究报告统计的里程数也相对有限,因此这个结果仅具有一定的参考性。接下来再来看Waymo的另一方研究报告,该报告分享了2000亿公里的人类驾驶数据,从统计学意义上来说参考意义更强。2023年,Waymo与瑞士再保险公司(SwissRe)联合发布了一份从责任保险角度的安全研究报告。瑞士再保险公司分析了约2000亿公里的人类驾驶数据,涉及60万起责任保险索赔。比较分析结果显示,在Waymo加州旧金山和亚利桑那州凤凰城380多万英里(约600多万公里)的车内无驾驶人自动驾驶过程中,Waymo自动驾驶系统未造成任何涉及人身伤害责任保险索赔事故,而人类司机为每百万英里1.11起责任保险索赔。从财产损失的责任保险索赔数据来看,自动驾驶系统和人类驾驶员指标分别是0.78和3.26,该指标也大幅下降了76%。可以说从目前的研究成果来看,自动驾驶确实能够使安全性实现较大幅度的提升。接下来我们要追问的问题是,自动驾驶系统究竟是什么?传统认识上,我们将自动驾驶系统归类为车辆组成部件;如今的主流看法大多认为自动驾驶系统是车辆的数字/AI驾驶员。汽车的安全性和可靠性已经有成熟的技术标准进行保证,并得到了证明,经过100多年的发展和相处,人类对汽车技术已经建立了信任。在当前的自动驾驶时代,我们需要解决的问题是能否安全可靠地驾驶汽车,以及如何验证AI的驾驶能力。也就是说,自动驾驶系统本身其实是AI驾驶员,自动驾驶时代,其实是如何解决如何信任、管理AI驾驶员的准入问题。当前,为什么公众会更担心自动驾驶系统的安全性问题?这是由于人类驾驶员属于分散决策(数亿个驾驶员),人的差异性决定了个人的安全水平不代表整体的安全水平,甚至没有太大关系,且由于行驶里程有限,任何个人驾驶员的问题的风险都是可控的。而自动驾驶系统可能会同时安装到数十万,数百万,甚至千万台车上,其可能的安全风险是单个人类驾驶员安全风险的数十万倍、甚至数千万倍,犹如我们对待运营驾驶员,因此需要高得多的安全标准。自动驾驶系统是超级驾驶员,是系统性安全问题,任何安全漏洞都有可能是系统的安全问题,这也就是人们所担心的问题症结所在。这样的风险如果存在,是否可控,我们并没有把握。如何测量自动驾驶系统的安全性,如何设定自动驾驶系统的安全准入标准是自动驾驶系统进入规模化应用需要解决的首要关键问题。这方面,我国目前的进展相对落后,下面看一下世界各国的准入工作。《德国自动驾驶实施条例》相对保守,提出了若干非常细化的功能要求,指出具有自动驾驶功能的机动车必须满足在必要要求时,可作为获得型式认证测试的一部分,以及作为验证符合与该型式认证相关的要求(功能要求)的一部分进行测试。测试案例必须为所有场景、测试参数和环境影响提供足够的测试覆盖范围。同时,文件明确,测试案例应能证明具有自动驾驶功能的机动车的安全水平高于由人驾驶的机动车的安全水平,以验证所要求的功能符合相关标准。2021年颁布的《法国自动驾驶条例》提出,任何自动道路运输系统的设计、投入使用以及在适当情况下进行的修改,都应确保与用户、操作人员及第三方相关的整体安全水平至少等同于现有的安全水平,或是实施提供类似服务或功能的系统或子系统后的安全水平。可以看出,虽然法国和德国的准入文件大体类似,但也有所不同。德国要求对于每项安全功能进行标准评判,而法国则是要求整体安全水平至少等同于现有的安全水平。《欧盟完全自动驾驶系统车型审批指令》相当于欧盟关于自动驾驶的立法文件,文件要求,鉴于自动化驾驶系统的复杂性,有必要通过制造商提供的文件补充本法规的性能要求和测试,这些文件应证明自动化驾驶系统在其整个生命周期内,在相关场景中对车辆乘员和其他道路使用者没有不合理的安全风险。对于“不合理的安全风险”,文件中进行了进一步的解释,即在操作设计域内的可比较运输服务和情况下,相较于手动驾驶车辆,自动化驾驶车辆对乘员及其他道路使用者的整体风险水平有所增加。这意味着整体安全水平要与人类驾驶车辆在同样的情况下达到同一安全水平。欧盟的做法也同德国类似,对所要检测的若干功能设置了总体验证目标(overallvalidationtarget)的安全条件基准,即通过一系列测试和验证过程来确保自动驾驶系统的安全性,确保其在实际使用中的表现不会比人类驾驶员更差,从而保证所有道路使用者的安全。此前,日本国土交通省宣布将对道路运输车辆的保安标准及保安标准的细目制定告示进行部分修改,导入与自动驾驶技术相关的国际标准。在本次修改的法律中,关于在高速公路上运行时装备车道保持系统的自动运行装置的要件,适用协定规则的要件(功能要件)。具体的要件是在自动驾驶系统工作中,不会妨碍乘车人员及其他交通的安全,因此与细心能干的驾驶者为同等以上的水平。这个要求相较人类驾驶员的说法进一步明确了比较对象。美国目前只有加州发布了自动驾驶的相关文件,但也并未发布非常明确的标准。加州要求在提交准入申请时,要向监管机构提交已完成的测试里程总数、人身伤害或死亡的碰撞次数及采取的补救措施等信息。美国及各州都认为各联邦政府没有能力制定相关的安全标准,实践是检验真理的唯一标准,因此其更注重上路后发生了什么事故,以及采用了哪些措施解决,这是美国与其他国家在准入思路方面的重大区别。综合其他主要域外国家的经验看,自动驾驶系统的安全性是与人的比较作为基准,并没有绝对的安全标准,这也侧面佐证了自动驾驶的本质是驾驶员。德国、欧盟、日本等大陆法系国家均明确了设定功能的要求标准,功能要求标准验证的标准是不能低于人类驾驶员的操作同样功能(驾驶情形)的水平;美国加州则是认为驾驶水平无法或很难进行一次性功能验证,倾向以长期的测试实地验证为主,他们认为能力不是功能,这是需要特别注意的一点。英国也是普通法国家,其法学会在立法工作的推进过程中曾对以下四个标准进行了深入探讨。一是自动驾驶的安全性难以测量。因此英国提出,自动驾驶系统在事件中需要成立专门的监管部门对其安全进行跟踪和管理。如果达到标准,公众在每次不利事件后可以得到保证,即自动驾驶车辆总体上仍然是安全的;如果未达到标准,则可以采取监管行动,要求进行改进或从道路上移除车辆。二是安全技术标准只是一个指导性的方向性指南。实践是检验真理的唯一标准,安全技术标准只是一个指导性的方向性指南,而不是一个测试,安全能力难以如安全功能那样测试,在实际部署后,与期望的安全标准进行比较才是可行的方法。三是安全标准是一个政治决定。安全标准是一个准入标准,没有绝对科学的标准,是否可以上路是一个政治决定,应该由政治家做出决策,技术专家提供技术支持。四是安全标准是相对的,即相对于人类驾驶员的安全性,而且有地域性。英国认为,由于英国的安全标准远高于全球其他国家,每个国家的实际情况不同,设定全球性的安全准入标准是不现实的,汽车可以有全球的安全标准,但驾驶员的标准只能是本地化的,车辆自动驾驶系统的准入标准必须是地域性的。2024年5月20日,英国政府正式通过了酝酿已久的《自动驾驶汽车法》(AutomatedVehiclesAct2024)。该法案首先对于安全的定义进行了明确,指出安全即要满足合法性和安全性两个要求,也就是车辆达到可接受的安全标准,且车辆在行驶时具有可接受的低风险违反交通法规的可能性。同时,法案要求交通部长要制定一份安全标准(thestatementofsafetyprinciples),以监控和评估获授权的自动化车辆在英国道路上及其他公共场所的一般表现。此外,法案还要求自动驾驶系统必须具备自主且达到一定安全水平的行驶能力。安全水平必须要等于或高于一个谨慎且能够胜任的人类驾驶员(carefulandcompetenthumandrivers)。这个要求和日本类似,明确了究竟是以全社会的平均水平还是以某城市的平均水平为基准,对于设立未来全国的安全标准至关重要。为此,英国也明确了准入的两层含义。一是要在投入运营前设置安全功能性标准;二是要在实践过程中测试出来所能达到的安全事故标准,并与安全标准进行对比,如果未能达到要求,将会撤销准入许可。同时规定了监管机构必须实时收集相关数据作为法律依据。有机构曾做过相关的研究,认为通过测试发现自动驾驶系统是否能够达到或超过人类安全水平是不现实的。测试里程需要达到110亿英里,约200公里,在投入运营前要求每个车辆完成200公里的测试成本是非常高昂的,也是不可能实现的。这也是英国规定在实践中进行测试的原因,单靠路测验证安全的成本和时间过于庞大与漫长。人类驾驶员的风险是可控的,为什么我们对于营运车驾驶员需要更高的要求?这是因为运营驾驶员驾驶的里程是普通驾驶员的数倍,其风险也高了数倍,因此其需要更高的驾驶安全标准来进行管理。值得注意的是,对于营运车辆驾驶员的准入考核并不是驾驶技术的特别考试,而是要求一定的驾驶经验,如出租车驾驶员需要3年以上的驾驶经历;大客车驾驶员需要已取得B1中型客车或者B2大型货车准驾车型资格五年以上。这样的制度安排实际有一个隐藏的重要假设,即驾驶经验比考试更有价值,有些能力是很难通过考试进行验证的。从人类驾驶员考试中我们可以看出,安全水平准入与汽车准入是完全不同的性质,不能照搬汽车准入的经验进行套用。汽车准入是设计功能和性能以及可靠性的认证,具有确定性;而驾驶员的安全水平准入是应用能力的准入,具有不确定性,难以通过任何简单、单一、短时间进行验证确认。人类获得驾驶证并没有经过驾驶安全水平的评估,主要是驾驶操作基本技能掌握的评估,获得的是驾驶资质,公安机关并没有对其驾驶安全水平进行背书。其隐含的假设是,在人类获得驾驶执照以后,驾驶员本身对其安全水平负责,并在实践中提高。考官主要考察动作的规范性,在考核驾驶过程(比如起步前先打左灯,并观察倒后镜,确认安全)中,过程与结果同等重要,甚至更为重要,结果(安全驾驶)有随机性,但正确的过程,或者说规范的驾驶才能保证安全驾驶证(结果)的可靠性。驾驶规范性的要求隐含的另外一个假设是每个驾驶员首先以及最重要的是要避免有责任的交通安全事故,不能苛求不发生无责事故。现在提到自动驾驶,就会提到道路测试,美国叫做testpermit,但我认为这种说法是不准确的。对于机器来说可以称为测试(test),但是对于人类来说,称为测试(test)则有失偏颇。测试是对既定功能的检验,而训练是提升适应环境(情景)的能力。无论进行多长时间和多少里程的测试,也不会提高自动驾驶系统的能力,只能是发现更多的BUG;测试是对机械功能,是没有智能的。而训练一定是对有智能的机器进行增强,更类似于人,是在增加经验。当我们只说道路测试的时候,其实也是一种思维惯性,更重要的是把自动驾驶系统当成一个机器,也就是否定了他的学习能力,对于没有学习能力的机器,我们只能是在其开始应用的时候,就要求具有最高的驾驶能力,而不是如对人类驾驶员那样,容忍他开始的不熟练和驾驶能力的瑕疵,并假设他能够在今后的驾驶过程中通过实践不断提高驾驶能力。在端到端大模型可能越来越流行的情况下,自动驾驶系统具有更多的自主性,学习能力更加重要。因此我认为,有测试的内容,更多还是训练,整体上称为训练可能更准确。人具有学习能力是最为重要的特征,过程的考核和学习能力的假设,是人类驾驶员在考试时最重要的两点。但现在的问题在于,当前的自动驾驶系统是个黑匣子,监管部门不能对驾驶过程进行观察,不了解驾驶过程,对其展示的结果很难建立信心。更重要的是对于学习能力的不了解,我们可以容忍自动驾驶系统在初期,犹如一个新手驾驶员的不完美,但究竟能在以后的过程中以什么样的速度进行自我学习?如何衡量AI的学习能力是一个更重要的问题。因此,透明化是自动驾驶系统必须要解决的问题。对自动驾驶系统的考试必须要考察驾驶过程,而不只是了解驾驶过程中的事故发生率、人工接管率、交通违规率等,测试或者考试结果的正确并不能保证未来驾驶的可靠性,过程比结果的考察更为重要。过程考察至少包括识别能力、风险的预判能力、决策等能力。同时,需要开发出一套标准的接口和测试系统,监管部门要监管的不应只是结果,还应定期对车型进行评估,特别是评估驾驶过程,犹如人类的驾驶考试的考官。我认为,当前行业需要制定驾驶水平或者能力的定量评价指标体系,驾驶的能力评价和驾驶过程的规范性的评价,包括驾驶的流畅度(如与整体交通系统的融入能力、乘坐的舒适度、交通规则的遵守率、交通安全等),以验证自动驾驶系统的学习能力。要将重心放在学习能力的测量,而非驾驶能力的测量,因为后者是无法评判的。最后我认为当前行业应当尽快开展有关数据研究。数据是做好准入工作非常关键的一个环节,从收集人类驾驶员安全数据的可得性与可靠性来看,职业驾驶员(如公交车、出租车、长途客车等专业驾驶员)数据最为齐全、可靠,可以作为比较基准,特别是涉及人生安全事故的数据。个人车辆数据不全,可以保险公司的数据作为参考,但在财产损失的数据方面有优势,却也存在数据要素不全的问题、当前,L2车辆事故数据的收集方面,工信部正在征求意见,新势力汽车厂家也有一些数据,这也是下一步的工作重点。综合全球各国的准入经验来看,标准必然是全国的,基准数据需要收集全国不同特征城市的数据,应该剔除安全水平较低的部分比例,如选择平均水平以上城市的数据,现在应该加强这方面的数据收集与研究,为准入标准制定提供基础。