驾驶行为谱系及反常驾驶行为建模

科技   2024-12-18 18:04   上海  

原创

驾驶行为谱系及反常驾驶行为建模

在开放道路实现正常、安全、高效的行驶是自动驾驶汽车的终极目标。自动驾驶汽车在开放世界中的交互对象复杂多样,其行为是影响自动驾驶车辆安全的关键因素之一。本文首先对驾驶行为进行分类、对驾驶行为谱系进行分解,随后基于跳跃—扩散方程对反常驾驶行为进行建模,并利用该模型对部分反常轨迹进行仿真。


关键词:驾驶行为;反常驾驶;跟驰模型;汽车安全;交通安全;跳跃—扩散模型


作者:浙江大学智能交通研究所 祁宏生

➡本文主要内容(约6600字,建议收藏阅读)


01.

驾驶行为谱系

1.1 谱系分解

得益于以大模型为代表的人工智能技术的进步,近年来自动驾驶得到了长足的发展。安全是自动驾驶技术的关键考虑要素之一。自动驾驶车辆安全性能的检验方法有多种。国内研发机构普遍先进行仿真测试,再到封闭测试区测试,最后到实际道路的自动驾驶开放路段测试这3歩走的方式进行。开放世界中与自动驾驶车辆交互的交通参与者类型多样、行为复杂,是汽车安全风险的重要来源之一。按照决策来源,本文提出的驾驶行为谱系如图1所示。任意时刻,与自动驾驶车辆交互的任一行为主体属于该谱系中的某一种。


图1 驾驶行为谱系


如图1所示,车辆的驾驶行为决策生成过程为:驾驶员—车辆单元进行感知决策、生成操作指令,指令主要为加减速和转向。由加减速和转向操作、形成车辆的实时运动状态。依据决策来源,将谱系分解为三类:自然人驾驶员、自动驾驶车辆、人机共驾。第一类由人类驾驶员控制车辆运动;第二类主要由算法/机器控制车辆运动,第三类的运动状态同时受人类和算法/机器的操控。


(1) 自然人驾驶员

自然人驾驶员同样也有许多种类。本文将其分为三类:理想驾驶行为、正常驾驶行为、反常驾驶行为。


a)理想驾驶行为指的是其行为可以由数学或物理方程精确刻画,对其轨迹进行预测、也可达到较高精度。典型的模型包括交通流理论中的跟驰模型、换道模型、Carla中的PID模型等。


b)第二类行为是正常驾驶行为,也是绝大部分驾驶员所体现出来的行为。这类行为的特征是存在一定的、可解释的随机性。例如,其随机性来源于图1中的路面随机激励输入、驾驶员感知误差和操纵误差等。大体而言,这类行为也可以用数学/物理模型刻画,其轨迹也可用模型进行预测。该类行为可以进一步细分为保守型、常规型、激进型等。例如,激进驾驶员的跟车时距较小、而保守驾驶员的加减速较为平缓。


c)第三类行为是反常驾驶行为。典型反常驾驶行为包括酒驾/醉驾/毒驾、路怒、蛇形走位、长时间跨车道线行驶、分心驾驶(如使用手机)等。之所以称之为“反常”,是因为其行为背离了驾驶任务(如分心)、或者被严重干扰(如醉驾)。反常驾驶行为的运动轨迹与前两类存在相当的差距,目前尚无微观交通模型对其进行刻画。


上述行为在数据上体现为什么样的差别?为了回答这一问题,作者用数据(受控跟驰实验数据、highD数据和分心情况下的驾驶模拟器数据数1(Taamneh, 2017))对第二类和第三类的区别进行了分析(关于第一类,可以参考著名的微观交通仿真软件SUMO中的跟驰模型列表2、国产微观交通模型TESS NG的模型列表3等)。纵向驾驶情况下的加速度分布如图2-a和b所示。图2-a为(Taamneh, 2017)中、分心情况下的驾驶模拟器实验数据、图2-b为受控跟驰实验。可以看到,自然驾驶员在稳定跟车场景下的加速度分布(图 2-b)近似服从正态分布,而分心驾驶场景下与正态分布不同;图2-c和d为侧向驾驶情况下、侧向波动(车辆距离本车道中心线的距离)的标准差。图2-c表明分心情况下、侧向波动迅速增大;而图2-d表明绝大部分车辆的std在0.2m左右,部分车辆呈现为较大的侧向波动。


图2 

(a)(Taamneh, 2017)中分心情况下的加速度分布;

(b)数据4中的加速度分布;

(c)分心情况下(Taamneh, 2017)的侧向距离std;

(d)highd中的侧向距离std


(2) 自动驾驶行为


驾驶行为谱系第二类是自动驾驶,其运动状态主要由机器或者算法生成。自动驾驶车辆的软硬件架构各异、算法不同;自动驾驶车辆有多种工作状态,例如ACC、AEB等。此外,车辆还可以工作于不同的模式,如单车、编队、协同换道等。


(3) 人机同驾


当车辆的运动状态由人和机器共同决定时、形成了驾驶行为谱系中的第三类:人机同驾。人机同驾是人机共驾车辆工作在特定模式(类似于双驾双控(宗长富, 代昌华, & 张东. 2021))下的结果。人机同驾可以应用于车辆的侧向(吴超仲 et al., 2022; 谢有浩 et al., 2020)和纵向控制(刘平 et al., 2024)


1.2 谱系内不同行为之间的关系

需要对上述行为谱系进一步说明:


● 谱系的构成随着技术条件的变化而进化,新行为有可能出现、并改变谱系构成。例如,远程辅助驾驶;


● 行为主体可以在谱系内不同类别之间转换。例如人类可以接管自动驾驶车辆。但转换并非总是瞬时的。例如,从机器到驾驶员控制权切换完毕后,人类驾驶员的驾驶绩效不一定能立刻达到最高点(张晖 et al., 2023)。Merat et al.(2014)发现在紧急情况下,虽然自然驾驶人能在 7~9s接管车辆, 但是保持车辆横向稳定却需要 35~40s的控制时间;


● 谱系内不同类别之间存在相互影响。研究表明,人类驾驶员在混入自动驾驶车流后,其行为特征发生明显改变(Zwart, Kamphuis, and Cleij 2023; Wen, Cui, and Jian 2022),包括较小的车头时距(降低6.38%)以及TTC(降低14.29%)


02.

现有建模方法在刻画反常行为方面的缺陷


反常驾驶行为对自动驾驶车辆的安全造成较大风险。自动驾驶仿真测试是应对该类行为的可行技术手段。现有自动驾驶仿真侧重传感器仿真、车辆动力学仿真、各类物体三维模型仿真,对交通流行为描述的解决方案主要是接入各类交通流仿真软件(赵祥模, 2023)。交通流仿真软件背后的技术为微观交通流理论/模型。目前微观交通行为建模方法包括如下类别:


● 传统微观交通流模型,例如Gipps模型、著名的IDM模型等。这类模型可参考Ni(2015)


● 基于深度学习的驾驶人模型,利用LSTM、GAN、GNN、Transformer等各类深度学习方法,从数据中提取行为特征、并对微观交通行为轨迹进行刻画;


● 基于强化学习的驾驶人模型,典型工作例如马依宁(2023)


上述方法各有优劣,已有文献对其进行了详尽归纳(He, 2022)。本文仅从反常行为驾驶这一角度、对上述建模的技术路线进行论述:


● 现有的微观交通流模型基于正常行为假设(例如驾驶员稳定跟随前车、驾驶员能稳定保持在车道线内、驾驶员会保持一定车距等),已有部分工作、改进微观模型,然而,全面刻画反常驾驶轨迹还需进一步研究。本文的反常行为模型是这方面的努力之一;


● 基于数据的建模方法。反常行为属于典型的长尾场景,目前学术界和工业界积累了相当多的路测数据,然而这些数据是否覆盖了足够多的反常行为值得探讨。反常行为的提取也需要构建相应的方法;


● 强化学习方法构建反常行为,该类方法目前存在一部分研究成果(马依宁等,2023)。总所周知,强化学习需要指定reward函数、构建训练流程。利用强化学习、对反常行为进行刻画,还需进一步探索。


03.

反常驾驶行为建模

3.1 建模思路

为了对反常驾驶行为进行建模,首先归纳正常驾驶行为的特征:(1)驾驶员对周围车辆和环境(标志标线等)有准确的感知;(2)纵向上能稳定跟随前车、侧向上能稳定维持其在车道内的位置;(3)正常驾驶行为不会导致较高的风险水平。基于和正常行为的对比,提出反常行为表征及处理思路如图 3所示。反常行为分解为纵向(A1、A2)、侧向(B1~B4)两个维度以及风险水平risk level(A3和B5、A4和B6)


纵向维度包括:

● A1: 前车的感知(leader perception)。如酒驾/醉驾/毒驾情况下,驾驶员无法准确感知与前车的相对距离,从而影响轨迹;

● A2: 均衡状态(equilibrium point)。即使当前车匀速行驶时、后车也无法维持稳定跟车状态,产生波动(如新手驾驶员)。


侧向维度包括:

● B1: 车道/道路的感知。在酒驾情况下,驾驶员无法准确感知车道线、道路边界等;

● B2: 缺乏明确的侧向目标位置。理想的侧向目标是本车道中心线或者目标车道中心线。当驾驶员分心情况下,无法通过轨迹确定其侧向目标位置、导致车辆侧向波动;

● B3: 侧向波动。自然人驾驶员在正常情况下、与本车道中心线的距离可近似正态分布,其标准差约为0.2~0.3米左右。然而,反常驾驶环境下、侧向来回波动较大。例如,新手驾驶员;

● B4: 完全侧向自由运动。当驾驶员失去对车辆的控制、或者驾驶员失去意识,车辆呈现侧向无控制状态。


风险水平的因素考虑两类:驾驶员对周围车辆的假设、驾驶员对本车操控性能的假设。正常驾驶环境下,驾驶员会对周围驾驶员以及本车的操控性能有一定的假设。


与之对应,反常驾驶分为:

● A3和B5:驾驶员对周围车辆的假设过于乐观,当这些车辆表现异常时、本车驾驶员无法在规定时间内进行规避动作、产生风险;

● A4和B6:驾驶员对自车的操控性能的假设过于乐观、或无法产生准确操控结果(侧向和纵向的加减速),从而产生风险。


上述解释了图 3中的Block A。Block B的解释见下述章节。


图 3 反常行为分解、及建模思路


3.2 模型架构:正常驾驶模型

本文认为正常驾驶环境下、车辆在两个方向上受到多种作用力(包括随机力,例如路面的随机激励、驾驶员随机误差等),从而产生车辆的运动轨迹(也即2D坐标、速度、加速度)。车辆受到的作用力列表如所图 4示。反常驾驶行为通过修改作用力的表达形式、添加某些项(如后文模型的chaotification项)或者忽略某些力来实现(Qi, 2024)。对图 4进行进一步说明,(1)图 4-b中,可以认为车辆受到中心线的吸引力。当吸引力较弱、车辆行为表现为车道内随机侧向波动;(2)图 4-c中,车辆会对相邻车道的车辆造成两个方向的压力,这个2D压力在交通流中向上游传导。半椭圆为车辆受作用的半径,其大小随着车辆速度变化而变化。


图 4 两个方向上的作用力


假设车辆(第i辆车)的状态向量为[xi,ui,zilon,yi,vi,zilat],表示车辆的纵向坐标、纵向加速度、纵向噪音、侧向坐标、侧向速度、侧向噪音(如轮胎的随机侧向力等)。本车(也即车辆i)的前方车辆坐标为Xle(i)(le表示leader)、周围车辆的集合为ne(i)(“ne”表示neighbor)。正常驾驶模型如图 5所示。


本模型采用带跳跃项的随机微分方程。采用这一技术路线的原因如下:(a)该类模型很容易和已有微观交通仿真软件相结合。(b)模型中众多参数可解释、可调节,适合描述不同的反常行为。模型的形式复杂、但结构简单。结构的解读如图 5所示。图5(a)~(c)为纵向运动、图5(d)~(f)为侧向运动。图5(c)和(f)为随机过程,表示纵向噪音和侧向噪音。在图5中,噪音的形式为OU过程,也可以替换为其他随机过程,例如几何布朗运动(Yuan et al. 2019)、分数阶布朗运动(Wang et al. 2010)等。


图 5 模型结构


图5中,I部分(传统跟驰模型)中的前车作用力采用IDM模型,也可以替换为其他任意跟驰模型;II部分是随机跟驰模型,类似已有的随机纵向模型(Yuan et al. 2019);III部分是侧向车道的车辆对本车道车辆产生的纵向力,例如,相邻车道的车在压线行驶时、对本车的作用力。该作用力表达式见图6、推导过程见(Qi, 2024b)。IV部分是跳跃项,用来解释较大的侧向和纵向急动度(Wang, Khattak, Liu et al, 2015)


图 6 相邻车道的车辆对本车的2D作用力

(Qi, 2024a)(Qi, 2024b)


对于各侧向作用力,其表达式如下:

● 道路边界作用力fbnd(△ybnd),随着车辆和道路边界距离△y递增至无穷(这一属性是假设车辆永远不会穿越至道路边界线外),公式如Eq.1、曲线形式如图7左图;


● 车道线作用力fmk(△ymk)。作用力随着车辆与车道线之间的距离△y而变化。公式如Eq.2所示、曲线形式如图7右图。该公式的基本思想:当车辆接近车道线时、作用力增加,但是车辆跨越车道线之后、又降低;


● 车道中心线吸引力fml(△yml)。可以采用抛物线,如图 4-b所示,此处不再赘述。


图 7 道路边界作用力

图 7 道路边界作用力


Eq.1


Eq.2


3.3 模型架构:反常驾驶模型

图5表达了正常驾驶行为受到的力。对公式各项进行修改、就得到了反常驾驶行为模型。依照图3列出的反常行为,对图5中的具体项进行修改如下:


● A1前车感知。在图5中前车的实时坐标为xle(i)(t)。反常驾驶环境下,驾驶员无法准确感知该坐标,从而可用函数表达不准确的前车感知位置。假设在时间段[t0dist1dis]内分心,则感知的前车轨迹可以表达为下式:

Eq.3


● A2均衡状态。在纵向控制(也即图5公式b)中添加混沌控制项uchaos(t)。考虑混沌控制项后、纵向驾驶形式上表达为dui=...+uchaos(t)。该项如Eq.4所示(Chen, 2003)


Eq.4


● B1: 车道/道路的感知(酒驾/醉驾/路怒等)。对真实的车辆与道路边界、车道线和车道中心线的距离(△ybnd、△ymk、△yml)进行修改,例如,假定车辆与车道线的真实距离为△yml、醉驾情况下的感知误差为Zdrunk,则驾驶员决策所依据的与车道线距离表达为△yml+Zdrunk。图8表示真实道路和感知道路的区别。在下节对其进行数值仿真。


图 8 侧向感知反常


● B2缺乏明确的侧向目标位置。例如分心驾驶。在图 5直接公式d中舍弃车道中心线的吸引力项Fml(△yml)。


● B3侧向较大波动。可以通过增大侧向噪音的参数来实现(也即增大图 5公式f中的σlat)。


● B4完全侧向自由运动。舍弃在图5直接公式d中所有侧向力(保留Fbnd(△ybnd),以避免车辆行驶至道路范围之外)


当考虑上述反常因素时,模型产生的行为就不能精确控制。为了控制模型产生轨迹的风险水平(例如,不能让车辆之间产生碰撞,毕竟本文模型是反常驾驶行为模型、不是交通事故模型),提出控制屏障函数(control barrier function)、调节风险水平(图3中的Block B)。在纵向控制公式(图5公式b)中添加纵向控制项(lon表示longitudinal、bar表示barrier)、在横向公式(图5公式e)中添加侧向控制项以纵向为例,添加控制项之后的形式如Eq.5所示。

Eq.5


添加控制的目的是将纵向风险水平维持在一定的水平。假定我们想让模型产生的轨迹的风险水平(和周围车辆的距离)维持在以上,定义该风险水平为一集合

Eq.6


其中,为依赖于Slon(也即)的函数。则按照随机控制屏障函数理论(Clark ,2021),当对于任意Slon、满足下述条件时候,会使系统维持在集合内。

Eq.7


以上述不等式为约束、最小化和参考控制量(uchaos(t))之间的差距,可以得到相应的控制量、代入Eq.5,得到车辆的轨迹(Qi, 2024b)


3.4 部分反常驾驶行为的数值仿真

本部分对几种常见的反常驾驶行为进行数值仿真。


3.4.1 侧向随机波动


侧向随机波动通过调节σlat来实现。图9-c给出了仿真结果。仿真场景包括4条车道。车道1的参数σlat是车道2车道0、2、3的参数取值的两倍。图9-c为车道1的2d轨迹;图9-d是其余车道的2d轨迹。图9-a为highD的侧向位置的std(车辆和本车道中心线的距离的标准差。“11_tracks”是highD数据文件的文件名);图 9-b是4条车道的std。可见,模型可以刻画大幅度波动。


图 9 (a): highD 数据集; (b) 仿真结果; 

(c): 反常驾驶车辆,σlat=0.4; (d) 正常驾驶车辆hσlat=0.2


3.4.2 蛇形走位、侧向完全自由运动


蛇形走位、侧向完全自由运动可以通过舍弃车道中心线力、舍弃车道线力等项来刻画。如图10-a所示,为车辆没有车道中心线和车道线的力的侧向运动结果,可以看到本模型可以刻画车辆的侧向异常行为。


图10 蛇形走位和侧向完全自由运动


3.4.3 醉驾


当驾驶员酒驾/醉驾/毒驾时,无法准确感知道路元素(车道线、车道中心线、周围车辆等,例如图 8中的感知误差)。假设驾驶员的车道线感知偏差为Zdrunk,服从OU过程如Eq.8。均值μdrunk为-1米。

Eq.8


图11-a中、车道1中的驾驶员都设定为醉驾驾驶员。从轨迹可以看出,车辆的运行偏离真实的车道中心线,部分车辆产生围绕车道线的较大波动、影响到了图11-b中车道2的车辆轨迹。图11-c和d是正常驾驶车流,可以看出和图11-a及b存在差距。


图 11 酒驾/醉驾/毒驾等


3.4.4 纵向驾驶

通过设定(公式Eq. 4中)αchaos大小可以控制车辆纵向行为的波动性。设定前车恒速行驶、后车通过本文提出的反常行为模型驾驶、调整αchaos大小得到的结果如图 12。图12-a~c为确定性IDM模型(无μdrunk;图12-d~f为αchaos=1;图12-d~f为αchaos=2。确定性条件下,后车稳定跟随前车;混沌项考虑后,即使前车匀速行驶、后车也产生预设的波动。


图 12 纵向反常驾驶:纵向波动


04.

结语

驾驶行为是道路交通安全风险的主要来源之一。高等级自动驾驶车辆在开放世界中的交互对象复杂多样。本文将其分为自然人驾驶员、自动驾驶、人机同驾三类。并对自然人驾驶员中的“反常驾驶行为”进行建模,提出了基于跳跃—扩散随机过程的2D反常驾驶行为模型。并利用该模型对部分反常驾驶行为的轨迹进行了仿真。


感知预测—决策—控制是目前自动驾驶算法的代表性数据流。后续工作包括:1)基于生成式人工智能对反常行为进行合成;2)将反常行为纳入预测决策控制的流程。



1. https://github.com/yaohandong/HISTORIC-DATA

2. https://sumo.dlr.de/docs/Definition_of_Vehicles%2C_Vehicle_Types%2C_and_Routes.html#car-following_models

3. https://www.jidatraffic.com/#/brochure 中的第六章6.2和6.3节

4. https://github.com/yaohandong/HISTORIC-DATA


祁宏生 | 作者

张玉新 | 审核




免责声明:如涉及侵权请及时与我们联系反馈,我们会在第一时间做更正声明或做删除处理。文章版权及解释权归原作者及发布单位所有,如需转载或引用本文的任何内容,请注明出处。


焉知汽车
科技 · 创新
 最新文章