利用线性结构对高度非线性的车辆动力学进行精确控制

科技   2024-10-31 22:54   上海  
来源 | 同济智能汽车研究所(优化与学习研究室)

编者按:漂移—一种以高侧滑角度操作车辆的技术—为在紧急情况下控制自动驾驶汽车提供了有趣的可能性。尽管漂移是一个高度动态的过程,涉及轮胎饱和与一个平衡不稳定的状态空间区域,但已证实自动驾驶汽车在此区域内仍能实现有效控制。过往用于漂移期间路径跟踪的控制方法依赖于非线性车辆模型。然而,证明了线性化模型能够捕捉到在漂移平衡周围大区域内进行控制的关键动力学特性。借助这一线性化模型,开发出了基于线性二次调节器的控制器。此控制器利用转向、油门及制动功能来追踪预设路径与所需速度曲线,实现系统的全面控制。通过在电动DMC DeLorean MARTY上部署该控制器,演示了线性化模型的保真度及其控制器的实际应用效果,路径跟踪精度超越先前工作,达到了厘米级的精确度。


摘要漂移—以高侧滑角度操作车辆 - 为在紧急情况下控制自动驾驶汽车提供了有趣的可能性。虽然漂移是一个非常动态的过程,发生在轮胎饱和且平衡不稳定的状态空间区域,但自动驾驶汽车已经在该区域成功控制。以前在漂移时进行路径跟踪的控制方法依赖于非线性车辆模型。然而,在本文中,我们证明了线性化模型捕获了在漂移平衡周围的大区域中进行控制的必要动力学。使用这个线性化模型,我们开发了一个基于线性二次调节器的控制器。该控制器使用转向、油门和制动器来跟踪所需的路径和所需的速度曲线,使系统完全启动。我们通过在电动 DMC DeLorean MARTY 上实施该控制器,并以超过先前工作的厘米级精度准确跟踪平衡和准平衡路径,展示了该线性化模型的保真度和该控制器的实用性。

关键词:自动驾驶汽车,车辆动力学,鞍点,线性化,漂移,LQR


Ⅰ 引言 

汽车绕过拐角的方式不止一种。通常,稳定转弯代表驾驶员将方向盘转向他们希望转动的方向的平衡状态。平衡由低转向角下的线性动力学定义,随着转向角的增加转变为非线性动力学,最终当一个车轴达到摩擦极限时变得不稳定或无法控制。一种不太传统的转弯方式,即漂移,代表了车辆在稳定转弯中的另一种可能的平衡条件。漂移涉及产生高侧滑角以保持后轮胎在其摩擦极限下运行,同时前轮胎反向转向以低于其摩擦极限运行。这会产生不稳定但可控的动态。

漂移对于低摩擦力和不确定的摩擦表面来说,这是一种有用的转弯方法。Tavernini 等人表明,对于低摩擦表面上的后轮驱动和全轮驱动车辆,漂移机动是驾驭发夹弯的最佳时间 [1],而 Berntorp 等人计算出,通过发夹转弯的最短时间机动将涉及 30 度或更多的侧滑在某些点。Velenis 等人表明,两种涉及漂移的拉力赛动作(林道制动和摆式转弯)是在低摩擦、越野路面上操纵某些弯道的时间最佳方式 [2]。特别是,他们发现越野制动漂移操作允许汽车离开弯道并快速恢复直线行驶,使驾驶员能够对不确定的道路和环境条件做出反应 [2]。Velenis 和 Tsiotras 发现,为了最大限度地提高出口速度,在弯道中导航的最佳轨迹包括在横向摩擦较小的情况下具有更大的侧滑角,从而产生与拉力赛车技术在质量上相似的轨迹 [3]。除了优化时间或出口速度外,Gray 等人还发现可以利用漂移机动来规划避障路径 [4]。

鉴于这种对障碍物和碰撞避让的适用性,一些研究人员已经开发出了使用现代非线性控制技术在漂移时跟踪路径的技术。Goh 等人开发了一种控制器,它使用转向和油门在漂移时跟踪路径 [5],将速度作为自由变量。Goel 等人开发了一种全驱动控制器,该控制器使用转向、油门和前制动器来跟踪漂移时的路径和速度曲线 [6]。这两个控制器都依赖于车辆动力学的非线性模型。在全尺寸车辆的实验中,这些控制器的均方根 (RMS) 横向路径跟踪误差分别为 18 cm [5] 和 42 cm [6]。然而,专业的拉力赛车手和漂移比赛车手似乎获得了更好的路径跟踪结果。拉力赛车手使用漂移机动来精确导航泥泞拉力赛赛道的不确定条件和能见度差,漂移比赛车手将他们的车辆与另一辆车或保险杠放在离墙壁仅几英寸的地方——同时保持非常高的侧滑角度。Keen 和 Cole 假设人类驾驶员使用线性模型来做出转向决策 [7],因此在车辆动力学高度非线性的状态空间中,采用非线性动力学的控制器的专业驾驶员表现优于控制器似乎令人惊讶。

转弯多重均衡的存在是运动方程非线性的直接结果。不同的模型预测了不同数量的均衡,Hindiyeh 和 Gerdes [8] 显示了由三态单轨车辆模型产生的三个不同的平衡,而 Edelmann 等人在双轨模型 [9] 中发现了四个。对应于漂移的均衡是不稳定的 [10],它们的线性表示包含不稳定的实特征值 [11]。Bárdos 等人通过实验表明,基于这种线性化模型的线性控制可以稳定漂移平衡周围飞行器的速度状态 [12]。

本文证明,车辆动力学可以被视为在平衡周围的大面积状态空间上呈线性。此外,即使平衡条件发生变化,特征结构也保持一致。因此,利用这种结构的线性技术不仅可以用于稳定速度状态,还可以用于跟踪轨迹。我们通过基于此线性模型开发控制器并在全尺寸测试平台 MARTY 上实现它来验证这一说法,如图 1 所示。该控制器使用线性技术来同时保持漂移平衡,并使用转向、油门和前制动器跟踪路径。通过利用底层线性结构,该线性控制器实现了超过以前文献中非线性控制器的路径跟踪性能。因此,利用自动驾驶汽车漂移的高度非线性动力学的关键是关注这些非线性方程可能掩盖的线性度。

图1. Marty 自主漂移。

本文章节如下:第Ⅱ部分介绍了用于分析的单轨车辆和轮胎模型。第 III部分描述了动力学的线性化,并演示了与平衡周围的非线性动力学的相似性。第 IV 部分介绍了可以利用这种线性度的平衡和路径跟踪线性二次调节器 (LQR) 控制器的开发。在 V 部分的全尺寸测试车辆上实施该控制器的实验结果表明,它能够跟踪恒定或可变曲率的路径,并且能够对调谐参数做出直接响应。第 VI 部分显示了跟踪性能如何超越以前发布的结果,第 VII 部分分享了结论和未来工作的方向。

Ⅱ 车辆建模

A. 单轨模型

单轨模型在模型复杂性和准确性之间取得了平衡。如图 2 所示,这个平面模型有三种状态:飞行器航向的速度、垂直于机体航向方向的速度、以及车辆的偏航角速率。该系统有三个输入:转向—建模为转向角,油门—建模为后轮胎上的力和前制动器—建模为前轮胎上的力。轮胎上的侧向力由车辆状态和输入生成,如下所述。车辆参数包括质量、转动惯量、从质心到车辆前部和后部的距离。使用单轨模型动力学建模如方程 (1)–(3) 所示。

图2. 带输入的三态单轨模型。

B. 轮胎模型

Fiala 刷子模型 [8] 的修改版本用于模拟轮胎前后侧向力。轮胎力是车辆状态、输入和参数以及轮胎参数的函数:轮胎的转弯刚度和轮胎的摩擦系数。确定轮胎横向力的第一步是计算滑移角:轮胎中心线与轮胎行驶方向之间的夹角。

图3.带参考路径的单轨模型。

C. 路径跟踪模型

曲线坐标系定义了车辆相对于所需参考路径的位置,如图 3 所示。横向误差是从路径上最近的点到车辆质心的距离。为沿路径的距离和是车辆航向与最近点处路径切线之间的角度。漂移时,始终为非零,因为车辆不再指向其行驶的相同方向。在平衡时,航向误差与侧滑角相反(为负的侧滑角)。路径跟踪动力学由以下公式描述。

请注意单轨模型方程、Fiala 轮胎模型和路径跟踪模型中的非线性。虽然这个方程组很好地代表了车辆动力学,但它不允许直接应用线性控制技术。

Ⅲ 动力学线性化

正如 Bárdos 等人所表明的,线性化漂移平衡的动力学会导致模型具有足够的精度来成功控制,并且足够简单地用于线性控制技术 [12]。这里介绍的研究更深入地研究了线性化动力学。在本节中,我们解释了线性化方法,在仿真中演示了为什么关于漂移平衡的线性化是有效的,并研究了各种漂移平衡的特征向量,以进一步了解漂移平衡附近的动力学行为。

A. 线性化方法

平衡状态由状态和输入的组合定义,其中状态导数为零。求解零态导数(1)–(3)可以得到由六个值定义的平衡:。用于表示论文其余部分的平衡值。

线性化方法对状态方程中涉及车辆动力学的项和与路径跟踪有关的项采用不同的方法。我们选择使用泰勒级数展开对车辆动力学方程进行数值线性化。虽然运动方程 (1)、(2) 和 (3) 可以通过分析线性化,如 Hindiyeh 在文献 [11] 中所示,但这需要额外的假设条件。由于本文的目标之一是研究原始方程和线性化方程在平衡点上的相似性,因此引入额外假设的弊大于闭式表达的利。相比之下,路径方程(8) 和 (10) 的分析线性化不需要在常量之外做其他假设。因此,分析线性化可以应用于路径方程,在不影响精度的情况下提供更多洞察力。

状态方程的解析偏导数相对于状态向量如下所示:

在计算解析偏导数后,在状态的平衡值处计算部分导数以产生(12)。注意

在纵向速度恒定的假设下,则完全线性化模型为:

在这组状态方程中,转向角和后轮纵力,包括可用于控制器设计的输入。接下来的实验使用前制动器在单独的控制回路中强制执行恒定速度的假设。为简单起见,数值线性化没有考虑前制动器对轮胎前侧向力的影响,因为在漂移平衡中,前侧向力通常低于其峰值 [11]。实验结果更详细地讨论了这种选择的影响。

B. 模拟分析

相位图为分析非线性系统的行为提供了一种有用的方法。Voser等人使用相图来确定漂移平衡是不稳定的鞍点[13]。图 4 显示了以漂移平衡为中心的完整非线性漂移方程的相位图。相位图与使用全非线性方程和数值线性化方程计算的轨迹重叠。为了生成线性化轨迹,将动力学围绕所示的漂移平衡线性化一次,然后使用这些动力学计算整个轨迹的状态导数。图中所示的区域大约表示在路径跟踪实验中观察到的平衡周围的状态变量变化范围。

图 4.在横向速度-偏航速率相位平面中绘制的相位图和轨迹。动力学围绕星号表示的平衡进行线性化,位于。使用非线性模型计算的相位图以浅蓝色箭头显示。使用线性化模型(蓝线)和线性化模型(红色虚线)计算从整个相位平面开始的模拟轨迹。请注意,使用线性化动力学模拟的轨迹与使用完全非线性动力学模拟的轨迹非常匹配。

在漂移平衡附近,使用线性方程计算的轨迹与使用非线性方程计算的轨迹定性匹配。没有明显缺失的动态或行为。此外,这些轨迹在定量意义上也非常吻合。这表明线性模型在平衡周围足够大的区域上很好地表示系统动力学,以便使用线性技术进行控制。虽然这里只展示了单个平衡的线性化,但图 4 代表了大范围的漂移平衡。

为了更好地理解线性化动力学如何从平衡到平衡变化,我们计算并绘制了整个横向速度 - 偏航速率相位平面的平衡特征向量。漂移的两种状态表示有一个稳定和一个不稳定的特征向量;图 5 显示了相位平面。从质量上讲,稳定的特征向量在各种均衡中保持非常一致的方向。不稳定特征向量的方向随着漂移平衡的变化而逐渐改变。特征值大小也会随着平衡值的变化而平滑而缓慢地变化。

图5. 整个相平面漂移平衡的特征向量。显示的平衡是通过保持纵向速度和曲率半径恒定和变化的横向速度从 -6 到 -2.5 m/s。计算并绘制每个绘制的均衡的线性动力学的特征向量。不稳定的特征向量显示为红色,而稳定的特征向量显示为蓝色。每个特征向量的大小由其相应的特征值进行缩放。请注意,当横向速度显著变化时,特征向量和值的方向和大小会平滑变化。

特征结构的一致性为漂移平衡提供了一些额外的见解。虽然漂移是不稳定的,但不稳定的特征是一致的,并且使用线性理解可以很好地预测。对于给定的线性控制器,当系统移动到相邻平衡或在单个平衡周围的区域时,开环动力学特征结构的一致性会导致闭环动力学的预期一致性。这让我们更有信心,可以使用基于线性模型的控制器控制整个区域的车辆。

 Ⅳ 控制器开发

在不牺牲模型保真度的情况下,使用线性模型表示车辆动力学的能力允许将传统的线性控制技术应用于控制漂移车辆的问题。

A. 稳定和路径跟踪控制器

如(13a)所示,该系统由四种状态表示:和两个输入:。所有状态和输入都以偏离平衡值的程度来衡量,当系统达到预期平衡时,状态和输入都将等于零(平衡值已经为零)。虽然线性化状态方程可以应用多种线性控制技术,但本文重点介绍线性二次调节器 (LQR) 控制,因为它既熟悉又透明。无限视距 LQR 的增益矩阵很容易计算,矩阵也有直观的解释。这样就可以对线性化动力学进行额外的测试--系统是否以直观的方式对这些矩阵的变化做出反应?第V-D 节通过实验回答了这个问题。

矩阵和矩阵最初是根据布赖森法则[14]选择的,并在模拟中进行了调整,最后在初步实验后进行了调整。最终的矩阵和矩阵(如下所示)为对角矩阵,分别对状态和指令进行惩罚。每个对角线条目均为(1/与平衡值的最大可接受偏差)

输入形式为,其中是无限视距LQR 问题的解。闭环系统的形式为:

请注意,所需的漂移平衡(使用单轨模型、Fiala 轮胎模型和车辆的估计参数计算)可能不是真实系统的实际平衡。漂移中的建模和参数错误比比皆是,因为轮胎在测试过程中会发热并脱落橡胶,从而产生与模型中假设的静态值不同的变化。如果计算出的平衡不是系统的真正平衡,则此控制器无法校正稳态误差。因此,这种方法应该预料到稳态跟踪误差。然而,特征结构的一致性表明,这种参数变化不会对系统的闭环稳定性产生重大影响。稍后介绍的实验研究了即使使用简单的控制器设计,特征结构一致性是否足以处理实际参数的变化。

B. 纵向速度控制器

我们使用一个单独的控制回路,具有前制动力,来调节车辆的纵向速度。均衡用作前馈项,而附加的比例项可校正

在仿真和实验中,增益足以进行速度跟踪。

   Ⅴ 实验验证    

A. 测试平台

MARTY 是 1981 年改进的 DMC Delorean,用作实验结果的试验台。MARTY 包含一个 GPS/IMU,可提供实时状态估计、计算机控制的电动助力转向、后轮上的双电动机以及允许单个车轮制动的线控制动系统。MARTY 通过 Oxford Technical Systems RT4003 双天线集成 RTK-GPS/IMU 获取车辆状态信息。状态信息以 250 Hz 发布。dSpace MicroAutoBoxII (DS1401) 以 250 Hz 的采样率运行 MATLAB/Simulink 模块,收集状态信息,实现控制器,并向转向、节气门和制动系统发送命令。表 Ⅰ显示了 MARTY 的更多规范,并在 [5]、[6] 和 [15] 中进行了讨论。

表 I 车辆参数。

对于实验测试,平衡和准平衡轨迹前面有一个入口轨迹,以启动漂移并使飞行器达到起始平衡,使用 [5] 中讨论的轨迹生成和控制器。下面显示的数据集不包括漂移进入和退出周期,侧重于在 LQR 控制器处于活动状态时收集的数据。前部制动力在左右轮胎之间平均分配。实验产生了所需的后驱动力,通过围绕车轮速度 闭合反馈循环,如 [5] 中所述。

B. 平衡轨迹

对于第一个实验,跟踪的平衡位于,,。遵循这种平衡会勾勒出一条圆形轨迹。跟踪平衡的线性动力学如下所示:

图 6 显示了使用稳定 LQR 控制器的四种车辆状态。图中所示的所有四种状态相对于现有技术而言,对于此应用程序来说,误差都非常低。特别是横向路径跟踪误差,相当低,RMS 误差为 4.2 cm,标准差仅为 1.4 cm。数据显示出明显的周期性,例如图 6 中 41、49 和 57 秒之前的横向速度出现峰值。该数据集表示圆形轨迹的大约 2.5 圈。这种周期性与轨道表面的变化相关。控制器可以精确地保持轨迹,以便在赛道表面的相同变化上行驶时,每圈都会表现出相同的可见动态响应。

图 6. 状态跟踪性能,用于跟踪单个平衡。测量值以蓝色显示,平衡值以黑色虚线显示。

图 7 显示了相平面中的横向速度和偏航角速率状态数据。在此实验期间,车辆保持在所需的平衡附近。即使平衡没有完美建模(测量状态的质心不在所需平衡之上),系统仍然保持稳定,跟踪误差仍然很小。这些实验支持了这样一个假设,即特征结构一致性在现实世界的不确定性下实现了闭环稳定性。正如预期的那样,不确定性会产生稳态跟踪误差,这些误差的大小取决于特定的增益选择。比较图 4 和图 7 的轴的范围,我们看到图 7 所示的大部分轨迹都在图 4 所示的相空间内。图 4 中的模拟轨迹表明,关于平衡线性化的动力学模型充分预测了该区域的行为。图 7 所示的实验数据证实,这个单一的线性化模型足够精确,可以开发一个控制器,使车辆保持接近这种平衡。

图 7.来自图 6 所示的相同常平衡实验的数据显示在横向速度-偏航速率相位平面上。该实验的参考平衡用星号表示,而测得的横向速度和偏航率值用蓝线表示。请注意,在整个数据集中,状态始终接近平衡。

LQR 控制器命令的两个稳定输入如图 8 所示。我们没有可用的轮胎力的直接测量值,因此这些力是根据惯性传感器估计的(见附录)。输入命令的变化很小:指令转向角的标准偏差仅为 0.4 度,指令后驱动力的标准偏差为 213 N。这种变化很容易通过执行器实现,测量和命令输入信号之间的相似性证明了这一点。

图 8.由 LQR 控制器命令的稳定输入。测量的输入显示为蓝色,而命令的输入显示为红色。每个输入的平衡值由黑色虚线表示。

最后,用于控制纵向速度的纵向速度和前制动力如图 9 所示。即使使用恒定的平衡前馈加比例反馈的简单控制定律,纵向速度的误差也相当低。通过前馈纯平衡值,而不是根据当前命令和状态计算前馈,我们避免了在前制动力命令中引入额外的噪声。

图 9.纵向速度控制器状态和输入,同时跟踪单个平衡。测量值以蓝色显示,命令输入以红色显示,黑色虚线显示平衡值

这里使用的 LQR 控制器并没有消除小的稳态跟踪误差,但确实在存在不确定性的情况下可靠地稳定了车辆。这种稳健性的大小可以在另一个平衡轨迹实验中看到,在该实验中,右后轮胎分层。尽管轮胎碎裂和胎面大块分离,轮胎参数受到很大干扰,但车辆仍保持了如图 10 所示的理想状态。虽然这是一个极端的例子,但定义漂移的滑动后轮胎会不断产生热量,因此,轮胎参数在整个漂移过程中不断变化。线性特征结构对轮胎参数变化的鲁棒性使即使使用如此简单的线性控制器也能实现稳健的控制。

图 10.状态跟踪性能,用于跟踪单个平衡。蓝色线表示测量值,黑色虚线表示平衡值。在这个实验中,右后轮胎分层。

C. 准平衡轨迹

1) 扩展控制器以跟踪准均衡轨迹

为了证明这种线性化方法在多个工作点上有效,我们采用该控制器来跟踪准平衡轨迹。最初在 [15] 中描述并在 [5] 中进一步发展,准平衡轨迹上的每个点都是一个平衡。图 5 显示,附近漂移平衡之间的动力学变化平滑,表明线性控制适用于此类轨迹。

我们使用第 IV 部分的控制器来跟踪准平衡轨迹,方法是沿参考轨迹每 0.25 m 线性化,并根据车辆的进度更新使用的线性化。整个准平衡轨迹使用与跟踪单一平衡时相同的矩阵以及值。通过改变线性化点,控制器变成了增益调度控制器。在轨迹上的每个点,我们都会更新线性化并计算新的反馈增益,但控制器结构在其他方面保持不变。

2) 准均衡结果

图 11 显示了在这个准平衡实验中跟踪的路径。该路径的半径称为“盒式磁带”,在 7 到 12 m 之间变化,同时保持平衡参考状态。

图 11.准平衡轨迹期间车辆所需路径和实际路径的俯视图。

我们将实验结果绘制在图 12 中的相平面。在这个平面中可视化,准平衡轨迹在相空间中缓缓弯曲。测得的状态在所有点上都保持接近参考轨迹,保持在与图 4 所示大小相似的区域内。这让我们有很好的信心,对于沿该轨迹的每个工作点,线性化很好地代表了动态行为。此外,这些结果验证了从图 5 中得出的关于平滑变化动力学的结论。即使使用的所需平衡和线性化发生变化,车辆也会保持路径。

图 12.来自图 13 所示的同一准平衡实验的数据在相位平面。黑色星号表示准平衡路径上的平衡,而蓝线表示测得的状态数据。即使参考平衡在整个相位平面上移动,状态仍然接近平衡。

图 13 显示了准均衡实验的状态跟踪数据。尽管漂移平衡发生变化,这会导致平衡横向速度和偏航率发生巨大变化,但无人机以最小的误差跟踪状态。对于此数据集,RMS 横向路径跟踪误差为 3.7 cm。状态中最大的误差发生在 52-55 秒左右,就在车辆达到 12 m 半径漂移并且平衡横向速度和偏航率达到拐点之后。对 52-55 秒左右的误差的可能解释来自图 14 所示的纵向速度控制器结果。

图 13.遵循准平衡轨迹时收集的数据。蓝色线条表示测量值,而黑色虚线表示平衡值。控制器保持近距离路径跟踪 - 表现在两个航向中与平衡的低偏差,和横向路径跟踪误差同时紧紧跟随漂移平衡逐渐变化的轨迹。

图 14. 纵向速度控制器状态和准平衡实验的输入。测量值以蓝色显示,命令输入以红色显示,平衡值由黑色虚线显示

如图 14 所示,前制动器在纵向速度增加和减少时调节纵向速度。此图揭示了此控制器的局限性。前制动器控制纵向速度,而不是油门,因此控制器提高纵向速度的唯一方法是松开制动器。虽然这种控制策略总体上有效(该数据集的 RMS 速度误差仅为 0.34 m/s),但当参考速度增加时,纵向速度中最大的一致误差会出现,大约在 47 到 53 秒之间。纵向速度误差的这种积累可能导致图 13 中其他状态的误差。

图 15 显示了稳定的 LQR 输入。平衡值和命令输入值之间的偏差是由于控制器稳定漂移,即使测量状态与所需状态不匹配也是如此。

图 15.实验的转向角和后驱动力输入如图 13 所示。输入的测量值以蓝色显示,命令值以红色显示,平衡值用黑色虚线显示。

尽管依靠制动器来控制纵向速度和足够精确的参数以避免重大的稳态误差存在局限性,但该控制器的整体性能非常出色。这种方法在具有大量工作点的轨迹上的成功证明了状态空间漂移区域中动力学的线性性和平滑性。

D. 调整 LQR 权重

线性化适当性的最后一个测试是查看线性化系统是否以直观的方式响应增益变化。微调 LQR 控制器的一种方法是选择与平衡值的最大可接受偏差相对应的协方差,如 (14) 和 15 所示。对于输入,与平衡值的最大可接受偏差本质上是最大可接受反馈。

由于更改了Q矩阵或R矩阵调整所有增益,一个简单的测试是改变一个输入的最大可接受反馈,看看闭环系统是否用另一个输入进行补偿。图 16 和图 17 显示了在的最大可接受反馈沿轨迹变化时稳定平衡的实验结果。代表最大可接受反馈值的每个协方差对应的增益在大约一圈内保持不变。每幅图中的垂直线表示增益发生变化的时间。实验显示,所有其他项保持不变,包括最大可接受反馈.

图 16.当跟踪各种最大可接受反馈值的单个平衡时,转向和油门输入.顶部两个图以红色显示输入命令,平衡值为黑色虚线。每个图中的垂直线表示何时改变。底部图显示了。请注意,作为增加,则命令增加和命令减少。

图 17.状态跟踪性能,用于跟踪各种最大可接受反馈值的单个平衡.通过 LQR 控制的四种状态以蓝色表示测量值,以黑色虚线表示平衡值。每条垂直线表示.的四个不同的最大可接受反馈值分别为 500 N、1000 N、2500 N 和 3500 N,如图 16 的最底部图所示。

由于 LQR 设计中的所有权重都是相对的,减少一个输入的最大可接受反馈量将要求控制器更加依赖另一个输入。实验结果恰恰证明了使用以稳定车辆。如图 16 所示,随着最大可接受反馈值的增加,指令的可变性增大,而 指令的可变性减小。只需调整矩阵的一个元素,控制器就能做出直观的响应。

图 17 显示了 R 矩阵调整实验中的四种 LQR 状态。在的四个不同的最大可接受反馈值中,则第一个最大可接受反馈值似乎过低。由于控制器需要更多的来减小状态误差,因此该部分的四个状态误差都较大。随后的三个最大可接受反馈值产生了令人满意的状态跟踪结果。因此,决定的最大可接受反馈值仅仅是两个输入指令所需的可变性问题,可以在此范围内任意选择一个值。

   Ⅵ 讨论    

与其他跟踪所需准平衡路径 [6]、[5] 的漂移控制器相比,该控制器可实现更准确的路径跟踪结果,特别是要低得多的 RMS 横向路径跟踪误差。Goh 等人实现了 18 cm 的 RMS 跟踪误差 [5],Goel 等人实现了 42 cm 的 RMS 跟踪误差 [6],而该控制器的 RMS 跟踪误差仅为 3.7 cm。我们介绍的方法的优势在于线性模型控制技术的广泛应用。虽然 Goh 和 Goel 依赖于非线性模型和特别选择的误差动态,而这里开发的控制器是一个基于线性模型的 LQR 控制器,外加一个比例反馈加前馈回路。LQR 技术无需严格遵守任意误差动态,因此会产生更好的跟踪结果。此外,这种简单明了的控制器还便于直观地选择和调整输入权重。

图 18 显示了 [5] 中描述的非线性控制器与此处开发的线性控制器之间的更直接比较。实验从非线性控制器开始,然后在大约 23.4 秒时切换到线性控制器。虽然此数据集开始时使用的非线性控制器成功地实现并保持了所需的状态,但当线性控制器接手时,路径跟踪会得到显著提高。采用线性设计后,路径跟踪性能得到了明显改善。相比之下,在非线性控制器中,增益选择与路径跟踪之间的联系就不那么清晰了。正是由于这种清晰性,我们才能为简单的 LQR 控制器找到一组线性增益,从而使其性能优于基准非线性控制器。

图 18. 用于跟踪平衡轨迹的不同控制器的比较。蓝色线表示测量值,黑色虚线表示平衡值。实验开始使用 [5] 中描述的非线性控制器,然后在洋红色垂直线指示的时间切换到本文中描述的线性控制器。


 Ⅶ 结论和未来工作    

漂移平衡点附近相当大的区域内的动力学可以用线性化动力学进行合理的近似。这就允许使用经典的线性控制技术(如 LQR)来精确控制漂移车辆的状态和轨迹。

未来工作的一个方向是将执行器动力学纳入车辆模型。并非车辆上的所有系统--发动机、制动器和转向系统--都以相同的速率响应。将执行器动态纳入模型可避免执行器之间的相互影响,并有可能带来更好的结果。用于演示该控制器的车辆是电动的,可以提供近乎瞬时的扭矩;但内燃车辆在提供必要扭矩时会有不可忽略的延迟。这可能需要额外的建模,特别是完成更多的瞬态机动。为了捕捉内燃机的动态,我们可能需要增加状态矢量,将轮速或发动机速度包括在内,然后在内燃机车辆上测试这种新控制器。

这里介绍的线性化模型也可以在模型预测控制 (MPC) 框架中实施。由于我们已经证明,在对非线性系统进行线性化后,我们可以对其进行控制,因此我们现在可以使用许多与非线性系统不兼容的分析工具。在这里,线性化模型将使我们能够研究不确定性;管控 MPC 是量化不确定性并提出相关主张的一个可能途径。此外,如果我们将纵向速度作为一个状态,并将制动力作为一个输入,则可以使用 MPC 框架来获得对纵向速度的更多控制。

该控制器实现的状态和路径跟踪精度表明,漂移并不是需要避免的状态空间区域。通过实施基于线性化模型的控制器,我们取得了比使用更复杂的非线性模型开发的控制器更好的路径跟踪结果。对于漂移车辆的控制,我们还有很多需要了解的地方,这里介绍的线性化模型是我们在了解并最终利用状态空间的这一不稳定区域方面迈出的重要一步。

 附录   

力计算

由于无法直接测量轮胎受力,我们对轮胎受力进行了如下估算。

我们使用轮胎纵轴与 Goh 等人在 [5] 中定义的总力矢量之间的夹角作为推力角,将后轴上的总力分解为纵向力和横向力。推力角是当前状态的函数,包括后轮速度和包括后轮半径在内的车辆参数。

为了通过推力角将轮胎力联系起来,我们假设后轮胎在滑动时。然后我们计算后轮的横向和纵向力

重新排列运动方程 (1)-(3),我们就得到了一个由三个方程和两个未知数组成的线性方程组。

使用 MATLAB 中的 Savitzky-Golay 滤波器计算和 的导数。


本文译自:

《Exploiting Linear Structure for Precision Control of Highly Nonlinear Vehicle Dynamics》

文章来源:

IEEE Transactions on Intelligent Vehicles, vol. 8, no. 2, pp. 1852-1862, February. 2023

作者:

Marsie T. Peterson, Tushar Goel, and J. Christian Gerdes

作者单位:
作者供职于斯坦福大学机械工程系,地址:Stanford, CA 94305 USA(电子邮箱:mtrego@stanford.edu;tgoel@stanford.edu; gerdes@stanford.edu)
原文链接:
https://ieeexplore.ieee.org/document/9767674

参考文献


责编丨高炳钊

焉知汽车
科技 · 创新
 最新文章