编者按:车辆动力学建模是汽车控制技术的关键要素之一,而传统的线性或非线性物理模型的缺点始终无法得到弥补。在汽车智能化时代,数据驱动的建模方法逐渐引起了研究人员的关注,基于数据驱动的建模方法通过对可用数据集进行特征提取与学习,能够有效弥补传统物理建模方法精度不足和难以处理不确定性项的缺点。本文介绍三种建模方式的主要步骤,定义评价指标,利用实车行驶数据进行了三种模型的预测能力对比,最终证明在正常行驶工况下,简单的数据驱动模型能够超越物理模型的模拟能力,同时比非线性物理模型简单得多。
《Linear System Identification Versus Physical Modeling of Lateral–Longitudinal Vehicle Dynamics》
IEEE Transactions On Control Systems Technology, Vol.29, No, pp.1380-1387(2021)
Bernardo A. Hernandez Vicente , Sebastian S. James , and Sean R. Anderson
摘要:精确的车辆动力学物理建模需要对所研究的车辆具有广泛的先验知识。相比之下,基于数据驱动的建模方法只需要能够很好地描述车辆行驶包络的数据组合。在本文中,我们首次比较了两种方法应用于大规模真实驾驶数据集的预测能力。该数据集包含若干转弯、加速和减速行为,并在公共道路上进行采集。通过对未知参数的非线性优化,辨识出线性和非线性物理模型。采用闭式子空间辨识方法对线性状态空间模型的估计值进行初始化,然后通过非线性优化对初始化进行细化。优化后的模型在59km的独立驾驶数据集上进行了验证。非线性物理模型和线性数据驱动(二阶)模型在纵向速度上的拟合度分别为68.9 %和80.2 %,在横摆角速度上的拟合度分别为43.0 %和63.5 %。这些结果表明,对于目标车辆,在实际驾驶条件下,简单的线性数据驱动模型优于线性和非线性物理模型。这对无人驾驶汽车中的控制设计方法具有重要的意义。
关键词:非线性参数估计,状态空间建模,子空间识别,系统识别,车辆动力学
在过去的二十年里,用于私人和商业用途的(半)自主地面车辆的相关研究工作急剧增加[1]-[3]。这些工作中有部分重点集中在设计车辆动力学的数学模型,以便用于控制设计[4]-[8]。控制设计的动态模型通常被允许是相对简单的近似表达,因为反馈控制方法对模型误差有很高的容忍度,这是反馈控制的一个关键优点。我们认为使用的非线性物理推导的车辆模型过于复杂,难以适当调整,且对于控制设计任务来说是不必要的,简单的线性模型可以以相近的精度水平捕捉到相同的基本动态行为。这将非常有利,因为可以放心地使用线性控制设计方法来替代非线性方法,从而在简单性、鲁棒性、稳定性保证和易于实施等方面获得关键的潜在优势。
物理模型通常是牛顿第二定律和对某些驾驶条件的经验理解的结合,这使得它们易于理解。大多数物理模型是非线性的,这是由于它们试图模拟的过程的复杂性[9]。在某些情况下,可以认为线性物理模型足够准确[10],并且它们在驱动包络的极端情况下的有效性可以通过允许它们的一些参数随时间变化来提高[6],[11]。
考虑到即使是简化的物理模型通常也包含大量的参数,大多数方法假设只有其中的一个子集是未知的。例如,在[12]-[15]中,采用基于观测器的技术来估计轮胎力和道路摩擦系数,而在[16]中,通过线性化和最小二乘法来估计相关参数,并且在[17]中,采用粒子滤波方法获得线性侧偏刚度值的贝叶斯估计。在[18]和[19]中,重点放在识别惯性参数上,例如重心(CoG)位置,而摩擦系数和悬架刚度假设是已知的。在相同的背景下,通常只研究一个主要动态,纵向的,如[20]-[22],或横向的,如[6],[7]和[23]-[25]。
无论是线性的还是非线性的,物理导出的模型都有几个缺点。它们只能模拟导出它们的动力学;因此,只有明确定义的实验数据才可用于参数估计。在没有对车辆特性有足够的先验知识的情况下,考虑到模型简化引入的偏差,对模型的未知参数估计合适的取值范围通常是很复杂的。此外,即使是线性模型,其参数通常也是非线性的,这导致了昂贵的计算和耗时的估计过程。
另一方面,数据驱动的建模技术产生的模型最能代表整个可用数据集。这使得实验设计和数据预处理具有更大的灵活性。此外,数据驱动模型的参数并不一定代表任何真实的物理量,因此不需要进行先验估计。然而,基于数据驱动的方法在文献中并不丰富,包括将转向角映射到横摆角速度和侧向加速度的线性变参数方法[11],[26],具有定速度假设的线性传递函数和迭代学习方法[27],以及仅针对纵向动力学的子空间方法[28],[29]和仅针对侧向动力学的子空间方法[30],[31]。
显然,虽然采用了几种不同的建模技术来获得车辆动力学的物理模型和数据驱动模型,但人们对它们之间的差异关注较少。因此,本文的重点是比较非线性物理模型和数据驱动模型在速度空间和位移空间的预测能力。我们将在大规模真实驾驶数据集上对模型进行识别和评估。
本文的其余部分安排如下。第二节提出建模假设,并对所选模型结构进行介绍。识别方法在第三节中介绍,第四节简要总结了所使用的数据。第五部分介绍并比较了优化后的模型及其预测能力。最后,在第六节中得出结论。
A.非线性物理建模
为了表示车辆的非线性动力学,使用耦合(纵向-横向)四轮模型(见图1)。我们做了一个小的转向角假设,但仅用于纵向动力学。实际上,这意味着我们通过忽略横向力对纵向力方程的影响来解耦纵向动力学;尽管如此,我们仍然可以观察到纵向力对横向动力学的影响。我们这样做的目的是降低参数估计过程的复杂度,同时保留一些重要的耦合效应。
变量和分别是车辆的CoG与其前轴和后轴之间的纵向距离,而是轮距。CoG的速度在车辆的车身坐标系中由和描述;车辆还受到一个横摆角速度和相应的横摆角。假设前轴的转向角对于两个车轮是相等的。每个轮胎受到纵向力和横向力,其中和,并且假定车辆的CoG受到耗散力。设汽车的质量是,其横摆转动惯量是,则车辆的动力学由下式控制:
纵向力/横向力与之间的几何关系由图1得出。
为简单起见,在本文中假设影响轮胎的纵向力仅由发动机扭矩()和制动器()产生。这是由于此类测量的可用性以及先前对数据集进行的识别实验[28]。所研究的车辆为前轮驱动;因此,发动机扭矩在两个前轮之间平均分配,而制动力假定在所有轮胎之间平均分配。
图1. 四轮车模型示意图
侧向力被认为是相应轮胎侧偏角的函数(待定义),而忽略了轮胎回正力矩[10]。最后,假设耗散力由气动阻力、滚动摩擦力和路面坡度()引起的质量分量组成。
1)纵向动力学:我们采用[28]中描述的65纵向模型。从发动机传递到车轮的力由建模,其中是发动机传递到变速箱后的扭矩,组合了发动机和变速器的效率以及传动系统的传动比。制动力根据制动系统压力由定义。道路坡度引起的耗散力为,其中为重力常数,为坡度角(假设较小)。摩擦力忽略了路面坡度,因此定义为,其中为车轮静摩擦系数(假定为常数)。最后,空气阻力由标准二次方程建模。在该模型中,、和未知。
2)轮胎侧向力模型:作用在轮胎上的侧向力取决于多种因素,包括路面条件、制造材料、充气压力等[4],[14]。然而,如果这些参数固定,则当前侧向载荷的大小仅因轮胎上的垂直载荷和轮胎的侧偏角的变化而变化。后者是轮胎纵向对称面与其速度矢量之间形成的夹角。考虑到CoG的速度和车辆的横摆角速度,可以很容易地定义每个轮胎的质心侧偏角:
侧偏角与轮胎侧向力之间存在多种关系模型[9]、[10]、[32] - [34]。其中,一个流行的半经验公式就是所谓的魔术公式[10]。这可以通过增加其参数的数量来实现,具有几个复杂程度。然而,如果没有对轮胎和道路的深入了解,很难对这些参数中的大部分提供先验估计。因此,我们假设所有轮胎都是相同,并采用简化版本以避免过拟合:
其中、和是未知参数。
3)轮胎垂向力模型:在匀速运动(零加速度)时,作用在每个车轮上的垂向力只取决于车辆的质量分布;然而,在加速运动中,它们也依赖于CoG所经历的当前加速度。在这项研究中,我们用零阶模型计算作用在每个车轮上的垂直力,假设前轴和后轴是机械解耦的:
其中,变量和表示车轴刚度比,且为未知量。为了提高模型的可识别性,我们用比值而不是绝对值(也是未知的)来投射模型。
B.线性物理建模
车辆动力学的线性模型可以通过几个简化/假设步骤从(1)获得。首先,我们假设小的转向角和车轮侧滑角以及,这允许将(2)简化为:
以及纵向/横向力与之间的几何关系。
第二个假设与轮胎横向力模型有关。由于假定侧偏角很小,侧向力保持在魔术公式的线性范围内;因此,(3)被简化为:
其中被称为侧偏刚度[10]。该参数是未知的,允许对每个轴不同,但不允许对轴中的每个车轮不同,忽略由于线性范围内的横向加速度引起的负载转移的一些影响。最后,纵向动力学中的阻力项由线性函数代替。
这些简化导致了一个模型,除了侧偏角依赖于之外,解耦了纵向和横向动力学。该模型可以写成标准状态空间形式,状态向量,输入向量矩阵 ,扰动表示摩擦力恒定。
由(5)描述的模型是非线性的,因为状态转移矩阵的所有横向项取决于车辆的纵向速度。为了获得线性时不变(LTI)物理模型以用于与LTI数据驱动模型进行比较,我们将这些矩阵条目中的视为未知常数,并将其与其他参数一起估计。
在某些(极端)驾驶条件下,线性模型的性能会因忽略横向和纵向动力学之间的耦合而退化。因此,我们也对LTI物理模型的耦合版本进行了估计。为此,我们直接修改(5),允许它的一些耦合参数非零。为了与非线性物理模型提供公平的比较,我们考虑了相同的单向耦合场景,其中横向动力学受到纵向动力学的影响,而不是相反。在实践中,这意味着通过允许元素和非零来修改状态转移矩阵,其中下标表示(行、列)位置。
C.数据驱动模型
对于数据驱动模型,我们采用子空间系统辨识技术[ 35 ]来估计一个最能解释数据的LTI状态空间模型。该模型具有如下结构:
其中是输入,测量噪声,是测量输出。在物理建模的情况下,矩阵和是由系统的物理定义的,而是适当维数的恒等式。另一方面,在子空间方法中,输入和输出由用户根据他们对系统动态的理解来选择;然而,在给定所应用的输入的情况下,模型矩阵的大小和内容由算法选择以最佳地模拟系统的输出。因此,状态向量及其维度不一定具有任何物理意义。
对于数据驱动模型,我们选择和,以便匹配线性物理模型(5)中使用的输入。
A.物理导出模型的系统辨识
通过最小二乘法对物理推导模型中的未知参数进行估计。总体流程如下:
1)估计独立非线性纵向模型、和的参数(在[28]中完成)。
2)估计线性纵向模型的参数。
3)估计耦合非线性横向模型,,,和的参数。
4)估计非耦合线性横向模型、和的参数。
5)估计单向耦合线性横向模型,,,和的参数。
注意,步骤(2)不重新估计参数和以避免由于线性化引起的偏差。此外,注意,尽管在步骤(5)中允许耦合,但是不重新估计纵向参数以提供用于与非线性模型比较的公平中点。
在前面列出的所有情况下,获得参数估计值的过程与[5]中的过程相同且相似。将
定义为包含真实模型参数的向量。通过求解以下优化问题来获得对应的估计 :( 7 )式中的集合对于每一个估计练习都是特殊的,它是由对每个参数施加的一组约束定义的。这样做是为了保证得到的参数具有物理意义。定义代价函数为:
其中
是在 时刻处的测量输出的向量,并且 是在给定候选参数 的向量的情况下在相同时刻处的对应模拟值的向量。矩阵 是由权重组成的对角矩阵,用于对输出向量 中的不同变量进行归一化处理。 的定义同样取决于所进行的具体估计。在纵向情况下, ,在非耦合和单向耦合横向情况下, 。B.数据驱动系统识别
数据驱动模型的识别分两个阶段进行。首先,一个封闭形式的子空间辨识方法被用来初始化状态空间模型的不同阶数(不同的状态数)。读者可参考[35]以获得此类方法的详细描述。在第二阶段中,状态空间模型的参数通过(7)的单个实现来细化,其中
并且 一个向量包含模型矩阵 、 和 中的所有参数。注意,由于初始化是以封闭形式执行的,因此获得数据驱动模型的过程不需要多次启动。C.参数估计
由于没有特定的模型被附加到测量噪声,所以所有物理导出的模型在参数上都是非线性的。因此,最小二乘泛函的最小化是一个非线性优化问题。在这种情况下,我们使用在MATLAB中的fmincon函数中实现的约束内点方法来求解(7)。为了避免质量差的局部最小值,每个识别实验用约束集内的不同起始值重复1000次,数据驱动模型除外,其参数在单个优化实例中估计。在1000个结果中选择参数的最佳向量作为具有最低成本函数的向量(8)。尽管有1000次启动,但无法保证所选参数确实是真实的车辆参数,也无法保证所选参数是优化问题的全局最优解。这是在对车辆特性缺乏先验知识的情况下,估计物理衍生模型参数的难点之一。
最后,在这两种建模方法中,识别过程的重点放在仿真上。这意味着是通过从初始条件模拟所研究数据集的整个长度来生成的,与预测误差方法不同的是,该方法在每个时间步都使用测量值来修正模拟。
D.评估指标
采用标准化拟合指标F [35]对模型进行了评价:
其中是测量的平均值。F=100%的值表示完美拟合,而F=0%的值表示拟合等于输出数据的平均值,如果拟合不佳,则值变为负值。
我们还进行了测量输出与线性和非线性模拟输出之间的相关性分析。其由度量的方差进行表征(VAF):
在这种情况下,V=100%表明模型能够解释测量的整个方差。但由于模型不能解释测量噪声引入的方差,上述值无法达到。
实验数据来源于一辆在意大利皮埃蒙特地区的公共道路上行驶了108公里的蓝旗亚Delta汽车。表Ⅰ中描述了物理建模中使用的已知车辆参数。这条路线的设计包括典型的城市外和城市道路、高速公路、环形交叉口和十字路口,但驾驶本身是无脚本的,因为它必须适应实时的交通状况。图2示出了行驶路线。这条路线的一圈长54公里,绕了两圈。通过GPS收集经度/纬度数据,并且通过使用等矩形近似将经度/纬度数据转换成距离来计算汽车相对于固定坐标集的位置。
表Ⅰ 蓝旗亚Delta物理参数
图3.在测试路线驾驶期间获取的输出测量值(对应于总训练数据集的25%)(a)纵向速度 (b)横摆角速度
数据集包含训练和验证两部分,如图2中的红线所示,其中训练数据为2501s,验证数据为2383s。数据最初采样频率为100 Hz;然而,相关测量的功率谱显示,超过99 %的功率集中在1 Hz以下。鉴于此,为了减少参数估计算法的计算量,对数据进行了20 Hz的重采样。图3显示了用于驱动训练部分的识别过程的测量,而图4显示了相应的输入。
图4.在测试路线驾驶期间获取的输入测量值(对应于总训练数据集的25%)(a)油门位置(b)制动压力 (c)道路坡度角 (d)转向角
为简洁起见,我们略过训练结果。我们将关注点放在验证数据集上,以确保数据驱动的模型不存在过拟合现象。图5-9展示了验证数据集以及不同估计模型的模拟,而表Ⅱ总结了它们的性能指标。注意,为了清晰起见,图5和7只给出了整个验证数据集的分段。物理模型和数据驱动模型的优化参数取值见表Ⅲ-V。
表Ⅱ 两类模型性能指标
表Ⅲ 物理推导的纵向动力学模型参数估计
表Ⅳ 物理推导的横向动力学模型参数估计
表Ⅴ 二阶数据驱动模型的参数估计
A.纵向动力学
与线性化物理模型(拟合度3.4 %)相比,非线性物理模型(拟合度68.90 %)具有更好的辨识性能。的确,线性物理模型虽然能够模拟出速度的总体趋势,但却高估了5到10 m/s。另一方面,最简单的数据驱动模型()优于两种物理推导模型,拟合度为80.2 %。此外,纵向动力学的数据驱动模型显示,正如预期的那样,随着模型阶次的增加,性能普遍提高,在(见表Ⅱ)时达到85.0 %。
验证数据与几种纵向模型预测值之间的比较如图所示。图5仅仅展示了一圈内的数据,而在完整的验证数据见图6。
图5. 速度的验证数据(为了清晰起见,只展示了车辆第一圈的行驶数据)
图6. 整个验证数据集的实测速度与模拟速度之间的相关性(a)物理非线性 (b)物理线性 (c)数据驱动。
数据驱动模型也能够解释更多的测量方差,与非线性和线性物理模型相比,方差分别大2.4%和32%。注意,非线性物理模型在高速范围内呈现较高的相关性;然而,数据驱动模型在整个驾驶包线中的表现更好(见图6)。这可以通过物理非线性模型中使用的一些建模假设来解释,例如简化的阻力和摩擦力。
B.横向动力学
横向物理模型的估计结果与纵向相反,线性物理模型的表现(拟合62.5 % )明显优于非线性物理模型(拟合43.0 % )。数据驱动模型(拟合度为63.5 % )表现略好于线性物理模型。如图7所示为一圈内验证数据与几种侧向模型的预测结果的比较。
非线性物理模型的性能不佳归因于其复杂性。事实上,尽管非线性模型原则上是车辆横向动力学的更精确的表示,但在没有对车辆特性进行广泛先验知识的情况下,寻找其参数的真实值是一项困难的计算任务。尽管我们进行了1000次不同的优化尝试(用不同的参数初始化),但并不能保证所选择的最优值确实是真实物理值的准确近似。
两个线性模型(物理导出和数据驱动)在整个驾驶包络中都表现出与数据相似的相关性,方差分别占86.1 %和86.8 %。图6以相关图的形式给出了对全部验证数据的比较。在较低的横摆角速度下,线性模型(物理导出和数据驱动)低估了横摆角速度,而非线性模型则高估了横摆角速度。这可以通过模型结构来解释。非线性物理模型利用魔术公式模拟侧向力,并给出了其参数的优化值,在原点附近呈现出比高一个数量级的斜率。
图7. 横摆角速度的验证数据(为了清晰起见,只展示了车辆第一圈的行驶数据)
图8. 整个验证数据集测量和模拟的横摆角速度之间的相关性(a)非线性 (b)线性非耦合 (c)数据驱动。
C.位移空间中的性能
最后,我们研究了预测控制器通常采用的位移空间和预测时域内模型的性能。在的时域内,以滚动时域的方式模拟了车辆的位移。
图9给出了在验证数据集中对一个典型的转弯机动进行滚动时域仿真的结果。正如预期的那样,给定它们的拟合指标,物理导出的模型产生了车辆在车道外转向的几个实例的预测,特别是在急转弯时。另一方面,数据驱动模型能够对车辆的位移进行足够精确的预测,以保证车辆停留在道路内部。注意,尽管数据驱动模型完全忽略了横向速度,但这样的结果是正确的。
图9. 以( 40个样本的预测期)的转弯机动为例,进行了位移空间的模型比较
在本文中,我们探索了数据驱动线性模型在模拟地面四轮车辆纵向速度和横摆角速度方面的潜力,并将其性能与物理线性和非线性模型进行了比较。结果表明,在正常行驶工况下,简单的数据驱动模型能够匹配并超越物理导出模型的模拟能力,同时比非线性物理模型简单得多。特别地,二阶状态空间模型能够足够精确地预测速度和横摆角速度,使得在基于模型的控制器的通常范围内,车辆的预测位置接近其真实位置,并保持在行驶车道内。
参考文献
联系人:唐老师 |
电话:13917148827 |
邮箱:tangyanqin@tongji.edu.cn |
点“阅读原文”获取论文