文|鲁肃
编辑|郭嘉
随着时间的推移,下游模块在数据驱动下可以通过不同的接口集成,看(Vision)-说(Language)-动手(Action)的VLA模型在处理复杂的机器人任务(RT-2、TeslaBot和1X)和自动驾驶(GAIA-1、DriveVLM,以及工业界的Wayve AI、特斯拉FSD)方面显示出巨大的潜力。这样实现一刀流,从感知直接通达规划,中间可以节省无数的判断代码。上图的下半部分就展示了利用神经网络的一刀流。
运动规划
经典的运动规划大致由全局路线规划、行为规划和局部轨迹规划组成。
全局路线规划提供了地图上从起点到终点的道路级路径。
行为规划决定了未来几秒内的驾驶动作类型,例如汽车跟随、轻推、侧向超车、让行和超车。
局部行为规划模块中确定的行为类型,而局部轨迹规划生成短期轨迹。
行为规划和轨迹生成可以明确地协同工作。行为规划在1-5Hz,轨迹规划在10-20Hz。这是个超参数,不同的场景需要精校。行为规划和轨迹规划可以合并,也可以分模块迭代交互。
就在上个月2024年6月份一篇利用流体动力学实现自动驾驶汽车通用的运动规划的论文提出了一种全新的办法。Motion Planning(运动规划):它接受语义动作,并在规划范围的持续时间内生成平滑、可行的轨迹航点,以便控制执行。
Behavior Planning(行为规划):它可产生高级语义动作,例如变道、刹车等,一般生成粗略的轨迹。
Trajectory Planning(轨迹规划):运动规划的另一个术语。
Frenet vs 笛卡尔
Frenet框架,也称为曲线框架,已被广泛用于对道路轨迹规划任务进行建模。在现实世界的笛卡尔坐标系中,形状不规则的道路在弗雷特坐标系中被转换为笔直的道路。使用 Frenet 框架的一个明显好处是,任何道路都可以标准化为具有左右边界的直线隧道。通过这种方式,将轨迹规划问题中的非线性碰撞避免约束转化为线性隧道内约束。除此之外,原始耦合的运动学约束在纵向和横向维度上被解耦为独立的多项式。基于Frenet的方法能够快速求解轨迹规划方案(二次元规划 QP) 。
Frenet 坐标系需要一个干净、结构化的道路图和低曲率车道。在实践中,它更适合曲率较小的结构化道路,例如高速公路或城市高速公路。然而,随着参考线曲率的增加,Frenet 坐标系的问题会被放大,因此在具有高曲率的结构化道路上应谨慎使用它。对于无结构道路,例如港口、矿区、停车场或没有准则的十字路口,建议使用更灵活的笛卡尔坐标系。笛卡尔系统更适合这些环境,可以更有效地处理更高的曲率和结构较少场景。