Neural fields for rapid aircraft aerodynamics simulations
摘要
本论文提出了一种基于隐式神经表示(INRs)的方法,用于在网格化域上学习稳态流体动力学模拟的替代模型。所提出的模型可以直接应用于不同流动条件下的非结构域,处理非参数化的三维几何变体,并在测试时泛化到未见过的几何形状。基于坐标的公式自然地提高了对离散化的鲁棒性,实现了计算成本(内存占用和训练时间)与准确性之间的良好权衡。该方法在两个工业相关的应用中得到验证:一个是二维可压缩流动的RANS数据集,研究超音速翼型上的流动;另一个是三维机翼表面压力分布的数据集,包括形状、进气条件和控制面偏转的变化。在考虑的测试案例中,我们的方法比当前的图神经网络(GNN)架构降低了三倍以上的测试误差,并显著改善了在未见几何形状上的泛化能力。值得注意的是,该方法可以显著加速高保真数值求解器,在RANS超音速翼型数据集上实现了五个数量级的加速。
code: https://gitlab.isae-supaero.fr/gi.catalani/aero-nepf
引言
计算流体动力学(CFD)已成为现代航空设计中不可或缺的工具,能够高保真地模拟飞机物理系统的复杂物理过程。数值解可以更低成本地评估气动性能、结构载荷和操控特性,而不必依赖实验和全尺寸飞行试验。这些模拟主要解决雷诺平均纳维-斯托克斯(RANS)方程,以预测整个飞行包络内的准确流动场。然而,每次模拟所需的高计算成本限制了它们在设计早期阶段和时间敏感环境中的应用,例如航程负载评估和上千种飞行条件和设计选择的气动负载模拟。鉴于传统CFD模拟的高计算需求,迫切需要高效的替代模型。这些模型旨在近似复杂的模拟,快速且准确,从而便于设计过程中的快速迭代。
传统上,方法如正交分解(POD)结合插值技术(如径向基函数或高斯过程)一直较为流行。尽管其具有高物理解释性,这些模型在强非线性现象(特别是在非定常流动条件下)中表现不佳,因其倾向于逼近线性自然模式。此外,POD方法对几何变化和多流体域数据的适应性较差,应用时受限于共同参考网格的假设。尽管这些方法存在局限性,仍有不少研究致力于改进,如快照聚类、优化POD最小化矩阵、网格变形等方法,但在一些案例中,其适用性依然有限。
数据驱动建模的最新进展,尤其是深度学习(DL),在提取和表示复杂的层级化数据特征方面展示了卓越的能力。在流体动力学中,DL方法被用于一系列任务:构建湍流或流动控制模型,加速数值求解器,识别湍流闭合模型,或优化流动控制策略。特别是在机翼和飞机气动设计领域,DL技术应用于气动系数建模、表面压力分布、形状优化等。
构建压力场的替代模型在上述应用中至关重要,因为它减少了数值模拟的需求。在捕捉空间局部相互作用和多尺度操作方面具有优势的卷积神经网络(CNN),已经被广泛用于构建替代模型。尽管如此,由于CFD解通常定义在非结构化网格上,且插值程序不可避免地导致性能损失,CNN在3D结构上的应用仍受到限制。此外,不同精细度的数据表示也阻碍了CNN在3D配置中的适用性,受限于计算资源。
几何深度学习,特别是图神经网络(GNN),为将CNN扩展到非结构域提供了强有力的范式。GNN能够处理网格上的复杂几何形状,使用相对节点距离作为边缘特征,并表现出流体力学时间相关问题的良好性能。然而,将GNN扩展到大图时,需要池化操作,以模拟流体的多尺度行为。在大规模图结构下,过多的消息传递层会导致过平滑现象和计算开销。GNN在处理不同的网格拓扑和离散化层级时,泛化能力仍存在局限。
最近在算子学习(Operator Learning)方面的进展使得引入离散化不变的架构成为可能,绕过了之前提到的GNN在有限维度输入输出空间中的局限。神经算子(Neural Operator)学习了空间域中任意点处的输出函数值。傅里叶神经算子(FNO)通过在傅里叶空间中学习积分核,利用快速傅里叶变换(FFT)在均匀网格上的计算效率,处理参数化偏微分方程(PDEs)。几何信息神经算子(GNO)利用图神经网络将非结构化3D域映射到结构化的潜在网格,使得傅里叶层可以高效地应用。类似地,DeepONet学习来自稀疏观测数据的算子,但受限于仅在相同位置上输入的函数值,难以处理形状变化。为此,Geom-DeepONet被提出,以扩展DeepONet在3D中处理参数化几何变化的能力。
值得注意的是,物理驱动神经网络(PINNs)已被用来将已知的物理定律融入神经网络优化指标,特别是在数据稀缺或不确定时增强模型的泛化能力。然而,在复杂气动应用中,PINNs在几何和边界条件泛化方面存在局限。由于PINNs是物理驱动的,它们对不同形状和控制面(如副翼)变化的边界条件显式编码,缺乏处理整个域内物理量观测的灵活性。此外,许多工业应用通常只提供表面测量值(如压力分布),限制了其应用。
隐式神经表示(INRs)也称为神经场(Neural Fields),被证明是学习物体空间表示的有效工具。INRs通过采样坐标作为输入,并生成对应函数值,展示了在低内存需求下逼近任意位置的函数的能力。近期的SIREN和傅里叶特征编码(FFN)显著增强了INRs在高频函数上表现出高效的表征能力。FFN利用一组预定义的频率分量表示复杂信号,但其频率调整较为复杂,尤其是流体动力学数据集中的频谱较宽。尽管最初INRs的应用局限于2D对象,通过潜在调制和元学习的进展已扩展到3D应用。
在本研究中,我们提出了一种基于INR的全面方法,用于在网格域上构建稳态气动模拟的替代模型。
主要贡献有两点。首先,我们将INR替代模型应用于3D机翼表面网格,包括形状变化和副翼偏转,展示了该模型在工业应用中的潜力。我们的方法分为两种框架:适用于通用非参数形状变化问题的编码-处理-解码设计,以及针对固定几何或参数形状变化优化的端到端设计。其次,我们提出了一种多尺度INR骨干结构来优化频谱收敛,解决了标准傅里叶特征编码架构的频率超参数调整问题。
我们对两类关键数据集进行了实验研究:一个是超音速翼型数据集(具有固定网格配置),另一个是3D机翼数据集(具有形状变化和副翼偏转)。我们的方法在不同的网格离散化水平上表现出显著的泛化能力。
方法论
问题定义:在本研究中,我们解决了基于数据的替代模型的问题,以逼近稳态流体动力学模拟。假设 表示几何域的物理空间, 表示空间维度。设 和 是Banach空间,其中 的每个元素 表示输入几何(如距离函数)和边界条件, 表示偏微分方程(PDE)的解算算子。数值方法求解离散化域 上的方程,该域由坐标集合 和连通性 表示。数据驱动方法从观测的输入输出对数据集中学习映射:
每个元组 通常由边界条件、入口条件以及在网格上计算得到的数值解 组成,通常由CFD求解器输出。此外,附加的标量量,如升力和阻力系数,可以作为替代模型的输出。在接下来的部分中,我们将专注于建立用于全场预测的参数化模型。具体来说,我们的目标是定义一种方法,在网格上通过基于隐式神经表示(INRs)的数据驱动架构,直接逼近底层PDE的解算算子。值得注意的是,尽管替代模型的主要目标是在给定网格上获取离散化解,重新表述问题为逼近连续解算子可以实现相对于离散化的灵活且可扩展的算法,接下来的段落将对此进行展示。
隐式神经表示(INRs)
隐式神经表示(INRs)是基于坐标的神经网络,通过权重 将欧几里得空间中的点 (或等价于流形上的点)映射到向量或标量量:
INRs 可以被视为底层信号的连续近似,其中信号被离散采样以供学习。通过利用INRs的连续特性,可以对多种数据模式进行建模,如图像、形状和物理场,而不受离散化类型的限制。在我们的工作中,我们采用INRs学习物理解的稀疏表示以及形状描述符,以应对跨不同离散化级别的流体动力学问题。可以通过对多个坐标点进行查询,从INRs获得场预测。
网络架构
隐式神经架构通过多层感知机(MLP)实现,其基本形式以空间坐标作为输入,并在特定坐标处输出物理场的值。此公式自然适合拟合定义在低维域上的单一信号,而不是学习一类对象(如PDE解)。因此,在以下部分中,我们将描述:(i) 如何训练INRs以处理几何和输入参数的变化;(ii) 提出架构组件如何使神经场在基于网格的模拟中更有效。
输入编码
标准神经网络难以在低维域中表示高频振荡信号,因为它们倾向于低频信号。这种现象被称为频谱偏差(Spectral Bias),会导致MLP在高频谐波上的收敛较差,造成模糊重建。文献中提出的解决方案包括位置编码或傅里叶特征编码,以提高高频信号的拟合精度。傅里叶编码实现如下:
其中,频率分量 从零均值高斯分布 中采样。标准差 是一个超参数,对网络的欠拟合-过拟合行为有显著影响。选择合适的 值对于流体动力学模拟中的复杂多尺度现象至关重要。
多尺度架构
为了避免单一 值的选择导致过拟合或欠拟合,我们提出了一种多尺度架构,其中输入编码采用不同的 值,并通过网络层级传播至中间输出,最终在最后一层进行拼接。编码函数为:
其中, 的每个元素都从高斯分布 中采样。网络的输出 是通过最终的线性层处理在每个尺度上拼接的中间输出得到的:
层级组成
网络的隐藏层对所有编码输入共享,因此不会显著增加参数数量。隐藏层输出通过调制向量 调整,并在应用ReLU激活函数之前加到每层的输出中。第一层接收编码输入 ,网络层的组合公式为:
其中, 是第 层的权重和偏置, 是第 层的偏移调制向量。这里我们省略了尺度编码的索引。调制向量携带每个样本的特定信息,并允许使用一组全局网络参数来适应所有参数或几何变化。
端到端框架
在固定几何上的物理场预测任务中,可以通过最小化模型预测值与训练样本在采样坐标上的点对点距离来端到端地处理该任务:
在这个框架中,可以使用参数为 的超网络 将输入参数 映射到潜在的调制向量 :
图2展示了隐式端到端框架的组件。该框架潜在地可以引入基于物理的损失函数,类似于PINNs。然而,这需要预测所有物理量(包括湍流粘度)并了解用于生成训练CFD数据的显式公式。此外,在基于物理的损失中应考虑入口条件变化及其相关的建模挑战。
本方法的测试案例是一个雷诺平均纳维-斯托克斯(RANS)数据集,用于研究二维跨音速翼型RAE2822。该数据集基于Fluent中的仿真生成,使用Spalart-Allmaras湍流模型在包含27,499个单元的混合网格上运行,共包含1200个样本。这些仿真涵盖了典型巡航飞行的雷诺数(),攻角范围为到,马赫数范围为到,涵盖了弱可压缩和跨音速条件。每次RANS计算大约需要30分钟,基于Intel Core i7处理器。机器学习任务涉及开发一个替代模型,以预测在网格上的压力场分布,并根据马赫数和攻角进行组合分析。我们将所提出的INR端到端模型与图UNET架构进行了比较。
标准的多层感知机(MLP)作为基准,使用5层MLP和残差连接。对于该基准,输入参数 与空间坐标一同输入到网络中,使其本质上成为一个没有潜在调节和输入编码的基本INR模型。这个基准帮助我们分离和评估输入编码和潜在调节对模型性能的特定影响。图UNET(GUNET)是一种多尺度消息传递图卷积神经网络,最早于2019年提出,旨在处理非均匀网格数据。GUNET通过执行分层池化操作来减少图的尺寸,并增加卷积的感受野,从而捕捉多尺度特征。由于数据集网格尺寸中等大,多尺度GNN特别适合该数据集,因为它需要比单尺度架构更多的消息传递层。
编码-处理-解码框架
该框架由Dupont等人提出,并由Serrano等人针对基于网格的模拟进行了优化。它将学习过程分为两大步骤:首先,学习输入和输出场量的紧凑表示 ;其次,学习通过输入参数 在两个潜在空间之间的映射关系:
编码步骤对于输入和输出变量是类比的(例如,用于几何形状和压力场)。我们旨在通过符号距离函数来建模几何形状。在编码步骤中,输入和输出变量的潜在编码 、全局网络 以及超网络参数 会通过基于CAVIA算法的二阶元学习方法联合优化。
这个学习任务可以分为两部分:对每个样本的特定回归问题,以找到对应的最佳潜在变量 ;以及在整个数据集样本中学习全局共享网络参数 。这种策略相较于传统方法具有多种优势,如稳定训练历史、减少过拟合风险以及加快推理时间:
回归步骤包含在压缩的潜在输入向量空间 ()、输入参数 () 和输出潜在向量 () 中学习一个映射。对于此任务,我们使用带有 SiLu 激活函数的简单残差 MLP ,通过最小化潜在损失来实现:
在推理阶段,可以使用预训练的神经场和处理器网络对未见过的几何形状和飞行参数进行预测。特别是,对于未见过的几何形状,输入潜在编码 可以通过最小化重构输入函数(符号距离)和目标值之间的损失函数 来推断:
在实践中,这相当于执行算法 1 中描述的内部循环,同时保持全局网络参数固定。一旦获得几何描述符,就可以将其与输入参数一起作为处理器网络的输入,以获得输出变量的潜在表示:
最后,可以通过查询预训练的输出神经场,在空间域上解码输出场:
图 3 中还概述了 3D 机翼形状的推理步骤。
我们在XRF1翼型数据集上展示了该方法。该数据集包含8,640个表面压力模拟,覆盖120种机翼形状和不同的操作条件。数值求解器基于TsAGI开发的BLWF方法。该方法假设外部无粘流与黏性边界层耦合。对于每次计算,我们在由6,600个节点组成的三角形网格上考虑机翼的压力场。图4展示了特定形状的网格示例。
该数据集的多样性和复杂性使其对工业航空航天应用具有高度相关性。测试模型在3D中对未见几何形状和配置的泛化能力,对于替代模型在初步气动设计和分析中的有效应用至关重要。数据集覆盖120种独特的机翼配置,这些配置通过**翼展、厚度和上反角扫掠**的系统变化定义。
在图4中展示了一些用于本研究的翼型子集。对于每种配置,操作条件通过实验设计(DoE)方法定义,马赫数 变化在典型的巡航速度范围内,攻角 ,副翼偏转角 。雷诺数固定为 。这提供了广泛的气动条件,包括可压缩和跨音速区域以及控制面偏转效应。
机器学习任务包括从操作参数 和输入网格预测表面网格上的压力场。需要注意的是,这里我们假设几何定义是非参数化的:尽管形状变化是通过形状参数的修改定义的,但我们决定仅根据网格节点位置、连通性和表面法线来学习几何的表示。对于这个测试案例,我们将INR模型的性能与图神经网络(GNN)进行比较,特别是MeshGraphNet,这是用于此类任务的常用模型。训练输入INR模型需要对表面网格进行预处理,以获得体积符号距离函数(SDF)字段。我们在网格周围采样点云,采用与训练DeepSDF模型相同的过程。最终,在每个采样点上计算SDF值,生成输入坐标和输出SDF值的集合,公式如下:
其中, 表示第 个样本的带符号距离场 (Signed Distance Field, SDF) 数据集,每个数据集包含位置 和对应的带符号距离值 。
输入INR被训练以学习从坐标到SDF值的映射,该映射通过每个几何特定的潜在向量集 进行条件化。处理器网络用于从输入潜在编码和飞行参数映射到输出潜在编码。飞行参数存储在包含攻角、马赫数、副翼偏转的三维向量中。该回归模型由具有跳跃连接和SiLU激活的四层MLP实现,训练最多进行1000次迭代,当验证损失未改进超过200次迭代时停止。
结果与讨论
跨音速RAE2822翼型
模型在跨音速翼型数据集上的表现总结在表1中。图5展示了各模型在空间域和翼型表面上捕捉压力分布的性能。简单的MLP方法在远离激波区域时表现出高精度,有效地捕捉了弱压缩区域的压力分布。然而,由于频谱偏差以及缺少输入编码,激波区域的梯度过度平滑,未能准确捕捉到锐利的梯度。GUNET模型适合处理具有多尺度特征的图结构数据,其分层池化操作帮助其在激波区域的预测表现较好。然而,其总体误差仍然高于基于MLP的方法,特别是在后缘区域。INR模型优于所有其他方法,达到了最低的均方误差(MSE)。多层MLP与多尺度特征编码和移位调制相结合,使INR能够有效地对数据集中复杂的气动现象进行建模。所有测试的替代模型相对于高保真RANS计算的加速因子约为 到 ,展示了替代模型的计算增益。
尽管本研究的重点在于压力分布的预测,但所提出的模型可以用于多输出预测;补充材料部分包含了额外的实验。此外,对于粘性阻力分量的估计,皮肤摩擦系数的预测尤为关键;在附录中,我们使用INR模型展示了方法捕捉翼面强非线性分量的能力,从而能够准确估计阻力系数。
离散化不变性分析
大量基于深度学习的降阶模型仅能在训练信号的相同分辨率上进行预测,通常与插值程序结合以从更细尺度上提取信号值。流体动力学由定义在连续域上的PDEs建模,数值方法通过在离散域上逼近连续算子来获得最佳解。为CFD构建替代模型的一个更具吸引力的研究方向是考虑模型的可扩展性,以应对大型网格模拟,特别是用于实际航空应用的情况。在此类场景中,表面网格可能由数量级为数百万的节点组成。高分辨率要求能够在边界层区域或跨音速区域内准确地模拟非线性现象,如局部湍流、激波等不连续性。计算资源的消耗,尤其是内存占用和训练时间,是训练基于机器学习的替代模型的主要限制因素。
理想情况下,能够跨不同分辨率泛化的替代模型允许在较低分辨率下训练,同时能够在全分辨率下精确预测。这类隐式神经表示(INRs)被自然地构建为坐标基的网络,不受信号离散化的限制,因此可以在测试时在更细的尺度上执行零样本超分辨率。我们通过在RAE2822数据集上分析INR模型的近似离散化不变性,来量化精度和效率之间的权衡。
该研究的设计如下:我们在不同的分辨率级别上对相同架构的多个INR模型进行训练,这些版本是通过随机下采样网格节点以不同分辨率获得的。然后使用这些模型预测在各分辨率下的CFD解,并总结均方误差(MSE)等全局指标。
表2显示了定量结果:INR可以在低分辨率(占总网格的2%)下训练,并在测试时执行包含误差界限的超分辨率。随着训练分辨率的提高,测试误差收敛至最小值,展示了神经算子的离散化收敛性。
XRF1翼型数据集
表3总结了XRF1翼型数据集上模型的表现。INR框架展示了对未见形状的预测具有极高的精度,获得了最低的均方误差(MSE)。图6中,替代模型的预测与CFD真实数据进行了对比。MGN方法能够捕捉压力分布的一般趋势,但未能建模更复杂的气动特征。激波区域的预测对于两种替代模型都是最具挑战性的。然而,INR方法能够以较高精度预测出锐利的梯度。靠近前缘处,由于强涡度的存在,MGN的精度下降,压力分布呈现出强烈的非线性模式。INR方法展示了在未见形状上的显著泛化能力,证明了几何潜在表示的有效性。
图7展示了在相同操作条件下的三个不同测试形状上的替代模型预测结果,并与CFD真实值进行了对比。对于所提出的INR方法,其推理时间主要由几何编码步骤决定。得益于元学习方法,测试几何的潜在编码可以通过少量梯度步长进行推断,而主网络参数保持冻结。需要注意的是,此步骤对于每种几何形状仅需执行一次。因此,INR模型可以用于在同一形状上对不同操作条件下的输出场进行解码,而无需重新计算。在典型的设计场景中,通常会在多种飞行条件下测试相同的形状设计,以适应飞机任务。
几何编码与重构
INR方法有效性的关键因素在于能够通过在符号距离函数标量场上拟合调制神经场,准确地将几何信息编码到输入潜在编码到数据集中,需要良好的精度,以便潜在表示明确地携带编码对象的特定几何特征。然而,在测试时,推断看不见的形状的潜在代码不应该是一项计算要求很高的任务,尤其是对于代理建模应用程序,其中主要关注点放在预测物理场的加速和准确性上,而不是极其详细的形状重建。出于这个原因,算法 1 中详述的采用的训练策略,允许通过更新少量梯度(在所有实验中 K = 3)来推断潜在代码,特别适合代理建模任务。在图 8 中,原始形状是根据推断的潜在代码重建的,这些代码是通过在 SDF 字段上拟合几何编码器(具有冻结参数)获得的(见图 3)。将行进立方体算法63应用于解码后的 SDF 场,以获得重建的表面网格。尽管机翼后缘和翼尖区域存在一些噪声区域,但可以观察到,决定数据集形状变化的主要几何特征得到了很好的表示。
结论
在本研究中,我们提出了一种稳健的方法来构建2D和3D中气动场的替代模型,该模型可泛化至未见的非参数化几何配置。该方法基于隐式神经表示(INRs),实现了目标函数的连续逼近和近似离散化不变性。所提出的多尺度骨干架构在复杂流体动力学数据集上实现了最佳信号重构,而无需频率超参数的广泛调整。我们在跨音速翼型和XRF1翼型数据集上的实验结果展示了基于INR的模型相对于最先进的图神经网络(GNNs)的优势。INR模型在各种气动条件下始终表现出最低的均方误差(MSE),展示了其准确捕捉复杂流动现象(包括激波区域和其他非线性现象)的能力。
INR模型的近似离散化不变性允许在低分辨率网格上进行训练,同时在全分辨率下保持较高精度。这大大减少了计算成本和内存占用。与高保真CFD模拟相比,替代模型可以实现五个数量级的加速,从而允许实时气动模拟。这为在大型网格上构建复杂3D工业仿真的替代模型铺平了道路,而无需对所提出的方法进行重大更改。
限制和未来工作
尽管该方法在扩展性方面表现出良好性,实验部分未报告大规模网格实验结果。由于包含形状变化的飞机气动CFD仿真公开数据集稀缺,未来研究将针对该方向进行进一步研究。此外,本研究仅处理单个组件气动配置(即机翼和翼型),而大多数飞机气动应用涉及多部件的相互作用,例如机身、螺旋桨和增升装置。将该方法扩展到这些情况并不容易,因为它需要学习具有不同尺度和相对位置的组件的几何表示。
数据可用性
本文使用的代码和数据可在链接(https://gitlab.isaesupaero.fr/gi.catalani/aero-nepf))