湖南中医药大学田星课题组综述: 机器学习在食品风味领域的研究进展与未来趋势

文摘   2024-12-31 14:30   湖北  

食品风味作为影响消费者购买欲的重要因素之一,是由口腔中的食物引起的味觉和嗅觉的融合,其背后的物质基础是各类风味物质共同作用。食品风味研究在食品的分类、地理来源、成熟度以及感官质量控制等领域起着重要作用。同时,食品风味也是食品生产加工过程中的重要监测参数。随着计算技术的快速发展和食品风味领域数据库的逐渐增多,具有高预测能力和准确性的机器学习(ML)模型已成为食品风味分析与预测领域研究的重要工具与传统方法相比,ML在预测和分析食品风味方面具有明显优势。

湖南中医药大学药学院陈靓、阳佳红、田星*归纳了近年来食品风味研究中广泛使用的ML模型,并重点论述了ML在食品风味研究领域的最新应用进展与未来发展趋势,旨在阐明ML在食品风味领域研究中的重要性,为ML在食品风味研究中的进一步开发应用提供理论指导和新思路。

1 ML技术

的概念与分类

作为人工智能的子领域,ML旨在通过数据、观察和与世界的互动为计算机提供知识,并通过寻找一个能够根据输入变量更精准地预测输出的算法模型,解决建模问题。如图1所示,ML大致可以分为4 个子类型:监督学习、无监督学习、半监督学习和强化学习。监督学习的概念是指在执行计算之前对输入和输出数据进行标记或预先分类。监督学习算法是通过对目标函数的迭代优化,学习一个函数,该函数可以预测与新输入相关的输出。无监督学习则是使用未标记的数据集,其算法旨在发现数据中隐藏或未定义的模式。而半监督学习结合了监督和非监督方法,可用于大量未标记和几乎没有标记的数据。另外,强化学习是指以目标为导向的算法,它学习如何通过许多步骤实现复杂目标或最大化特定维度。总之,无监督学习和监督学习的区别在于,分析的数据不能产生标签或预先确定的假设。基于无监督算法的模型通常用于降维输入和特征提取,以补充并进一步增强监督学习中预测模型的性能,包括聚类分析和主成分分析(PCA)。而不同于其他算法,强化学习则主要关注智能体与环境之间的相互作用,基于奖励函数计算的环境反馈寻求最优策略。强化学习的目标是获得最大的奖励,而不是从输入数据中预测输出数据。


2 食品风味研究领域中常用的ML算法

ML主要包括两类:分类和回归。分类是主要用于识别极有可能属于某个类别的样本,而回归通常用于预测某些变量的具体值。目前,食品风味分析主要依靠感官评价、仪器分析或两者结合。近年来,ML在食品风味分析和预测中得到了广泛应用。现代智能感官检测技术结合ML的方法拥有可靠性高、客观性强、准确性高、省时省力等独特的优势。目前,ML在食品风味研究中的应用,包括香气和味觉研究,2019年至今受到关注,正在成为食品风味领域的研究热点。SVM、DT、RF、kNN、ELM、ANN和DL、PLS是食品风味预测与分析领域的常见ML算法。其中,ELM、SVM和ANN是2019年之前最常用的模型,而CNN近年来开始逐渐流行

 2.1 传统ML算法

RF是一种用户友好的集成学习模型,由彼此不相关的多个DT组成。主要用于分类任务,但也可用于回归,被认为是最强大和最关键的ML技术之一。RF包括装袋算法和DT两种强大的ML技术。在预测过程中,输入数据时,RF的分类结果由大量DT记录。数据的类别和回归由森林中所有树木的最大投票和每个DT的平均输出分别确定(图2A)。RF可以处理高维数据、大型数据库以及不平衡数据集,并且不影响其预测精度。故可选择复杂的MS数据作为RF模型的输入。例如,使用RF模型研究了无目标气相色谱-质谱(GC-MS)联用数据与添加长链多不饱和脂肪酸和加铁奶粉的感官腥味之间的相关性。将每个质谱峰的m/z作为输入后,RF分类模型的预测误差显著低于回归模型,表明分类模型相比于直接回归模型能更准确地预测结果。由于其精确的预测率和噪声鲁棒性,RF近年来受到越来越多的关注。

SVM是主要用于解决线性可分和不可分问题的一种ML算法,最初由Cortes和Vapnik提出。SVM的基本思想就是将低维输入向量变换成一个高维特征空间,并寻找一个最优的分离超平面对数据点进行分类,使得误分类误差在这个空间中最小化(图2B)。SVM是最大间隔分类器,使经验误差最小化、边缘面积最大化解决非线性可分离问题,并使其尽可能线性。SVM适用于处理非线性、小样本量和高维模式识别任务,并在预测中表现出优异的性能。例如,研究者采用SVM分类模型识别不同发酵时间金耳草的风味变化规律,发现“Day4”“Day5”“Day6”样品的分化均无法通过PCA直接分离,说明发酵可能从“Day4”开始进入了稳定期,发酵底物组织的变化非常缓慢甚至停滞。SVM在训练集(100%)和测试集(97.14%)中对不同发酵时期样品的分类准确率极高。因此,使用SVM算法将原始特征空间映射到高维空间,可以成功地识别出相似度较高的样本。

kNN是所有监督学习算法中最简单的样本分类方法。当未知样本作为输入时,该方法的分类机制是使用不同的距离搜索数据集中最接近的k个样本。然后选择基于多数投票算法的类别作为输出(图2C)。根据kNN原理,数据集样本通常与具有相同属性的其他样本最接近。作为较简单的ML算法,kNN模型需要计算每个测试点与训练集之间的距离,当训练集较大时,计算量大且时间复杂度高。故kNN的主要限制在于其存储需求和计算成本。然而,这些限制可通过处理训练集克服。目前,研究者开发了一种新的特征提取方法,称为快速有限剪切波变换(FFST),以提高kNN算法的精度。此外,研究者还成功设计了一种简单有效的电子鼻数据识别系统区分醋的风味。结果表明,FFST具有较高的模型分类性能和较强的抗干扰能力,是一种令人满意的特征提取方法。

ELM作为前馈神经网络学习中一种全新的训练框架,广泛用于回归和多重分类。ELM由3 层组成:输入层、隐藏层和输出层。ELM可以随机选取网络的输入权值和隐层偏置,在隐藏层中随机生成隐藏节点,选择输入层、隐藏层和阈值之间的连接权值。因此,不需要使用反向传播连续优化参数,这与反向传播算法相似而减少其计算量。此外,ELM更适合于快速预测且易于使用。近年来ELM在食品风味研究中得到了极大的关注。Men Hong等使用基于电子舌和电子鼻数据融合的ML预测啤酒风味信息分类,ELM、SVM和RF从原始数据集中选择的特征变量中实现了啤酒风味分类的预测,预测准确率分别为98.33%、96.67%和94.44%。这些研究表明ML在食品风味研究中的预测精度有待进一步提高。例如,研究者将ML应用于风味预测是工业化过程中控制啤酒或其他产品质量的一种有效而准确的方法。此外,各种其他ML算法,即偏最小二乘回归(PLSR)、极端梯度提升(XGBoost)和梯度提升树(GBT),已被用于解决食品风味领域的预测问题。

事实上,虽然传统的ML方法在食品风味领域已得到一些应用,但也存在明显局限性。例如,其通常需要人工设计和选择特征,这是一个耗时的过程,而且依赖于领域知识,如果特征选择错误,可能会影响模型的性能。此外,在处理非线性、高维数据和错综复杂的数据关系时,其有效性也会受到限制,而且在捕捉这些数据中的潜在模式和结构时常遇到困难。特别是非结构化数据(如文本和图像)的处理具有一定的挑战性,因为这些数据类型通常具有复杂的内在结构和特征。然而,DL算法的使用为这些问题提供了解决方案。

 2.2 DL算法

ANN是一种模拟人脑神经系统的处理技术,这使其能够模拟参数和目标之间的非线性关系。它模拟生物体神经细胞原理,由连接的神经单元组成网络,通常分为3 层,即输入层、隐藏层和输出层。每一层都连接到下一层网络。神经元对加权输入求和,并通过将结果传递给传递函数生成输出(图2D)。ANN用于估计任何线性或非线性函数,并解决传统方法无法解决的困难数据分析或复杂问题。然而,与其他ML算法(即DT和RF)相比,ANN倾向于过拟合数据。因此,通常需较大的样本量才能产生可接受的泛化。Li Yu等将超快速气相色谱-电子鼻与ANN分类模型相结合,建立了一种成本低、准确率高的快速判别食醋质量的方法,使用ANN模型预测了不同酿造技术的醋的风味特征。其对5 种不同酿造工艺的69 种食醋样品的风味进行了分析,并将这些数据作为输入,识别准确率作为ANN模型的输出。ANN对训练集和预测集的预测准确率分别达到98.60%和96.70%。该方法为提高其他液体调味料的质量提供了新思路。

DL是ML的重要组成部分,其通过构建网络从大型数据集中自动提取特征。DL是基于传统的ANN模型发展而来的,现已广泛用于解决高度复杂的分类和回归问题。由于DL使用一个可以在层次上抽象和表示数据的杂项函数转换数据,故它也被认为是ML的扩展。

CNN是所有算法中应用最广泛的DL预测模型之一。CNN由多个卷积层、池化层和全连接层组成,如图2E所示。DL模型可以使用端到端演示(end-to-end walkthrough)学习框架共同学习内在规律和特征表示,并且具有比传统ML模型更高的特征学习能力或效率。CNN广泛用于图像处理领域,通常用于模糊或锐化图像,或用于边缘检测等其他任务。

总之,上述DL算法均为解决食品风味研究中分类和攻击任务的有力工具与方法,其强大的模式识别和特征学习能力能够有效地处理复杂的食品相关数据。然而,大多数DL算法很难解释不同描述符之间的关系且它们的行为是不可见的,导致“黑盒现象”的发生。因此,未来的研究重点应着眼于提高ML算法在食品风味领域研究的可解释性、预测能力和学习速度。

ML在食品风味研究领域的应用

食品风味是影响食品可接受性和消费者偏好的最重要属性之一。食品风味评价已成为满足消费者对食品风味需求和生产高质量新产品的关键。然而,传统的感官评定存在主观性、不一致性、不可预测性、耗时、效率低等众多缺点,同时感官评定结果还受物理条件和环境的影响。与传统感官评定相比,ML方法以其快速、有效、客观、准确、经济的优势,被用于食品风味预测与分析,并在食品风味领域取得了巨大成功。ML技术已被应用于基于风味化合物的分子结构和物理化学性质预测食品风味。此外,红外光谱、电子鼻、电子舌和GC-MS获得的风味成分结构数据也可作为ML方法预测食品风味的输入或输出。

 3.1 常见的食品风味数据库

ML是分析食品数据库等大数据源的宝贵工具。许多研究都是从各种食品数据库中获取信息进行的,由于数据源丰富多样,因此可使用不同的ML方法对食品数据库中的内容进行有效的分析和计算。自100多年前第一个食品数据库发布以来,食品数据库变得更加多样化,包括食品成分数据库、食品风味数据库和食品化学化合物数据库。食品风味数据库是另一类关注天然和合成风味分子的分子特性的数据库。例如,最著名的风味数据库之一FlavorDB,包含超过25 000 个代表一系列味道和气味的风味分子。FlavorDB是印度德里因陀罗普拉斯塔信息技术学院计算生物学中心开发的在线数据库,旨在整合风味分子的多维方面,展示其分子特征、风味特征以及天然来源细节,与其他风味数据库相比,如BitterDB、VirtualTaste数据,主要侧重于风味的特定方面,而FlavorDB则不同,它收集各种参考资料,汇编成一个全面的风味数据库。FlavorDB数据库的风味分子数据主要来源于《费纳罗利风味成分手册》、FooDB数据库以及文献综述等(表1),同时,该数据库提供的信息包括每种香料分子的基本特性、官能团、理化性质、二维/三维性质以及其在生物体内的ADMET(吸收、分布、代谢、排泄和毒性)性质。

 3.2 基于分子结构和性质预测食品风味

品中风味化合物与其分子结构密切相关,通常根据食品中风味化合物的分子结构,采用适当的ML模型预测食品风味。Yang Zhengfei等通过应用ML模型预测甜味特性,成功建立了多层甜味预测系统。收集两个数据集,包括Taste DB和LogSw DB,然后将这些数据转换为分子格式。利用ML模型不断迭代,基于分子结构预测其甜味剂风味,这有助于食品行业新型健康天然甜味剂的开发与利用。同时,ML模型用于根据分子结构预测甜度,光梯度提升机(GBM)软投票集成模型表现出极佳的预测性能,该模型返回的接收者操作特征曲线得分高达0.961,另外,研究表明分子中氢键供体的氮原子在决定甜度方面起着至关重要的作用。与其他研究相比,这项研究通过ML分化提供了对甜味更直观的解释,这也有利于快速准确地设计甜味剂结构并选择新甜味分子。Zheng Suqing等从实验数据集中收集了707 种苦味和592 种非苦味分子,使用kNN、SVM、RF、GBM等算法并使用分子描述符作为输入的深度神经网络(DNN)建立了苦/无苦预测模型,其最优模型(SVM)的预测精度为0.918。

另外,Bo Weichen等使用ML预测了分子结构的味觉特征(甜味和苦味)。采用2D化学图作为CNN模型的输入预测其风味。结果表明,和CNN模型相比,多层感知器指纹模型表现出良好的预测性能。因此,DL方法是探索结构-风味关系以及预测分子风味属性的有力工具,同时为风味识别提供有效的方法学参考。在预测苦味化合物方面,ML展现出强大的潜力,Dagan-Wiener等提出的一个ML分类器——BitterPredict,可正确分类80%以上的化合物,以及70%~90%的化合物,为快速分类苦味化合物提供了有效工具。在一项预测单体香料的香味保留等级的研究中,结合使用ML模型(RF、SVM和DNN)和其分子结构,RF表现出更好的预测精度,准确率、精确度和召回率分别为77.81%、77.83%和77.99%。通常单体香精的留香值测定采用人工嗅闻的方法,周期长、效率低。将ML应用于单体风味预测将为快速可靠地预测风味特征提供创新方法,从而促进整个香精香料行业的发展。

此外,利用ANN和低场核磁共振(LF-NMR)结合的方法监测食品风味变化,成功建立了ANN和PLS风味预测模型,用于监测脱水大蒜在不同干燥过程中的风味变化。LF-NMR预测模型表明微波真空干燥(MVD)的Rp2(决定系数)为0.963 3。优化后的反向传播神经网络的预测性能优于PLS,对MVD的Rp2为0.997 5。因此,基于LF-NMR结果的ANN模型可能更适合于预测食品风味。与GC-MS等方法相比,LF-NMR可在不破坏样品的情况下呈现样品的变化。因此,ML与LF-NMR的结合将有助于以非破坏性的方式预测样品的风味变化。最近,Sun Dawei等使用动态规划(DP)和近红外高光谱成像相结合的方法预测养殖鲑鱼的异味,并采用ML模型、偏最小二乘判别分析(PLS-DA)、最小二乘支持向量机(LS-SVM)、ELM和一维CNN预测鲑鱼变质情况。结果表明,DP模型在预测养殖鲑鱼中的异味相关化合物方面也表现出了可接受的性能,这也表明ML是监测食品风味变化和预测食品样品异味特征的有效工具。

然而,食品风味研究中不建议使用kNN和DT解决分类任务。与其他算法相比,kNN和DT在根据图像特征对其风味进行分类方面的效果较差。Bahramparvar等使用ML模型以感官属性作为输入,预测消费者对不同口味冰淇淋的接受程度,并将总接受度作为ANN的输出。感官属性数据分为训练集(30%)、验证集(10%)和测试集(60%)。结果表明,具有一个包含10 个节点的隐藏层的ANN模型对冰淇淋总体接受度的预测效果最好,该模型使用ML根据冰淇淋口味预测感官接受度。然而,作为ANN输入的预测能力在其他感官属性(如紧实度、光滑度和外观)方面低于使用味觉指标和质地作为输入的预测能力。因此,输入数据和参数对于ML模型的预测精度至关重要,而且ML模型的输入数据应在一定程度上与输出数据相关。

食品风味特征还与风味化合物的理化性质或食品的理化参数有关。物理化学性质或参数也被用于提供可靠的基于ML的食品风味预测。使用ML预测气味分子的气味感知研究中发现,通过分子计算软件获得收集的1 026 个气味分子理化参数,利用SVM、RF和ELM 3 种ML模型对代表性气味分子进行气味感知预测,其中SVM预测效果最好,准确率高达97.08%。另外,ML模型可以根据气相色谱流出物获得感官信息,还可以作为GC/O分析小组成员提供可能的气味描述符。此外,Li等使用袋装决策树算法(treeBagger)、线性判别分析(LDA)、SVM和kNN,对来自日本的2 400 份大米样品的理化参数进行预测味觉评分。与treeBagger(90.80%和9.20%)、LDA(89.60%和10.40%)和kNN(85.50%和14.50%)模型相比,SVM模型的预测准确率最高(91.80%),误差最低(9.20%)。因此,作为一种新型的食品品质控制方法,在使用ML过程中输入数据或参数的选择是决定风味预测准确性的重要因素之一。

 3.3 DL与智能分析技术结合在食品风味分析领域的应用

作为基于人类感官仿生技术而开发的智能检测系统,现代智能分析技术具有操作简便、精密度高、检测迅速等优势,目前已广泛应用于食品风味分析领域。而将DL与现代智能分析技术相结合,可以更好地解释食品风味、化学成分与感官体验之间的相关性,为分析食品风味成分物质基础提供理论依据。表2为ML与不同智能风味分析技术在食品风味分析领域的应用案例汇总。

电子鼻和电子舌可用于分析和获得食品的综合味觉和嗅觉特征。因此,这两种智能仿生仪器获得的结果经常被用作预测食物风味的ML模型的输入。Tian Huaixiang等使用BPNN训练的多层前馈神经网络和基于电子鼻的RF预测了酸奶的风味可接受性。BPNN和RF模型表现出卓越的预测性能,能够区分满意和不满意的酸奶样本,预测准确率接近100%。Liu Ming等使用LDA、BPNN和SVM预测中国白酒的风味类型,将有效电子鼻传感器的归一化数据作为输入数据,将风味类型作为输出数据。分析得出SVM模型对中国白酒的5 种香型(江味、浓香、清香、芝麻香和农家香)都有较好的预测能力,测试数据集的分类准确率高达83.30%。与LDA和BPANN相比,SVM的泛化能力更强,预测能力更高。在另一项研究中,利用电子鼻的结果作为输入,Viejo等开发了两个基于ANN的ML模型预测咖啡的香气特征和风味强度,其准确率高达98%,预测咖啡香气的相关系数为0.99。Viejo等使用两个ANN模型结合电子鼻数据对啤酒香气进行了预测。结果表明,ANN模型的预测准确率极高,其中模型1预测17 种挥发性芳香化合物的相关系数为0.97,模型2预测啤酒中10 种感官描述强度的相关系数为0.93。另外,有学者运用SVM、RF和ELM的方法,将电子舌和电子鼻的综合信息(数据融合)作为输入数据预测不同啤酒的风味,并与基于单一电子舌和电子鼻的分类准确率进行比较,其结果表明,基于电子舌和电子鼻的数据融合的预测准确率高于单一仪器的预测准确率,而SVM、RF和ELM 3 种ML模型的预测能力相当,准确率分别为88.89%、88.89%和88.33%。因此,使用来自多个设备的数据融合信息可以提高ML模型的预测精度,尤其是更全面的输入数据是决定模型性能的重要因素之一。

GC-MS联用仪一般用于定性和定量食品中的挥发性化合物,并经常被用作预测食物风味的ML基础。Bi Kexin等通过混合GoogLeNet和SqueezeNet的结构构建了一种新的CNN模型,以确定不同品牌花生油样品中香气化合物的强度。GC-MS图谱数据集被用来创建指纹模板,并使用指纹图像生成程序对其进行食品风味预测,研究表明,PLSR对花生油样品风味预测的准确率低于67%。而经过CNN训练(约600 s)和数据结构化,整个分析过程(包括频谱分析、ML预测和输出解释)(约30 s)准确率可提升至93%。这项研究通过指纹图像实现了食品风味预测,并且CNN在从图像中提取特征方面表现出强大性能优势,但该模型仍需改进,以减少过拟合问题。此外,Eggink等利用GC-MS技术测定挥发性代谢物,并将其作为ML模型的输入数据,进一步使用射频回归方法预测风味属性(即香气、果味/苹果味、甜味和酸味)。事实上,ML模型的预测能力通常与特定食品无关,而是与预测任务以及输入和输出参数之间的关系有关。Chen Chengchang等应用了RF、SVM、ANN和LDA模型预测乳粉的异味,并从原始GC-MS数据中找到了主要的挥发性物质。与其他分类模型相比,RF在预测感官鱼腥味方面的表现出明显优势。Eggink和Chen Chengchang等的研究也表明RF在风味分类任务中表现明显优于其他算法。在基于二维GC×GC/TOF-MS算法综合分析中,使用RF和SVM算法预测了中国白酒的风味类型,SVM的分类准确率为97.67%,表现优于RF。此外,与SVM相比,RF的准确率较低可能与RF需要更大的样本量有关。SVM对中国白酒地理产地的预测准确率仅为91.86%,这表明ML模型的预测性能也与预测任务有关。Boccorh等使用GC和两个ML模型(ANN和PLSR)预测了黑加仑浓缩汁的风味强度。根据黑加仑浓缩果汁GC结果的主成分回归得分,ANN对风味强度的预测能力略优于PLSR模型。ANN模型模拟人类感知中的非线性关系的能力,可能是该研究中其预测性能高于PLSR模型的原因。

近红外光谱被广泛用于快速测定食品成分和结构,而食品成分和结构很大程度上影响食品风味。Viejo等利用近红外光谱数据作为输入,开发了ML模型预测啤酒中6 种重要的香气,结果表明ML模型对啤酒香气的预测具有较高的准确性和鲁棒性,总体相关系数为0.91。此外,Viejo等使用近红外光谱、电子鼻结合ML对红、白色基酒的异味进行了预测,其中基于近红外光谱和电子鼻对红葡萄酒和白色葡萄酒的香气预测准确率分别为96%和97%。该研究表明,ML模型的预测结果不仅取决于所使用的算法,还取决于获取输入数据的方法。因此,研究者们必须不断探索用于食品风味或有效输入数据的数据收集方法,以提高ML的预测精度。另外,拉曼光谱是基于光和材料内化学键的相互作用的无损分析技术。研究者将ML和表面增强拉曼散射相结合,定量和定性地预测葡萄酒风味,结果表明,两种含硫分子的预测系数都达到了0.998。

总之,ML在快速、精确地预测食品风味方面具有巨大的潜力。然而,目前不同的ML算法都存在各自明显的优缺点,没有一种一致的ML算法可以解决所有食品的风味预测任务。因此,研究者们需要仔细选择具有最佳预测精度和适当学习速度的模型。通常,RF和SVM在有关食品风味的分类和回归任务中存在明显优势。此外,运用多种ML方法联合分析可能会比仅使用单一模型预测食物风味产生更准确的结果。不同技术的数据融合,如电子鼻和电子舌的结合,通常也会比使用单一结果作为输入显示出更好的预测性能。因此,采用数据融合策略与ML模型相结合的方法,提高食物风味预测的准确性,必将成为预测食物风味的一种有效工具和新趋势。

4 ML在筛选潜在关键风味化合物及其合成预测领域的应用

风味是食物代谢成分与人类味觉和嗅觉相互作用的结果,决定了食物的受欢迎程度。Colantonio等预测了西红柿和蓝莓的感官性状,包括甜味、酸味、鲜味和风味强度,以及挥发性物质浓度的18 个统计模型和ML模型。XGBoost、GBM和RF的预测准确率高于其他模型,其中,XGBoost的预测准确率最高,对两个物种所有性状的预测准确率为0.62~0.87。利用ML模型与代谢组学结合预测了这两种水果的风味属性,使研究者能够将风味作为提高水果风味的育种目标。Fan Zhen等利用ML将挥发性化合物与草莓甜度和消费者偏好相关联,从中发现20 种挥发性化合物可增加草莓的甜度感知,18 种挥发性化合物可增加消费者的喜好度,15 种挥发性化合物对草莓甜度和消费者喜好度均有积极影响。而γ-十二内酯、6-甲基-5-庚烯-2-酮和各种脂肪酸酯被鉴定为草莓甜度和风味的关键化合物。最近,Ferrão等分析了蓝莓的主要香气成分,将其与消费者的偏好联系起来,并使用ML模型对芳香基因型进行了分类,萜烯类化合物包括桃金娘烯醛、4-异丙基甲苯、D-柠檬烯和芳樟醇,被确定为蓝莓香气的关键挥发性物质。尽管目前利用ML在调节食品风味方面的研究主要局限于水果风味的改良,但通过ML筛选潜在的关键风味化合物间接调控其他类型食品风味具有广泛的应用前景。

另外,ML已被应用于预测化学反应或化学合成。然而,基于ML预测风味前体合成以调控食品风味的研究尚鲜见报道。Coley等利用DNN组合预测了有机反应的结果,该模型基于DNN进行了训练,以便从一系列候选产品中选出主要产品。Segler等使用以扩展连接性指纹为输入的深度网络模型预测反应和逆合成。从已发表的化学学科知识中提取的反应(350万 个)用于训练模型。在验证集中,ML模型在逆合成和反应预测方面分别达到了95%和97%的高准确率。ML在预测化学反应或药物化学合成方面已显示出卓越的性能,这些方法可能也适用于直接或间接合成食品风味物质,从而更好地调节食品风味。因此,通过化学合成风味前体产生特定的风味物质,或基于ML法直接合成风味化合物可能是未来精确调控食品风味的新趋势。

此外,ML在化合物性质预测、逆合成分析、化学反应预测等方面应用广泛。分子结构参数(包括双键位置、官能团、分子特征)与风味化合物的感官品质之间的关系也已广泛研究。研究发现,当在酸的C-2位置添加双键时,气味阈值较高。此外,各种不饱和支链酯的气味阈值高于相应的饱和酯。当去除或改变脂肪族或芳香族中的羟基时,气味就会消失。同时,研究发现芳香化合物的气味质量和阈值会受到手性的影响。尽管在结构-活性关系的研究方面已经取得了很大进展,但很难就分子结构与感官品质之间的相关性建立一个普遍且广泛的理论。因此,利用ML强大的计算能力,希望可以利用多种ML算法对各种食品风味品质相关指标进行分析,建立高效数据模型并提高模型的效率和准确性,从而为指导食品风味的调控以及创新产品开发提供理论指导和基础。

结 语


目前,ML已越来越多地应用于食品科学,尤其是食品风味研究领域。随着人工智能技术的快速发展,现代智能感官技术结合ML算法的方法在食品风味分析领域已取得了良好的应用。ML弥补了传统人工评价主观性强、标准难以统一等缺点,如ML算法与电子鼻、电子舌、红外光谱和GC-MS等技术相结合预测和调控食品风味,对于促进食品风味的增强和质量控制尤为重要。除了直接从食品中获得的风味成分数据外,食品与消费者之间相互作用的质子转移反应质谱法、选择性离子流管质谱法和大气压化学电离质谱法等在线质谱分析法获得的食品与消费者之间相互作用的大量数据,对于预测食品口腔加工过程中的风味感知和调控也具有重要的指导意义。

然而,ML在食品风味预测和分析领域的实际应用与研究尚未成熟,还有待不断完善与探索。目前,利用ML进行食品风味分析与调控越来越受到重视,相关方法也在不断优化,以满足消费者对食品风味的期望。在未来,食品研究者们可通过筛选和改进ML算法或使用混合模型提高可预测性,促进ML算法在食品风味研究中的应用与推广。此外,笔者期望从应用ML控制化学反应或化学合成的案例中汲取经验,指导理想物质的合成(生物合成或化学合成)从而达到对风味物质的调控。研究者们还可以通过开发潜在复杂的预测模型探索食品生产加工过程中风味变化的机理,这将有助于食品工业领域研发出更具创新性和吸引力的创新食品,以满足消费者的需求和喜好。总之,ML在食品结构设计、食品风味分析与预测、潜在关键风味化合物筛选及其合成预测等领域均扮演着重要角色,而ML在食品风味领域的应用与发展将为整个食品行业带来商机和挑战。在未来,ML在食品风味研究领域的应用场景将更加深入和多元化,这必将成为食品风味研究领域的新高度。



本文机器学习在食品风味领域的研究进展与未来趋势》来源于《食品科学》2024年45卷第10期28-37页,作者:陈靓,阳佳红,田星DOI:10.7506/spkx1002-6630-20231123-181。点击下方阅读原文即可查看文章相关信息。

版权声明

本文转载自“食品科学杂志”微信公众号,原标题“《食品科学》:湖南中医药大学田星副教授等:机器学习在食品风味领域的研究进展与未来趋势”。转载仅用于学术分享,若有侵权,请后台留言联系修改或删除!



    『点赞在看,精彩不断』↓ ↓ ↓

    食品信息学
    关注机器学习、化学计量学与仪器分析化学在食品科学领域的交叉应用研究新成果!
     最新文章