【全文】融合时间感知和增强过滤的农业知识推荐模型

学术   2024-12-09 21:01   北京  

引用格式:

王鹏哲, 朱华吉, 缪祎晟, 刘畅, 吴华瑞. 融合时间感知和增强过滤的农业知识推荐模型[J]. 智慧农业(中英文), 2024, 6(1): 123-134.

Citation:WANG Pengzhe, ZHU Huaji, MIAO Yisheng, LIU Chang, WU Huarui. Agricultural Knowledge Recommendation Model Integrating Time Perception and Context Filtering[J]. Smart Agriculture, 2024, 6(1): 123-134.

官网全文在线阅读

知网阅读

融合时间感知和增强过滤的农业知识推荐模型

王鹏哲1,2, 朱华吉2,3,4, 缪祎晟2,3,4, 刘畅2,3,4, 吴华瑞1,2,3,4*

(1.广西大学 计算机与电子信息学院,广西南宁 530000,中国;2.国家农业信息化工程技术研究中心,北京 100097,中国;

3.北京市农林科学院信息技术研究中心,北京 100097,中国;4.农业农村部数字乡村技术重点实验室,北京 100097,中国)


摘要: 

[目的/意义]农业场景下的知识服务具有周期性长、活动时间长的特点。传统推荐模型无法有效挖掘农业场景下的基于农时的隐藏信息。针对上述问题,提出一种融合时间感知和增强过滤的农业知识个性化推荐模型(Time-aware and Filter-enhanced Sequential Recommendation Model for Agriculture Knowledge, TiFSA)。

[方法]首先,基于时间感知的位置嵌入方法,将农户交互的时间信息与位置嵌入相结合,帮助学习农业情境下基于农时的项目相关性。其次,在时间感知位置嵌入的基础上,引入滤波器过滤算法,自适应地衰减农户情境数据中的噪声。最后,引入时间信息的多头自注意力网络,实现对时间、项目和特征的统一建模,对农户随时间变化的偏好特征进行情境表示,从而为用户提供可靠的推荐结果。

[结果和讨论]根据“全国农业知识智能服务云平台”中的用户交互序列数据集进行实验。结果表明,该模型在农业数据集上的命中率为45.79%,归一化折损累计增益为53.52%;与近几年性能最佳的模型Ti-SASRec相比分别提升16.19%和14.02%。

[结论]该模型能够有效捕获农业领域的用户情境特征和建模农户的动态偏好,具有更好的推荐性能。

关键词:农业知识推荐;滤波器算法;时间感知;自注意力网络;序列推荐

0

引 言


随着现代信息技术在农业领域的广泛应用,发布于互联网上的农业知识信息量成指数级增长,造成信息过载和碎片化严重等问题。面对海量的农业信息数据,农业知识个性化推荐任务能够快速获取农户的知识需求,计算农户的兴趣偏好特征,最终为农户提供准确、个性化的农业知识服务。

在推荐领域中,捕获用户的动态序列交互行为对于提高推荐系统的性能至关重要。为了准确刻画用户的兴趣偏好并提供高质量的推荐结果,早期的序列推荐利用Markov链(Markov Chains, MC)从用户交互序列中获取顺序模式。该方法只能关注到局部的信息,无法从整体构建用户偏好特征。近年来,深度学习技术凭借其更强大的深层表达能力,在序列推荐领域研究中得到了较好的发展。其中基于循环神经网络的推荐通常使用长短期记忆网络(Long Short-Term Memory, LSTM)和门控循环单元处理推荐问题中的长序列信息。Niu等提出通过自注意力机制与Bi-GRU网络分别提取用户长短期兴趣偏好,最后通过欧式距离融合特征得到最终加权求和的推荐结果。Tang和Wang将卷积神经网络运用至序列推荐领域,分别使用水平卷积核和垂直卷积核对用户行为序列进行兴趣偏好提取,提高了内存的使用效率。Zhao等提出了LSIC(Long and Short-term Information in Content-aware)模型,通过对抗训练利用长期和短期信息的内容感知进行推荐。Fang等集合基于内容的推荐方法、K最邻近(K-Nearest Neighbor, KNN)和协同过滤(Collaborative Filtering, CF)这3种算法实现特定用户输入的特定电影推荐。此外,相关研究人员也将丰富的上下文信息引入到序列推荐当中,预测用户下一项可能交互的项目。上述推荐算法在视频、新闻、商业等领域可以被推广应用,但在农业场景中的适用度有限。在农业知识推荐领域,惠银帆通过获取农户当前行为特征并加以分析,为农户提供农业种植技术的个性化推荐。国帅构建农业知识领域本体,根据用户需求、情感和兴趣偏好,综合考虑农业信息服务平台的结构特征,结合现有的用户画像和知识图谱,为用户提供精准的个性化推荐。王梦瑶设计的农产品电商个性化推荐系统利用农产品领域知识图谱,通过建立群组动态用户画像,运用动态画像与协同过滤的混合推荐算法来实现个性化推荐。系统根据用户在农产品领域的兴趣和偏好,结合群组内的动态用户画像,精准地推荐符合用户需求的农产品。

当前,互联网的农业知识存在碎片化严重、低质重复、噪声影响严重,同时缺少公开的序列推荐数据集,相关研究仍处于起步阶段。传统的序列推荐模型对于农业场景的适用度不高,农业情境中的隐藏信息难以被发掘,需要结合农业情境信息进行个性化推荐,而基于用户画像和知识图谱的推荐算法,融入了一定的农业情境信息但无法更好地获得农户的动态兴趣变化和需求。为了提高农业知识推荐服务质量,要充分考虑基于农时的农业情境信息。农业用户的交互行为往往有着丰富的农时信息,种植不同作物的农户在不同的农时下会有不同的知识需求。而传统的序列推荐算法往往丢弃了时间信息,只保留了交互项目的相对位置信息,依靠用户所访问的时间顺序进行位置编码,忽略了时间间隔信息对推荐结果的影响,因此无法有效捕捉用户基于农时的动态偏好信息。综上所述,目前农业领域的推荐模型存在以下问题:1)常规模型无法针对农业数据场景进行有效的推荐;2)农业数据规范性差、噪声影响严重;3)农业数据场景信息利用不充分。

针对以上问题,本研究提出融合时间感知和增强过滤的农业知识推荐模型(Time-aware and Filter-enhanced Sequential Recommendation Model for Agriculture Knowledge, TiFSA),通过引入时间间隔信息对用户交互的农时特征进行建模,并以此进行推荐。针对农业场景周期性强、活动时间长的特点,将用户交互的时间戳信息引入推荐框架,通过时间感知位置嵌入方法,将所有的用户序列信息转换为带时间信息的序列嵌入;设计增强过滤算法对嵌入序列信息进行噪声过滤,优化农业数据集噪声影响大、容易过拟合的问题;使用多头自注意力网络进行时序分解和用户偏好特征的捕捉,通过时间间隔信息计算注意力得分,提升农业场景下的推荐性能;采用AdamW优化器优化最终预测结果,在预测层推测出用户下一农时时期内的知识需求。

1

数据采集与处理


1.1 农业数据描述 

实验数据来源于作者团队开发的“全国农业知识智能服务云平台”中的用户点赞、评论数据和对应的时间信息。其中农业知识包括种植和养殖数据。种植知识包括病虫草害、土壤肥料、栽培管理、市场销售、品种选择、农业机械。养殖知识包括养殖管理、动物疫病、良种繁育、饲料营养、市场销售5种类型。其中种植品种涵盖蔬菜、水果和作物3种类型,主要包括黄瓜、甘蓝、辣椒、萝卜、西红柿、水稻、小麦、玉米、苹果、桃子10个品种。每个品种根据其时间或者生长时期对应不同农时。例如,甘蓝的种植时间通常为4~9月份,时间范围较广,因此以发芽期、种苗期、生长期、接球期、成熟期这5个生长时期作为对甘蓝的农时描述更为合适。不同作物和不同种植时期下农时的划分方式不相同,因此引入交互时间戳,以时间间隔信息作为对农时的感知方式。

本研究的推荐数据为农户交互知识的序列数据,将交互的农业知识按照时间顺序排列。用户在不同的农时阶段会浏览相应的知识,如图1所示,用户A为种植冬小麦的农户,在10月浏览品种选择和播种相关的知识,11~12月份浏览越冬水灌溉相关知识,次年的3月和4月分别浏览返青水灌溉和病虫害防治知识,以此组成序列推荐数据。最终目标是预测出用户下一个可能交互的知识。 

图1 农户兴趣漂移图

Fig. 1  An example of farmer interest drift

1.2 数据预处理 

通过对原始数据的标准化处理、剔除异常值和重复值等操作,选择用户交互序列长度大于5的数据构建农业数据集,包括1 270位用户对69 504条农业知识的128 547条交互数据,并命名为“Agriculture”。同时选用电影推荐场景下的数据集ml-1m作为对本模型性能的辅助验证。2个数据集的具体信息如表1所示。

表1 农业知识推荐实验数据集信息

Table 1  Agricultural knowledge recommendation experimental dataset information

2

模型构建


本研究提出的TiFSA模型,整体结构由嵌入层、增强过滤层、时间感知自注意力层、预测层4个部分组成。嵌入层可以获取用户和项目交互序列的初始嵌入,同时在用户序列嵌入矩阵中引入他们的绝对位置和相对时间间隔信息;增强过滤层包含可学习农业推荐场景的滤波器,用于对农业领域序列推荐数中的噪声进行过滤;时间感知自注意力层利用时间间隔信息计算注意力权重,探索农户、所交互的农业知识以及交互时间之间的关系,从而得到不同农户在不同农时下的兴趣偏好信息;预测层结合农户兴趣特征进行推荐,获得目标项目的Top-N排序。整体模型结构如图2所示。

图2 TiFSA模型整体结构

Fig. 2  Overall structure of TiFSA model

2.1 农业场景问题建模 

设U和I分别表示农业用户集和农业知识集,在时间感知序列推荐模型的中,对于每个农户所交互的农业知识序列表示为,其中Stu对应于每一个农业知识I,表示农户交互每个知识的时间序列。在模型训练过程中,设置最大时间步长为t,模型读取农户交互的前t个农业知识,将riju作为定义两次交互农业知识i和j的时间间隔,根据交互序列与时间间隔信息共同来预测下一个项目。本研究所提出的模型的输入为附带交互时间间隔Ru的农户交互序列,其中时间信息,模型每次的输出是用户交互的下一个项目,最终目标是预测农户u在(t+1)时刻的交互项目。

2.2 嵌入层 

本研究提出的时间感知位置嵌入方法,主要为建模农时层面的农业知识相关性。首先将最大序列长度设置为n,模型将输入的用户交互序列转换为固定的最大长度的序列S=(S1,S2,…,Sn)。当输入的序列长度大于n时,截取交互序列中时间最近的前n个项目;当输入的序列长度小于n时,补充添加填充项至最大序列长度为n。对于一同输入的时间序列

,转换为与用户交互序列相对应的时间序列T=(T1,T2,…,Tn )。

本研究对输入农户交互序列中的时间间隔信息进行建模,表示两个农业知识之间基于农时情境的关系。其中一些农户在他种植作物的生长周期内会有更频繁的交互行为;而另一些种植作物没有在生长周期内的农户的活跃程度则相对较低。因此,本方法主要计算交互时间间隔的相对长度。对于每一个农户,将所有时间间隔信息除以其最短的时间间隔,得到不同农户个性化的农时情境表示。根据用户u的时间序列T=(T1,T2,…,Tn ),将交互农户知识的时间间隔设置为|Ti–Tj|,并定义为Ru。用户交互的最小时间间隔为r_min^u=min(I^u),按比例缩放的时间间隔为,其中riju∈N。因此,用户的关系矩阵Mu∈Nn×n可表示为矩阵(1)。

由于农业的周期性时间较长,会出现交互知识之间时间间隔过大的问题,导致稀疏关系编码。在农业领域中,精确的时间间隔信息在超过一定的阈值时将失去它的作用,因此对相对时间间隔修剪为k,作为交互知识之间的最大时间间隔,可以缓解稀疏关系编码的问题。因此,被修剪后的矩阵为Muclipped=clip(Mu),其中将修剪运算应用于矩阵的每个元素,定义为

嵌入层创建了农户交互知识的嵌入矩阵MI∈R|I|×d,其中d是嵌入向量维度。在进行嵌入查找操作时,可以将嵌入矩阵的前n个交互知识的嵌入进行堆叠,形成一个新的嵌入矩阵,使用常数零向量0作为填充项,以保持嵌入矩阵的形状一致。最后得到矩阵EI∈Rn×d,如矩阵(2)。

在自注意力机制中使用两个不同的位置嵌入矩阵MKP∈Rn×d和MVP∈Rn×d分别作为键和值,得到农户交互知识的嵌入EKP∈Rn×d和EVP∈Rn×d,表示为矩阵(3)和矩阵(4)。

自注意力机制中的键和值的相对时间间隔与位置嵌入类似,嵌入矩阵为MKR∈Rk×d,MVR∈Rk×d。在检索到裁剪过的关系矩阵Muclipped后,得到嵌入矩阵EKR∈Rn×n×d和EVR∈Rn×n×d,其中主对角线上的元素都是零,表示为矩阵(5)和矩阵(6)。

2.3 增强过滤层 

经过嵌入层的数据处理后,增强过滤层通过堆叠多个可学习滤波器来过滤农业项目噪声,其结构如图3所示。 

图3 农业知识推荐研究增强过滤层结构

Fig. 3  Agricultural knowledge recommendation structure of filter-enhanced layer

在增强过滤层中,对数据频域中的每个维度特征进行滤波操作,然后进行连接和归一化操作。给定输入项表示矩阵E∈Rn×n×d的第l层,首先沿着项目维度执行快速傅里叶变换(Fast Fourier Transform, FFT)以转换E到频域,如公式(7)所示。

式中:f(·)表示一维FFT;Xl表示E频谱的复张量;然后乘以可学习滤波器K,如公式(8)所示。

式中:⊙表示元素乘法;滤波器K是一个可学习滤波器,它可以被随机梯度下降(Stochastic Gradient Descent, SGD)优化以自适应地表示农业领域数据的频域。最后采用逆FFT变换调制频谱Xl使其返回到频域并更新序列,如公式(9)所示。

式中:f^(-1) (•)表示逆FFT运算,它将复数张量转换为实数张量。经过FFT和逆FFT的运算,可以有效降低农业数据中的噪声,获得更纯净的农业项目嵌入。最后结合跳跃连接、层归一化和丢弃操作,缓解梯度消失和训练不稳定的问题,如公式(10)所示。

2.4 时间感知自注意力层 

根据自注意力机制,本研究提出融入两个项目之间不同时间间隔的自注意力机制。由于农业用户在获取知识时的交互序列可能有很多相同的时间戳,不仅要考虑时间间隔,还需要考虑项目在序列中的位置。

对于时间感知自注意力层,包含n个项目的每个输入序列EI=(mS1,mS2,…,mSn),同时计算一个新的序列X=(x1,x2,…,xn)。每个输出元素xi被计算为线性变换的输入元素和关系与位置的加权和,如公式(11)所示。

式中:WV∈Rd×d是值的输入投影。

使用softmax函数计算每个权重系数αij,如公式(12)所示。

   

使用考虑输入、关系和位置的兼容性函数来计算eij,如公式(13)所示。

式中:WQϵRd×d、WKϵRd×d分别为查询和关键字的输入投影。当尺寸过高时,比例因子√d可以避免内积的较大值。

时间序列任务中,模型预测下一个时间步的值时通常只考虑前面时间步的历史信息。然而,基于时间感知的自注意力机制在计算权重时考虑了时间的关系。它通过对序列中的每个位置应用自注意力机制,以便在预测第(t+1)个项目时能够捕捉到更多全局的依赖关系。因此,本研究通过禁止Qi和Ki(j>i)之间的所有链接来修改注意力,如公式(14)和公式(15)所示。

式中:Q代表输入序列的特征;K代表输入序列中的每个元素进行匹配,以确定与之相关的特征。

在该层中,模型能够根据序列中不同位置的重要性和相关程度,自适应地计算每个位置的权重。通过这种方式,模型可以在预测任务中综合利用以往的项目、绝对位置和相对时间信息。考虑线性组合实现的方式,因此在每个时间感知自注意力层之后应用两个线性变换,通过ReLU函数激活,可以赋予模型非线性能力,如公式(16)所示。

式中:W1、W2ϵRd×d、b1、b2ϵRd线性变换在不同的层之间参数不共享。

由于农业数据的稀疏性和低质性,在堆叠两个网络层之后,本层同样采用层归一化、残差连接和丢弃正则化技术来解决过拟合、梯度消失和训练时间过长的问题,如公式(17)所示。

归一化层用于归一化特征之间的输入,可以加速和稳定神经网络的训练。假设z是包含所有农户样本特征的向量,归一化层可定义为公式(18)。

式中:⊙表示元素乘积;μ和σ分别表示z的均值和方差;α和β表示学习的比例因子和偏差项。

2.5 预测层 

本研究的输出结果为预测的用户下一个交互项目,其输出交互序列为S=(S1,S2,...,Sn),其中每一个输出元素S代表一个预测结果,并按照偏好得分输出评分最高的前n个项目。

在时间感知自注意力层之后,得到项目、位置和时间间隔的组合表示。本研究使用潜在因子模型来计算农户对下一个可能交互的农业知识i的偏好得分,如公式(19)所示。

式中:MiI∈Rd表示项目i的嵌入Xt是给定的前t个项(S1,S2,...,St)及其时间间隔(

本研究采用AdamW优化器,在继承Adam算法的基础上引入权重衰减的思想,提高Adam的泛化能力和收敛速度,进一步提升模型性能。

3

实验与分析


3.1 实验设置与评价指标 

本实验模型采用PyTorch深度学习框架进行实验,设置最大序列长度在[10,20,30,40,50,60,70]之间调整,嵌入向量维度在[8,16,32,64,128]之间调整,Dropout比率设置为0.5,初始学习率为0.001,批处理大小设置为128,设置自注意力块数为2,注意力头数为2,采用AdamW作为本实验的优化器,损失函数为BCEWithLogitsLoss,所有实验均在GTX-1650Ti GPU上进行。

本实验采用Top-N排序的两种常用评估指标,分别是用于衡量推荐结果的准确性的命中率(Hit Rate,HR)和用于对推荐结果中位置排名靠前的项目分配更大的权重的位置感知指标归一化折损累计增益(Normalized Discounted Cumulative Gain, NDCG),如公式(20)和公式(21)所示。

根据文献[18—20]中的策略,为每个用户随机抽取99个用户未交互过的项目作为负样本。将这些项目与正样本一起进行排名,并计算相应的HR和NDCG。

3.2 模型对比实验分析 

本研究将所提出的TiFSA模型与PopRec、GRU4Rec、SASRec、BERT4Rec、Caser、TiSASRec、FMLP-Rec7个具有代表性的先进模型进行对比分析。

在Agriculture与ml-1m两个数据集上对所有模型进行测试。各个模型的结果如表2所示。其中实验结果最后一列数据为TiFSA模型结果相较于次优结果的提升比率。根据表2实验结果可知,PopRec模型在两个数据集上的表现最差,说明了个性化的用户建模在推荐领域的重要性。在基于用户序列推荐的模型中,BERT4Rec、SASRec、TiSASRec的模型性能都超过了GRU4Rec和Caser模型。这表明相较于GRU和卷积神经网络,自注意力机制拥有更强大的序列建模能力。此外,在Agriculture数据集上,FMLP-Rec的性能优于BERT4Rec和SASRec,表明基于滤波算法的推荐模型对于农业数据集噪声大的问题有一定的优化和提升。引入时间间隔信息的TiSASRec模型比其他传统序列推荐模型提升较大。FMLP-Rec和TiSASRec对农业数据集的提升较为明显,而在电影数据集中的模型性能低于SASRec。这表明在时间间隔信息和滤波算法的引入更符合农业场景下的服务需求。

从表2中结果可以得知,TiFSA在两个不同数据集上的结果都优于其他模型,其中在Agriculture数据集上的提升较为明显,与次优模型TiSASRec相比,HR和NDCG分别提高14.02%和16.19%;而在ml-1m数据集上与次优模型SASRec相比,HR和NDCG分别提升1.90%和2.30%。综上所述,本研究提出的TiFSA模型相较于其他模型有较大提升,验证了TiFSA模型的有效性,有利于对用户所处不同农时情境进行感知,表明农户交互的时间间隔信息和滤波算法对农业情境下的模型性能的提升具有重要作用。

表2 农业知识推荐研究不同模型性能对比

Table 2  Agricultural knowledge recommendation performance comparison of different models

注:加粗为最优模型结果;下划线为次优模型结构。

3.3 参数影响分析 

3.3.1 嵌入向量维度分析 

隐藏空间中,嵌入向量维度是一个关键参数。不同维度的嵌入向量对推荐性能的影响也会不同。本实验设置嵌入维度的值分别为8~128维,其他参数保持不变,对模型性能进行实验,采用公式(20)和公式(21)的评估指标HR@10和NDCG@10,实验结果如图4所示。

图4 TiFSA模型的不同嵌入向量维度对比图

Fig. 4  Comparison of different embedding dimension in TiFSA model

由图4分析可知,随着嵌入向量维度的不断增加,所提模型性能在维度达到64之前呈现上升趋势,超过64时模型性能开始下降,因此认为在维度为64时模型性能达到饱和。分析原因,在嵌入向量维度较小时,模型可供学习的参数较少,无法有效捕获农业场景下基于农时特征的用户信息,从而导致模型性能不好;在嵌入向量维度较大时,模型可以更好地学习农户的隐藏信息,提升模型性能,但当嵌入维度达到128时,模型的计算量增大,需要更长的时间进行收敛,同时由于数据噪声的影响,出现过拟合的现象,导致性能下降。在农业数据集上,TiFSA模型均在嵌入维度设置为64时达到最佳性能,因此将两个模型的嵌入向量维度设置为64。

3.3.2 最大序列长度分析 

图5展示了在Agriculture和ml-1m数据集上最大序列长度对模型性能的影响,其中序列长度的取值范围设置为10~60个序列信息。从图5分析可以得知,随着序列长度的增加,模型性能会不断提升,Agriculture数据集的序列长度在达到40时会使结果趋向平稳。ml-1m数据集数据密度较大,在最大序列长度为60时达到最佳性能。而对于农业场景下数据密度较小的Agriculture数据集,模型性能同样呈现先上升再下降的趋势,在序列长度超过50后性能开始平稳下降。这是因为Agriculture数据集噪声较大,在增大序列长度后会引入更多的噪声数据,使得模型性能退化。因此在Agriculture数据集上的最大序列长度设置为50,而在ml-1m数据集上的最大序列长度设置为60。

图5 TiFSA模型不同序列长度对比图

Fig. 5  Comparison of different sequence length in TiFSA model

3.3.3 超参数分析 

本节将选择Dropout比率和学习率两个超参数进行实验,进一步验证TiFSA模型的稳定性,实验结果如图6和图7所示。从图6可以看出,两个数据集的模型结果随着Dropout比率的增加先平稳上升再下降,其中当Dropout比率达到0.5时模型性能达到最优,超过0.5后性能逐渐下降。这是因为当Dropout比率较高时会减小有效参数,使模型无法在农业情境下有效学习用户特征,从而降低模型的性能,而适当的Dropout比率则可以有效过滤数据集中的噪声,从而提高模型性能。从图7中可以看出,ml-1m和Agriculture数据集分别在学习率为5e-4和1e-3时达到最好的性能,而较大的学习率会导致模型性能降低。这是由于当学习率较大时,模型无法收敛达到最优解;而当学习率较小时,会降低模型的收敛速度。若想达到模型的最优解,则需要更多的迭代次数。因此在ml-1m数据集上,Dropout比率设置为0.5,学习率设置为5e-4;在Agriculture数据集上Dropout比率设置为0.5,学习率设置为1e-3。

 图6 Dropout比率实验对比图

Fig. 6  Experiment comparison of dropout ratio

 

图7 学习率实验对比图

Fig. 7  Experimental comparison of learning rates

3.3.4 优化器对比分析 

本研究通过两个数据集,分别选取SGD、Adagrad、RMSprop、Adam和AdamW优化器进行对比实验,结果如图8所示。

 

图8 TiFSA模型不同优化器对比实验

Fig. 8  Comparison of different optimisers in TiFSA model

图8表明,不同的优化器在两个数据集上有不同的收敛速度。其中SGD优化器的收敛效果较差,主要原因是该优化器每次更新参数时采用的数据量较小,且容易受到异常值的影响,无法有效适应农业数据集规范性较差、噪声影响严重的特点。Adagrad优化器在训练过程中可以自适应调整学习率,获得更好的训练效果,因此其性能优于SGD优化器。RMSprop优化器针对梯度平方和累计越来越大的问题,改进了Adagrad优化器上梯度下降算法,适合处理平稳的目标,但对于较为稀疏的农业数据集效果并不理想。Adam优化器则既吸收了Adagrad优化器善于处理稀疏梯度的特点,又结合了RMSprop的优点,使得其在两个数据集上分别取得了不错的效果,其中对于稀疏度较高的农业数据集提升较为明显。AdamW优化器则在Adam基础上引入权重衰减,解决Adam的自适应学习率在遇到L2正则化时效果不理想的问题,比Adam收敛得更快,相比于其他优化算法具有一定优势。

3.3.5 消融实验分析 

本节将讨论时间感知和增强过滤模块对模型性能的影响,评估指标为3.1节所提出的HR和NDCG。由于这两个模块主要是对农业场景下的数据提升较为明显,因此本节将只针对Agriculture数据集进行实验,结果如表3所示。其中TiFSA-tf表示将时间感知模块和增强过滤模块移除,仅利用多头自注意力网络进行推荐;TiFSA-t表示仅将时间感知模块移除,利用加入滤波算法的自注意力网络进行推荐;TiFSA-f表示仅将滤波器模块进行移除,利用基于时间感知的自注意力网络进行推荐。

表3 农业知识推荐研究的TiFSA消融实验
Table 3  Research on agricultural knowledge recommendation ablation experiments of TiFSA 

从表3的消融实验结果可以看出,当移除时间感知和增强过滤模块时,HR@10和NDCG@10两个指标的值分别为0.293 6和0.203 9,推荐性能较差。当仅移除时间感知模块和仅移除增强过滤模块时,实验结果相比于TiFSA-tf有不同程度的提升,本研究所提出的TiFSA模型在两个评估指标上达到最优性能。对实验结果的具体分析如下:

1)当仅利用多头自注意力网络进行推荐时,模型两个推荐指标都较低,表明只考虑项目号的传统序列推荐方法不适用于农业场景。

2)当引入增强过滤模块而未引入时间感知模块时,模型性能有所提升,但依然无法达到理想推荐效果。主要原因是增强过滤模块能有效解决农业数据集规范性差、噪声影响较大的问题,但由于没有引入相关的农业情境信息,导致该方法并不能完全适应农业场景。

3)当仅引入时间感知模块而未引入增强过滤模块时,模型效果有显著的提升,证明时间感知模块对于农业场景的适用性较强,能够有效感知不同作物种植环境下的复杂农时情境,提升序列推荐任务的模型性能。

4)当同时引入时间感知模块和增强过滤模块时,模型性能得到进一步的提升。一方面说明了增强过滤模块对时间感知模块的依赖性;另一方面也验证了采用增强过滤对时间感知的自注意力网络模型的必要性。

综上所述,TiFSA模型的两个组成模块在农业场景下的具有积极提升作用,验证了各组成模块的有效性。

4

结论与展望


本研究针对农业知识推荐这一重要问题开展了研究,提出了一种融合时间感知和增强过滤的农业知识推荐模型。该模型将用户的交互时间间隔引入嵌入信息中,使得模型对农业场景中农时信息进行有效的学习,使用户的交互时间和对象的预测更贴近实际场景;同时采用增强过滤算法对农业数据中的噪声进行衰减,并能有效融入模型中进行使用,进一步提高模型的推荐性能。实验结果表明,在农业数据集上,所提出的TiFSA模型具有有效性,且在农业领域有较显著的提升,在HR@10和NDCG@10上分别提高14.02%和16.19%;消融实验证实了时间感知和增强过滤模块对推荐性能的提升具有积极作用。

在未来的研究中,将考虑引入地域、种植作物、温度等更多农业情境信息,并研究如何实现各情境信息的有效融合,进一步提高农业知识推荐的性能。




推荐阅读


人工智能在农业风险管理中存在的问题、建议与展望


农业农村部关于大力发展智慧农业的指导意见


论文快速发表通道已开通,《智慧农业(中英文)》欢迎您投稿!


审稿专家邀请函





智慧农业微信交流服务群

为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。入群方法:加小编微信17346525780备注:姓名、单位、研究方向,小编拉您进群,机构营销广告人员勿扰。

发布征集







欢迎在我公众号发布科研团队介绍、创新科研成果及相关活动等信息。

智慧农业期刊
《智慧农业(中英文)》是国内外公开发行的农业科学类学术期刊。期刊聚焦农业信息技术发展前沿与热点,刊载和传播国内外最新研究成果,通过搭建高水平学术交流平台,引领学术研究方向,服务行业科学决策,培养高水平创新人才,促进学科发展。
 最新文章