2024年10月30日,智慧教育学院(计算机科学与技术学院)在泉山9#906举办了第十六期学术沙龙活动(软件工程、电子信息专场)。本次活动由智慧教育学院2022级软件工程专业研究生黄重阳同学主持,特邀指导老师有学院副院长祝义教授、于巧副教授和谢春丽副教授。我院2023、2024级软件工程和电子信息专业全体研究生参加了此次活动。
会议伊始,祝院长进行致辞。他指出,研究生应该不断提升自身的学术素养,他期待同学们能够积极参与学术沙龙、导师会议和专家科研报告等活动。
随后,黄重阳同学、魏家劲同学、程圣懿同学和张雨同学依次进行了学术分享。黄重阳同学做了题为《基于语法语义和流信息特征的软件缺陷预测模型》的报告分享。黄重阳同学认为使用深度学习来确定源代码文件是否包含缺陷已成为一个重要的研究课题。他提出了一种名为RGCN_CNN模型,并将其应用于软件缺陷预测。具体来说,将源代码转换为抽象语法树和代码属性图。然后,使用卷积神经网络和关系图卷积网络分别从AST和CPG中学习语法语义特征和流信息特征。最后,将两个学习到的特征连接起来,用于训练缺陷分类器。实验结果表明,RGCN_CNN模型可以有效地识别软件项目中的缺陷文件。
魏家劲同学的报告题目为《基于多模态数据与多级检索的重复缺陷报告检测方法》。其研究提出了一种基于多模态数据与多级检索的检测方法,结合了信息检索技术和深度模型特征,以增强对包含文本和图片的多模态数据的处理能力,构建了一个包含图片、文本、分类多模态的缺陷报告数据集,并在该数据集上开展了实验。实验结果显示,采用多模态数据与多级检索的方法可以将缺陷检测的准确率提升5.6%-18.9%,召回率提升4.2%-11.1%。
程圣懿同学汇报了《基于多尺度感知与数据增强的漏洞检测方法》。其文章提出了一种新颖的基于图神经网络的漏洞检测方法HPDA,包含了混合尺度感知和数据增强两个部分。此方法首先设计了一种混合尺度感知漏洞检测模型,利用全局注意力机制来弥补图神经网络在感知全局信息能力上的不足。之后利用该模型指导训练了一个针对代码图样本的数据增强模型,并增强训练集样本。最后,利用扩充后的训练集训练得到一个泛化性能更强的漏洞检测模型。实验结果表明,相较于其他基线方法,HPDA取得了最优的性能,证明了其有效性。
张雨同学分享了《TSO-A Time-Series based Oversampling method for just-in-time software defect prediction》。张雨同学提出了一种基于样本时序的过采样方法,并在在线场景下对其性能进行了深入研究。此外,本文还设计了一种基于缺陷率的动态采样策略,以进一步优化模型性能。实验结果表明:(1)所提出的方法在性能上优于传统的SMOTE、Borderline-SMOTE和ADASYN方法;(2)在在线场景下,本文方法的表现优于SMOTE,且在更细粒度的训练集划分策略下效果更佳;(3)通过动态采样可以略微提升本文方法的性能。
最后,祝院长对本次学术沙龙进行了总结。他对四位同学的汇报给予了积极的评价,并结合他们的汇报内容,分享了一些发表学术论文的实用技巧和建议。祝院长还着重指出,科研过程中团队合作至关重要,并期望同学们能在科研领域有所成就。活动结束后,与会老师和汇报的同学合影留念,本次活动在愉快的氛围中圆满落幕。
图片|汤玮君
排版|金 雨
审核|黄有玉 林威宇