清华软件论坛
2022年4月开始,为迎接清华大学建立、软件学院成立的周年庆祝活动,旨在持续增强学术交流氛围,鼓励促进学科交叉研究,扩大学术研究成果影响传播,软件学院开启了“清华软件论坛”系列学术活动,形式包括但不限于大型学术论坛、小型学术研讨会、与产业技术交流会等。
论坛纪实
11月22日,清华大学软件论坛第二十七期邀请中国科学院外籍院士、清华大学杰出访问教授樊文飞作题为“AI=机器学习+逻辑推理”的学术报告。中国工程院院士、软件学院教授孙家广,软件学院院长王建民,校内部分师生线下参会,来自校内外的相关研究者共200余人线上参会。报告会由王建民主持。
樊文飞院士作报告
樊文飞在报告中首先介绍了逻辑推理的应用场景和主要工具,机器学习的主要特征和特点;深度学习的发展表现为传统的AI构建流程演变为预训练+指令微调的两阶段训练过程,出现了若干种不同的生成式模型GPT,Diffusion,VAE和GAN及其组合。樊文飞指出,随着Transformer的提出,生成式AI模型进入爆发式增长阶段,模型规模、指标和经济效益持续上升,人工智能模型的应用拓展到智能对话和多模态生成等更丰富的任务场景,但也面临模型输出结果的可解释性和溯源问题,准确性、公平性和鲁棒性目标难以同时满足的问题,逻辑表达能力问题,资源消耗巨大的问题,训练数据样本量与质量不足的问题,幻觉问题。
樊文飞分别分析了逻辑推理和机器学习的优劣势,针对如何将逻辑推理与机器学习融合在一个统一框架下、有效地结合二者的优势,通过逻辑推理提高机器学习模型的精度和可解释性,并在解决行业痛点问题时探索比大模型成本更低、精度更高、更易解释的解决方案,樊文飞研究团队提出一个基于图数据关联规则的逻辑框架。这些规则可将机器学习模型做为谓词嵌入,降低模型预测的假阳性和假阴性,提供GNN模型的可解释性,并在缺少样本数据的情况下,提供精准分析。
樊文飞团队在新能源电池、生物制药、网络安全、电子商务、金融等领域的实践证明,二者相融合或可在应用中产生奇效。他们提出将机器学习模型作为谓词嵌入逻辑规则的统一框架,实现了基于图的关联关系智能分析系统——“钓鱼城”系统。将逻辑规则、图模式作为机器学习模型推理结果的“测试预言”,有效地提高了给定任务模型输出结论的准确性,降低了机器学习的假阴性和假阳性,为机器学习预测提供逻辑可解释性,降低了对大规模数据样本的依赖,为产线提供了可靠的决策支持。
会议现场
樊文飞的报告引发了线上线下的参会者就逻辑规则的获取、大规模图数据的高效存储与利用、应用场景的迁移等问题的深入讨论和研究兴趣。
嘉宾介绍
关于我们
数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。
新浪微博:@数据派THU
微信视频号:数据派THU
今日头条:数据派THU