今年,KDD 2024 OAG-Challenge Cup 的三道赛题,提出的是针对学术数据挖掘领域中的论文同名消歧、论文源头追溯、学术论文检索三个经典难题。团队同学创新性地采用大模型来解决这三个问题,他们基于大模型,提出自反馈增强、嫁接学习等技术,在效果上显著优于其他队伍,在排行榜上均取得较大领先。
在(AQA学术论文问答任务)任务中,带有复杂噪声的数据是该任务的主要难点。GPT4等开源大模型因为噪声问题,在场景文本搜索方面输出结果完全不可用。团队利用LLM For Vector及Boosting技术在文本搜索场景实践,提出集成召回、排序的Boosting LLM For Searching方案,在指标上全面超越基于传统文本嵌入方式的搜索方案,有效将LLM具备的语义理解能力迁移至场景文本搜索任务,解决了学术搜索场景的噪声问题。BlackPearl团队开源了全部解决方案代码供研究者交流学习,并提交了解决方案的论文,团队成员将在巴塞罗那举行的 KDD 2024 上展示报告其研究成果。后续,美团技术团队公众号将陆续发布这三道赛题的技术解读,敬请期待。未来,大众点评App将不断深入探索大模型技术,充分挖掘其内在潜力,通过先进AI技术产品化,使大众点评能够更精准地服务于用户,努力让AI帮大家更懂美食,更会生活。