本文精选了美团技术团队被CIKM 2024收录的8篇论文进行解读,覆盖了自监督学习、解释生成、CTR预测、跨域推荐、向量召回、图像生成、时效预测等多个技术领域。这些论文有美团独立研究,还有跟高校、科研机构合作的成果。希望能给从事相关研究工作的同学带来一些帮助或启发。
CIKM是信息检索、知识管理和数据库领域中顶级的国际学术会议。2024年,CIKM共收到全球1496篇论文投稿,最终347篇被接收,接收率约为23%。
01
Relative Contrastive Learning for Sequential Recommendation with Similarity-based Positive Sample Selection
论文类型:Poster(Full Research Paper track )
论文地址:PDF
本论文提出使用相似序列(具有不同的目标内容)作为额外的正样本,并引入了一种名为相对对比学习 (RCL) 的新方法用于序列推荐。所提出的 RCL 包含两级正样本选择模块和相对对比学习模块,前者模块选择相同目标序列作为强正样本,并使用相似序列作为弱正样本,后者模块采用加权的相对对比损失,确保每个序列与其强正样本的表示更接近,而不是弱正样本。在公开数据集和点评业务数据集上 RCL 都优于现有方法,该算法在论文接收前已在大众点评首页信息流推荐场景落地并取得显著的效果。
02
Aligning Explanations for Recommendation with Rating and Feature via Maximizing Mutual Information
论文下载:PDF
论文简介:为用户提供基于自然语言的解释以证明推荐有助于提高用户满意度并赢得用户信任。然而,由于当前的解释生成方法通常被训练以模仿现有用户评论为目标,生成的解释往往与推荐商品的预测评分或是一些重要特征不一致,导致这些解释不能真正地帮助用户在推荐平台上做出明智的决策。为了解决这个问题,本文提出了名为MMI(最大化互信息)的优化框架,以增强生成的自然语言解释与推荐商品的预测评分/重要特征之间的一致性。
具体来说,本文使用互信息(Mutual Information, 简称MI)作为解释与预测评分/商品特征一致性的衡量标准,并训练一个基于MINE方法的互信息估计神经网络,将此神经网络作为后续的MI估计器。然后,我们将一个训练好的解释生成模型视为主干模型,基于来自MI估计器的奖励对其进行基于强化学习的微调。微调过程会指导原先的主干生成模型学习会生成与商品的预测评分及重要特征更一致的解释。在三个公开数据集上的实验表明,MMI框架可以提升不同的主模型,使它们在与推荐商品的预测评分和重要特征的一致性方面优于现有的模型。此外,本文通过用户实验验证了MI增强的解释确实有助于用户的决策,并且由于它们更好的一致性特点,与其他方法生成解释相比更能让用户满意。
03
Enhancing CTR prediction through Sequential Recommendation Pre-training: Introducing the SRP4CTR framework
论文类型:Short Paper
论文下载:PDF
论文简介:理解用户兴趣对于点击率(CTR)预测任务至关重要。在序列推荐中,通过自监督学习从用户历史行为中进行预训练可以更好地理解用户动态偏好,展现出与CTR任务直接集成的潜力。以往的方法将预训练模型集成到下游任务中,仅用于提取语义信息或单独的用户兴趣编码,然后将这些信息作为特征加入下游模型。然而,这些方法忽略讨论了下游任务中的额外推理成本,且没有考虑如何将预训练模型中的信息高效的转移到CTR任务预测的特定估计项中。
04
EXIT: An EXplicit Interest Transfer Framework for Cross-Domain Recommendation
论文类型:Applied Research Paper
论文简介:跨域推荐是指利用其他领域的知识增强推荐系统对用户兴趣的预测精度,在工业应用中受到了广泛关注。现有的隐式建模跨域推荐方法并未考虑不同域之间服务功能和商品展现形式的差异,导致在落地过程中产生严重的负迁移问题。例如,用户在金刚和搜索中大量表达对医药、闪购等紧急需求的兴趣,直接将这些信号用于推荐系统并大量推送医药和闪购产品显然不合适。
05
VIER: Visual Imagination Enhanced Retrieval in Sponsored Search
论文类型:Short Paper
论文简介:向量召回是搜索系统的重要能力之一,通过将搜索词、用户和商品的信息编码为稠密向量,为用户检索出高质量的候选。然而,在即时零售场景下,搜索词(Query)存在两类极端问题:1)短Query通常为模糊意图,例如鲜花,2)长Query包含大量噪声实体,例如巧克力鲜花费列罗。这两类情况导致很难识别用户确切的搜索意图。实际上,消费者对于搜索的商品有心理图像预期,反映了他们特定的购买意图。
06
Design Element Aware Poster Layout Generation
论文类型:Full Research Paper
论文下载:PDF
论文简介:图像创意在广告系统中起着重要的作用,利用商户素材制作优质的图片创意能够帮助广告主吸引更多的用户、获得更多的点击。海报布局生成领域虽然在近期取得了显著进展,但现有的方法多关注于对海报背景的理解,而忽略了设计元素(例如文字、Logo和底纹)对布局的影响,这导致生成的布局经常存在明显的视觉瑕疵,包括(1)尺寸不当,例如将较短的文字放入较大的文本框中或将长文本放入较小的文本框中,以及(2)图像失真,例如拉伸变形的logo图标。为此,本文定义了一个新的布局生成任务:感知设计元素的海报布局生成,该任务要求生成的布局不仅适配于背景图片,还要与给定的设计元素相匹配。
07
Process-Informed Deep Learning for Enhanced Order Fulfillment Cycle Time Prediction in On-Demand Grocery Retailing
论文类型:Applied Research Paper
论文下载:PDF
论文简介:在即时零售(On-demand Grocery Retail, OGR)领域,准确预测订单履约周期时间(Order Fulfillment Cycle Time, OFCT)对于提高客户满意度和运营效率至关重要。由于自营前置仓+配送的模式,小象这类OGR平台有着与即时外卖配送(On-demand Food Delivery, OFD)平台不一样的运营调度策略和可用数据,面临着截然不同的时效预测挑战。
08
Collaborative Scope: Encountering the Substitution Effect within the Delivery Scope in Online Food Delivery Platform
论文类型:Applied Research Paper
---------- END ----------
美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行合作。欢迎老师和同学们发送邮件至:meituan.oi@meituan.com。