推荐系统当中的双塔模型到底是什么

职场   2024-04-08 21:24   天津  

专业成就职业

大家好,我是策略产品夏师傅

今天跟大家简单聊聊推荐系统中常见的双塔模型,作为策略产品经理,大概了解了解其工作原理即可。

什么是双塔模型?

说起双塔模型,不得不提最早的DSSM,深度语义匹配模型,最早是出现在微软发表的一篇应用于NLP领域中计算语义相似度任务的文章。

DSSM模型原理很简单:获取搜索引擎中的用户搜索query和doc的海量曝光和点击日志数据,训练阶段分别用复杂的深度学习网络构建query侧特征的query  embedding和doc侧特征的doc  embedding,线上infer时通过计算两个语义向量的cos距离来表示语义相似度,最终获得对应的相似输出。

我们都知道推荐系统的本质在于“人货匹配”,这里我们一般称人就是user,货就是item。显然,这种query和doc的匹配思路同样可以应用于推荐当中对于user和item的匹配思路。

因此这种模型架构开始应用于推荐系统当中。

它的核心思路其实就是通过构建user和item两个独立的子网络,将训练好的两个“塔”中的user embedding 和item embedding各自缓存到内存数据库中。线上预测的时候只需要在内存中计算相似度运算即可。

双塔模型其实是一种模型架构,和传统的我们针对user或者item单独进行相似度计算不同,它会把整个数据处理的过程形成user和item两个独立的进程,如上图,左侧是用户塔,右侧是item塔,这两个塔的参数互不影响。

user的特征是指用户端的一些数据,比如用户访问的上下文环境信息(设备,系统,时间等)、基础属性数据(地域,年龄)、还有就是比较重要的行为数据(比如点击,播放,收藏,评论,转发)等;

item特征是指物品侧的一些特征,主要包括:物品id,物品类目,物品规格,物品属性等等;

有了这些特征以后,我们就可以把两路特征分别输入到对应的特征提取网络进行处理,得到User Embedding和Item Embedding,然后就到了关键一步,利用特征向量化的结果进行相似度的计算,比如常见的余弦相似度。

最终达到的一个效果就是用户有过交互行为的item相似度比较大,用户未点击或者负反馈的item相似度比较小。

模型训练好后,我们可以离线将所有的Item通过Item塔得到其向量,并将其离线保存到缓存数据库当中。

当来了一个用户后,我们首先利用User塔计算得到其用户向量;之后拿用户向量去和离线的Item向量进行相似度计算,并返回相似度最大的N个Item作为个性化的召回结果。

同理,当有一个新的item过来的时候,比如广告,那么我们首先会利用item塔得到其广告向量,然后分别和所有user向量计算相似度,返回相似度最大的N个用户进行item展示即可。

以上就是关于双塔模型的一个简单介绍。不过作为策略产品经理,了解一下其工作原理即可。

以上希望能给你带来启发。

夏师傅策略产品经理训练营,最专业,最体系,最贴近工作的策略产品内容,包含了搜索,推荐,广告,AI和增长等五大主流策略方向,至今已经持续4年之久。无论你是C、B端产品经理,还是数据分析,运营,算法开发等,如果你面临求职问题,想转行策略产品,拿策略offer,那么不容错过,学到会为止。

策略产品夏师傅
夏唬人,京东/美团/阿里/快手高级策略产品专家,搜索业务负责人,策略产品经理训练营主理人
 最新文章