「深度」学习计算广告,我为什么从推荐系统转向计算广告?

文摘   2024-11-02 22:32   广东  





「深度」学习计算广告,我为什么从推荐系统转向计算广告?


你好,我是王喆,这里是「深度学习计算广告」的第一篇文章。熟悉我的朋友们可能知道,从2018年底开始,我更新了一系列推荐系统相关的文章,主要集中在推荐模型,CTR模型等技术的迭代更新上。2020年,我以专栏内容为基础,把所有知识结构化,形成了「深度学习推荐系统」这本书,以及「深度学习推荐系统实战」这门课程。算是把自己所有的理论知识和实践经验做了一个全面的总结。


从2021年开始,我离开了推荐系统领域,回到我职业生涯开始的地方——计算广告,全面负责Tiktok Ad Network的算法工作,最近这一年又来到Dinsey Streaming,负责其下辖所有视频app的广告算法研究和相关工程工作,算是做了一个小的职业方向的转型。


由于职业方向上的转变,我也希望从这第一篇文章开始,逐渐把计算广告最经典也最前沿的知识体系建立起来。专栏名称“深度学习计算广告”有两层意思,第一层意思是深度地学习计算广告,第二层意思是计算广告中的深度学习应用。一语双关,也符合咱们专栏的定位。





为什么回到计算广告领域—推荐系统和计算广告的技术特点


回到计算广告领域的决定我当初也思考了一阵子,主要的出发点是考虑到推荐系统和广告系统技术特点的差异,从职业生涯不同阶段的需求决策的。虽然推荐系统和计算广告的主流技术有诸多相似点,比如:


深度学习推荐模型和深度学习CTR模型分别作为二者的核心,技术方案是完全相通的;

推荐系统的工程架构和广告系统的工程架构也基本可以共用,事实上,一线公司的推荐和广告业务也往往会共享技术中台;

搜广推不分家,二者的业务形态和团队背景也都高度近似


但如果你在两个方向都工作过三年以上,其实能很清晰的感觉到,两个方向的特点其实看似相似,工作模式实则差异很大,宏观上来说主要是以下区别:


推荐系统:推荐系统的主要目标是候选物品排序,这甚至是整个系统的唯一目标,围绕着这个目标,做深做精推荐模型几乎是唯一的效果提升途径,所以“技术精深”是推荐系统的第一特点

广告系统:计算广告系统首先生态上就非常复杂,DSP,SSP,ADX,DMP,MMP等等,广告生态上的各个平台都是重要不可或缺的组成部分。第二广告系统技术架构本身比推荐系统复杂,除了相似的排序模块,广告系统中出价,pacing,库存预估,竞价,定向等模块都是推荐系统不具备的。所以“生态庞大,架构复杂”是广告系统的第一特点


基于上面的技术特点,我的技术选择也就比较顺理成章了。在推荐系统方向工作的4年期间,我跟团队一起搭建了深度学习推荐系统的工程架构,模型服务体系,数据流体系,尝试了不同的模型结构,在业务上也完成了几十个点的效果提升。我几乎经历了一个深度学习推荐系统成熟过程中所有精彩的部分,自己也可以说成长为一个领域专家。再往下走,除了用同一套技术体系支持不同的业务场景,就是在已有的体系上修修补补,这不是不可以,但我个人认为不够精彩。


广告系统这时候的优势就体现出来了。不同利益方之间的关系权衡,不同技术模块之间的联合优化,虽然业界优秀团队的积淀不可谓不深厚,但显然,这其中的潜在优化点是多于推荐系统的。另外,广告团队的合作关系往往非常复杂,跟内外部合作团队的连接也比推荐团队多出很多,这也是对自己软实力的进一步锻炼。


基于上面的考虑,我微调了一下自己的职业方向,让自己的工作不确定性更强,也有更大的优化空间。事实证明,这一步走的不容易,但却完全符合我当初的期望,实现了当初的目标。






计算广告系统的优化空间在哪?还有卷的余地吗?


很多知友可能会说,搜广推,搜广推,三个业务都已经极端成熟,都已经卷到极致了,哪还有什么优化空间啊。我可以很负责的说,说这话的人要么对搜广推的任意一个系统都没有全面的认识,要么就是没什么发现问题解决问题的能力。特别是对于计算广告系统来说,几乎可以说是四处漏风,即使是业界最前沿的团队,几乎也没办法对每个模块都深入独立研究一遍,更别提模块间的联合优化了。


下面是我之前画过的一张广告系统技术架构图。随便举两个优化点来说:


DSP和ADX之间的竞价算法在流量价值方向上的优化。竞价算法有不少独立的研究,但单单竞价过程中流量价值如何衡量这一点,就很少有团队深入思考过。思考过的也仅仅是拿出一个理论框架,没法真正联系实际操作。比如CTR目标和CVR目标广告主对流量价值的判断是一致的吗?如何在一起比较确定这个流量最终的价值,进而决定对外竞价时的出价?

再比如CTR,CVR预估与pacing的结合。广告系统大致可分为效果广告和品牌广告,品牌广告有pacing无CTRCVR,这无可厚非。效果广告系统有CTRCVR和出价,但pacing仅仅负责粗力度的投放速度控制,无法做到基于流量特点分布的全局优化,这一点又有多少团队深入研究过呢?


类似这样的优化点,在仅在DSP方,少说也有几十个,更何况ADX,SSP都有站在自己利益角度的业务需求和相应算法设计,这所有的所有,充满了生态位上不同公司间的合作和博弈,真是多么有趣的问题。


爱因斯坦曾说过:“提出一个问题往往比解决一个问题更重要“。发现不了问题不能都怪一个行业太卷。当初经典物理学大厦都完备了,爱因斯坦都能生生咬出一个口子把大厦推翻,何况是这个四处漏风的广告系统呢。






为什么不是大模型?


选择了计算广告这个非常传统又看似很卷的方向之后,很多同行曾经问过我,为啥不选择那么火的大模型呢?太多大佬都投身其中,特别是清华很多实验室的老同学,优秀的师兄弟们都已经成绩斐然,风生水起,我也确实在很多大模型公司早期有不错的加入机会。这个就还得聊聊职业选择的问题,前段时间我跟很多找我咨询的新同行说,钱差不多的时候,或者不太缺钱的时候 follow your heart,最好能找到属于自己的passion。


我是一个非常喜欢研究“赚钱”策略的人。这是我加入搜广推的初衷,我喜欢看到自己的工作直接为公司赚了多少钱,越直接越好,看到一个AB Test能让公司多赚几个million,我自己比老板估计还高兴(简直完美打工人啊。。)。所以我个人对离钱比较远的方向得不到成就感的正反馈。总结来说就是人比较“俗”,对改变世界的梦想不太感兴趣,因此也就对自动驾驶,AGI,LLM这些预期改变人类从而挣大钱的方向比较祛魅。


所以工作这个东西还是要看点个人性格,了解自己,别让自己工作的太痛苦是你应该要做的,不要低估了兴趣对你长期主义的帮助。工作之外我也很喜欢研究投资策略,所以这个东西是我的爱好,那选择广告系统还有啥说的,能让我跟铜臭味一起腐烂还不高兴坏了。


当然,我对直接研究基础大模型技术本身不感兴趣,但对怎么拿大模型赚钱很感兴趣,对怎么把大模型应用在广告系统这种话题简直感兴趣到家了。所以今后,专栏也会多探讨这方面内容。






深度学习计算广告系列今后写些什么?



说回咱们的专栏,这个专栏今后会写些什么呢?其实初衷还是我自己的知识架构的构建,上次是推荐系统,这次是计算广告系统,如果在这个过程中,大家能有所收获,当然是最好的正反馈。具体到内容,还是两个标准:


1.经典

2.前沿


经典的内容比如经典的出价算法,经典的pacing方法,经典的竞价算法等等,这会帮助我们建立一个很好的技术地基,技术感觉;前沿的内容比如大模型在计算广告的应用,深度学习CTRCVR模型的最新进展,多目标学习,联邦学习的广告应用等等,这些新内容会保持我们的技术竞争力。


最后我们回答一个问题,选择了从推荐系统转向计算广告,是不是意味着推荐系统卷的价值不大了?答案肯定是否定的,因为这完全是基于我自己的客观状况,自己所处的职业发展阶段做出的决定,每个人有不同的适合自己的个性化决定,才能让整个行业更健康,万不可跟风决策,人云亦云。另一方面,推荐系统仍然是学术界和工业界最经典的应用机器学习和AI的场合,它需要工程师和研究者们进一步向精深的方向深挖推荐模型的潜力,另一方面探索推荐产品的新模式,探索新技术在推荐系统的进一步应用。


如果这个专栏的定位符合你想看到的内容,那就请点赞支持一下,给我点继续写作的正反馈吧,期待今后每一两周的相遇,感谢!



—END—





旺知识
AI技术最新进展、发展趋势、研发经验、从业经验
 最新文章