导读 本工作被人工智能顶级会议 NeurIPS 2024 接收。在诸如推荐系统、展示广告等多数实际应用中,所收集的数据往往包含缺失值,并且这些缺失值通常并非随机缺失,这会使模型的预测性能变差。一些现有的估计量和正则化器试图实现无偏估计以提升模型的预测性能。然而,当倾向得分趋于零时,这些方法的方差和泛化误差界通常是无界的,从而损害了它们的稳定性和鲁棒性。在本文中,我们首先从理论上揭示了正则化技术的局限性。此外,我们进一步阐明,对于广义形式的估计器,其无偏性必然会导致方差和泛化误差无界。这些一般性规律启示我们,预估模型的设计并非仅仅关乎消除偏差、减小方差或者简单地实现偏差-方差的权衡。我们基于这些理论发现,从一个全新的视角重新审视对于非随机缺失数据预估建模的本质——偏差和方差的定量联合优化。网商银行智能营销团队提出细粒度动态学习框架来联合优化偏差和方差,该框架能够依据预先定义的目标函数为每个用户-商品对自适应地选择合适的估计器。通过这种操作,模型的泛化误差界和方差降低并从理论层面保证了预估模型方差和泛化误差有界,进一步提高模型在随机缺失数据上的泛化能力。
1. 纠偏推荐背景介绍
2. 正则化技术和目前纠偏估计器的局限性
3. 细粒度动态框架及估计器设计准则
4. 偏差-方差定量联合优化
5. 实验结果
6. 结语
7. 加入我们
分享嘉宾|哈明鸣
内容校对|李瑶
出品社区|DataFun
纠偏推荐背景介绍
正则化技术和目前纠偏估计器的局限性
对于具有正则化项的一般估计器 L_(Est+Reg),在不牺牲无偏性的同时减少方差是不可能的。 正则化方法 L_Reg 无法保证估计器方差和泛化误差是有界的。
对于一般形式的估计器 L_Est,估计器的无偏性将不可避免地导致无界方差和泛化误差界。
细粒度动态框架及估计器设计准则
(保序性)f(p ̂_(u,i) )>p ̂_(u,i) 单调递增且满足 f(0)=0,f(1)=1。 (同阶性)lim┬(p ̂_(u,i)→0)〖p ̂_(u,i)/f(p ̂_(u,i) ) 〗=C,其中 C>0 为正常数。
其中,
偏差-方差定量联合优化
如果动态估计器采用 α_(u,i)^opt 作为参数,则对应的方差和泛化误差是有界的。
实验结果
结语
加入我们
活动推荐
往期推荐
大模型时代下的私有数据安全与利用
独家专访李飞飞爱徒,斯坦福AI博士,a16z投资千万美元,AI视频月收入飞涨200%
对话Nvidia黄仁勋:机器学习不仅是关于软件,而是涉及整个数据管道;机器学习的飞轮效应是最重要的
李彦宏:大模型幻觉基本消除,这是只靠想法就能赚钱时代
百度沧海·存储统一技术底座架构演进
翁荔B站分享原文:AI安全与“培养”之道
抖音集团数据血缘深度应用:架构、指标与优化实践
OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议
腾讯语音合成技术:模型优化与推理加速实践
策略产品AI转型指南:能力模型与实战策略
点个在看你最好看
SPRING HAS ARRIVED