首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

算法复现 | MNL-Bandit:分类选择的动态学习方法

文摘 2024-05-27 09:59 中国香港

文献链接：

https://doi.org/10.1287/opre.2018.1832

01 研究背景

我们考虑一个动态分类选择问题，其中零售商在每一轮中提供N种可替代产品的子集(分类)给消费者，消费者根据多项式logit (MNL)选择模型从这些产品中选择一种。零售商观察这种选择，目标是动态学习模型参数，同时优化长度为T的销售范围内的累积收入。我们将这种探索-利用公式称为MNL-Bandit问题。

本文中，我们给出了一种新的有效的算法，可以同时探索和利用任何问题参数，而无需先验知识。此外，该算法是自适应的，在“良好分离”的情况下，它的性能接近最优，在这种分离不需要保持的一般参数设置中。

02 模型建立

1.购买概率：

零售商有N个产品, 𝑖: 𝑖∈{1,2,⋯ , 𝑁}，在 t 时刻选择提供产品组合S_t⊂{1,2,⋯ , 𝑁}。消费者在 t 时刻的购买选择c_t∈ S_t∪{0}。消费者的购买概率p_i (S)为

2.预期利润：

产品 i 被消费者购买后零售商获得的利润为r_i，零售商在 t 时刻提供给消费者产品组合 S 获得的预期利润为𝑅(𝑆,𝑣):

3.目标函数：

目标是设计策略π=(π_1,π_2, ⋯ ,π_T )使累计预期收益最大化：

也可以通过遗憾来衡量策略π的性能表现：

03 算法框架

04 实验设置

我们考虑参数化MNL设置，对于所有i, 设置n=10, k=4, ri=1和效用参数v0=1，对于i=1，…N

其中ϵ={0.05, 0.1, 0.15, 0.25}

文献中所绘制的遗憾图如下：

05 代码复现

复现结果：

对于不同的ϵ值，随着进行1000000迭代，累计遗憾的增长逐渐趋于平缓。其中ϵ代表的是最优产品组合与次优产品组合之间的分离程度，可以看出，ϵ越小，即最优与次优之间不易被算法区分，即使这样，本篇文献设计的算法的性能依然可以呈次线性增长。而随着ϵ的增大，算法的性能表现越好。

链接: https://pan.baidu.com/s/1NMuMNglvCImJ-nepAGlA2g

提取码: 0527

识别二维码关注我们

文章推荐人 | 陈正

校对 | 罗陈斌

排版 | 陈正

http://mp.weixin.qq.com/s?__biz=MzAwMTUzOTU1Ng==&mid=2456734622&idx=1&sn=7374d10349119615c27c794d38d5aa07

东南数智港

智能商务分析=数据建模+决策优化+算法实现

最新文章

成果快照 | 用于长尾市场需求估计的机器学习

学术活动 | 团队成员参与2024年江苏省研究生“管理科学与工程”学术创新大赛

成果快照｜中国与美国关税战争对中国经济的影响

成果快照 | 贸易战与产业政策竞争：解读中美经济冲突

成果快照 | 期权合约和需求模糊条件下救灾物流的两阶段分布式稳健优化

数字经济运营系列讨论(九)——服务渠道

成果快照 | 结合天气信息的鲁棒无人机配送

数字经济运营系列讨论(八)——渠道入侵中的质量决策和信息分享

成果快照| Refined Models for Efficiency-Driven Queues

成果快照 | RSOME使鲁棒随机优化简单

成果快照 | 不确定考虑集下的需求估计

数字经济运营系列讨论(七)——鲁棒优化

成果快照｜具有代金券销售的报童模型：分布鲁棒方法

成果快照 | 存在预期后悔的消费者搜索

成果快照 | 医疗谣言在社交网络中的传播与控制：一种具有高度不对称网络结构的广义扩散模型

算法复现|利用约束与列生成方法求解两阶段鲁棒优化问题

成果快照 | 数字内容平台上的广告和内容创作

成果快照 | 在线市场中合作竞争卖家的信息共享

学术活动 | 团队成员参与中国运筹学会企业运筹学分会第十七届学术年会

算法复现 | 数据驱动的报童问题：新的界限和见解

算法复现 | 通过两两比较进行排序

学术活动 | 团队成员参与2024管理科学与工程学会协同创新与管理分会

学术活动 | 团队成员参与2024年中国POMS国际会议

团队纪实 | 十年同行永不止步

学术活动 | 团队成员参与第七届智能制造系统工程学术会议

学术活动 | 团队成员前往美国明尼阿波利斯参加2024年POMS年会

学术活动：团队成员参与第二届数据驱动决策智能优化国际研讨会（日本松江）

算法复现 | 基于目标的资源池问题

算法复现 | MNL-Bandit:分类选择的动态学习方法

成果快照 | 多阶段选择模型的定价优化

成果快照 | 随机优化中样本复杂度的改进界限

喜报｜我院博士生获首批国家自然科学基金青年学生基础研究项目资助

成果快照 | MMNL模型下的联合品类优化和个性化

成果快照 | 分销渠道中奢侈品的社会定价

成果快照 | 利用赞助广告在线上零售市场中的平台操纵

成果快照 |开放还是封闭？技术共享、供应商投资和竞争

成果快照 | 供应商入侵、信息分享和在线零售平台的渠道结构

成果快照 | 数字时代的广告消费：注意力与广告内容

成果快照 | 竞争环境下的平台信息共享与商业模式选择

成果快照 | 在线独家还是混合销售？实施送货到店的渠道销售策略

数字经济运营系列讨论（六）——行为运营初探

数字经济运营系列讨论（五）——亦敌亦友：竞争中的优势共享策略

学术活动 | 团队成员参与第十五届行为运筹学与行为运营管理国际研讨会

学术活动 | 团队成员参与第四届（2023）全国供应链与运营管理学术年会

算法复现 | 考虑顾客搜索成本与预期后悔的选择过载行为建模

成果快照 | 投资者情绪与股票横截面收益

成果快照 | 基于抽样的有容随机库存控制模型近似方案

成果快照 | 面向大规模数据驱动的品类优化的部分排序选择模型

算法复现 | 针对具有异质性顾客在多个销售渠道下的数据驱动的体育门票定价

成果快照 | 质量信息不对称下网络中介平台开放的影响

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉