上海交大姚韬教授在顶刊MS上发表：多臂老虎机算法用于高维数据决策

学术 2024-11-16 11:37 北京

undefined

据MS官网显示，来自阿里巴巴达摩院的Xue Wang、纽约州立大学布法罗分校的Mike Mingcheng Wei、上海交通大学的姚韬，合作的论文“Online Learning and Decision Making Under Generalized Linear Model with High-Dimensional Data”在国际管理学顶刊《Management Science》线上正式发表。

Title: Online Learning and Decision Making Under Generalized Linear Model with High-Dimensional Data

在线学习和决策制定在广义线性模型下的高维数据

作者简介

undefined

Xue Wang

阿里巴巴达摩院

Mike Mingcheng Wei

纽约州立大学布法罗分校

姚韬

上海交通大学安泰经管学院

摘要

We propose a minimax concave penalized multiarmed bandit algorithm under the generalized linear model (G-MCP-Bandit) for decision-makers facing high-dimensional data in an online learning and decision-making environment. We demonstrate that in the data-rich regime, the G-MCP-Bandit algorithm attains the optimal cumulative regret in the sample size dimension and a tight bound in the covariate dimension and the significant covariate dimension. In the data-poor regime, the G-MCP-Bandit algorithm maintains a tight regret upper bound. In addition, we develop a local linear approximation method, the two-step weighted Lasso procedure, to identify the minimax concave penalty (MCP) estimator for the G-MCP-Bandit algorithm when samples are not independent and identically distributed. Under this procedure, the MCP estimator can match the oracle estimator with high probability and converge to the true parameters at the optimal convergence rate. Finally, through experiments based on both synthetic and real data sets, we show that the G-MCP-Bandit algorithm outperforms other benchmarking algorithms in terms of cumulative regret and that the benefits of the G-MCP-Bandit algorithm increase in the data’s sparsity level and the size of the decision set.

本文提出了一种在广义线性模型（G-MCP-Bandit）下的最小最大凹形惩罚多臂老虎机算法，用于在线学习和决策环境中面对高维数据的决策者。本文证明，在数据丰富的环境下，G-MCP-Bandit算法在样本大小维度上达到了最优的累积遗憾，并在协变量维度和显著协变量维度上得到了紧密的界限。在数据匮乏的环境下，G-MCP-Bandit算法保持了紧密的遗憾上界。此外，本文开发了一种局部线性近似方法，即两步加权Lasso过程，用于在样本不是独立同分布的情况下，为G-MCP-Bandit算法识别最小最大凹形惩罚（MCP）估计器。在这一过程中，MCP估计器可以以高概率匹配到神谕估计器，并以最优的收敛速率收敛到真实参数。最后，通过基于合成数据和真实数据集的实验，本文展示了G-MCP-Bandit算法在累积遗憾方面优于其他基准算法，并且G-MCP-Bandit算法的优势随着数据的稀疏度和决策集的大小而增加。

Tips：“机器学习在经济金融领域的应用”研讨会即将举办，欢迎对机器学习方法及其应用感兴趣的学者和学生报名！

为了我们不走散，学说请你加星标

疯狂暗示↓↓↓↓↓↓↓↓↓↓↓

http://mp.weixin.qq.com/s?__biz=Mzg3NzU5OTcyNg==&mid=2247622100&idx=2&sn=c18e181c78f037beac2cea1383134fc1

学说平台

“学说”平台（www.51xueshuo.com）是清华大学孵化的专业知识传播平台，平台利用学术大数据和人工智能技术，通过学术直播、音视频分享和个性化推送，推动经济金融领域的学术交流和普惠，促进中国科技创新传播与最佳商业实践分享。

中科大张鑫、程丽红、余玉刚，合作论文在信息系统顶刊ISR上发表！

港科大梁健熙教授在会计学顶刊TAR上发表：信用评级是否反映了关于SEC调查的私人信息

预告 | 清华大学科技创新中心与科研城市论坛

比特币价格创历史新高，如何看待挖矿？回顾区块链经济学被引最高的RFS经典论文

预告 | 国际公共部门会计准则理事会(IPSASB)动态与可持续报告准则最新进展——会计准则公益大讲堂第四期

解锁AI+金融 | QS排名全球第八新加坡国立大学人工智能与金融项目

不知道稳健性检验怎么做？来看看这篇顶刊8种稳健性检验

诺奖得主托马斯·萨金特等顶级学者阵容，人工智能经济学研讨会即将举办！

上财靳庆鲁教授和马慧教授等，合作论文在管理顶刊MS上发表！

NBER最新中国故事：特朗普关税引起的中美贸易战，加速了越南北部城市经济增长

突破！广西大学青年教授发表运筹顶刊《Operations Research》！

连平：特朗普重新执政对中国经济影响几何？

报名即将截止 | “机器学习在经济金融领域的应用”研讨会

上海交大姚韬教授在顶刊MS上发表：多臂老虎机算法用于高维数据决策

NBER中国故事：以明朝覆灭为例研究精英家族策略

预告 | 中国会计学会管理会计专业委员会2024年学术年会

CEO与分析师同名会导致信息偏袒？港中深黄侃元教授PNAS论文

浙大陈帅、港中深张鹏等在AEA P&P发表中国故事：空气污染与心理健康

什么是高质量的学术人才评审？——基于2352名评审专家的调查报告

预告 | 2024中国工业经济学会数字化与创新学科专委会年会暨第十届大数据产学研论坛——人工智能与经济高质量发展

预告 | 2024科学与技术预测前沿学术论坛

港中深陈睿、西南交大陈若然、南科大王宇、港科大王譞合作发MS！

央财彭章、北大施新政教授，合作发表FM：犯罪对企业就业的有害影响

暨大&福大老师在FM发表中国故事：2015股灾之后，国家队股权对公司业绩有何影响？

预告 | 2023-2024年度数字经济开放研究平台年度峰会

北大孟涓涓教授在PNAS发表评论：大语言模型如何模仿人类行为特征

港大助理教授发表顶刊MS：存在双重道德风险时的动态合同设计

独生子女婚配成为中国贫富差距扩大主因

华中科技教授在FM发表中国故事：中美贸易战对中国企业创新的影响

NBER中国故事：利用机器学习大规模挖掘中国历史资料

中国故事再次登上AEJ | 国际朋友与敌人

中国故事获2023年MS最佳论文 | 政策不确定性与企业创新

教授亲历：国内国外学术会议的10个区别

上交刘佳璐、上财裴思琦、港中文张晓泉，合作发表管理学顶刊MS！

港城李烜博教授，发表会计学顶刊JAR：商业关系是否影响ESG评级

预告 | 2023-2024年度数字经济开放研究平台年度峰会

预告 | 国际商务中文教育学术会议暨国际商务中文教师人才培训活动

《American Economic Review》11月刊目录及摘要

港理工黄文利老师机器学习论文在会计学顶刊CAR发表！

港大熊琰、多伦多大学杨立岩教授，合作发表金融学顶刊《Journal of Financial Economics》!

2025QS亚洲大学排名发布！北大港大新国立蝉联前三

预告 | 第二十一届中国金融学年会

浙大、人大教授等JPE论文见刊，2024年11月刊目录及摘要

武大沈思晨研究员、港大邹宏教授，合作发表管理学顶刊MS！

预告 | 国际商务中文教育学术会议暨国际商务中文教师人才培训活动

香港大学助理教授发表会计学顶刊JAR！独作！

《经济研究》宣布2025年开始公布论文数据、代码及附录！

中国故事登上会计顶刊TAR：信用报告对贷款违约率和使用率的影响

《Review of Financial Studies》11月刊目录及摘要

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉