成果快照 | 随机优化中样本复杂度的改进界限

文摘 2024-04-26 18:27 美国

文章链接：

https://doi.org/10.1287/opre.2018.0340

PART/1

研究背景

现实中的网络优化问题在优化阶段经常涉及不确定参数，随机优化是解决这种不确定性的一种关键方法。本文给出了在随机优化问题中SAA方法所需要的样本数量的上界。改进来了现有方法的样本复杂度，对应用在该框架下的方法提供更快的近似算法，如随机Steiner树问题等。

PART/2

文章模型

随机优化问题举例——两阶段不限容的工厂选址

假设有一个可能的工厂选址集合F_0和可能的客户集合C_0。实际的客户集合C_1是C_0的一个子集，是随机的。现在的问题是选择一个合适的工厂选址集合F_1（是F_0的子集）以最小化这些工厂的建造成本总和以及客户具体最近的工厂的距离总和。

在第一阶段，利用C_1的分布信息构造一个初始的工厂集合F_2；在第二阶段，采样获得C_1的分布，扩充F_2输出一个完备的解F_1。

这个两阶段优化问题的难点在于第二阶段的求解耗时较长，以及很难去平衡求解成本（第一阶段较低，第二阶段较高）和准确度（第一阶段的概率和第二阶段的准确度）。

在工厂选址问题的例子中，通常认为应该选择尽可能少的工厂以最小化目标函数。假定在第一阶段中每一个候选的客户j∈C_0以一个未知概率p_j出现，且与C_1中的其他客户独立。或者更现实一点，有一个可以从分布中抽取C_1的盲盒，输出任意数量的想从第一阶段得到的样本。在上面这两种分布假设下，两阶段随机工厂选址的目标是在第一阶段更加精确地提供F_2，并且在第二阶段当C_1揭示时选择近优的附加工厂。

两阶段随机规划：

假定X是有限的，且该模型是一个离散优化问题，解集也是从一个有限族中选取。随机变量ω的概率分布为π，ω∈Ω。Resource action r∈R需要被采取以保证场景ω的需求被满足。在两阶段模型中，c(x)表示第一阶段采取行动x的成本。给定一个特定的情景ω和第一阶段行动x，第二阶段的成本q(x,ω)表示为：

其中cost项表示情景ω下第一阶段采取行动x，第二阶段采用行动r的第二阶段成本。

要解决问题（1），有一种方法（SAA，sample average approximation）是采集N个独立样本ω_1,…,ω_N（服从分布π），用如下的样本平均函数近似f：

现在要讨论的问题是，问题（3）的解也是问题（1）中f的一个较优解。进一步定义

如果x^满足上述条件，则说它是函数f的一个α近似最小值解。

PART/3

研究问题

(1) 样本数量需要多少？

(2) 假定预期的准确度为1-ε，置信度为1-δ。给定ε和δ，N要多大才能使得（3）中的最优解有1-δ的概率是函数f的（1+ε）近似最小值解?

PART/4

研究结论

1.假设

（1）非负性

（2）第一阶段行动为空（第一阶段成本最小，但第二阶段会产生极高的成本）

（3）界定膨胀因子（第二阶段的成本——第一阶段不采取行动与第一阶段采取x行动的，相差不会超过λc(x)。

2. 改进的样本复杂度上界

本文提出的改进样本复杂度如定理2所示。

样本复杂度至少为：

才能以1-δ的概率得到1+ε近似优的解。

3. 定理2证明

用Chernoff bound得到引理1：

设置一个阈值M1，将所有的情景ω_1,ω_2,…划分成两个子集，分别表示为高和低。随机分解第二阶段的成本。

令Z*=f(x*)，其中x*是函数f的最小值解。令M1=λZ*/ε，用于将scenarios划分成两类——q(0, ω)≥M1划分为高，其余的划分为低。假定有N个独立样本ω_1,…,ω_N（服从分布π）令，其中

令其中的

期望是关于N个独立样本ω_1,…,ω_N的。因此，

令p=Pr[ω为高]，有

本文证明了：

A+B以一个高概率等于：

令A=A1+A2，其中：

证明了以下claim：

得到：

识别二维码关注我们

文章推荐人 | 付严亮

笔记审核人 | 王子川

校对 | 罗陈斌

排版 | 邹维海

http://mp.weixin.qq.com/s?__biz=MzAwMTUzOTU1Ng==&mid=2456734508&idx=1&sn=b8d8c05a58d8840c49176719ffef3ee3

东南数智港

智能商务分析=数据建模+决策优化+算法实现

最新文章

成果快照 | 用于长尾市场需求估计的机器学习

学术活动 | 团队成员参与2024年江苏省研究生“管理科学与工程”学术创新大赛

成果快照｜中国与美国关税战争对中国经济的影响

成果快照 | 贸易战与产业政策竞争：解读中美经济冲突

成果快照 | 期权合约和需求模糊条件下救灾物流的两阶段分布式稳健优化

数字经济运营系列讨论(九)——服务渠道

成果快照 | 结合天气信息的鲁棒无人机配送

数字经济运营系列讨论(八)——渠道入侵中的质量决策和信息分享

成果快照| Refined Models for Efficiency-Driven Queues

成果快照 | RSOME使鲁棒随机优化简单

成果快照 | 不确定考虑集下的需求估计

数字经济运营系列讨论(七)——鲁棒优化

成果快照｜具有代金券销售的报童模型：分布鲁棒方法

成果快照 | 存在预期后悔的消费者搜索

成果快照 | 医疗谣言在社交网络中的传播与控制：一种具有高度不对称网络结构的广义扩散模型

算法复现|利用约束与列生成方法求解两阶段鲁棒优化问题

成果快照 | 数字内容平台上的广告和内容创作

成果快照 | 在线市场中合作竞争卖家的信息共享

学术活动 | 团队成员参与中国运筹学会企业运筹学分会第十七届学术年会

算法复现 | 数据驱动的报童问题：新的界限和见解

算法复现 | 通过两两比较进行排序

学术活动 | 团队成员参与2024管理科学与工程学会协同创新与管理分会

学术活动 | 团队成员参与2024年中国POMS国际会议

团队纪实 | 十年同行永不止步

学术活动 | 团队成员参与第七届智能制造系统工程学术会议

学术活动 | 团队成员前往美国明尼阿波利斯参加2024年POMS年会

学术活动：团队成员参与第二届数据驱动决策智能优化国际研讨会（日本松江）

算法复现 | 基于目标的资源池问题

算法复现 | MNL-Bandit:分类选择的动态学习方法

成果快照 | 多阶段选择模型的定价优化

成果快照 | 随机优化中样本复杂度的改进界限

喜报｜我院博士生获首批国家自然科学基金青年学生基础研究项目资助

成果快照 | MMNL模型下的联合品类优化和个性化

成果快照 | 分销渠道中奢侈品的社会定价

成果快照 | 利用赞助广告在线上零售市场中的平台操纵

成果快照 |开放还是封闭？技术共享、供应商投资和竞争

成果快照 | 供应商入侵、信息分享和在线零售平台的渠道结构

成果快照 | 数字时代的广告消费：注意力与广告内容

成果快照 | 竞争环境下的平台信息共享与商业模式选择

成果快照 | 在线独家还是混合销售？实施送货到店的渠道销售策略

数字经济运营系列讨论（六）——行为运营初探

数字经济运营系列讨论（五）——亦敌亦友：竞争中的优势共享策略

学术活动 | 团队成员参与第十五届行为运筹学与行为运营管理国际研讨会

学术活动 | 团队成员参与第四届（2023）全国供应链与运营管理学术年会

算法复现 | 考虑顾客搜索成本与预期后悔的选择过载行为建模

成果快照 | 投资者情绪与股票横截面收益

成果快照 | 基于抽样的有容随机库存控制模型近似方案

成果快照 | 面向大规模数据驱动的品类优化的部分排序选择模型

算法复现 | 针对具有异质性顾客在多个销售渠道下的数据驱动的体育门票定价

成果快照 | 质量信息不对称下网络中介平台开放的影响

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉