COPT里的线性规划与整数规划

科技 2024-10-16 20:03 德国

Outline

1. 数学规划应用与难度

2. COPT的LP开发流程图

3. COPT的IP开发流程图

4. 一点总结

======================

1. 数学规划应用与难度

数学规划，运筹优化，这个从2015年开始，社会上对这方面的需求越来越多。当然，跟大数据、人工智能、深度学习什么的肯定不是一个数量级的，仍然属于小众学科。目前社会上对数学规划的需求，实际应用占比，15%的线性规划(LP)，79%的混合整数规划(MIP)，6%的非线性规划(NLP).

其中，整数规划难度最大，是典型的NP难问题，只有非多项式时间的精确算法。编一个线性规划求解器大约需要5万行代码，整数规划求解器大约需要100到200万行代码，非线性各个模块大约规模是10万行代码左右。

======================

2. COPT的线性规划求解流程图

预处理部分的主要工作就是识别一些变量或者消除一些约束，尽量固定一些变量，尽量减少一些约束。预单变量约束消除这个可能就是变成单变量上下界的形式。这个Presolve的东西有时候当我们需要特定结果时，需要人为关闭这个功能，否则有可能模型还没有到调用具体算法的阶段就被预处理直接求解完了。

具体求解的过程，正儿八经的线性代数的东西，A=LU的LU分解，L是lower triangular matrix, U是upper triangular matrix. 想想高斯消元法求解线性方程组的事情。

单纯形法里的Pivoting那个，只是一个环节。这个环节有很多启发式的东西，其实就是有很多非基变量可以进基时，选哪个？这个其实没有明确的结论，一般图省事，我们会用最简单的规则来选择满足需要的进基变量，比如最小下标规则。
先选哪个，再选哪个，这个事情整体上影响的是求解过程，也可以理解成迭代过程。有可能好的规则下，只需要迭代50步就完事了，差的规则下需要迭代100步。这个事情在列生成时也会遇到。
另外，就是还有循环那一茬，某个非基变量进基变成了基变量，有可能在后面的继续迭代过程中又被排挤出去了，后面的继续迭代过程中发现又被加进去了，就导致了循环，这个也是有一些规则的，防止循环。

单纯形法与内点法
单纯形法严格意义上讲不是多项式时间算法，是一个指数时间算法，但是它的实际表现，average performance不错。内点法才是严格意义上好的多项式时间算法，这个是有数学证明的。
现在大部分教材还是教单纯形法，一方面是因为它的表现不错，另外一方面是它有很好的几何结构和性质，而且很多高级算法都要依赖于单纯形法，比如Gomory’s cut就是从最优单纯形表里来，Column generation寻找满足条件的列也是参考单纯形表里的非基变量检验数的事情。而内点法powerful的地方在于首先是表现好是一方面，这个还能用来解非线性规划，这一点simplex method不行。

======================

3. COPT的整数规划求解流程图

对于整数规划的精确求解而言，其实就只有3种方法，cutting plane, branch-and-bound, dynamic programming.其中割平面法与分支定界法是普适性的方法，而动态规划是适用于求解某一个特殊的问题，能划分阶段，能界定出来状态变量、决策变量什么的，而且得能刻画出来阶段之间的关系。

从发展历程上来看，是先有割平面法再有分支定界算法。割平面法参考Gomory’s fractional cut那个，把一个IP问题松弛成LP问题，再不停的加割，直到得到一个整数解为止。这个方法是有理论保证的，通过这种方式不停加割，最终一定能得到一个整数解。只是有可能每次加的割都是切割掉了一点点可行域，结果需要加很多很多割才能得到整数解，所以收敛很慢。所以对于割这个事情，一个很重要的研究就是每次去找一些强有效的割，尽可能多的切割可行域。对于IP问题而言，基本上所有算法的初衷都是尽可能地缩小可行域，以方便寻找。

分支定界这个是目前最基础、最核心的求解IP问题的算法框架，基本上但凡涉及到整数规划问题，都绕不过这个B&B去，哪怕那些高级算法column generation, row generation, benders decomposition等，其实都是在折腾一个个的node，最外层还是得包一层B&B.
但凡以Branch-and-XXX命名的算法，最外层都是B&B，内核上都是在折腾一个个的node，而折腾node的目的是为了得到更好的upper bound或者lower bound, 从而在B&B tree上进行尽可能多的剪枝操作。
B&B tree的搜索过程就是去求解一个个的node, 每个node都是一个LP model.如果没有什么其他技巧的话，对于一个min问题而言，每个node求解得到的非整数解就是下界，碰巧找到的整数解就是上界，整数解是用来剪枝的。

求解器的控制台输出，一行对应着一个节点，如果这一行上有“H”或“*”的标记，表明求解器在求解这个node时用了一些heuristic的技巧，或者取整了，或者加了什么cut，从而得到了整数解。这些技巧是发生在node上的。
而对于B&B本身而言，核心的东西就2个，(1) 选择分支变量；(2) 选择节点。这里有很多技巧。但是不管是什么技巧，目的都是为了剪枝，为了尽可能地减少B&B tree的node数量。

B&B + cutting plane组合起来，就是branch-and-cut了，这个是目前所有求解器都在用的解整数规划的框架。
B&C = Branch-and-Cut
B&P = Branch-and-Price, 这个price的事情是发生在node内部的，解子问题付出的代价。
B&P&C = Branch-and-Price-and-Cut
B&BC = Branch-and-Benders cut
大部分高级算法都是在折腾node里面的求解过程，目的是为了得到更好的上界或下界。而B&B本身是那个分支定界树，这里的技巧是在分支定界树上怎么遍历。这是两个不同的层级。

======================

4. 一点总结

做整数规划精确算法相关的研究，要发paper，设计开发的算法肯定要比求解器好才行，否则没有意义。

对于求解器而言，在解一个模型时，它能够通过一些预处理来收紧变量的界，或者减少一些冗余约束，也能识别一些特定的约束结构，从而调用一些针对性的加割模块，以加速求解。但是对于求解器而言，它不会识别变量本身的意义，也不在意什么第一阶段、第二阶段（这个可能就是人与机器的区别）

比如对于选址路径问题而言，我们可能用变量y表现选址决策，x表示路径决策，对于这类问题我们会考虑如果这个事情能够先选址再决策路径，对问题进行分解，整个事情也许会被简化。或者对于一个模型的约束而言，我们能够理解某个约束，比如那些耦合约束，这些东西就是导致问题复杂难求解的原因，我们会考虑能否通过拉格朗日松弛的方式把这个难点给处理掉，从而降低问题的难度。

对于每一个复杂的问题，做出来模型之后，上求解器，发现很难求解，才有做研究的必要。而识别计算瓶颈，具体明确这个问题为什么求解起来这么费劲，是什么约束很复杂，还是说什么变量的取值有什么特点等，进一步怎么处理这些困难点，这就是做研究本身了。

对于复杂问题设计一些复杂的算法，往往是基于分解的路线来做。如果只是套用某些分解框架的话，很有可能整体上求解下来，还不如求解器硬解来的快。设计一个好的算法，往往是方方面面都要考虑，比如核心是分解，再加上很多其他技巧，这样才有可能超过商业求解器。

把事情做到极致，这也是个很艺术的事情。

整数规划的建模与求解都是挺有艺术性的事情。

-------------------------------

ps. 关于COPT的内容来自上财葛冬冬老师的讲座，杉数科技的创始人，斯坦福的博士，叶荫宇老师的学生，运筹优化领域里的大佬级别的人物。

http://mp.weixin.qq.com/s?__biz=Mzk0ODMwMjMwMA==&mid=2247681268&idx=2&sn=152ff2bce4a9346102c8c5cef0129e86

运筹OR帷幄

致力于成为全球最大的运筹学中文线上社区

最新文章

供应链｜OR论文精读：在不确定考虑集合下的需求估计

Qaekwy，一个崭新的Python运筹优化库

交通 | Introduction to Linear Optimization——从分离超平面到对偶的反向论证

运筹优化库PyMathProg使用介绍

【运筹OR帷幄】一周博士申请&会议信息汇总--2024.10(3)

交通 | Introduction to Linear Optimization——Farkas引理及其应用

主编推荐 | 当我们求解数学规划问题时，如何区分数学建模和算法设计

供应链｜MnSc论文精读：采用 RSOME 轻松实现稳健的随机优化

【10.19全球美食圆桌交友会纽约站】探讨全球价值洼池：欧洲VS北美？

优化 | 整数规划预求解算法的核心技术：Domain Propagation

全奖｜澳洲阿德莱德大学招收能源系统方向博士

供应链｜POMS论文精读：新产品生产时机内生下的竞争厂商信息共享

COPT里的线性规划与整数规划

服务运营 | POMS: 分销渠道中奢侈品的社会定价

学界|澳大利亚阿德莱德大学招募博士(复杂能源基础设施的稳健解决方案)

服务运营 | 上门配送成本控制：如何通过激励机制优化成本？

FelooPy，一个Python的算法建模集成库介绍

论文速递|Management Science 月9文章合集

除了经典优化问题的求解，利用Pyomo还可以做什么

【运筹OR帷幄】一周博士申请&会议信息汇总--2024.10(2)

读博士，去哪找那么多创新点？水水得了...

最新的几个VRP问题求解的开源工具

优化 | 分块结构整数规划的增广拉格朗日方法：论文详细解读及代码复现

学界招聘|奥地利格拉茨科技大学招募算法与复杂性博士后

优化 | 边缘智能的新时代：端侧大模型的研究进展综述

全奖｜西班牙巴塞罗那招收离散与计算几何专业博士

优化 |『运筹OR帷幄』优化版块2024招新

中国运筹学会数学规划分会第十届研究生论坛第一轮通知

INFORMS 2024 Fellow：表彰拯救生命算法和全球供应链等领域的杰出贡献者

学界招聘|韩国基础科学研究所离散数学小组招募研究员

报道 | 2024年11月-2024年12月国际运筹优化会议汇总

『运筹OR帷幄』招募令 | 期待你的加入

【运筹OR帷幄】一周博士申请&会议信息汇总--2024.10(1)

优化 | 如何判断一个变量是否是冗余的？

一款小型求解器使用介绍

优化 | Gurobi 加速混合整数规划问题求解速度的建议

东南大学交通学院运输与物流工程系董智捷教授团队诚聘硕士、博士、博士后及研究助理

直播预告｜神户大学Yusuke Zennyo：零售竞争与商业模式的多产品视角「Ad OR Talk 11」

【运筹学】硕博申请指导、科研背景提升（限时特惠）

服务运营 | 医疗谣言在社交网络中的传播与控制：一种具有高度不对称网络结构的广义扩散模型

全奖｜年薪20W+，英国华威大学招收多智能体系统及其相关领域博士

架起工业界和学术界的桥梁！『运筹OR帷幄』商务合作指南

『运筹OR帷幄』创新学术成果宣传栏目，为论文插上翅膀

服务运营 | POMS论文精读：特征驱动的鲁棒手术调度

直播预告｜神户大学Yusuke Zennyo：零售竞争与商业模式的多产品视角「Ad OR Talk 11」

优化 | 整数规划预处理 Clique Merge 算法

全奖｜年薪30W+，维也纳技术大学招收人工智能博士

供应链 | 供应链中的后悔效应：解密买方势力下的战略博弈

供应链 | 经典文献解读：报童问题与库存管理中经典模型与优化策略解析

交通 | 基于自适应多图卷积和注意力机制的多模式交通系统短时客流预测模型

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉