COPT的AI+MIP求解能力当前极限在哪里？

文摘科技 2024-02-29 11:42 湖北

杉数于过年期间发布了COPT 7.1版本，新增了能在GPU上运行的LP求解器，我年后复工第一时间便要来尝鲜。看到能在GPU上丝滑运行，求解很多此前无法求解的超大LP问题，不得不感慨杉数总能带来惊喜。

H100 GPU（图片来源：NVIDIA官网）

求解器COPT自带MIP调参

求解更快效果更优

其实我一直以来主要关注的还是MIP问题，去年底遇到了几个实际问题用COPT求解比Gurobi慢，我问COPT团队的葛冬冬老师如何提速。葛老师给我推荐了COPT自带的调参器。我先试了手头的一个小问题，通过几分钟的时间，调参器找出了能从15秒提升到8秒的参数组合。在另一个大规模的问题上则是花了一晚上，找出的参数组合可以从默认1小时解不出提升到300秒之内完成求解。

对于这个结果，葛老师解释说：这是由于MIP求解器内的各种启发式和割平面等模块实在是太多了，开发求解器时很难把每个模块的状态都调到最优。如果给全部的模块都开到最大强度，那些不起作用的模块就会拖慢整体的求解速度；反之如果降低强度则又可能影响求解效果，例如减少割平面的数量或轮次，则可能影响MIP的对偶边界的收敛速度。因此商业求解器一般的做法是将启发式、割平面以及预求解等强度预先设置在一个较为“适中”的程度，通过调参数来找到针对客户问题的最佳配置。由于客户模型往往结构相同，只是规模上有区别，或者是每次求解数据不太一样，因此对同一个客户来说，往往一套参数能用很长时间。在MIP领域调参数是将求解器和实际模型适配的一个重要步骤。

听完了葛老师的解答，我忍不住问了个略显刁钻的问题：那MIP打榜的240个算例，是不是也能通过调参找到更好的参数呢？杉数是不是已经给每个问题都调到最优了？

葛老师告诉我说：按照通行惯例，COPT和国际几个大的求解器都没这么做，也是大家默认竞争的一个基础。通过打榜是想展示求解器面对客户问题的真实实力，而不是每个MIP问题都调到最优的结果。其实一些其他厂商一直以为国产求解器打榜就是这样做的，但我们是真的没有。不信拿COPT调参器试试看就知道了。

听了这番话，我刻意选了一个MIPLIB榜单里面，COPT已经是最快的算例co-100来试试看。根据Hans Mittelmann教授测评榜单的信息：COPT求解这个问题需要166秒，而Gurobi需要292秒，所有其他求解器均需要10分钟以上。结果COPT的调参器花了不到两个小时，便找出了改进参数HeurLevel=0和 TreeCutLevel=3。在和Hans Mittelmann同配置的台式机上 (配置为Intel 11700K，64G内存)，COPT的求解时间从166秒缩减到了121秒，速度提升达37%之多。

葛老师说有这个结果一点都不奇怪。因为一个正常的MIP求解器就是这样，针对每一个具体问题，调调参数往往都能找到更好的选择。他进一步说：其实杉数内部会每隔一段时间都会对收集到的算例进行一次调参，看看能不能从调参数的结果中发现一些可以解的更快的客户问题，以及辅助研究如何更优化的配置各项算法的默认强度等。葛老师说最近一次大规模的调参数正是春节假期，其中MIPLIB测评集上240个问题，有80%都能找到比默认更好的参数。

我有点不太敢相信，便问葛老师把这套参数要来，在我的和Mittelmann同配置的台式机上验证了一下。可能由于使用了最佳参数，一个周末就全验算完了。我统计了结果，惊讶的发现，调参后的版本，不仅比榜单上的默认版本能多求解5个算例，平均求解时间更是从103.8大幅下降到了62.6，快于gurobi榜单上的72.1，求解速度领先达15.2%！！这真是太难以置信了！！(完整的求解时间和改进参数有兴趣的读者可以联系我或者葛老师)

MIPLIB 2017 测评集5个COPT 7.1通过调参能解出的算例

COPT探索AI+MIP求解

再一步提升求解能力

葛老师开玩笑的说，如果我们也claim一个机器学习嵌套的求解器，用这个作弊的话，很容易就显得比Gurobi好的挺多了，似乎就世界第一了，其实意义不大。COPT和Gurobi、Cplex、Xpress现在大家都还是处在一个良性竞争的环境，大家互相竞争，也默守着这些不成文的规定。

面对我的惊讶，葛老师却告诉我说：其实这个只是调了十余个相对宏观的公开参数的结果。如果允许调其他上百个未公开的参数，则总体效果会更上一个台阶。他说：比如就割平面而言，公开的参数一共有三个CutLevel、 RootCutLevel 和 TreeCutLevel，分别用于指定全局，根节点和分支定界时的割平面强度。然而，COPT内部有几十种割平面可供选择，如果一个问题通过调割平面能把求解器速度调快，那完全可以进一步只选出那些起作用的割平面算法，关闭不起作用的，这样还能更快。同理，百种启发式算法，和几十种不同的预求解模块也各有单独的参数控制其强度和开关，这些都可以更深入的调整。杉数在拿到客户算例时，一般都会协助精调这些参数，帮助客户把求解器和模型适配到最佳状态。

葛老师来了兴致，他继续说：你看Gurobi默认可以求解229个问题，而我们默认能求解220个，调参数版能解出225个。实事求是的说，COPT和对方还是有一定差距的，总还是有一部分问题，Gurobi能较快解的出，我们调参数也很吃力。这种时候我们就会组织开发的力量集体攻坚。目前看来，都能搞定。最近一年需要解决的客户问题比较多，不太有时间关注MIPLIB榜单。但是我们发现解决了客户的实际问题时，最终新增的模块或者改进后的算法实现，往往对MIPLIB这样的榜单又有速度提升的帮助。这属于是无心插柳了。当然也不是所有的客户都愿意分享他们的算例，有些客户尤其是国外客户，拿COPT和现在用的其他国外商业求解器一比，发现COPT慢也往往不联系我们协助调参。针对这种情况，我们也在想办法，比如目前我们正在研究如何通过机器学习的办法，针对实际问题，预先推荐一套参数，让COPT默认就能跑的更好。这项工作其实还挺有挑战性的，我们也欢迎感兴趣的同行一起参与，期盼机器学习领域的专家能加入到这项工作中来。

葛老师最后提到：

他在上海交大刚成立的智能计算研究院团队，将和叶荫宇，何斯迈等著名学者一起，攻坚GPU大规模加速、机器学习和优化算法融合、以及大模型的建模决策路径等前沿问题，也欢迎有志于此方向的年轻学子报考他们的博士（今年秋天就可以入学）。

数据魔术师

有数据的地方，就有机遇

最新文章

第二届智能优化论文写作研讨会参会总结

成果速递|When Gray Markets Meet “Made in China”: The Impacts of...

第二届运筹优化论文写作研讨会报名通知（最终轮）

边流模型与集合划分模型在车辆路径规划问题中的上界或下界的对比

第二届运筹优化论文写作研讨会报名通知（第四轮）

秦虎教授简介

谷粒学堂第六期直播预告：等不到市场“红利”，那就主动出击降本增效！

2024年UTD最新中国商学院科研百强榜发布

第二届运筹优化论文写作研讨会报名通知（第三轮）

【高峰论坛】2024年第二十届物流系统工程暨第八届管理系统工程学术研讨会（第三轮通知）

免费参与 | 专项奖金 | 2024年中国运筹学会运筹竞赛正式开启！

学术前沿 | 彭一杰课题组发文提出了一种解决大规模决策问题的高效蒙特卡洛树节点选择策略

第二届运筹优化论文写作研讨会报名通知（第二轮）

【高峰论坛】2024年第二十届物流系统工程暨第八届管理系统工程学术研讨会（第二轮通知）

第二届运筹优化论文写作研讨会报名通知（第一轮）

论文识萃|基于站点的无人机大型设施巡检(SDIP)的最优分配与路径设计

论文拾萃｜基于Branch-and-Cut的两阶段算法求解考虑储物柜的无人机配送问题

第二期运筹优化技术培训班成功举办

面上项目增幅48.77%，官方发布2024年度国家自然科学基金项目申请集中接收与受理情况分析

论文拾萃｜分支定价切割算法解决紧急停电时基站的发电机分配问题

秦虎教授简介

北京大学武汉人工智能研究院单位介绍

论文拾萃｜分支定价切割算法精确求解单向汽车共享系统中的E-VReP

重要通知 | 第二届工程管理前沿年会（FEM2024）将于7月13-15日在武汉光谷科技会展中心举办

【高峰论坛】2024年第二十届物流系统工程暨第八届管理系统工程学术研讨会（第一轮通知）

谷粒学堂｜选型避坑指南：如何巧妙避开陷阱，掌握供应链优化选型策略？

第二届工程管理前沿年会（FEM2024）第一轮通知

第二期运筹优化技术短期培训班通知（第一轮）

第七届智能制造系统工程学术会议暨“数智时代智能制造技术与管理创新”论坛通知（第二轮）

第二期运筹优化技术短期培训班通知（第一轮）

2024年智能优化应用实践研讨会成功召开

学术报告|本科生智能算法培训系列讲座（2024年4月21日15:00 - 17:00）

【通知公告】2024年管理科学与工程学会“博士学位论文支撑计划”项目申报通知

《中国可持续发展研究报告（2023）》（蓝皮书）重磅发布

2024年北京大学光华管理学院“全国优秀大学生夏令营”通知

谷粒学堂｜链界智能：智能供应链在汽车汽配行业的实战应用

智能制造学域杜娟教授课题组博士后招聘

商学院All in AI：它在吞噬世界

运筹学教学|Logic-based Benders Decomposition技术介绍(一)

谷粒学堂｜链界智能：智能供应链在汽车汽配行业的实战应用

2024年智能优化应用实践研讨会（终轮通知）