2023阿里巴巴全球数学竞赛决赛中的LLM背景题解析（应用与计算数学部分第2题）

教育 2024-06-28 18:08 广东

早点关注我，精彩不错过！

最近闹得沸沸扬扬的姜萍事件果真又成了世界就是个草台班子的有力论据。无论真相如何，各自心怀鬼胎，自有策略的合作看起来就一定是一场场的闹剧。

无意作过多评论，也绝不妄下言论，就观察子弹怎么飞以及飞的过程就够耐人寻味了。

不过，这次事件倒是成功地吸引了我抽空重新关注阿里巴巴全球数学竞赛这一赛事。

可惜这比赛创办之时已不是读书人而是社会螺丝钉，早就没了当年的锐气和勇气去参与和拼搏一番，有的是成人世界的极致权衡的策略罢了。不过既然到这了，我不禁翻开了今年的初赛试题。嗯，确实和以往我熟悉的中等数学竞赛风格还是迥异的。既不是考察如平面几何的奇技淫巧，更不是数学游戏这般门槛极低的大众娱乐，而是看起来还挺严肃的大学数学学科内容。显然这些内容更接近比较小型初等的研究课题，因为这些内容是研究而不是游戏，也没有广泛竞争性，这也体现出这个比赛的独特之处。

索性又再搜索了下去年2023的决赛试题，官方分为了代数数论，集合拓扑，分析方程，应用与计算数学，组合概率5大模块。看来，以人类今天数学知识的厚度，已经默认一个个人类个体应该是难以再出欧拉高斯那样的神仙了，要出就只能期待AI了。看到这些细分领域，除了入门了一点代数、每天应用着计算数学和组合概率仅还算熟悉外，其他内容我已经要很费劲了。毕竟工业生产和理论证明之间，压根就互不依赖。

不过，看到应用与计算数学部分时，不禁眼中一惊，就是下面这题：

居然是以当今最热、货真价实的LLM中的RLHF算法为背景命题的！不愧是互联网公司办的数学竞赛，也算颇具特色了。不过，当我读完、做完以后，不禁也再度感叹，数学和算法，基本可以成为独立的两种能力，只是偶尔被同一个人所具备罢了。一个优秀的LLM的架构师或强化学习的算法研究员，可能压根没仔细思考过以上的证明问题，而引导其走向工业应用成功的能力中，工程能力，算法经验，项目管理，有一大堆东西排在数学证明前面，全都搞定了再来管数学也是不迟的。相反，一个传统的数学家可能也不了解算法的世界，其研究方向可能于工业界在大部分时候没什么用，偶尔的碰撞并不是那么容易发生。更何况，数学的逻辑证明，经常在工业领域被大家都这么用，效果一直不错，就圆过去了，这早就是司空见惯的实用主义逻辑。数学那点东西，实在ROI太低。

不过吧，拿着题，仔细看过想过，不写出来就牙痒痒，就好像有个事没做完，就没法释放大脑已经分配的计算资源来干别的事一样。于是我花了点时间，也查了些资料，给出我的解答：

简单说两句吧。

0. 这种中等以上的数学和前者有明显区别，那就是没有太多人为设置的解题门槛，而是来源于理论和实际问题的困难，比较直接地摆着去解决，不是有答案的解谜猜谜，更像是探秘。像本题，论思维链条的长度，关联广度，对经验的要求，要远远低于一道平面几何题，但是其结论本身又都是有实际价值和意义的，证明的难度其实主要在理解题意的本质，按照定义的本质写出式子，整理一下基本就成了。

1. 强凸函数式指的比凸函数再多一个二次项的值，使得其不仅在切线上方，更高于一条抛物线。这个性质使得函数收敛更快，是神经网络优化中一类加速收敛算法中的核心技术。不过这里对解题帮助不大，凸函数定义正反推导一下就秒了。

2. 从解题而言这算是一个构造类问题。但是，从强化学习排序的角度，其实很容易想到这个构造方式。因为这个G函数本质上是一个单调的非线性映射成分，不要让线性项直接抵消掉，而这里的排序走的是打分+排序的逻辑，因此我们在优化L函数时，一定是sort后取得当下这些r值（连续情况下就是mu分布的样本）排序后来算的，显然这个序要和真实标的相同是前提，而且希望大家都排序的情况下，我打出来的L函数还要更大才好，以区分得最好。于是题意中的这些性质基本就不言自明了。其中最后的加和性质其实是对称序列构造的问题，结构很是巧妙，还有点像Reverse原理的意思。另外，这里的反证法其实看起来是用存在来解决一个任意全程的问题，因为前者的逻辑链条有时好推导，这其实是我们逻辑公理的问题吧，也正好符合了一部分一般思维规律，很自然。

不过吧，没想过这些问题，真不影响做LLM和强化学习。

3. 题目表述还挺有意思，不依赖于c，可不就是常函数嘛，只需要按定义写出原式子是一个泛函导数在c处的值的含义，剩下的直接就是拉格朗日乘子法的结论了。所以只要看懂了定义，写明白了，思维链条倒是不难。但看懂题意定义，基本就代表这部分数学，你得熟练掌握，但不是那种刷题的背诵。

好了，就说到这里，保持对数学、科学和技术的敬畏之心，常读常新，共勉！

附：2023阿里巴巴全球数学竞赛决赛试题地址

https://files.alicdn.com/tpsservice/d2a6b6ee90217712d3e3897b5f4427a1.pdf

我们是谁：MatheMagician，中文“数学魔术师”，原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义，也取像魔术一样玩数学的意思。文章内容涵盖互联网，计算机，统计，算法，NLP等前沿的数学及应用领域；也包括魔术思想，流程鉴赏等魔术内容；以及结合二者的数学魔术分享，还有一些思辨性的谈天说地的随笔。希望你能和我一起，既能感性思考又保持理性思维，享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流！

扫描二维码
关注更多精彩

CATO原理中的数学与魔术（十四）——流程设计思路与升华
魔术里的交代与暗交代（三）——暗交代是怎么做的？
牛顿运动定律的谜团（四）——牛顿定律的数学模型
魔术《4 Kings 折纸》的三重境界（四）——魔术效果的突破
视错觉与魔术（二）——橡皮筋的奇迹

点击阅读原文，往期精彩不错过！

http://mp.weixin.qq.com/s?__biz=MzI2NjQwNzQxMQ==&mid=2247491379&idx=1&sn=a5557defad11f19d263a8cff1b9396ba

MatheMagician

当数学遇上魔术，当理性遇上感性，不仅可以在艺术的殿堂里擦出火花，展现魅力；也能在科学的世界里无所不能，摧城拔寨。马上，就是实现梦想的瞬间。

万圣节cos最像幽灵的竟然是他？！

完美洗牌的秘密（十三）——（反）完美洗牌第二定理的应用（16张的Anti faro周期魔术）

科幻电影中的全息空间影像在现实中快实现了吗？

完美洗牌的秘密（十二）——反完美洗牌定理的应用扩展（三叠发牌巴格拉斯效果）

从《费曼讲义》中，我竟然读出了一部“玄幻”小说……

完美洗牌的秘密（十一）——反完美洗牌定理的应用五（茫茫人海魔术扩展版）

离大谱！居里夫人竟获得了诺贝尔文学奖？

完美洗牌的秘密（十）——反完美洗牌定理的应用四（16张茫茫人海魔术）

半年炫2篇SCI！研究生一定要试一下！SCI论文辅导真的太香！

听说抛个硬币就能拿10万亿奖金，今年搞笑诺贝尔奖花落谁家？

往期精彩20241005

完美洗牌的秘密（九）——反完美洗牌定理的应用三（anti faro shuffle的奇迹等）

调休哪有不疯的？！看物理系博士生如何带你绝地反击……

在国际学校当老师的一天——深圳爱文学校数学魔术授课和访校记录

从广义相对论到规范理论（下）

完美洗牌的秘密（八）——反完美洗牌定理的应用二（感应奇迹）

被朋友拉去听演唱会，可注意力全程被手里这个东西吸引

完美洗牌的秘密（七）——反完美洗牌定理的应用一（指引巴格拉斯效果）

近视眼的人年纪大了后会老花眼吗？

完美洗牌的秘密（六）——完美洗牌定理的应用（penehole's principle magic more等）

从《黑神话：悟空》爆火，看游戏史的第一话

完美洗牌的秘密（五）——完美洗牌的性质和变体

完蛋！我们在实验室里做出了“毒液”

完美洗牌的秘密（四）——（反）完美洗牌第三定理

科学吃瓜—“紫薯”、兴奋剂都是怎么回事儿？

完美洗牌的秘密（三）——（反）完美洗牌第二定理续

外国人念不对中国运动员的名字？科学的解释来了

完美洗牌的秘密（二）——完美洗牌第二定理

“莎头”组合夺冠，他们在赛场上的这个动作，你注意到了吗？

完美洗牌的秘密（一）——（反）完美洗牌定理

我们首次在月壤中发现了水！大家准备种点什么菜?

记2024深圳暑期吴如皓魔术数学研修班活动

从广义相对论到规范理论（中）

易拉罐的奇迹（二）——《易拉罐平衡》与《气体转移》

毕业季，我们的学位服是怎样发展而来的？

易拉罐的奇迹（一）——硬币入可乐

夏天到了，究竟怎样才能越吃越瘦？

2024阿里巴巴全球数学竞赛决赛中的数列题解析（分析与方程方向第4题）

盘点那些年你学不会的物理

2023阿里巴巴全球数学竞赛决赛中的LLM背景题解析（应用与计算数学部分第2题）

从广义相对论到规范理论（上）

CATO原理中的数学与魔术（十四）——流程设计思路与升华

期末复习不完了？助你成为时间管理大师！

CATO原理中的数学与魔术（十三）——综合应用

2024高考数学压轴题解析——数学 VS AI最后的倔强

为啥高考完，学了三年的东西立马忘干净了？

CATO原理中的数学与魔术（十二）——CATO与MAT principle

当练就火眼金睛，看到了一颗原子

CATO原理中的数学与魔术（十一）——Parity Principle及其应用二：集合的可视化

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉