首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
2023阿里巴巴全球数学竞赛决赛中的LLM背景题解析(应用与计算数学部分第2题)
教育
2024-06-28 18:08
广东
早点关注我,精彩不错过!
最近闹得沸沸扬扬的姜萍事件果真又成了世界就是个草台班子的有力论据。无论真相如何,各自心怀鬼胎,自有策略的合作看起来就一定是一场场的闹剧。
无意作过多评论,也绝不妄下言论,就观察子弹怎么飞以及飞的过程就够耐人寻味了。
不过,这次事件倒是成功地吸引了我抽空重新关注阿里巴巴全球数学竞赛这一赛事。
可惜这比赛创办之时已不是读书人而是社会螺丝钉,早就没了当年的锐气和勇气去参与和拼搏一番,有的是成人世界的极致权衡的策略罢了。不过既然到这了,我不禁翻开了今年的初赛试题。嗯,确实和以往我熟悉的中等数学竞赛风格还是迥异的。既不是考察如平面几何的奇技淫巧,更不是数学游戏这般门槛极低的大众娱乐,而是看起来还挺严肃的大学数学学科内容。显然这些内容更接近比较小型初等的研究课题,因为这些内容是研究而不是游戏,也没有广泛竞争性,这也体现出这个比赛的独特之处。
索性又再搜索了下去年2023的决赛试题,官方分为了代数数论,集合拓扑,分析方程,应用与计算数学,组合概率5大模块。看来,以人类今天数学知识的厚度,已经默认一个个人类个体应该是难以再出欧拉高斯那样的神仙了,要出就只能期待AI了。看到这些细分领域,除了入门了一点代数、每天应用着计算数学和组合概率仅还算熟悉外,其他内容我已经要很费劲了。毕竟工业生产和理论证明之间,压根就互不依赖。
不过,看到应用与计算数学部分时,不禁眼中一惊,就是下面这题:
居然是以当今最热、货真价实的LLM中的RLHF算法为背景命题的!不愧是互联网公司办的数学竞赛,也算颇具特色了。不过,当我读完、做完以后,不禁也再度感叹,数学和算法,基本可以成为独立的两种能力,只是偶尔被同一个人所具备罢了。一个优秀的LLM的架构师或强化学习的算法研究员,可能压根没仔细思考过以上的证明问题,而引导其走向工业应用成功的能力中,工程能力,算法经验,项目管理,有一大堆东西排在数学证明前面,全都搞定了再来管数学也是不迟的。相反,一个传统的数学家可能也不了解算法的世界,其研究方向可能于工业界在大部分时候没什么用,偶尔的碰撞并不是那么容易发生。更何况,数学的逻辑证明,经常在工业领域被大家都这么用,效果一直不错,就圆过去了,这早就是司空见惯的实用主义逻辑。数学那点东西,实在ROI太低。
不过吧,拿着题,仔细看过想过,不写出来就牙痒痒,就好像有个事没做完,就没法释放大脑已经分配的计算资源来干别的事一样。于是我花了点时间,也查了些资料,给出我的解答:
简单说两句吧。
0. 这种中等以上的数学和前者有明显区别,那就是没有太多人为设置的解题门槛,而是来源于理论和实际问题的困难,比较直接地摆着去解决,不是有答案的解谜猜谜,更像是探秘。像本题,论思维链条的长度,关联广度,对经验的要求,要远远低于一道平面几何题,但是其结论本身又都是有实际价值和意义的,证明的难度其实主要在理解题意的本质,按照定义的本质写出式子,整理一下基本就成了。
1.
强凸函数式指的比凸函数再多一个二次项的值,使得其不仅在切线上方,更高于一条抛物线。这个性质使得函数收敛更快,是神经网络优化中一类加速收敛算法中的核心技术。不过这里对解题帮助不大,凸函数定义正反推导一下就秒了。
2.
从解题而言这算是一个构造类问题。但是,从强化学习排序的角度,其实很容易想到这个构造方式。因为这个G函数本质上是一个单调的非线性映射成分,不要让线性项直接抵消掉,而这里的排序走的是打分+排序的逻辑,因此我们在优化L函数时,一定是sort后取得当下这些r值(连续情况下就是mu分布的样本)排序后来算的,显然这个序要和真实标的相同是前提,而且希望大家都排序的情况下,我打出来的L函数还要更大才好,以区分得最好。于是题意中的这些性质基本就不言自明了。其中最后的加和性质其实是对称序列构造的问题,结构很是巧妙,还有点像Reverse原理的意思。另外,这里的反证法其实看起来是用存在来解决一个任意全程的问题,因为前者的逻辑链条有时好推导,这其实是我们逻辑公理的问题吧,也正好符合了一部分一般思维规律,很自然。
不过吧,没想过这些问题,真不影响做LLM和强化学习。
3.
题目表述还挺有意思,不依赖于c,可不就是常函数嘛,只需要按定义写出原式子是一个泛函导数在c处的值的含义,剩下的直接就是拉格朗日乘子法的结论了。所以只要看懂了定义,写明白了,思维链条倒是不难。但看懂题意定义,基本就代表这部分数学,你得熟练掌握,但不是那种刷题的背诵。
好了,就说到这里,保持对数学、科学和技术的敬畏之心,常读常新,共勉!
附:2023阿里巴巴全球数学竞赛决赛试题地址
https://files.alicdn.com/tpsservice/d2a6b6ee90217712d3e3897b5f4427a1.pdf
我们是谁:
MatheMagician
,中文“数学魔术师”,原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义,也取像魔术一样玩数学的意思。文章内容涵盖
互联网,计算机,统计,算法,NLP
等前沿的数学及应用领域;也包括
魔术思想,流程鉴
赏
等魔术内容;以及结合二者的
数学魔术
分享,还有一些思辨性的谈天说地的
随笔
。希望你能和我一起,既能感性思考又保持理性思维,享受人生乐趣。欢迎扫码关注和在文末或公众号留言与我交流!
扫描二维码
关注更多精彩
CATO原理中的数学与魔术(十四)——流程设计思路与升华
魔术里的交代与暗交代(三)——暗交代是怎么做的?
牛顿运动定律的谜团(四)——牛顿定律的数学模型
魔术《4 Kings 折纸》的三重境界(四)——魔术效果的突破
视错觉与魔术(二)——橡皮筋的奇迹
点击阅读原文,往期精彩不错过!
http://mp.weixin.qq.com/s?__biz=MzI2NjQwNzQxMQ==&mid=2247491379&idx=1&sn=a5557defad11f19d263a8cff1b9396ba
MatheMagician
当数学遇上魔术,当理性遇上感性,不仅可以在艺术的殿堂里擦出火花,展现魅力;也能在科学的世界里无所不能,摧城拔寨。马上,就是实现梦想的瞬间。
最新文章
完美洗牌的秘密(十四)——反完美洗牌第三定理的应用一(whispering joker)
万圣节cos最像幽灵的竟然是他?!
完美洗牌的秘密(十三)——(反)完美洗牌第二定理的应用(16张的Anti faro周期魔术)
科幻电影中的全息空间影像在现实中快实现了吗?
完美洗牌的秘密(十二)——反完美洗牌定理的应用扩展(三叠发牌巴格拉斯效果)
从《费曼讲义》中,我竟然读出了一部“玄幻”小说……
完美洗牌的秘密(十一)——反完美洗牌定理的应用五(茫茫人海魔术扩展版)
离大谱!居里夫人竟获得了诺贝尔文学奖?
完美洗牌的秘密(十)——反完美洗牌定理的应用四(16张茫茫人海魔术)
半年炫2篇SCI!研究生一定要试一下!SCI论文辅导真的太香!
听说抛个硬币就能拿10万亿奖金,今年搞笑诺贝尔奖花落谁家?
往期精彩20241005
完美洗牌的秘密(九)——反完美洗牌定理的应用三(anti faro shuffle的奇迹等)
调休哪有不疯的?!看物理系博士生如何带你绝地反击……
在国际学校当老师的一天——深圳爱文学校数学魔术授课和访校记录
从广义相对论到规范理论(下)
完美洗牌的秘密(八)——反完美洗牌定理的应用二(感应奇迹)
被朋友拉去听演唱会,可注意力全程被手里这个东西吸引
完美洗牌的秘密(七)——反完美洗牌定理的应用一(指引巴格拉斯效果)
近视眼的人年纪大了后会老花眼吗?
完美洗牌的秘密(六)——完美洗牌定理的应用(penehole's principle magic more等)
从《黑神话:悟空》爆火,看游戏史的第一话
完美洗牌的秘密(五)——完美洗牌的性质和变体
完蛋!我们在实验室里做出了“毒液”
完美洗牌的秘密(四)——(反)完美洗牌第三定理
科学吃瓜—“紫薯”、兴奋剂都是怎么回事儿?
完美洗牌的秘密(三)——(反)完美洗牌第二定理续
外国人念不对中国运动员的名字?科学的解释来了
完美洗牌的秘密(二)——完美洗牌第二定理
“莎头”组合夺冠,他们在赛场上的这个动作,你注意到了吗?
完美洗牌的秘密(一)——(反)完美洗牌定理
我们首次在月壤中发现了水!大家准备种点什么菜?
记2024深圳暑期吴如皓魔术数学研修班活动
从广义相对论到规范理论(中)
易拉罐的奇迹(二)——《易拉罐平衡》与《气体转移》
毕业季,我们的学位服是怎样发展而来的?
易拉罐的奇迹(一)——硬币入可乐
夏天到了,究竟怎样才能越吃越瘦?
2024阿里巴巴全球数学竞赛决赛中的数列题解析(分析与方程方向第4题)
盘点那些年你学不会的物理
2023阿里巴巴全球数学竞赛决赛中的LLM背景题解析(应用与计算数学部分第2题)
从广义相对论到规范理论(上)
CATO原理中的数学与魔术(十四)——流程设计思路与升华
期末复习不完了?助你成为时间管理大师!
CATO原理中的数学与魔术(十三)——综合应用
2024高考数学压轴题解析——数学 VS AI最后的倔强
为啥高考完,学了三年的东西立马忘干净了?
CATO原理中的数学与魔术(十二)——CATO与MAT principle
当练就火眼金睛,看到了一颗原子
CATO原理中的数学与魔术(十一)——Parity Principle及其应用二:集合的可视化
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉