“他山之石,可以攻玉”,站在巨人的肩膀才能看得更高,走得更远。在科研的道路上,更需借助东风才能更快前行。为此,我们特别搜集整理了一些实用的代码链接,数据集,软件,编程技巧等,开辟“他山之石”专栏,助你乘风破浪,一路奋勇向前,敬请关注!
论文标题:Formal Mathematical Reasoning: A New Frontier in AI
论文地址:https://arxiv.org/pdf/2412.16075
从教科书、论文和讲义中自动形式化非形式化数学内容
基于数学公理生成合成的猜想和证明
从不同的证明框架和代码等数据丰富的领域迁移知识
建立自动形式化语句的评估指标
将形式化过程分解为小步骤
加强与形式系统的交互
增强多步推理、长文本处理、抽象和分层规划能力
通过合成基准诊断推理失败之处
利用检索和搜索等推理技术辅助模型
对搜索进行扩展以利用更多的测试时间计算;
对模型、搜索算法和超参数进行系统性评估;
用于评估证明目标并为其设定优先级的价值模型。
将大型、高级证明目标逐步分解为较小的目标。
学习在成熟的证明助手中构建新的定义、引理和策略。
为形式数学推理量身定制的检索器;
处理动态增长的知识库。
识别跨领域联系的通用方法;
针对各个领域的有效性的专家方法以及与数学家合作的专家方法;
将通用方法和专家方法结合起来,例如为 LLM 配备特定领域的工具。
资源、激励措施和工程开发,以提高可用性和用户友好性;
研究数学家如何使用形式化工具的行为;
支持大规模分布式协作的工具。
将形式化方法纳入 AI 辅助的系统设计和实现中;
增强 AI 进行形式化软件和硬件验证的能力;
将基于 AI 的生成与形式化验证结合起来。
在最高的第 4 级,AI 可以帮助开发人员制定技术规范,包括自动生成规范文档、解释具体要求,以及帮助找出规范中的问题。
本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。
收藏,分享、在看,给个三连击呗!