曹云龙等15人各获百万奖金,2024青橙奖揭晓;OpenAI推出最强推理模型o3,几分钟破解陶哲轩口中数学难题 | 科研圈日报

学术   2024-12-23 12:42   北京  

“科研圈日报”主要关注科研圈与研究者个体、科研圈与更广阔的社会环境之间的重要互动。点击 这里 可以查看往期内容。



· 学术奖项


2024 达摩院青橙奖名单揭晓,曹云龙等 15 名青年科学家每人将获百万奖金


12 月 20 日,2024 青橙奖结果揭晓,15 名中国青年科学家获奖,每人将获得可自由支配的 100 万元奖金。本届获奖者平均年龄 34 岁,他们在集成光电芯片、情感计算与交互、青藏高原冰冻圈、时域巡天等多个关键领域取得重要成果。其中,超六成获奖者的研究涉及将人工智能引入科研领域(即 AI for Science),利用交叉研究实现突破。值得关注的是,青橙奖此次 15 名获奖者中,北京大学研究员曹云龙(首次证明病毒基于免疫压力的突变可以被精准预测)和香港大学助理教授杨易(阐明了光子与自由电子之间的耦合极限问题)4 个月前也获得了 2024 年科学探索奖,后者将为获奖者提供 300 万元的奖金。



此外,青橙奖还公布了“最具潜力奖”的 30 人名单,每位获奖者将获得 10 万元的奖励。


(达摩院官网)


相关阅读:

2024 科学探索奖公布,曹云龙等 49 人获奖 | 科研圈日报



· 人工智能


OpenAI 推出新一代推理模型 o3,几分钟即可破解陶哲轩口中数学难题


当地时间 12 月 20 日,OpenAI 12 天直播活动的最后一天,CEO 山姆・奥特曼(Sam Altman)宣布推出该公司最新一代 AI “推理” 模型 o3 与 o3-mini,它们基于今年早些时候的 o1 模型构建,目前正在开展公共安全测试。这些模型采用 “私有思维链” 技术,在回应前会暂停审视内部对话并规划,属于模拟推理(Simulated Reasoning)范畴,超越了基础的大型语言模型(LLM)。据悉,模型系列命名为 “o3” 是为避免与英国电信运营商 O产生商标冲突。


来源:Youtube截图


测试结果显示,在自 2019 年设立以来的视觉推理基准 ARC-AGI 测试中,o3 模型低计算场景下得分 75.7%,高计算测试时达 87.5%,接近人类 85% 的表现水平。在 2024 年美国数学邀请赛中,o3 模型得分 96.7%,仅错一题;在包含研究生水平生物、物理、化学问题的 GPQA Diamond 中得分达 87.7%。此外,该模型还能在陶哲轩宣称能难住 AI 好几年的 EpochAI Frontier Math 测试中解决 25.2% 的问题,速度远超其他模型。编写代码方面,在 Codeforces 测试中表现也优于 o1。对此,ARC 奖基金会主席表示这将改变人们对 AI 能力的认知。


在直播中,OpenAI 研发科学家、北大校友任泓宇展示了 o3 - mini 的编程能力。他使用特殊版本 ChatGPT 下达任务:编写 Python 脚本在本地为带大文本框的 HTML 文件启动服务器,实现输入文本提交后通过 API 调用自身。o3-mini 经 38 秒思考后迅速生成代码且一次运行成功。后续利用该代码调用自身低思考版本在 GPQA 数据集上的表现,脚本能够正确运行,准确率结果 61.62%,与正式评估相近。据悉,OpenAI 计划于 2025 年 1 月下旬向用户开放 o3-mini 的使用权限,o3 也将随后公开。在 OpenAI 发力的同时,谷歌、DeepSeek、阿里巴巴等公司也在积极研发各自的模拟推理模型,竞争愈发激烈。(Ars Technica,公众号“量子位”)



· 新药研发


首个治疗打呼噜的处方药!礼来 Zepbound 在美获批用于治疗阻塞性睡眠呼吸暂停


据美国国家公共电台(NPR)报道,当地时间 12 月 20 日,美国食品药品监督管理局 (FDA)批准礼来公司生产的减肥药 Zepbound (商品名)用于治疗肥胖成年患者的中度至重度阻塞性睡眠呼吸暂停 (OSA),并建议该药物应配合低热量饮食和增加运动。Zepbound(tirzepatide)曾于 2023 年 11 月在美获批用于治疗肥胖症,现在成为首个获批用于治疗OSA的处方药。


OSA 是一种常见疾病,任何人都有可能患上,且在超重人群中更加普遍。OSA 患者在睡眠时会因上呼吸道堵塞出现呼吸困难甚至暂停,可能引发严重的心脏代谢并发症。过去 40 年里,患者只能通过正压通气(PAP)来维持正常睡眠。在评估 Zepbound 疗效的临床 3 期试验中,研究人员根据 OSA 患者是否使用 PAP 开展了两项试验,分别随机进行 Zepbound 或安慰剂治疗。结果表明,经过 52 周的治疗后,在不使用 PAP 的试验中,Zepbound 减少呼吸中断的效果都是安慰剂的 5 倍。此外,接受 Zepbound 治疗的患者中 OSA 症状得到缓解或消退的比例为 42%,而安慰剂组只有 16%。除了改善 OSA 症状,接受 Zepbound 治疗的患者的体重下降了 18%,而安慰剂组仅下降了 2%。使用 PAP 的试验也得到了类似的结果。相关专家强调,OSA 的诱因有很多,Zepbound 并不适合所有人。(NPR,美国 FDA)



· 开放获取


美国 NIH 与 DOE 联合宣布新政策:所有资助成果发表后即刻公开


《科学》新闻(Science News)消息,为回应美国白宫科学技术政策办公室(OSTP)于 2022 年发出的呼吁——由联邦资助的科研论文应在 2025 年底前实现即时免费获取,美国国立卫生研究院(NIH)和能源部(DOE)近日发布最终政策,要求受资助者最晚自 2025 年 12 月 31 日起,将研究产出的期刊文章即时免费提供给公众,其他美国联邦研究资助机构预计将在 12 月底之前跟进。据统计,全球约 9% 的科研论文将受到这一政策的影响。


NIH 和 DOE 的政策规定,受资助者须在论文正式发表后,立即将未经出版商编辑排版润色、但已经过同行评审且被期刊接收的最终手稿上传至各机构的公共存储库,并鼓励共享项目数据。这一举措符合近年来全球开放科学运动的发展,但也在学术界引起了广泛争议。目前,实现开放获取的两种主要途径是金色开放获取(Gold Open Access)和绿色开放获取(Green Open Access)。金色 OA 通常指作者或所在机构向学术出版商支付数千美元的文章处理费(APC),论文发表后即可被免费开放给所有人阅读和下载。有批评者认为该模式对作者及所在机构而言成本过高。2013 年起,NIH 等机构已要求受资助发表论文符合绿色 OA 流程——允许出版商设置最长 12 个月的禁止公开期限,如今美国政府推出的政策更倾向于“0 禁止期”的绿色 OA。


报道显示,出版商对这项政策表示担忧,认为该政策将减少订阅费收入,影响期刊运营和编辑质量。政策实施还面临一些实际操作层面的挑战,例如论文和元数据的上传工作耗时耗力,这部分工作原本通常由出版商承担,未来可能需要专人管理。该政策还可能涉及版权问题:NIH 和 DOE 声明其资助的成果受“政府使用许可”保护,允许政府利用包括 AI 在内的自动化方法分析论文,但这可能与作者和出版商间签订的标准合同、以及出版商向 AI 开发者出售付费内容访问权用于文本挖掘的行为存在利益冲突。目前,新政策能否在国会审查中存活仍是未知数,美国下一届总统特朗普的上任也可能对此政策产生影响。尽管存在不确定性,但一些人对“0 禁止期”的绿色开放获取的未来持乐观态度,认为这项政策的推进将深刻影响未来的学术出版模式。(《科学》新闻)



· 生物物理


研究揭示睫毛独特结构帮助快速排水,保持视线清晰


12 月 20 日,来自中国科学院物理化学技术研究所的团队在《科学进展》Science Advances)发表的一项新研究,揭示了了人类睫毛如何通过其独特的微观结构高效地排出眼部液体,从而保持视线清晰。


研究发现,睫毛的特殊结构,具有类似微棘轮(Micro-ratchet)的结构和近似最速降线(Brachistochrone)的形状,使其能够定向并迅速地排出进入眼睛的液体,保持眼球干净。具体而言,睫毛表面的微棘轮结构使水滴能够从根部流向尖端,但阻止其逆向流动。接着,弹性变形的疏水纤维阵列促使水滴迅速排出,最终通过最速降线形状加速水滴滑落,减少了约 20% 的接触时间。该研究表明,睫毛不仅能够保护眼睛免受灰尘侵扰,还通过独特的结构特性在雨天、流泪或出汗时发挥排水作用。这项研究为理解睫毛的生物力学功能提供了新的视角,也为未来在仿生工程和防水技术方面的应用奠定了基础。(ScienceNews)


编写:马凤娟、杨梦、王泽凡、字鑫楠、魏潇

编辑:魏潇


▽ 精彩回顾 ▽



点个“在看”,及时获取最新学术资讯

环球科学科研圈
《环球科学》杂志旗下综合性学术传播与服务平台。
 最新文章