热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。

4/N 第二,IMO 提交的证明难以验证,且通常是多页的。要在这里取得进展,需要超越 RL 范式的明确、可验证的奖励。通过这样做,我们获得了一个能够在与人类数学家相当的水平上构建复杂、严密论证的模型。




除了结果本身,我对我们的方法感到兴奋:我们不是通过狭窄的、特定任务的方法达到这个能力水平,而是通过在通用强化学习和测试时计算扩展方面开辟新天地。
顺便说一下,我们很快将发布GPT-5,我们很高兴你能尝试它。但为了明确:IMO金牌LLM是一个实验性研究模型。我们不打算在几个月内发布任何具有这种数学能力的产品。
9/N 仍然——这突显了近年来人工智能的快速进步。在2021年,我的博士生导师 @JacobSteinhardt 让我预测到2025年7月人工智能在数学方面的进展。我预测在 MATH 基准上达到 30%(并认为其他人过于乐观)。结果,我们获得了国际数学奥林匹克金牌。

最后,我们要祝贺2025年国际数学奥林匹克(IMO)的所有参与者取得的成就!我们为@OpenAI有许多过去的IMO参与者感到自豪,并认识到他们是未来一些最聪明的年轻头脑。
131.54K
热门
排行
收藏