热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Mark Chen
@OpenAI 首席研究官。美国 IOI 队教练。
我们在今年的国际数学奥林匹克(IMO)上达到了金牌水平的表现!我们的模型能够用清晰、简单的英语思考和撰写证明——无需正式的代码。
与过去比赛中使用的较窄系统不同,我们的模型旨在进行广泛的推理,远远超出比赛问题的范围。

Alexander Wei7月19日 15:50
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。

144.49K
我们在 @atcoder 世界总决赛启发式竞赛中现场竞争,并获得了第二名!
像 o3 这样的模型在编程/数学竞赛中排名前100,但据我所知,这是在一场顶级编程/数学竞赛中首次获得前3名的成绩。前100名和前3名之间有着巨大的差距!

Ahmed El-Kishky7月17日 02:52
祝贺 @FakePsyho 的精彩表现!同时也要祝贺 @bminaiev、@andresnds 和 @_lorenzkuhn 代表 OpenAI 的出色表现。赞助 AtCoder 世界总决赛 @atcoder 真是太棒了。我们很高兴能与世界分享一些模型解决方案。
54.01K
Mark Chen 已转发
我对链式思维的可靠性和可解释性的潜力感到非常兴奋。这对我们推理模型的设计产生了重大影响,从o1-preview开始。
随着AI系统在长期研究问题上花费更多的计算资源,监控其内部过程的某种方式至关重要。隐藏的链式思维的一个奇妙特性是,尽管它们最初是基于我们可以解释的语言,但可扩展的优化过程并不对观察者验证模型意图的能力构成对抗——这与例如使用奖励模型的直接监督不同。
这里的紧张关系在于,如果链式思维默认不是隐藏的,并且我们将该过程视为AI的输出的一部分,那么就有很多激励(在某些情况下,甚至是必要)去对其进行监督。我相信我们可以朝着两全其美的方向努力——训练我们的模型在解释其内部推理方面表现出色,同时仍然保留偶尔验证的能力。
链式思维的可靠性是更广泛研究方向的一部分,即可解释性训练:以一种方式设定目标,使系统的至少一部分保持诚实和可监控,并具备规模。我们正在继续增加在OpenAI进行这项研究的投资。
264.18K
我们在研究方面不会过度招聘。至于人才标准——下个月会有一些非常出色的人加入!
我在交易领域工作了多年,直到缺乏意义让我感到疲惫。在OAI,我从未有过这种感觉——构建对现实世界有影响的事物要充实得多。

Iain Dunning2025年5月17日
您是OAI/Anthropic等机构的研究员,对过度招聘、组织结构混乱、人才标准降低感到厌倦,想搬到纽约,或者只是想做些不同的事情吗?给我发邮件、私信或寄明信片。我们有一个新的数据中心,配备了B200s,团队紧密且非常成功。
221.94K
非常兴奋能与@fidjissimo合作——她是一位产品愿景家!

Sam Altman2025年5月8日
非常激动地宣布 @fidjissimo 加入 OpenAI,担任新职位:应用程序首席执行官,向我汇报。
我将继续担任 OpenAI 的首席执行官,但在这种新配置下,我将能够更加专注于研究、计算和安全。
随着我们接近超级智能,这些领域至关重要。
77.88K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可