热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
DeepMind在周五下午获得了国际数学奥林匹克的金牌。但他们不得不等到周一才能获得市场营销部门的批准才能发推。
@OpenAI在周六凌晨1点首先分享了他们的消息,抢走了风头。
在这个游戏中,速度 > 官僚主义。错过时机,就会失去叙事。
澄清:我从谷歌的一位人士那里得知,他们的IMO结果仍在验证中。一旦这个过程完成,他们计划正式分享这些结果。期待看到他们的方法。
澄清:我从谷歌的一位人士那里得知,他们的IMO结果仍在内部验证中。一旦完成,他们计划正式分享这些结果——我很想看看他们的做法。
另一位消息来源提到,IMO委员会要求在闭幕式后一周内不要公开讨论AI的参与。事情变得更加有趣了 🧐
@OpenAI 这里有一些更新

20 小时前
我们可能正面临OpenAI与DeepMind IMO传奇中的情节反转。
刚看到Joseph Myers的一篇帖子(自1992年以来参与数学奥林匹克):IMO委员会据说要求AI实验室在闭幕式后7天内不要发布结果——出于对人类参赛者的尊重(见我昨天的帖子),并可能是为了留出时间对AI提交的内容和格式进行适当的验证。
根据Joseph的说法,OpenAI并没有与IMO合作测试他们的模型,91名官方IMO协调员中没有人参与评分其解决方案。与此同时,DeepMind似乎遵循规则,耐心等待他们的轮次。
背景信息:
IMO有6道题目,每道题值7分。今年的金牌分数线是35分。即使是小幅扣分也可能让OpenAI降到银牌。从我对他们的写作的理解来看,有些部分可能会引发质疑——并可能导致扣分。
Terence Tao还指出,虽然题目保持不变,但测试格式很重要。在标准条件下无法获得铜牌的学生,可能在修改后的设置中获得金牌——这引发了关于“解决IMO”对AI意味着什么的真实问题。
下周可能会变得火热。敬请关注。


215K
热门
排行
收藏