openAI的Noam Brown确认了两个关键点: 1)达到IMO金牌水平表现的模型是通用的—— 并不是针对数学进行微调的,并且在没有使用工具的情况下实现了这一点。 2)openAI开发了新的技术,使得LLMs大大提升。 这可能是新的RL突破还是算法改进?
27.89K