Noam Brown da openAI confirmou 2 pontos-chave: 1) o modelo que alcançou um desempenho de nível ouro no IMO é de propósito geral — não foi ajustado para matemática e conseguiu isso sem usar ferramentas 2) a openAI desenvolveu novas técnicas que tornam os LLMs muito melhores poderia ser um novo avanço em RL ou uma melhoria algorítmica?
27,9K