Parabéns à equipa GDM pelo seu resultado no IMO! Acho que o sucesso paralelo deles destaca a rapidez do progresso da IA. A abordagem deles foi um pouco diferente da nossa, mas acho que isso mostra que existem muitas direções de pesquisa para um progresso adicional. Algumas reflexões sobre o nosso modelo e resultados 🧵
Há cerca de 2 meses, a IMO nos enviou um e-mail sobre a participação em uma versão formal (Lean) da IMO. Temos estado focados em raciocínio geral em linguagem natural sem as restrições do Lean, por isso recusamos. Nunca fomos abordados sobre uma opção de matemática em linguagem natural.
Nos últimos meses, fizemos muitos progressos em raciocínio geral. Isso envolveu a coleta, curadoria e treinamento com dados matemáticos de alta qualidade, que também serão utilizados em modelos futuros. Na nossa avaliação IMO, não utilizamos RAG ou quaisquer ferramentas.
Antes de partilharmos os nossos resultados, falámos com um membro do conselho da IMO, que nos pediu para esperar até depois da cerimónia de entrega de prémios para torná-los públicos, um pedido que honramos com prazer.
Anunciámos por volta da 1h PT (18h AEST), após a conclusão da cerimónia de entrega de prémios. Em nenhum momento alguém pediu que anunciássemos mais tarde do que isso.
Mais do que tudo, estamos entusiasmados por partilhar o nosso progresso e resultados com o mundo. As capacidades de raciocínio da IA estão a progredir rapidamente, e estes resultados IMO mostram-no realmente.
357,08K