Que fim de semana selvagem sobre IA e IMO. Olhando para os últimos 3 dias, testemunhei: > Sexta-feira à tarde: informações vazadas sobre a DeepMind ganhando ouro > 1h de sábado: OpenAI fez o anúncio oficial, roubando os holofotes > Inicialmente pensei que o Google estava lento devido à aprovação de marketing > Então ouvi do pessoal do Google que a IMO e eles próprios precisavam de mais tempo para verificação > Acontece que a OpenAI nem mesmo envolveu a IMO oficialmente > segunda-feira: DeepMind confirmou seu ouro com respostas mais limpas e estéticas, totalmente verificadas pela IMO Foi divertido ser o primeiro a compartilhar a notícia no X na última sexta-feira. Que fim de semana selvagem! Brincadeiras à parte, há muito hype em torno da IA matemática ultimamente, mas o que precisamos mais é de rigor e padronização. Como Terence Tao apontou, mesmo que os resultados pareçam semelhantes, as diferenças no formato de teste podem fazer uma grande diferença. Ainda estamos longe de ter padrões e mensagens claros e consistentes na pesquisa de IA. Se quisermos um progresso significativo, é hora de a comunidade intensificar. Vamos construir benchmarks em que todos possamos confiar.
Jasper
Jasper19 de jul., 06:25
Apenas 20 minutos atrás, o resultado da IMO de 2025 foi divulgado. A China ficou em 1º lugar e @GoogleDeepMind ganhou uma medalha 🥇 de ouro As futuras competições de matemática serão a equipe da China contra os EUA Equipe chinesa contra a IA
4,3K