Saya pikir umat manusia aman hanya 2 hari yang lalu, itu benar-benar menghitung dalam beberapa hari ... Beberapa konteks: Ini bukan pertama kalinya AI meraih medali di Olimpiade Matematika Internasional (IMO). Tahun lalu, AlphaProof Google memenangkan perak—tetapi model itu dilatih khusus untuk matematika. Kali ini, OpenAI menggunakan model serba guna (kemungkinan prototipe GPT-5 internal?), dan memenangkan emas. Itu adalah lompatan besar dalam signifikansi. Untuk menempatkan ini dalam perspektif: memecahkan masalah tingkat IMO biasanya membutuhkan waktu sekitar 100 menit bagi pesaing manusia elit. Hanya 2 tahun yang lalu, model AI teratas masih berjuang dengan masalah kata sekolah dasar (GSM8k), yang membutuhkan waktu sekitar 10 detik untuk dipecahkan oleh manusia. Seperti yang dibagikan Dan Roberts dari OpenAI di Sequoia's AI Ascent 2025, lamanya tugas yang dapat ditangani AI berlipat ganda setiap 7 bulan. Pada akhir 2025, GPT-5 mungkin akan beroperasi pada tingkat tugas manusia selama satu jam. Satu peringatan: IMO tahun ini dilaporkan memiliki cacat dalam keseimbangan kesulitan—masalah 1-5 relatif mudah, sedangkan masalah 6 sangat sulit. Akibatnya, banyak skor berkumpul antara 28-35 (setiap soal bernilai 7 poin). AI mencetak 35—cukup untuk emas. Sedikit keberuntungan, tapi lintasannya tidak dapat disangkal. Yang tak kalah pentingnya, kompetisi matematika tidak diragukan lagi akan menjadi perlombaan antara Cina di Cina, Cina di AS, dan model AI (dibangun oleh Cina di AS dan Cina)
Alexander Wei
Alexander Wei19 Jul, 15.50
1/N Saya senang berbagi bahwa penalaran @OpenAI eksperimental terbaru kami LLM telah mencapai tantangan besar yang sudah lama ada di AI: kinerja tingkat medali emas pada kompetisi matematika paling bergengsi di dunia—Olimpiade Matematika Internasional (IMO).
5,43K