Penampilan tingkat medali emas di Olimpiade Matematika Internasional 2025 dari LLM penalaran eksperimental terbaru kami. Model dioperasikan dalam bahasa alami (yaitu mengeluarkan bukti bahasa alami) di bawah aturan yang sama dengan manusia (misalnya 4,5 jam per sesi, tanpa alat). Tonggak sejarah yang luar biasa!
Alexander Wei
Alexander Wei19 Jul, 15.50
1/N Saya senang berbagi bahwa penalaran @OpenAI eksperimental terbaru kami LLM telah mencapai tantangan besar yang sudah lama ada di AI: kinerja tingkat medali emas pada kompetisi matematika paling bergengsi di dunia—Olimpiade Matematika Internasional (IMO).
Yang paling luar biasa adalah bahwa sistem ini menggunakan pendekatan yang sangat umum, menggunakan pembelajaran penguatan dan penskalaan komputasi waktu pengujian:
Alexander Wei
Alexander Wei19 Jul, 15.50
5/N Selain hasilnya sendiri, saya senang dengan pendekatan kami: Kami mencapai tingkat kemampuan ini bukan melalui metodologi khusus tugas yang sempit, tetapi dengan membuka jalan baru dalam pembelajaran penguatan tujuan umum dan penskalaan komputasi waktu pengujian.
107,5K