Sungguh akhir pekan yang liar tentang AI dan IMO. Melihat kembali 3 hari terakhir, saya menyaksikan: > Jumat sore: bocoran informasi tentang DeepMind memenangkan emas > Sabtu 1 pagi: OpenAI memimpin pengumuman resmi, mencuri sorotan > Awalnya mengira Google hanya lambat karena persetujuan pemasaran > Kemudian mendengar dari orang-orang Google bahwa IMO dan diri mereka sendiri membutuhkan waktu ekstra untuk verifikasi > Ternyata OpenAI bahkan tidak melibatkan IMO secara resmi Senin >: DeepMind mengkonfirmasi emas mereka dengan jawaban yang lebih bersih dan lebih estetis, sepenuhnya diverifikasi oleh IMO Sangat menyenangkan menjadi yang pertama membagikan berita di X Jumat lalu. Akhir pekan yang liar! Selain lelucon, ada banyak hype seputar AI matematika akhir-akhir ini, tetapi yang lebih kita butuhkan adalah ketelitian dan standarisasi. Seperti yang ditunjukkan Terence Tao, meskipun hasilnya terlihat mirip, perbedaan format pengujian dapat membuat perbedaan besar. Kami masih jauh dari memiliki standar dan pesan yang jelas dan konsisten dalam penelitian AI. Jika kita menginginkan kemajuan yang berarti, inilah saatnya bagi komunitas untuk melangkah. Mari kita bangun tolok ukur yang dapat kita semua percayai.
Jasper
Jasper19 Jul, 06.25
Hanya 20 menit yang lalu, hasil IMO 2025 keluar. China peringkat No.1 dan @GoogleDeepMind memenangkan medali 🥇 emas Kompetisi matematika di masa depan adalah tim China vs tim Cina AS vs AI
4,28K