IMO adalah 3 masalah per 4,5 jam <-> 1,5 jam per masalah Jadi kami ... tepat pada jadwal?
METR
METR19 Mar 2025
Kapan sistem AI dapat melakukan proyek panjang secara mandiri? Dalam penelitian baru, kami menemukan semacam "Hukum Moore untuk agen AI": lamanya tugas yang dapat dilakukan AI berlipat ganda setiap 7 bulan.
4,29K