Цікаво: 3/4 місяці тому я запустив o3 для деяких науковців над набором задач у стилі AIME. Їм знадобилося стільки часу, щоб написати резюме результатів (98%), що Алекс тим часом вирішив proof+IMO, лол
77