fun: 3/4 miesiące temu uruchomiłem o3 dla kilku akademików na prywatnym zbiorze testowym problemów podobnych do AIME. Zajęło im tak długo napisanie podsumowania wyników (96%), że Alex w międzyczasie rozwiązał IMO.
49