leuk: 3/4 maanden geleden heb ik o3 uitgevoerd voor enkele academici op een privé testset van AIME-achtige problemen. Het heeft zo lang geduurd voordat ze een samenvatting van de resultaten (96%) hebben geschreven dat Alex ondertussen IMO heeft opgelost.
52