Je překvapivě obtížné zjistit, zda OpenAI a Google DeepMind skutečně získaly zlatou medaili IMO "férovou a čtvercovou", nebo ne. Těším se na další analýzy.
Jasper Dekoninck
Jasper Dekoninck22. 7. 17:20
Zajímavý přístup! Podívali jsme se však na důkazy a metodiku a našli jsme několik problémů, konkrétně s použitím nápověd daných k modelu. I když lešení skutečně zlepšuje výkon, neřeší všechny problémy přesně a nezískalo by zlatou medaili. 🧵
1,33K