Bra riktmärke. Den första artificiella intelligensen som gör detta kommer att bli mycket imponerande Jag gillar särskilt kravet på experimenterande. Du kan inte riktigt lösa någon av dessa förrän du testar hypoteser och lär dig av dem
ARC Prize
ARC Prize19 juli 01:26
Idag presenterar vi en förhandsvisning av ARC-AGI-3, Interactive Reasoning Benchmark med det största gapet mellan lätt för människor och svårt för AI Vi släpper: * 3 spel (miljöer) * $ 10K agent tävling * API för AI-agenter Startresultat - Frontier AI: 0%, Människor: 100%
5,68K