Großartiger Maßstab. Die erste KI, die dies tut, wird sehr beeindruckend sein. Ich mag besonders die Anforderung an Experimente. Man kann keines dieser Probleme wirklich lösen, bis man Hypothesen testet und daraus lernt.
ARC Prize
ARC Prize19. Juli, 01:26
Heute kündigen wir eine Vorschau auf ARC-AGI-3 an, den Interaktiven Reasoning Benchmark mit der größten Kluft zwischen einfach für Menschen und schwer für KI. Wir veröffentlichen: * 3 Spiele (Umgebungen) * 10.000 $ Agenten-Wettbewerb * API für KI-Agenten Startwerte - Frontier KI: 0%, Menschen: 100%
5,66K