私たちは、ARC-AGI-1でQwen 3の報告された41%を再現するよう取り組んでいます。このスコアはまだ検証されていません。 ARC-AGIリーダーボードのすべてのスコアは、セミプライベートホールドアウトセットでの独自の検証済みテストを反映しています。
28.91K