nb điều này được tweet 7 giờ trước khi OAI công bố kết quả vàng của họ
Ravid Shwartz Ziv
Ravid Shwartz Ziv09:17 19 thg 7
Vậy là, tất cả các mô hình đều kém hơn con người trong các câu hỏi mới của Kỳ thi Toán học Quốc tế, và Grok-4 đặc biệt tệ trong đó, ngay cả với lựa chọn tốt nhất trong số n? Thật không thể tin được!
26,99K