Chúng tôi mất vài tháng để biến ranh giới nghiên cứu thử nghiệm thành một sản phẩm. Nhưng tiến độ nhanh đến mức vài tháng có thể tạo ra sự khác biệt lớn về khả năng.
Ravid Shwartz Ziv
Ravid Shwartz Ziv09:17 19 thg 7
Vậy là, tất cả các mô hình đều kém hơn con người trong các câu hỏi mới của Kỳ thi Toán học Quốc tế, và Grok-4 đặc biệt tệ trong đó, ngay cả với lựa chọn tốt nhất trong số n? Thật không thể tin được!
113,88K