Bạn có cảm nhận được sự tăng tốc không?
Noam Brown
Noam Brown15:52 19 thg 7
Thật đáng để suy ngẫm về tốc độ tiến bộ của AI, đặc biệt là trong toán học. Vào năm 2024, các phòng thí nghiệm AI đã sử dụng toán học tiểu học (GSM8K) như một tiêu chí đánh giá trong các bản phát hành mô hình của họ. Kể từ đó, chúng ta đã bão hòa tiêu chuẩn MATH (trung học), sau đó là AIME, và giờ đây đã đạt được huy chương vàng IMO.
8,56K