1/N Tôi rất vui mừng khi chia sẻ rằng mô hình LLM lý luận thử nghiệm mới nhất của @OpenAI đã đạt được một thách thức lớn trong AI: hiệu suất đạt huy chương vàng tại cuộc thi toán học danh giá nhất thế giới - Olympic Toán học Quốc tế (IMO).
2/N Chúng tôi đã đánh giá các mô hình của mình trên các bài toán IMO 2025 theo cùng một quy tắc như các thí sinh con người: hai phiên thi kéo dài 4,5 giờ, không có công cụ hay internet, đọc các tuyên bố vấn đề chính thức và viết các chứng minh bằng ngôn ngữ tự nhiên.
4/N Thứ hai, các bài nộp IMO rất khó xác minh, là những bằng chứng nhiều trang. Tiến bộ ở đây đòi hỏi phải vượt ra ngoài mô hình RL với những phần thưởng rõ ràng, có thể xác minh. Bằng cách làm như vậy, chúng tôi đã có được một mô hình có thể tạo ra những lập luận phức tạp, chặt chẽ ở cấp độ của các nhà toán học con người.
5/N Ngoài kết quả chính, tôi rất hào hứng về cách tiếp cận của chúng tôi: Chúng tôi đạt được cấp độ khả năng này không phải thông qua phương pháp hẹp, cụ thể cho nhiệm vụ, mà bằng cách mở ra những con đường mới trong học tăng cường đa mục đích và mở rộng tính toán trong thời gian kiểm tra.
6/N Trong đánh giá của chúng tôi, mô hình đã giải quyết 5 trong số 6 bài toán trong IMO 2025. Đối với mỗi bài toán, ba cựu vô địch IMO đã độc lập chấm điểm chứng minh mà mô hình nộp, với điểm số được hoàn thiện sau khi đạt được sự đồng thuận nhất trí. Mô hình đã kiếm được 35/42 điểm tổng cộng, đủ để giành huy chương vàng! 🥇
8/N Nhân tiện, chúng tôi sắp phát hành GPT-5, và chúng tôi rất hào hứng cho bạn thử nghiệm. Nhưng để rõ ràng: mô hình LLM vàng IMO là một mô hình nghiên cứu thử nghiệm. Chúng tôi không có kế hoạch phát hành bất kỳ thứ gì với khả năng toán học ở mức này trong vài tháng tới.
9/N Vẫn—điều này nhấn mạnh tốc độ phát triển nhanh chóng của AI trong những năm gần đây. Vào năm 2021, người hướng dẫn tiến sĩ của tôi @JacobSteinhardt đã yêu cầu tôi dự đoán sự tiến bộ của AI trong toán học vào tháng 7 năm 2025. Tôi đã dự đoán 30% trên tiêu chuẩn MATH (và nghĩ rằng mọi người khác đều quá lạc quan). Thay vào đó, chúng ta có huy chương vàng IMO.
Cuối cùng, chúng tôi xin chúc mừng tất cả các thí sinh của IMO 2025 về thành tích của họ! Chúng tôi tự hào có nhiều cựu thí sinh IMO tại @OpenAI và nhận ra rằng đây là một trong những bộ óc trẻ sáng giá nhất của tương lai.
1,12M