Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kỳ thi toán học trung học khó nhất thế giới, IMO 2025 với 6 bài toán trong 9 giờ, đã diễn ra trong tuần này.
Các mô hình AI đã thể hiện kém.
Gemini 2.5 Pro đạt điểm cao nhất, chỉ 13/42, với chi phí 431,97 đô la, trong một bài đánh giá tốt nhất 32. Điểm cắt đồng là 19.
Còn một chặng đường dài để AI có thể giải quyết toán học khó.

Đây là một hình ảnh trực quan đẹp hơn về hiệu suất của mô hình trên MathArena

P6 chắc chắn là vấn đề khó nhất và thú vị nhất. Hầu hết mọi người có thể hiểu nó, nhưng rất ít người có thể giải quyết nó.
Tất cả các mô hình đều ghi được 0/7.

Sửa nhỏ:

15 giờ trước
1/N Tôi rất vui mừng khi chia sẻ rằng mô hình LLM lý luận thử nghiệm mới nhất của @OpenAI đã đạt được một thách thức lớn trong AI: hiệu suất đạt huy chương vàng tại cuộc thi toán học danh giá nhất thế giới - Olympic Toán học Quốc tế (IMO).

76,37K
Hàng đầu
Thứ hạng
Yêu thích