Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Đồng sáng lập và Giám đốc điều hành @Hyperbolic_Labs. cựu @avax và cựu @citsecurities. Hoàn thành Tiến sĩ Toán trong 2 năm @UCBerkeley. Người đoạt huy chương vàng Olympic Toán học. Danh dự cao nhất @PKU1898
Chúng ta có thể đang tiến vào một bước ngoặt trong cuộc chiến giữa OpenAI và DeepMind trong cuộc thi IMO.
Vừa thấy một bài đăng từ Joseph Myers (người tham gia Olympic Toán học từ năm 1992): Ủy ban IMO được cho là đã yêu cầu các phòng thí nghiệm AI không công bố kết quả cho đến 7 ngày sau lễ bế mạc — để tôn trọng các thí sinh con người (xem bài đăng của tôi hôm qua) và có lẽ để cho thời gian xác minh đúng đắn các bài nộp và định dạng của AI.
Theo Joseph, OpenAI không hợp tác với IMO để thử nghiệm mô hình của họ, và không có bất kỳ điều phối viên chính thức nào của IMO trong số 91 người tham gia vào việc chấm điểm các giải pháp của nó. Trong khi đó, có vẻ như DeepMind đang tuân thủ các quy tắc và kiên nhẫn chờ đến lượt của họ.
Để có bối cảnh:
IMO có 6 bài toán, mỗi bài trị giá 7 điểm. Điểm cắt vàng năm nay là 35 điểm. Ngay cả một sự trừ điểm nhỏ cũng có thể khiến OpenAI rớt xuống bạc. Và từ những gì tôi đọc trong các bài viết của họ, một số phần có thể gây ra câu hỏi — và có thể làm mất điểm.
Terence Tao cũng chỉ ra rằng trong khi các bài toán vẫn giữ nguyên, định dạng kiểm tra lại rất quan trọng. Một sinh viên không thể đạt được huy chương đồng trong điều kiện tiêu chuẩn có thể đạt huy chương vàng với một thiết lập đã được điều chỉnh — điều này đặt ra những câu hỏi thực sự về việc "giải quyết IMO" có nghĩa là gì đối với AI.
Tuần tới có thể sẽ rất thú vị. Hãy theo dõi.


87,42K
DeepMind đã giành huy chương vàng tại IMO vào chiều thứ Sáu. Nhưng họ phải chờ đợi bộ phận marketing phê duyệt tweet — cho đến thứ Hai.
@OpenAI đã chia sẻ của họ đầu tiên vào lúc 1 giờ sáng thứ Bảy và đã chiếm spotlight.
Trong trò chơi này, tốc độ > quan liêu. Bỏ lỡ khoảnh khắc, mất đi câu chuyện.
215,02K
Vừa mới tan làm và thử Grok-4 với một bài toán hình học đại học. Nó mất 9 phút để suy nghĩ và sau đó tự tin đưa ra một câu trả lời sạch sẽ, hợp lý, nhưng hoàn toàn sai 😅
Đừng nghĩ rằng cái này đủ tiêu chuẩn là "có tính đối kháng khéo léo." Các mô hình AI đang nghiền nát các tiêu chuẩn — nhưng vẫn còn một chặng đường dài để đạt được AGI toán học thực sự.



Elon Musk16:47 10 thg 7
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
663,02K
Grok đã đạt điểm tối đa trong AIME 🤯 Chúng ta chắc chắn cần một tiêu chuẩn toán học tốt hơn cho AI ngay bây giờ.


xAI12:01 10 thg 7
Giới thiệu Grok 4, mô hình AI mạnh mẽ nhất thế giới. Xem livestream ngay bây giờ:
3,01K
Tương lai của AI là sự hợp tác

Yuchen Jin06:09 9 thg 7
Sam Altman được hỏi cảm giác của anh về việc Zuck và Meta đang lôi kéo những tài năng hàng đầu của OpenAI.
“Ổn... tốt...” anh nói.
Dưới cặp kính do Jony Ive thiết kế, tôi không thể nhìn thấy mắt anh. Nhưng tôi có thể cảm nhận được nỗi đau.
Không khó để Zuck lôi kéo tài năng từ OpenAI, không chỉ vì anh có tiền, mà còn vì AI mã nguồn mở đang thực hiện sứ mệnh ban đầu của OpenAI.
1,48K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất