Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vừa mới tan làm và thử Grok-4 với một bài toán hình học đại học. Nó mất 9 phút để suy nghĩ và sau đó tự tin đưa ra một câu trả lời sạch sẽ, hợp lý, nhưng hoàn toàn sai 😅
Đừng nghĩ rằng cái này đủ tiêu chuẩn là "có tính đối kháng khéo léo." Các mô hình AI đang nghiền nát các tiêu chuẩn — nhưng vẫn còn một chặng đường dài để đạt được AGI toán học thực sự.



16:47 10 thg 7
Grok 4 đã đạt đến mức mà nó gần như không bao giờ sai câu hỏi thi toán/vật lý, trừ khi chúng được thiết kế một cách khéo léo để gây khó khăn.
Nó có thể xác định lỗi hoặc sự không rõ ràng trong các câu hỏi, sau đó sửa lỗi trong câu hỏi hoặc trả lời từng biến thể của một câu hỏi không rõ ràng.
663,05K
Hàng đầu
Thứ hạng
Yêu thích