Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

o3 Pro trên kết quả đánh giá bán riêng tư ARC-AGI ARC-AGI-1: * Thấp: 44%, $ 1.64 / nhiệm vụ * Trung bình: 57%, $ 3.18 / nhiệm vụ * Cao: 59%, $ 4.16 / nhiệm vụ ARC-AGI-2: * Tất cả các nỗ lực lý luận: <5%, $ 4-7 / nhiệm vụ Bài học rút ra: * O3-Pro phù hợp với hiệu suất O3 * Giá mới của o3 thiết lập ARC-AGI-1 Frontier

Cần lưu ý, o3 Pro *không* phải là cùng một mẫu mà chúng tôi đã thử nghiệm vào tháng 12 năm 2024 (o3-preview) OpenAI đã xác nhận điều này một cách rõ ràng. Xem tweet tham khảo để biết thêm thông tin.

Kết quả o3 đã được cập nhật để phản ánh mức giảm 80% giá.

Điểm dữ liệu mới trên biểu đồ là o3 (Lý luận cao) và o4-mini (Lý luận cao). Chúng đã bị loại trừ trước đây do thời gian chờ của mô hình. Chế độ 'nền' mới của OpenAI đã cho phép chúng tôi xử lý các mô hình này với cài đặt tính toán cao.

Xem bảng xếp hạng: Tái tạo kết quả:

108,74K

Hàng đầu

Thứ hạng

Yêu thích

Onchain thịnh hành

Thịnh hành trên X

Ví funding hàng đầu gần đây

Được chú ý nhất