Trước khi chúng ta bắt đầu một IDE lập trình cho AI để có thể thu thập dữ liệu tốt.
pash
pash09:58 19 thg 7
Tôi muốn chỉ ra rằng đối với các nhiệm vụ thực tế (không phải benchmark), Kimi K2 vượt trội hơn Gemini. Đây là dữ liệu telemetry từ tất cả người dùng @cline, cho thấy tỷ lệ lỗi chỉnh sửa khác nhau. Lưu ý rằng Kimi có khoảng 6% tỷ lệ lỗi, điều này tốt hơn đáng kể so với tỷ lệ lỗi ~ 10% của Gemini. Đáng chú ý, Kimi thậm chí còn vượt qua Claude 4 trong hầu hết tuần này, đạt được tỷ lệ lỗi dưới 4%!.
6,71K