Inb4 ми запускаємо кодування ide для штучного інтелекту, щоб ми могли просто отримати хороші дані
pash
pash19 лип., 09:58
Хочу зазначити, що для реальних завдань (а не бенчмарків) Kimi K2 перевершує Gemini. Це телеметрія для всіх @cline користувачів, що показує частоту невдач редагування різниці. Зверніть увагу, що Kimi має близько 6% відмов, що значно краще, ніж показник помилок ~ 10% у Gemini. Примітно, що Кімі навіть перевершив Claude 4 протягом більшої частини цього тижня, досягнувши показника відмов нижче 4%!
6,7K