Zanim zaczniemy, stworzymy IDE do kodowania dla AI, abyśmy mogli po prostu uzyskać dobre dane.
pash
pash19 lip, 09:58
Chciałbym zwrócić uwagę, że w przypadku rzeczywistych zadań (nie benchmarków) Kimi K2 przewyższa Gemini. To jest telemetria z wszystkich użytkowników @cline, pokazująca różnice w wskaźniku błędów edycji. Zauważ, że Kimi ma około 6% wskaźnik błędów, co jest znacznie lepsze niż około 10% wskaźnik błędów Gemini. Co ciekawe, Kimi przez większość tego tygodnia przewyższył Claude 4, osiągając wskaźnik błędów poniżej 4%!
6,71K