Перед тем как мы начнем разрабатывать IDE для ИИ, чтобы мы могли просто получить хорошие данные.
pash
pash19 июл., 09:58
Я хотел бы отметить, что для реальных задач (не бенчмарков) Kimi K2 превосходит Gemini. Это телеметрия по всем пользователям @cline, показывающая разницу в уровне ошибок редактирования. Обратите внимание, что у Kimi примерно 6% уровень ошибок, что значительно лучше, чем у Gemini с ~ 10%. Удивительно, но Kimi даже обошел Claude 4 на протяжении большей части этой недели, достигнув уровня ошибок менее 4%!.
6,71K