Avant que nous ne commencions à créer un IDE de codage pour l'IA afin que nous puissions simplement obtenir de bonnes données.
pash
pash19 juil., 09:58
Je tiens à souligner que pour les tâches du monde réel (pas les benchmarks), Kimi K2 surpasse Gemini. Ceci est une télémétrie de tous les utilisateurs de @cline, montrant le taux d'échec des modifications. Remarquez que Kimi a un taux d'échec d'environ 6 %, ce qui est significativement mieux que le taux d'erreur d'environ 10 % de Gemini. Remarquablement, Kimi a même surpassé Claude 4 pendant la majeure partie de cette semaine, atteignant un taux d'échec inférieur à 4 % !
6,71K