Ik wil erop wijzen dat Kimi K2 in de echte wereldtaken (niet benchmarks) beter presteert dan Gemini. Dit is telemetrie van alle @cline gebruikers, die de verschillende foutpercentages bij bewerkingen laat zien. Let op hoe Kimi een foutpercentage van ongeveer 6% heeft, wat aanzienlijk beter is dan het foutpercentage van ongeveer 10% van Gemini. Opmerkelijk is dat Kimi deze week zelfs Claude 4 heeft overtroffen, met een foutpercentage van minder dan 4%!
Paul Gauthier
Paul Gauthier18 jul, 19:09
Kimi K2 scoorde 59% op de aider polyglot coding benchmark. Volledige ranglijst:
In onze interne "Hard" diff bewerkingsbenchmark voor gevallen waarin een frontier model eerder een diff bewerking niet kon uitvoeren (voor onze updates van het diff-algoritme), heeft Kimi Claude 3.5 overtroffen. Het zal interessant zijn om de resultaten van onze "Nightmare Difficulty" benchmarks in de komende weken te zien.
157,21K