Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ik wil erop wijzen dat Kimi K2 in de echte wereldtaken (niet benchmarks) beter presteert dan Gemini.
Dit is telemetrie van alle @cline gebruikers, die de verschillende foutpercentages bij bewerkingen laat zien. Let op hoe Kimi een foutpercentage van ongeveer 6% heeft, wat aanzienlijk beter is dan het foutpercentage van ongeveer 10% van Gemini.
Opmerkelijk is dat Kimi deze week zelfs Claude 4 heeft overtroffen, met een foutpercentage van minder dan 4%!

In onze interne "Hard" diff bewerkingsbenchmark voor gevallen waarin een frontier model eerder een diff bewerking niet kon uitvoeren (voor onze updates van het diff-algoritme), heeft Kimi Claude 3.5 overtroffen.
Het zal interessant zijn om de resultaten van onze "Nightmare Difficulty" benchmarks in de komende weken te zien.

157,21K
Boven
Positie
Favorieten