DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik wil erop wijzen dat Kimi K2 in de echte wereldtaken (niet benchmarks) beter presteert dan Gemini. Dit is telemetrie van alle @cline gebruikers, die de verschillende foutpercentages bij bewerkingen laat zien. Let op hoe Kimi een foutpercentage van ongeveer 6% heeft, wat aanzienlijk beter is dan het foutpercentage van ongeveer 10% van Gemini. Opmerkelijk is dat Kimi deze week zelfs Claude 4 heeft overtroffen, met een foutpercentage van minder dan 4%!

In onze interne "Hard" diff bewerkingsbenchmark voor gevallen waarin een frontier model eerder een diff bewerking niet kon uitvoeren (voor onze updates van het diff-algoritme), heeft Kimi Claude 3.5 overtroffen. Het zal interessant zijn om de resultaten van onze "Nightmare Difficulty" benchmarks in de komende weken te zien.

157,21K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste