Inb4 startar vi en kodning ide för ai så att vi bara kan få bra data
pash
pash19 juli 09:58
Jag vill påpeka att när det gäller de verkliga uppgifterna (inte riktmärken) överträffar Kimi K2 Tvillingarna. Det här är telemetri för alla @cline användare som visar felfrekvensen för diff-redigering. Lägg märke till hur Kimi har ungefär 6 % felfrekvens, vilket är betydligt bättre än Geminis ~ 10 % felfrekvens. Anmärkningsvärt nog överträffade Kimi till och med Claude 4 under större delen av denna vecka och uppnådde en felfrekvens på under 4%!
6,71K