Jsem nadšený, že uvidíme, kam se s OS Models vydáme dál
pash
pash19. 7. 09:58
Rád bych podotkl, že pro úlohy v reálném světě (ne v benchmarcích) Kimi K2 překonává Gemini. Jedná se o telemetrii napříč všemi uživateli @cline, která ukazuje míru selhání rozdílových úprav. Všimněte si, že Kimi má asi 6% poruchovost, což je výrazně lepší než chybovost ~ 10 % u Gemini. Pozoruhodné je, že Kimi dokonce po většinu tohoto týdne překonal Clauda 4 a dosáhl míry selhání pod 4 %!
7,4K