molto entusiasta di vedere dove andremo da qui con i modelli OS
pash
pash19 lug, 09:58
Vorrei sottolineare che per i compiti del mondo reale (non benchmark), Kimi K2 supera Gemini. Questa è la telemetria di tutti gli utenti @cline, che mostra il tasso di errore nelle modifiche. Nota come Kimi abbia circa un tasso di errore del 6%, che è significativamente migliore rispetto al tasso di errore di circa il 10% di Gemini. Incredibilmente, Kimi ha persino superato Claude 4 per la maggior parte di questa settimana, raggiungendo un tasso di errore inferiore al 4%!
7,4K