在我們開始為 AI 開發編碼 IDE 之前,我們可以獲得良好的數據。
pash
pash7月19日 09:58
我想指出,對於現實世界的任務(而非基準測試),Kimi K2 的表現超過了 Gemini。 這是所有 @cline 用戶的遙測數據,顯示了不同的編輯失敗率。注意 Kimi 的失敗率約為 6%,這明顯優於 Gemini 約 10% 的錯誤率。 值得注意的是,Kimi 在本週的大部分時間內甚至超越了 Claude 4,達到了低於 4% 的失敗率!
6.7K