在 DeepSeek R1 之后,中国推出了新的 Claude 4 级模型,性能超越了 DeepSeek v3、Qwen 和 OpenAI GPT-4.1。 介绍 Kimi k2 - 一个拥有 1 万亿参数的模型,专为代理工作流程而设计,具有原生 MCP 集成。 100% 开源,免费试用。让这个事实沉淀一下。
Kimi k2 由 @Kimi_Moonshot 开发,是一个最先进的 AI 编码模型,能够在编码提示中提供惊人的一次性结果。
@Kimi_Moonshot Kimi K2 在编码基准测试中超越了 Claude Sonnet 4 和 GPT-4.1。 在 SWE-bench Verified 上得分 65.8%,而 Claude 为 50.2%,GPT 为 40.8%。 在非思考模型中,数学、编码和 AI 代理任务的 SOTA 性能。
@Kimi_Moonshot Kimi K2 直接在你的终端中运行。 它理解你的环境,决定采取什么行动,并无缝执行。 它仅凭一个提示就构建了一个 3D Minecraft 网页版本。
517.24K