热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

lmarena.ai
🧵按提供者排名的前10个开放模型
尽管专有模型通常位居榜首,但开放模型也在对战模式中并列,并在我们的公共排行榜上排名。
以下是按提供者排名的前10个开放模型。
- #1 Kimi K2(修改版MIT) @Kimi_Moonshot
- #2 DeepSeek R1 0528(MIT) @deepseek_ai
- #3 Qwen 235b a22b 无思考(Apache 2.0) @alibaba_qwen
- #4 MiniMax M1(MIT) @minimax_ai
- #5 Gemma 3 27b it(Gemma) @googledeepmind
- #6 Mistral Small Ultra(Apache 2.0) @mistral_ai
- #7 Llama 3.1 Nemotron Ultra 253b v1(Nvidia开放模型) @nvidia
- #8 Command A(Cohere) @cohere
- #9 Llama 4 Maverick Instruct(Llama 4) @aiatmeta
- #10 OLMo 2 32b Instruct(Apache 2.0) @allen_ai
查看线程以了解此列表中前5名的更多信息 👇

31.75K
🚨 突发消息:@Kimi_Moonshot 的 Kimi-K2 现在是竞技场中排名第一的开放模型!
凭借超过 3000 票的社区投票,它在整体排名中位列第五,超越了 DeepSeek,成为顶级开放模型。
祝贺 Moonshot 团队取得这一令人印象深刻的里程碑!排行榜现在在前 15 名中有 7 个不同的提供者——这是有史以来最具竞争力的时刻。
更多见解请查看线程 🧵


Kimi.ai7月11日 23:03
🚀 你好,Kimi K2!开源代理模型!
🔹 1T 总计 / 32B 活跃 MoE 模型
🔹 在 SWE Bench 上经过验证的 SOTA,Tau2 和 AceBench 在开放模型中
🔹 在编码和代理任务方面表现强劲
🐤 目前不支持多模态和思维模式
有了 Kimi K2,先进的代理智能比以往任何时候都更加开放和可及。我们迫不及待想看看你会构建什么!
🔌 API 已上线:
- 每百万输入令牌 $0.15(缓存命中)
- 每百万输入令牌 $0.60(缓存未命中)
- 每百万输出令牌 $2.50
🔗 技术博客:
🔗 权重与代码:
🔗 Github:
现在就试试,或通过 API!

247.23K
Kimi K2,来自 @Kimi_Moonshot 的最新作品现已在竞技场上线!


Kimi.ai7月11日 23:03
🚀 你好,Kimi K2!开源代理模型!
🔹 1T 总计 / 32B 活跃 MoE 模型
🔹 在 SWE Bench 上经过验证的 SOTA,Tau2 和 AceBench 在开放模型中
🔹 在编码和代理任务方面表现强劲
🐤 目前不支持多模态和思维模式
有了 Kimi K2,先进的代理智能比以往任何时候都更加开放和可及。我们迫不及待想看看你会构建什么!
🔌 API 已上线:
- 每百万输入令牌 $0.15(缓存命中)
- 每百万输入令牌 $0.60(缓存未命中)
- 每百万输出令牌 $2.50
🔗 技术博客:
🔗 权重与代码:
🔗 Github:
现在就试试,或通过 API!

46.33K
Kimi K2 很快将在竞技场加入🫡

Kimi.ai7月14日 21:42
我们已将 Kimi K2 提交给 @lmarena_ai。等待加入比赛池:
63.45K
🚨 新的竞争者进入竞技场:@xAI 的 Grok-4 已上线!
Grok-4 在许多艰难的基准测试中以 #1 的成绩首次亮相,令人印象深刻。
现在是时候进行现实世界的测试了:用你最棘手的提示来挑战 Grok-4!

xAI7月10日 12:01
介绍Grok 4,世界上最强大的AI模型。现在观看直播:
791.51K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可