热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们的研究实习生介绍:
Kevin-32B = K(ernel D)evin
这是第一个使用 RL 训练的用于编写 CUDA 内核的开放模型。我们在 KernelBench 数据集上使用 GRPO (基于 QwQ-32B)实现了多轮 RL。
它的表现优于顶级推理模型(o3 & o4-mini)!🧵

316.07K
热门
排行
收藏