Noe virkelig flott arbeid fra @carlobaronio @pmmarsella @ybenpan! Fortsatt en lang horisont foran seg for agenter med flere svinger :)
Cognition
Cognition7. mai 2025
Våre forskningspraktikanter presenterer: Kevin-32B = K(ernel D)evin Det er den første åpne modellen som er trent ved hjelp av RL for å skrive CUDA-kjerner. Vi implementerte multi-turn RL ved hjelp av GRPO (basert på QwQ-32B) på KernelBench-datasettet. Den overgår de beste resonneringsmodellene (o3 og o4-mini)! 🧵
5,83K