abbiamo un risultato SOTA non verificato su KernelBench con o3-mini e un nastro di esempi evolutivi: 208/250 accelerazioni dichiarate, di cui 3 per il Livello 4 (prev untouched). Sarei grato per qualsiasi aiuto nella revisione dei kernel KernelBench ottimizzati all'indirizzo . grazie a @anneouyang e Stanford's @ScalingIntelLab per aver accettato di recensirli.
wordgrammer
wordgrammer30 apr 2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,66K