temos um resultado SOTA não verificado no KernelBench com o3-mini e uma fita de exemplos evolutivos: 208/250 acelerações reivindicadas, incluindo 3 para o Nível 4 (anterior intocado). ficaria grato por qualquer ajuda para revisar os kernels otimizados do KernelBench em . obrigado a @anneouyang e ao @ScalingIntelLab de Stanford por concordar em revisá-los.
wordgrammer
wordgrammer30 de abr. de 2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,65K