temos um resultado SOTA não verificado no KernelBench com o3-mini e uma fita de exemplos evolutivos: 208/250 acelerações reivindicadas, incluindo 3 para o Nível 4 (prev intocado). ficaria grato por qualquer ajuda na revisão dos kernels otimizados do KernelBench em . obrigado a @anneouyang e ao @ScalingIntelLab de Stanford por concordarem em revê-los.
wordgrammer
wordgrammer30/04/2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,65K