nous avons un résultat SOTA non vérifié sur KernelBench avec o3-mini et une bande d’exemples évolutifs : 208/250 accélérations revendiquées, dont 3 pour le niveau 4 (précédent intact). je vous serais reconnaissant de toute aide pour examiner les noyaux KernelBench optimisés à l’adresse . merci à @anneouyang et à la @ScalingIntelLab de Stanford d’avoir accepté de les examiner.
wordgrammer
wordgrammer30 avr. 2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,66K