vi har ett overifierat SOTA-resultat på KernelBench med o3-mini och ett evolutionärt exempelband: 208/250 påstådda speedups, inklusive 3 för nivå 4 (tidigare orörd). skulle vara tacksam för all hjälp med att granska de optimerade KernelBench-kärnorna på . Tack till @anneouyang och Stanfords @ScalingIntelLab för att ni gick med på att granska dem.
wordgrammer
wordgrammer30 apr. 2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,66K