wir haben ein unverifiziertes SOTA-Ergebnis auf KernelBench mit o3-mini und ein Evolutionsbeispielband: 208/250 behauptete Beschleunigungen, darunter 3 für Level 4 (vorher unberührt). Ich wäre dankbar für jede Hilfe bei der Überprüfung der optimierten KernelBench-Kernel unter . Vielen Dank an @anneouyang und die @ScalingIntelLab von Stanford, dass sie sich bereit erklärt haben, sie zu überprüfen.
wordgrammer
wordgrammer30. Apr. 2025
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,66K