у нас є неперевірений результат SOTA на KernelBench з o3-mini та еволюційною стрічкою прикладів: 208/250 заявлених прискорень, у тому числі 3 для 4 рівня (попереднє недоторкане). буду вдячний за будь-яку допомогу в огляді оптимізованих ядер KernelBench на . Дякуємо @anneouyang та @ScalingIntelLab Стенфорду за згоду їх переглянути.
wordgrammer
wordgrammer30 квіт. 2025 р.
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,66K