У нас есть непроверенный результат SOTA на KernelBench с o3-mini и эволюционной лентой примеров: заявлено 208/250 ускорений, включая 3 для уровня 4 (ранее не тронутого). Будем благодарны за любую помощь в проверке оптимизированных ядер KernelBench на . Спасибо @anneouyang и лаборатории @ScalingIntelLab Стэнфорда за согласие их проверить.
wordgrammer
wordgrammer30 апр. 2025 г.
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10,65K