我們在 KernelBench 上有一個未經驗證的 SOTA 結果,其中包含 o3-mini 和一個進化示例磁帶:208/250 次聲稱的加速,其中包括 3 次 4 級加速(上一個未觸及)。 將不勝感激在 上審查優化的 KernelBench 內核的任何説明。 感謝 @anneouyang 和 Stanford's @ScalingIntelLab 同意對其進行審核。
wordgrammer
wordgrammer2025年4月30日
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10.65K