KernelBenchには、o3-miniと進化例テープを使用して未検証のSOTA結果があります:レベル4の3つを含む208/250のスピードアップが主張されています(以前のものは手つかず)。 で最適化されたKernelBenchカーネルのレビューにご協力いただければ幸いです。 @anneouyangとスタンフォード大学の@ScalingIntelLabがそれらをレビューすることに同意してくれたことに感謝します。
wordgrammer
wordgrammer2025年4月30日
The good GPT wrappers have already been built, and ChatGPT struggled to write raw Cuda. Now is the time for monsters.
10.66K