Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
kebocoran alfa lainnya. teknik yang sama yang kami gunakan untuk KernelBench. Ini adalah pendekatan universal dalam bentuknya yang paling sederhana.
Contoh adalah semua yang Anda butuhkan: Dapatkan satu hasil yang baik atau satu peningkatan tunggal, tambahkan ke konteks, dapatkan lebih banyak hasil yang baik dengan konteks yang ditingkatkan, tambahkan ke konteks, inf...


22 Jul, 11.19
Baru-baru ini Openai, Goolge mencapai Medali Emas IMO dengan model eksperimental baru mereka.
Tetapi tim kami mencapai level yang sama dengan hanya o4-mini-tinggi dan sistem agen kami. Dan sekarang kami membuka sumbernya.
Terutama kami mendapatkan peningkatan gila dengan tolok ukur USAMO. Garis dasarnya hampir 0 tetapi agen kami mendapat rata-rata 90%.
Juga kita dapat membuktikan secara teoritis makalah arxiv baru-baru ini hanya memberikan Ide penelitian utama.

tidak ada gunanya melatih model kecil benar-benar ... Anda lebih baik menemukan program yang ideal untuk memberi makan ke mesin terbesar.
Jika Anda menginginkan distribusi output terbaik, Anda perlu menemukan distribusi input yang ideal, seperti latihan.
Anda bisa sampai di sana dari nol selama Anda memiliki cara untuk memberi peringkat output Anda.
Teknik orang-orang ini tampaknya terlalu direkayasa, kemungkinan bisa jauh lebih sederhana.
Generasi pertama KernelBench di o3-mini. Kami hanya menyebutnya "perbaikan diri."


30 Apr 2025
we have an unverified SOTA result on KernelBench with o3-mini and an evolutionary examples tape: 208/250 claimed speedups, including 3 for Level 4 (prev untouched).
would be grateful for any help reviewing the optimized KernelBench kernels at .
thank you to @anneouyang and Stanford’s @ScalingIntelLab for agreeing to review them.

3,15K
Teratas
Peringkat
Favorit