一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

熱門話題

另一個 alpha 洩漏。與我們用於 KernelBench 的技術相同。這是一種最簡單形式的通用方法。你只需要範例：獲得一個好的結果或一個單一的改進，添加到上下文中，獲得更多好的結果，並改善上下文，將這些添加到上下文中，無限循環…

訓練小模型真的沒有意義……你最好是找到理想的程序來餵給最大的機器。如果你想要最佳的輸出分佈，你需要找到理想的輸入分佈，就像練習一樣。只要你有一種方法來評估你的輸出，你就可以從無到有。不過這些人的技術似乎過於複雜，實際上可以簡單得多。

KernelBench 的第一代在 o3-mini 上。我們稱這為「自我提升」。

3.16K

熱門

排行

收藏

鏈上熱點

X 熱門榜

近期融資

最受認可