Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🆕 Träning av agentiska resonemang
dagens inslag är @willccbb:s triumferande återkomst till AIE-scenen RL-banan - nu som en del av @PrimeIntellect!
Många agentbyggare gör i princip "RL för hand". Han förklarar kortfattat nuvarande RL-algoritmer i en bild (!) men hävdar sedan att RL - särskilt för öppna modeller - har fastnat i matematik och kod Q&A-land
den nya hetheten är multi-turn agentic RL, och det nya verifierarbiblioteket är den ultimata verktygslådan för att bygga en agent och förvandla den till en RL-loop.
Fler människor borde utforska att bygga bättre agentmodeller och Will + PI möjliggör det för alla!



47,58K
Topp
Rankning
Favoriter