Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🆕 Treinamento de raciocinadores agenciais
o recurso de hoje é o retorno triunfante de @willccbb à pista RL do palco AIE - agora como parte de @PrimeIntellect!
Muitos construtores de agentes estão basicamente fazendo "RL à mão". Ele explica de forma concisa os algoritmos atuais de RL em um slide (!), mas depois argumenta que a RL - particularmente para modelos abertos - está presa na terra de perguntas e respostas de matemática e código
a nova gostosura é RL agêntica de várias voltas, e a nova biblioteca de verificadores é o kit de ferramentas definitivo para construir um agente e transformá-lo em um loop de RL.
Mais pessoas deveriam explorar a construção de melhores modelos de agentes e Will + PI está permitindo isso para todos!



47,58K
Melhores
Classificação
Favoritos