Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
a minha palestra completa da feira mundial AIE já está disponível :)

8/07, 01:34
🆕 Treinamento de Raciocínios Agentes
A característica de hoje é o retorno triunfante de @willccbb ao palco AIE na trilha de RL - agora como parte do @PrimeIntellect!
Muitos construtores de agentes estão basicamente fazendo "RL à mão". Ele explica de forma concisa os algoritmos de RL atuais em um slide (!) mas depois argumenta que o RL - particularmente para modelos abertos - está preso em perguntas e respostas de matemática e código.
A nova tendência é o RL agente multi-turno, e a nova biblioteca de verificadores é o kit de ferramentas definitivo para construir um agente e transformá-lo em um loop de RL.
Mais pessoas deveriam explorar a construção de melhores modelos de agentes e Will + PI está possibilitando isso para todos!



14,75K
Top
Classificação
Favoritos