a minha palestra completa da feira mundial AIE já está disponível :)
AI Engineer
AI Engineer8/07, 01:34
🆕 Treinamento de Raciocínios Agentes A característica de hoje é o retorno triunfante de @willccbb ao palco AIE na trilha de RL - agora como parte do @PrimeIntellect! Muitos construtores de agentes estão basicamente fazendo "RL à mão". Ele explica de forma concisa os algoritmos de RL atuais em um slide (!) mas depois argumenta que o RL - particularmente para modelos abertos - está preso em perguntas e respostas de matemática e código. A nova tendência é o RL agente multi-turno, e a nova biblioteca de verificadores é o kit de ferramentas definitivo para construir um agente e transformá-lo em um loop de RL. Mais pessoas deveriam explorar a construção de melhores modelos de agentes e Will + PI está possibilitando isso para todos!
feedsImage
14,75K