🆕 Formation des Raisonneurs Agentiques La fonctionnalité d'aujourd'hui est le retour triomphant de @willccbb sur la scène AIE dans la piste RL - maintenant en tant que partie de @PrimeIntellect ! Beaucoup de constructeurs d'agents font essentiellement du "RL à la main". Il explique de manière concise les algorithmes RL actuels en une diapositive (!) mais soutient ensuite que le RL - en particulier pour les modèles ouverts - est coincé dans un monde de questions-réponses mathématiques et de code. La nouvelle tendance est le RL agentique multi-tours, et la nouvelle bibliothèque de vérificateurs est l'outil ultime pour construire un agent et le transformer en une boucle RL. Plus de gens devraient explorer la construction de meilleurs modèles d'agents et Will + PI permet cela à tout le monde !
feedsImage
47,57K