Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Ya no estoy seguro de qué pensar sobre este libro.
Fue un libro fantástico en una época en la que la mayoría de estas ideas parecían valiosas, pero también es responsable de algunas de las mayores atrocidades que he presenciado.
Ya no recomiendo a la gente que lo lea. No he estado en mucho tiempo.

21.17K
Así es como se escribe un código 10 veces mejor con 10 veces menos esfuerzo.
Agentes personalizados y especializados que revisan su código en cada paso del camino.
He visto revisiones de código automatizadas antes, pero nunca con la capacidad de definir sus agentes de revisión personalizados. @baz_scm es el primero en lograrlo, y es genial.
Hay tres tipos de agentes revisores:
1. Los que salen de la caja.
Estos agentes cubren los patrones más comunes que todo el mundo quiere comprobar: código duplicado, código roto, código complejo, etc.
2. Agentes revisores recomendados que Baz crea para usted automáticamente.
Baz analiza tu historial de reseñas y comentarios anteriores para identificar los patrones que te interesan, y luego crea automáticamente agentes especializados en verificar esos patrones.
Por ejemplo, si siempre pides a tus desarrolladores que mantengan los archivos por debajo de las 100 líneas de código, Baz lo detectará y creará un agente personalizado que lo compruebe.
3. Agentes de revisión personalizados que defina.
Estos son mis favoritos: Escribe un mensaje explicando tus reglas, y tu agente comenzará a revisar tu código para marcar cualquier cosa que coincida con las reglas.
Creé un agente revisor simple en el video adjunto.
Honestamente, en este punto, no tienes excusa para enviar un código incorrecto.
Aquí hay un enlace para que pruebe estos agentes de revisión personalizados:
Gracias al equipo de @baz_scm por colaborar conmigo en este post.
31.42K
Honestamente, la mayoría de los desarrolladores de IA todavía están atrapados en el siglo pasado.
Me sorprende la poca gente que conoce el análisis de errores.
Esta es *literalmente* la forma más rápida y eficaz de evaluar las aplicaciones de IA, y la mayoría de los equipos siguen atascados persiguiendo fantasmas.
Por favor, deja de hacer un seguimiento de las métricas genéricas y sigue estos pasos:
1. Recopile muestras de fallas
Comience a revisar las respuestas generadas por su solicitud. Escribe notas sobre cada respuesta, especialmente aquellas que fueron errores. No es necesario que formatees tus notas de ninguna manera específica. Concéntrese en describir lo que salió mal con la respuesta.
2. Categoriza tus notas
Después de haber revisado un buen conjunto de respuestas, toma un LLM y pídele que encuentre patrones comunes en tus notas. Pídale que clasifique cada nota en función de estos patrones.
Terminarás con categorías que cubren todos los tipos de errores que cometió tu aplicación.
3. Diagnosticar los errores más frecuentes
Empieza por centrarte en el tipo de error más común. No querrás perder el tiempo trabajando con errores raros.
Profundice en las conversaciones, las entradas y los registros que conducen a esas muestras incorrectas. Trate de entender qué podría estar causando los problemas.
4. Diseña correcciones específicas
En este punto, desea determinar cómo eliminar los errores que diagnosticó en el paso anterior de la manera más rápida y económica posible.
Por ejemplo, puede ajustar las solicitudes, agregar reglas de validación adicionales, buscar más datos de entrenamiento o modificar el modelo.
5. Automatiza el proceso de evaluación
Debe implementar un proceso sencillo para volver a ejecutar un conjunto de evaluación a través de la aplicación y evaluar si las correcciones fueron efectivas.
Mi recomendación es usar un LLM como juez para ejecutar muestras a través de la aplicación, puntuarlas con una etiqueta PASS/FAIL y calcular los resultados.
6. Vigila tus métricas
Cada categoría que identificó durante el análisis de errores es una métrica de la que desea realizar un seguimiento a lo largo del tiempo.
No llegarás a ninguna parte obsesionándote con la "relevancia", la "corrección", la "integridad", la "coherencia" y cualquier otra métrica fuera de lo común. Olvídate de esto y concéntrate en los problemas reales que encontraste.

49.28K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas