Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Solo hazte un favor y lee la explicación de Trissy de por qué @codecopenflow es una de las mejores apuestas para los operadores de IA
OpenAI acaba de lanzar su agente de operadores, por lo que está claro que los grandes también están trabajando en VLAs
Sigue siendo de alto riesgo, pero la estratosfera es el techo ideal para este

18 jul, 16:10
OpenAI acaba de confirmar mi tesis de la estrella del norte para la IA hoy al lanzar su agente operador.
No solo fue esta mi tesis rectora para $CODEC, sino para todas las demás inversiones en IA que hice, incluidas las de principios de año durante la manía de la IA.
Ha habido mucha discusión con Codec con respecto a la robótica, aunque esa vertical tendrá su propia narrativa muy pronto, la razón subyacente por la que fui tan optimista sobre Codec desde el día 1 se debe a cómo su arquitectura impulsa a los agentes operadores.
La gente todavía subestima cuánta participación de mercado está en juego al crear software que se ejecuta de forma autónoma, superando a los trabajadores humanos sin la necesidad de indicaciones o supervisión constantes.
He visto muchas comparaciones con $NUIT. En primer lugar, quiero decir que soy un gran admirador de lo que Nuit está construyendo y no deseo nada más que su éxito. Si escribes "nuit" en mi telegrama, verás que en abril dije que si tuviera que mantener una moneda durante varios meses, habría sido Nuit debido a mi tesis de operador.
Nuit era el proyecto de operador más prometedor sobre el papel, pero después de una extensa investigación, descubrí que su arquitectura carecía de la profundidad necesaria para justificar una inversión importante o poner mi reputación detrás de ella.
Con esto en mente, ya era consciente de las brechas arquitectónicas en los equipos de agentes operadores existentes y buscaba activamente un proyecto que las abordara. Poco después apareció Codec (gracias a @0xdetweiler insistiendo en que los investigara más profundamente) y esta es la diferencia entre los dos:
$CODEC frente a $NUIT
La arquitectura de Codec se construye en tres capas; Máquina, sistema e inteligencia, que separan la infraestructura, la interfaz del entorno y la lógica de IA. Cada agente de operador en Codec se ejecuta en su propia máquina virtual o contenedor aislado, lo que permite un rendimiento casi nativo y aislamiento de fallas. Este diseño en capas significa que los componentes pueden escalar o evolucionar de forma independiente sin romper el sistema.
La arquitectura de Nuit toma un camino diferente al ser más monolítica. Su pila gira en torno a un agente de navegador web especializado que combina análisis, razonamiento de IA y acción. Lo que significa que analizan profundamente las páginas web en datos estructurados para que la IA los consuma y se basan en el procesamiento en la nube para tareas pesadas de IA.
El enfoque de Codec de incrustar un modelo ligero de Visión-Lenguaje-Acción (VLA) dentro de cada agente significa que puede ejecutarse completamente local. Lo que no requiere un ping constante a la nube para obtener instrucciones, lo que reduce la latencia y evita la dependencia del tiempo de actividad y el ancho de banda.
El agente de Nuit procesa las tareas convirtiendo primero las páginas web a un formato semántico y luego usando un cerebro LLM para averiguar qué hacer, lo que mejora con el tiempo con el aprendizaje por refuerzo. Si bien es efectivo para la automatización web, este flujo depende del procesamiento pesado de IA del lado de la nube y las estructuras de página predefinidas. La inteligencia de dispositivos locales de Codec significa que las decisiones ocurren más cerca de los datos, lo que reduce la sobrecarga y hace que el sistema sea más estable ante cambios inesperados (sin scripts frágiles ni suposiciones DOM).
Los operadores de Codec siguen un bucle continuo de percibir-pensar-actuar. La capa de la máquina transmite el entorno (por ejemplo, una aplicación en vivo o una fuente de robot) a la capa de inteligencia a través de los canales optimizados de la capa del sistema, lo que le da a la IA "ojos" en el estado actual. Luego, el modelo VLA del agente interpreta las imágenes y las instrucciones juntas para decidir una acción, que la capa del sistema ejecuta a través de eventos de teclado / mouse o control de robot. Este bucle integrado significa que se adapta a eventos en vivo, incluso si la interfaz de usuario cambia, no interrumpirá el flujo.
Para poner todo esto en una analogía más simple, piense en los operadores de Codec como un empleado autosuficiente que se adapta a las sorpresas en el trabajo. El agente de Nuit es como un empleado que necesita hacer una pausa, describir la situación a un supervisor por teléfono y esperar instrucciones.
Sin caer demasiado en una madriguera de conejo técnica, esto debería darle una idea de alto nivel de por qué elegí Codec como mi apuesta principal en Operadores.
Sí, Nuit cuenta con el respaldo de YC, un equipo apilado y un github de nivel S. Aunque la arquitectura de Codec se ha construido teniendo en cuenta el escalado horizontal, lo que significa que puede implementar miles de agentes en paralelo sin memoria compartida ni contexto de ejecución entre agentes. El equipo de Codec tampoco es un desarrollador promedio.
Su arquitectura VLA abre una multitud de casos de uso que no eran posibles con los modelos de agentes anteriores debido a la visión a través de píxeles, no capturas de pantalla.
Podría continuar, pero lo guardaré para futuras publicaciones.
1.93K
Populares
Ranking
Favoritas