La próxima frontera de la IA no es el cálculo o modelos más grandes, es mejor datos. Hoy, estamos incorporando a una de las pocas personas que realmente ha pasado su vida resolviendo ese problema. Bienvenido @SPChinchali, nuestro nuevo Director de IA. La frontera de la IA ya no se define por modelos con más parámetros, o clústeres de cálculo con más GPUs. Se definirá por la escasez de datos de alta integridad, con derechos de propiedad intelectual claros, del mundo físico (piensa en robótica, hardware autónomo y dispositivos de borde). Sandeep ha pasado su carrera persiguiendo esta frontera. Ahora nos está ayudando a desbloquearla. Cuando conocí a Sandeep por primera vez, me impresionó su actitud suave y entrañable. Tiene una forma de hablar que te atrae, independientemente de si está explicando IA neurosimbólica o alabando el teclado ergonómico de aspecto alienígena que lleva a donde quiera que va. Su trayectoria habla por sí misma: PhD de Stanford, NASA JPL. Ahora es profesor en UT Austin, liderando investigaciones en la intersección de ML descentralizado y robótica. Sandeep ha estado obsesionado con cómo obtener datos útiles para el entrenamiento de IA para que sea útil en el mundo real: > creando incentivos de datos para redes distribuidas, > abordando el problema clásico de muestreo de cola larga en robótica de borde, y > diseñando sistemas que preserven la procedencia. Sandeep también confirmó una tesis que me ha obsesionado durante años: la verdadera ventaja competitiva son los datos. No foros de Reddit raspados o texto web genérico, sino datos del mundo real atribuibles y con derechos claros. Los datos desordenados e impredecibles requeridos para hacer que los sistemas físicos sean robustos no pueden ser simulados. Se trata de obtener y curar los datos desordenados y de cola larga que los sistemas físicos ven en la naturaleza: el robot de carga resbaladizo en el muelle a las 2 a.m., la micro-grieta tenue en una pala de turbina eólica, el caso extremo que una unidad lidar nunca ha visto antes. Esos momentos son propiedad intelectual, y son preciosos. Si podemos hacer que esa propiedad intelectual sea programable, licenciable, rastreable y monetizable en tiempo real, desbloqueamos un ciclo virtuoso para cada equipo de IA en el planeta. La propiedad intelectual programable es la única columna vertebral que hace esto posible. La mayoría de los intentos de combinar cripto y IA añaden "IA" a la infraestructura existente. Sandeep se une porque Story está construido desde cero para resolver este tipo de desafíos de coordinación de datos. Story está diseñado para relaciones dinámicas y composables. Nuestro protocolo está diseñado para la procedencia basada en grafos, licencias dinámicas y flujos de regalías automatizados que los sistemas de IA modernos exigen. Una foto puede ser licenciada, se puede añadir una etiqueta, se puede generar una variación sintética, y en Story, cada acción se convierte en un nuevo activo de propiedad intelectual vinculado en un gráfico transparente, con valor fluyendo de regreso a cada contribuyente. La llegada de Sandeep es un punto de inflexión. El capítulo 2 de Story está tomando forma, y la próxima fase de la infraestructura de IA apenas está comenzando. Su combinación de profundo intelecto, genuina curiosidad y dedicación silenciosa es exactamente lo que este momento requiere. No podríamos estar más emocionados de construir el futuro de la IA con él, y hay mucho más por venir. ¡Estén atentos!
Sandeep Chinchali
Sandeep Chinchali17 jul, 23:00
He pasado mi carrera persiguiendo una pregunta: ¿Cómo reunimos los datos correctos para hacer que la IA funcione en el mundo real? Desde los laboratorios de Stanford hasta las aulas de UT Austin, busqué en todas partes. La respuesta no es otro laboratorio de IA, sino una blockchain construida para tratar los datos como propiedad intelectual. Por eso me uno a @StoryProtocol como su Director de IA. En Stanford, estudié "robótica en la nube", cómo flotas de robots podrían usar computación distribuida para aprender juntos. Incluso monté una cámara en mi coche para resolver esto: Si los robots solo pudieran subir el 5-10% de lo que ven, ¿cómo elegimos los datos más valiosos? La mayor parte era metraje aburrido de la autopista. Pero <1% capturó escenas raras: Waymos autónomos, sitios de construcción, humanos impredecibles. Esos datos de "larga cola" hicieron que los modelos fueran más inteligentes. Los etiqueté a mano, incluso pagué el servicio de etiquetado de Google Cloud para anotar mi metraje con conceptos específicos como "unidad LIDAR" y "vehículo autónomo", y entrené modelos que funcionaban en un TPU del tamaño de un USB. Pero la academia solo llega hasta cierto punto. En UT Austin, mis preguntas cambiaron: → ¿Cómo podemos hacer crowdsourcing de datos raros para mejorar el ML? → ¿Qué sistemas de incentivos realmente funcionan? Eso me llevó al cripto: blockchains, economías de tokens, incluso DePIN. Escribí en un blog, redacté artículos sobre ML descentralizado, pero aún me preguntaba: ¿quién está realmente construyendo esta infraestructura? Por pura casualidad, conocí al equipo de Story. Me invitaron a dar una charla en su oficina de Palo Alto. Eran las 6 PM, la sala aún estaba llena. Hablé sobre "IA Neuro-Simbólica" y terminé con una diapositiva llamada "Un Toque de Cripto". Esa charla se convirtió en un rol de asesoría, que ahora se ha transformado en algo mucho más grande. Estamos en un momento crucial. La computación está mayormente resuelta. Las arquitecturas de modelos se copian de la noche a la mañana. La verdadera ventaja competitiva son los datos. No datos extraídos de Reddit. No lenguaje interminable. Sino datos del mundo real, de larga cola y con derechos claros que entrenan IA encarnadas: robots, vehículos autónomos, sistemas que navegan nuestro mundo desordenado. Imagina esto: Capturo una escena de conducción rara en la cámara del coche y la registro en Story. Un amigo la etiqueta. Un agente de IA crea variantes sintéticas. En la cadena estructurada en grafos de Story, cada una se convierte en propiedad intelectual vinculada. Las regalías fluyen automáticamente. Todos reciben pago, cada paso es rastreable en la cadena. Por eso ahora soy el Director de IA en Story, construyendo las vías para datos de entrenamiento descentralizados y con derechos claros. Es hora de hacer que los datos sean la nueva propiedad intelectual. Story es el lugar para hacerlo. Mucho más por venir pronto. Vamos.
feedsImage
6,9K