A próxima fronteira da IA não é computação ou modelos maiores, são dados melhores. Hoje, estamos trazendo uma das poucas pessoas que realmente passou a vida resolvendo esse problema. Bem-vindo @SPChinchali, nosso novo diretor de IA. A fronteira da IA não é mais definida por modelos com mais parâmetros ou clusters de computação com mais GPUs. Ele será definido pela escassez de dados de alta integridade e IP do mundo físico (pense em robótica, hardware autônomo e dispositivos de ponta). Sandeep passou sua carreira perseguindo essa fronteira. Agora ele está nos ajudando a desbloqueá-lo. Quando conheci Sandeep, fiquei impressionado com sua atitude cativante e de fala mansa. Ele tem uma maneira de falar que atrai você, independentemente de estar explicando a IA neurosimbólica ou elogiando o teclado ergonômico de aparência alienígena que ele carrega aonde quer que vá. Sua formação fala por si: Stanford PhD, NASA JPL. Agora professor da UT Austin, liderando pesquisas na interseção de ML descentralizado e robótica, Sandeep está obcecado em como obter dados úteis para o treinamento de IA para torná-lo útil no mundo real: > criação de incentivos de dados para redes distribuídas, > abordando o problema de amostragem de cauda longa por excelência na robótica de ponta, e > projetar sistemas que preservem a proveniência. Sandeep também confirmou uma tese pela qual sou obcecado há anos: o verdadeiro fosso são os dados. Não fóruns do Reddit raspados ou texto genérico da web, mas atribuíveis, direitos liberados, dados do mundo real. Os dados confusos e imprevisíveis necessários para tornar os sistemas físicos robustos não podem ser simulados. Ele está obtendo e selecionando os dados confusos e de cauda longa que os sistemas físicos veem na natureza: o robô escorregadio da doca de carregamento às 2 da manhã, a micro-rachadura fraca em uma pá de turbina eólica, a caixa de canto que uma unidade lidar nunca viu antes. Esses momentos são IP e são preciosos. Se pudermos tornar esse IP programável, licenciável, rastreável e monetizável em tempo real, desbloquearemos um volante para todas as equipes de IA do planeta. O IP programável é o único backbone que torna isso possível. A maioria das tentativas de criptografia x IA aparafusa "IA" na infraestrutura existente. Sandeep está se juntando porque o Story foi desenvolvido desde o início para resolver esses tipos de desafios de coordenação de dados A história é construída para relacionamentos dinâmicos e combináveis. Nosso protocolo foi projetado para a proveniência baseada em gráficos, licenciamento dinâmico e fluxos de royalties automatizados que os sistemas modernos de IA exigem. Uma foto pode ser licenciada, um rótulo pode ser adicionado, uma variação sintética pode ser gerada e, no Story, cada ação se torna um novo ativo IP vinculado em um gráfico transparente, com valor fluindo de volta para cada colaborador. A chegada de Sandeep é um ponto de virada. O capítulo 2 da história está entrando em foco e a próxima fase da infraestrutura de IA está apenas começando. Sua combinação de intelecto profundo, curiosidade genuína e dedicação silenciosa é exatamente o que este momento exige. Não poderíamos estar mais empolgados em construir o futuro da IA com ele, e há muito mais por vir. Fique ligado!
Sandeep Chinchali
Sandeep Chinchali17 de jul., 23:00
Passei minha carreira perseguindo uma pergunta: como reunimos os dados certos para fazer a IA funcionar no mundo real? Dos laboratórios de Stanford às salas de aula da UT Austin, procurei em todos os lugares. A resposta não é outro laboratório de IA, mas um blockchain construído para tratar dados como IP. É por isso que estou me juntando à @StoryProtocol como Chief AI Officer. Em Stanford, estudei "robótica em nuvem", como frotas de robôs poderiam usar a computação distribuída para aprender juntos. Eu até montei uma câmera de painel no meu carro para resolver isso: Se os robôs só pudessem fazer upload de 5 a 10% do que veem, como escolhemos os dados mais valiosos? A maior parte eram filmagens chatas de rodovias. Mas <1% capturou cenas raras: Waymos autônomos, canteiros de obras, humanos imprevisíveis. Esses dados de "cauda longa" tornaram os modelos mais inteligentes. Eu o rotulei à mão, até paguei o serviço de rotulagem do Google Cloud para anotar minhas filmagens com conceitos de nicho como "unidade LIDAR" e "veículo autônomo" e treinei modelos que rodavam em um TPU do tamanho de um USB. Mas a academia só vai até certo ponto. Na UT Austin, minhas perguntas mudaram: → Como fazemos crowdsourcing de dados raros para melhorar o ML? → Quais sistemas de incentivo realmente funcionam? Isso me atraiu para a criptografia – blockchains, economias de token e até DePIN. Eu escrevi no blog, escrevi artigos sobre ML descentralizado, mas ainda me perguntava: quem está realmente construindo essa infraestrutura? Por acaso, conheci a equipe da Story. Fui convidado para dar uma palestra em seu escritório em Palo Alto. Eram 18h, sala ainda lotada. Eu divaguei sobre "IA Neuro-Simbólica" e terminei com um slide chamado "A Dash of Crypto". Essa conversa se transformou em um papel consultivo, que agora se transformou em algo muito maior. Estamos em um momento crucial. A computação está quase toda resolvida. As arquiteturas de modelo são copiadas durante a noite. O verdadeiro fosso são os dados. Não raspado Reddit. Não linguagem interminável. Mas dados do mundo real, de cauda longa e liberados de direitos que treinam IA incorporada – robôs, AVs, sistemas que navegam em nosso mundo confuso. Imagine isso: eu capturo uma cena rara de direção na câmera do painel e a registro no Story. Um amigo o rotula. Um agente de IA cria variantes sintéticas. Na cadeia estruturada por gráficos da Story, cada um se torna IP vinculado. Os royalties fluem automaticamente. Todos são pagos, cada passo rastreável na cadeia. É por isso que agora sou Chief AI Officer da Story, construindo os trilhos para dados de treinamento descentralizados e compensados por IP. É hora de tornar os dados o novo IP. A história é o lugar para fazer isso. Muito mais por vir em breve. Vamos.
feedsImage
6,94K