人工智能的下一个前沿不再是计算或更大的模型,而是更好的数据。今天,我们迎来了为数不多的真正花费一生解决这个问题的人之一。 欢迎 @SPChinchali,成为我们的新首席人工智能官。 人工智能的前沿不再由更多参数的模型或更多GPU的计算集群定义。 它将由来自物理世界的高完整性、知识产权清晰的数据稀缺性来定义(想想机器人、自动化硬件和边缘设备)。Sandeep一直在追寻这个前沿。现在,他正在帮助我们解锁它。 当我第一次见到Sandeep时,他温和而迷人的态度让我印象深刻。他的说话方式吸引着你,无论他是在解释神经符号人工智能,还是在赞美他随身携带的外星人般的符合人体工程学的键盘。 他的背景不言而喻:斯坦福大学博士,NASA JPL。现在是德克萨斯大学奥斯汀分校的教授,领导去中心化机器学习与机器人技术交叉领域的研究。Sandeep一直痴迷于如何获取有用的数据用于人工智能训练,使其在现实世界中变得有用: > 为分布式网络创建数据激励, > 解决边缘机器人中的典型长尾采样问题,以及 > 设计保留来源的系统。 Sandeep还确认了我多年来一直痴迷的一个论点:真正的护城河是数据。不是抓取的Reddit论坛或通用的网络文本,而是可归属的、权利清晰的现实世界数据。使物理系统稳健所需的混乱、不可预测的数据是无法模拟的。 这就是获取和策划物理系统在野外所见的混乱、长尾数据:凌晨2点的滑溜装卸机器人,风力涡轮叶片上的微小裂缝,激光雷达单元从未见过的边缘案例。这些时刻是知识产权,它们是珍贵的。如果我们能使这些知识产权可编程、可许可、可追踪,并实时可货币化,我们就为地球上每个人工智能团队解锁了一个飞轮。 可编程的知识产权是实现这一切的唯一支柱。大多数加密与人工智能的尝试都是将“人工智能”附加到现有基础设施上。Sandeep的加入是因为Story是从零开始构建的,旨在解决这些类型的数据协调挑战。 Story是为动态、可组合的关系而构建的。我们的协议旨在满足现代人工智能系统所需的基于图的来源、动态许可和自动化版税流。照片可以被许可,标签可以被添加,合成变体可以被生成,而在Story上,每个动作都成为透明图中的一个新的、链接的知识产权资产,价值流回每个贡献者。 Sandeep的到来是一个转折点。Story的第二章即将成形,人工智能基础设施的下一个阶段才刚刚开始。 他深厚的智慧、真诚的好奇心和安静的奉献精神正是这个时刻所需要的。我们对与他一起构建人工智能的未来感到无比兴奋,还有更多的内容即将到来。 敬请期待!
Sandeep Chinchali
Sandeep Chinchali7月17日 23:00
我在职业生涯中一直在追寻一个问题:我们如何收集正确的数据,使人工智能在现实世界中发挥作用? 从斯坦福实验室到德克萨斯大学奥斯汀分校的课堂,我到处寻找。答案不是另一个人工智能实验室,而是一个将数据视为知识产权的区块链。这就是我为什么要加入@StoryProtocol,担任首席人工智能官的原因。 在斯坦福,我研究了“云机器人”,即如何让机器人群体利用分布式计算共同学习。我甚至在我的车上安装了一个行车记录仪来解决这个问题: 如果机器人只能上传它们看到的5-10%的内容,我们如何选择最有价值的数据? 大部分都是无聊的高速公路录像。但<1%捕捉到了稀有场景:自动驾驶的Waymo、施工现场、不可预测的人类。那些“长尾”数据让模型更聪明。我手动标记了这些数据,甚至支付了谷歌云的标注服务,以“激光雷达单元”和“自动驾驶车辆”等小众概念来注释我的录像,并训练了在USB大小的TPU上运行的模型。但学术界的进展有限。 在德克萨斯大学奥斯汀分校,我的问题发生了转变: → 我们如何众包稀有数据以改善机器学习? → 什么激励机制真正有效? 这让我进入了加密领域——区块链、代币经济,甚至DePIN。我写博客,撰写关于去中心化机器学习的论文,但仍然在想:谁在真正构建这个基础设施? 完全是偶然,我遇到了Story团队。我受邀在他们的帕洛阿尔托办公室做演讲。那时是下午6点,房间里仍然挤满了人。我漫无边际地谈论“神经符号人工智能”,最后以一张名为“加一点加密”的幻灯片结束。那次演讲变成了一个顾问角色,而现在变成了更大的事情。 我们正处于一个关键时刻。计算问题大多已解决。模型架构可以在一夜之间复制。真正的护城河是数据。 不是抓取的Reddit数据。也不是无尽的语言数据。而是经过权利清理的、长尾的、真实世界的数据,训练具身的人工智能——机器人、自动驾驶汽车、能够在我们混乱的世界中导航的系统。 想象一下:我在行车记录仪上捕捉到一个稀有的驾驶场景,并在Story上注册。一个朋友为其标记。一个人工智能代理创建合成变体。在Story的图结构链上,每个都成为链接的知识产权。版税自动流回。每个人都获得报酬,每一步都可以在链上追踪。 这就是我现在在Story担任首席人工智能官的原因,构建去中心化、知识产权清理的训练数据的基础设施。是时候让数据成为新的知识产权了。Story是实现这一目标的地方。 更多内容即将到来。让我们开始吧。
feedsImage
6.88K