热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
给自己一个好处,看看Trissy对为什么@codecopenflow是AI运营商最佳选择之一的解释。
OpenAI刚刚发布了他们的运营商代理,所以显然大公司也在研究VLA。
风险依然很高,但这个的上限是个疯狂的天花板。

7月18日 16:10
OpenAI今天通过发布他们的操作员代理确认了我对AI的北极星理论。
这不仅是我对$CODEC的指导理论,也是我在AI狂热期间年初所做的每一项AI投资的基础。
关于Codec与机器人技术的讨论很多,虽然这个领域很快会有自己的叙述,但我从第一天起对Codec如此看好的根本原因在于它的架构如何支持操作员代理。
人们仍然低估了通过构建能够自主运行的软件而占据的市场份额,这些软件能够超越人类工作者,而无需不断的提示或监督。
我看到很多与$NUIT的比较。首先,我想说我非常喜欢Nuit正在构建的东西,并祝愿他们成功。如果你在我的电报中输入“nuit”,你会看到我在四月时说过,如果我必须持有一种币几个月,那就是Nuit,因为我的操作员理论。
Nuit在纸面上是最有前景的操作员项目,但经过广泛的研究,我发现他们的架构缺乏深度,无法证明进行重大投资或将我的声誉置于其后面是合理的。
考虑到这一点,我已经意识到现有操作员代理团队中的架构缺口,并积极寻找一个能够解决这些问题的项目。Codec出现后不久(多亏了@0xdetweiler坚持让我更深入地了解他们),这就是两者之间的区别:
$CODEC与$NUIT
Codec的架构分为三个层次:机器、系统和智能,分别分离基础设施、环境接口和AI逻辑。Codec中的每个操作员代理都在自己的隔离虚拟机或容器中运行,允许接近本地的性能和故障隔离。这种分层设计意味着组件可以独立扩展或演变,而不会破坏系统。
Nuit的架构采取了不同的路径,更加单一化。他们的堆栈围绕一个专门的网页浏览器代理展开,结合了解析、AI推理和行动。这意味着他们将网页深度解析为AI可以消费的结构化数据,并依赖云处理来完成重的AI任务。
Codec将轻量级的视觉-语言-行动(VLA)模型嵌入到每个代理中,这意味着它可以完全本地运行。这不需要不断地回到云端获取指令,减少了延迟,避免了对正常运行时间和带宽的依赖。
Nuit的代理通过首先将网页转换为语义格式,然后使用LLM大脑来决定该做什么,这一过程随着强化学习而不断改进。虽然这种流程对于网页自动化有效,但它依赖于重的云端AI处理和预定义的页面结构。Codec的本地设备智能意味着决策发生在离数据更近的地方,减少了开销,使系统在意外变化时更加稳定(没有脆弱的脚本或DOM假设)。
Codec的操作员遵循一个持续的感知-思考-行动循环。机器层通过系统层的优化通道将环境(例如实时应用或机器人馈送)流式传输到智能层,为AI提供“眼睛”以观察当前状态。代理的VLA模型然后将视觉和指令结合起来进行解释,以决定行动,系统层通过键盘/鼠标事件或机器人控制来执行。这种集成循环意味着它能够适应实时事件,即使UI发生变化,你也不会打断流程。
用一个更简单的类比来说明,想象Codec的操作员就像一个能够适应工作中意外情况的自给自足的员工。Nuit的代理就像一个需要暂停、通过电话向主管描述情况并等待指示的员工。
不深入技术细节,这应该能让你对我为什么选择Codec作为我在操作员领域的主要投资有一个高层次的了解。
是的,Nuit得到了YC的支持,拥有强大的团队和S级的github。尽管Codec的架构是以水平扩展为目标构建的,这意味着你可以并行部署数千个代理,而代理之间没有共享内存或执行上下文。Codec的团队也不是普通的开发者。
他们的VLA架构打开了许多以前的代理模型无法实现的用例,因为它能够透过像素而不是截图进行观察。
我可以继续说下去,但我会把这些留到未来的帖子中。
1.91K
热门
排行
收藏