私は、AIを現実の世界で機能させるためには、どのように適切なデータを収集するかという1つの疑問を追い求めてきました。 スタンフォード大学の研究室からUTオースティンの教室まで、あらゆる場所を探しました。その答えは、別のAIラボではなく、データをIPとして扱うために構築されたブロックチェーンです。そこで、私は@StoryProtocolのチーフAIオフィサーとして入社します。 スタンフォード大学では、ロボットの群れが分散コンピューティングを使用して一緒に学習する方法である「クラウドロボティクス」を研究しました。これを解決するために、車にドライブレコーダーを取り付けました。 ロボットが見たものの5〜10%しかアップロードできなかった場合、最も価値のあるデータをどのように選択すればよいのでしょうか? そのほとんどは退屈な高速道路の映像でした。しかし、<1%は、自動運転のWaymos、建設現場、予測不可能な人間など、珍しいシーンをキャプチャしました。この「ロングテール」データにより、モデルがよりスマートになりました。手書きでラベルを付けたり、Google Cloud のラベリング サービスにお金を払って「LIDAR ユニット」や「自律走行車」などのニッチなコンセプトで映像に注釈を付けたり、USB サイズの TPU で動くモデルのトレーニングを行ったりしました。しかし、アカデミアはそこまでしか進んでいません。 UTオースティンでは、私の質問は変わりました。 → MLを改善するために、希少なデータをどのようにクラウドソーシングしますか? → 実際にどのようなインセンティブシステムが機能しますか? それが私を暗号、ブロックチェーン、トークンエコノミー、さらにはDePINに引き込みました。私はブログを書いたり、分散型MLに関する論文を書いたりしましたが、それでも疑問に思いました:このインフラストラクチャを実際に構築しているのは誰なのか? 偶然にも、ストーリーチームと出会ったのです。私は彼らのパロアルトオフィスで講演をするように招待されました。午後6時で、部屋はまだ満員でした。「Neuro-Symbolic AI」についてとりとめもなく話しましたが、最後に「A Dash of Crypto」というスライドで終わりました。その話はアドバイザーの役割に変わり、今ではもっと大きなものに変わりました。 私たちは今、極めて重要な瞬間にいます。コンピューティングはほぼ解決されています。モデルアーキテクチャは一晩でコピーされます。本当の堀はデータです。 Redditをスクレイピングしていません。終わりのない言語ではありません。しかし、権利が認められたロングテールの実世界のデータであり、ロボット、AV、乱雑な世界をナビゲートするシステムなど、具現化されたAIを訓練します。 想像してみてください:私は珍しい運転シーンをドライブレコーダーでキャプチャし、それをストーリーに登録します。友人がラベルを貼っています。AIエージェントは、合成バリアントを作成します。Storyのグラフ構造のチェーンでは、それぞれがリンクされたIPになります。ロイヤリティは自動的に返金されます。誰もが支払いを受け、すべてのステップをオンチェーンで追跡できます。 そのため、私は現在、Storyの最高AI責任者として、分散型のIPクリアトレーニングデータのレールを構築しています。今こそ、データを新しいIPにする時です。ストーリーはそれを行う場所です。 さらに多くのことが近日中に公開される予定です。行きましょう。
feedsImage
31.74K