時々、独自のレースを実行するユニークなプロジェクトが生まれます。 AIは、ほとんどの場合、chatgptスタイルの端末と創造的な画像/ビデオ生成に他なりません。 私たちは数か月前から、AIによって誰もが仕事を失う瀬戸際にいると聞いています。 確かに、生産性は全員の10倍になりましたが、労働力の人々を完全に置き換えたわけではありません。なぜでしょうか。 ブラウザ上のチャットボットから実験的な「エージェント」フレームワークまで、今日の主要なAIアシスタントは、会話には優れていますが、実行には構造的に制限があります。 通常、タスクの実行にはブラウザまたは単純なスクリプト環境を使用します。これは、情報の取得や基本的なWeb自動化には機能しますが、これらのエージェントは複雑で多段階のプロセスに苦労し、物事が限られた経路から逸脱すると壊れることがよくあります。 現在のAIエージェントは、永続的なメモリとフォールトトレランスが不足しているため、予期しないエラーに直面したときに回復または適応できず、多くの場合、失速したり、無期限にループしたりします。 ほとんどの企業は、限られたブラウザベースの環境で動作し、エンタープライズソフトウェアの全範囲にアクセスできるわけではないため、日常的な作業は手の届かないところにあります。 そのため、AIがカスタマーサポートや管理などの日常的な企業の役割に取って代わるものはありません。AIモデル自体に機能がないからではなく、その周りのフレームワークが重要なワークフローに対して十分な信頼性を持っていないためです。 では、何が必要なのでしょうか? 再考されたシステムアーキテクチャ。フォールトトレランス、メモリ、アクセス、分離、効率を単一のフレームワークで対処するフレームワーク。 最初の予期しない入力で立ち往生するのではなく、人間が物事がうまくいかなかったときに行うのと同じように、エラーを見つけて適応し、さまざまな方法を試す必要があります。 AIを実際のワークフローに拡張するには、長期間にわたって確実に動作するための永続メモリとタスク追跡が必要です。 また、デスクトップアプリケーションなど、人間が使用しているのと同じソフトウェアを使用するためには、ブラウザツールだけでなく、エコシステムへの完全なアクセスも必要です。 安全な分離がなければ、エージェントは専用の環境で安全に運用できず、システム間の干渉可能性があるため、大規模なデプロイがリスクになります。 ランタイムの一貫性と効率性を望むなら、コンピュータを生き生きとした機能的な体のように扱うスマートなリソース管理も必要になります。 点と点をつないでいた方のために説明すると、最近のFabricリリース@Codecopenflowこれらすべてをまとめ、高度なモデルの認知能力と信頼性の高いデジタルワーカーのように機能するために必要なインフラストラクチャを組み合わせた、信頼性の高い完全専用のオペレーティングシステム(OS)をAIエージェントに提供します。 ファブリック自体は、完全に独立したライセンスソフトウェアである可能性があります。これにより、エージェントはブラウザにバインドされたスクリプトから、完全なOSレベルのアクセス権を持つ自律的なオペレーターに変換されます。 DEXアグリゲーターが最も効率的な価格をルーティングするのと同じように、FabricはCodecのディープレベルアーキテクチャを提供するルーティングレイヤーです。 CPU、GPU、メモリのニーズ、および地域の設定をリストします。これは、AWS / Google CloudやGPUリソースなどの最も費用対効果の高いサーバーをRender / IOネットから見つけることを意味します。 codec は、これらの AI オペレーターを完全に制御するためのクリーンな SDK と API を提供します。企業は、インフラストラクチャを再発明することなく、Codecエージェントを既存のソフトウェアパイプラインに統合できます(たとえば、ユーザーリクエストを処理するためにエージェントをスピンアップし、それをスピンダウンします)。 カスタマーサポートでは、エージェントはワークフロー全体、クエリ解決、CRMの更新、返金を管理でき、一貫性と稼働時間を向上させながら、人件費を最大90%削減できます。 事業運営の場合、Codecは、特に金融やヘルスケアなどの大量セクターにおいて、請求書の処理、人事の更新、保険金請求などの反復的な管理プロセスを自動化します。 各AIオペレーターが完全に分離されたマルチアプリ環境に焦点を当てることで、AIは、以前のフレームワークでは対処できなかった信頼性と統合という重大な問題に制限されません。 基本的に、クラウドコンピューティングインフラストラクチャをAIワーカー向けの柔軟な組立ラインに変えます。各「ワーカー」には、その仕事をするための適切なツール(アプリ、OS、データアクセス)と安全ハーネス(分離+障害処理)が与えられます。 AIモデル(GPT-5など)の改善は、コーデックのプラットフォームの価値を高めるだけです。なぜなら、より優れた「頭脳」をこの強力な「体」に接続して、さらに複雑な仕事を成し遂げることができるようになったからです。 codecはモデルに依存しない(任意のAIモデルで動作する)ため、単一のプロバイダーの運命に縛られることなく、一般的なAIの進歩の恩恵を受けることができます。 私たちは、クラウドコンピューティングの黎明期と同様の転換点にいます。クラウドのプラットフォーム(仮想化、AWSのインフラストラクチャなど)を提供した企業がエンタープライズITにとって不可欠になったように、AIエージェントが運用するための頼りになるプラットフォームを提供する企業は、巨大な市場を獲得するでしょう。 OpenAIはすでに、Codexと呼ばれる完全エージェントのクラウドコーディング端末をリリースしています。Codex は、コンピューター上で実行できる Codex のミニ ローカル バージョンになりますが、さらに重要なことは、Codex のプライマリ モデルは、独自のコンピューターを備えたクラウド上に存在することです。 OpenAIの共同創設者は、将来最も成功する企業は、これら2つのタイプのアーキテクチャが統合されると信じています。聞き覚えがありますね。 次のステップ 次に何が起こるかを言うのではなく、まだ見ていないものを指差した方がいいかもしれません。 - 確認済みのトークンユーティリティはありません - インセンティブなし - コアロードマップがない - デモなし - マーケットプレイスなし - 最小限のパートナーシップ 新しいウェブサイト、更新されたドキュメント、より深い流動性プール、コミュニティキャンペーン/マーケティング、ロボティクスとともに、パイプラインにどれだけのものがあるかを考えます。コーデックはまだ多くのカードを公開していません。 確かに、現在市場に出回っている既製のブラウザベースの製品はもっとあるかもしれませんが、それらが時代遅れになるまでどれくらいの時間がかかりますか? これは、AIの方向性と、人間の労働力に取って代わる主要なアーキテクチャへの投資です。 コーデックがコード化されています。
Trissy
Trissy2025年5月13日
オペレーターエージェントの仮想環境:$CODEC AIの爆発的な普及に関する私の主要な論文は、常にオペレーターエージェントの台頭を中心に据えてきました。 しかし、これらのエージェントが成功するためには、深いシステムアクセスが必要であり、これにより、パーソナルコンピュータや機密データを効果的に制御できるようになるため、深刻なセキュリティ上の懸念が生じます。 OpenAIのような企業や、その他のテック大手がユーザーデータをどのように扱っているかは、すでに見てきました。ほとんどの人は気にしませんが、オペレーターエージェントから最も恩恵を受ける立場にある個人、上位1%は絶対に気にしています。 個人的には、OpenAIのような会社に私のマシンへのフルアクセスを与える可能性はゼロです。たとえそれが生産性の10×向上を意味するとしてもです。 では、なぜコーデックなのでしょうか? Codecのアーキテクチャは、AIエージェント向けの分離されたオンデマンドの「クラウドデスクトップ」の立ち上げを中心としています。その中核となるのは、Kubernetes ポッド内に軽量の仮想マシン (VM) をプロビジョニングする Kubernetes ベースのオーケストレーション サービス (コードネーム Captain) です。 各エージェントは、独自のOSレベルの分離環境(完全なLinux OSインスタンス)を取得し、他のエージェントやホストから完全にサンドボックス化されたアプリケーション、ブラウザ、または任意のコードを実行できます。Kubernetes は、これらのエージェント ポッドのスケジューリング、自動スケーリング、および自己修復を処理し、信頼性と、負荷の要求に応じて多くのエージェント インスタンスをスピンアップ/ダウンする機能を確保します これらのVMを保護するためにTrusted Execution Environment(TEE)が使用されるため、エージェントのマシンを暗号で分離し、そのメモリと実行をホストOSまたはクラウドプロバイダーから保護できます。これは機密性の高いタスクにとって非常に重要で、たとえば、エンクレーブで実行されているVMは、APIキーや暗号ウォレットのシークレットを安全に保持できます。 AI エージェント (LLM ベースの「頭脳」) がアクションを実行する必要がある場合、AI エージェントは API リクエストを Captain サービスに送信し、Captain サービスはエージェントの VM ポッドを起動または管理します。ワークフロー: エージェントがマシンをリクエストし、Captain (Kubernetes 経由) がポッドを割り当て、永続ボリューム (VM のディスク用) をアタッチします。その後、エージェントは (セキュリティで保護されたチャネルまたはストリーミング インターフェイスを介して) VM に接続し、コマンドを発行できます。Captain は、エージェントがシェル コマンドを実行したり、ファイルをアップロード/ダウンロードしたり、ログを取得したり、後で復元するために VM をスナップショットしたりするためのエンドポイントを公開します。 この設計により、エージェントは完全なオペレーティング システムを使用できますが、アクセスは制御され、監査されています。Kubernetes上に構築されているため、Codecは水平方向に自動スケーリングでき、100のエージェントが環境を必要とする場合、クラスター全体で100のポッドをスケジュールし、ポッドを再起動して障害を処理できます。 エージェントのVMには、さまざまなMCPサーバー(AI用の「USBポート」など)を搭載できます。たとえば、CodecのConductorモジュールは、ChromeブラウザとMicrosoft Playwright MCPサーバーを実行するコンテナで、ブラウザ制御が可能です。これにより、AIエージェントは、まるで人間がブラウザを制御しているかのように、標準のMCP呼び出しを介してWebページを開いたり、リンクをクリックしたり、フォームに入力したり、コンテンツをスクレイピングしたりできます。 その他のMCP統合には、ファイルシステム/ターミナルMCP(エージェントがCLIコマンドを安全に実行できるようにするため)やアプリケーション固有のMCP(クラウドAPI、データベースなど)などがあります。基本的に、Codecはインフラストラクチャの「ラッパー」(VM、エンクレーブ、ネットワーキング)を提供し、高レベルのエージェントプランを実際のソフトウェアとネットワーク上で安全に実行できるようにします。 ユースケース ウォレットの自動化: Codecは、TEEで保護されたVM内にウォレットやキーを埋め込むことができるため、AIエージェントは秘密鍵を公開することなくブロックチェーンネットワークと対話(DeFiでの取引、暗号資産の管理)を行うことができます。 このアーキテクチャにより、オンチェーンの金融エージェントは、一般的なエージェントのセットアップでは非常に危険な実際の取引を安全に実行できます。プラットフォームのキャッチフレーズには、主要な機能として「ウォレット」のサポートが明示的にリストされています。 たとえば、エージェントは、エンクレーブ内のイーサリアムウォレットのCLIを実行し、トランザクションに署名して送信し、エージェントが誤動作した場合、VMに限定され、キーがTEEから出ることがないことを保証できます。 ブラウザとWebの自動化: CodecFlow エージェントは、VM 内の完全な Web ブラウザーを制御できます。Conductor の例では、エージェントが Chrome を起動し、その画面をリアルタイムで Twitch にストリーミングする方法を示します。Playwright MCPを通じて、エージェントは人間のユーザーと同じようにWebサイトをナビゲートし、ボタンをクリックし、データをスクレイピングできます。これは、ログインの背後にあるWebスクレイピング、自動化されたWebトランザクション、Webアプリのテストなどのタスクに最適です。 従来のフレームワークは通常、API呼び出しまたは単純なヘッドレスブラウザスクリプトに依存しています。対照的に、CodecFlowは、UIが見える実際のブラウザを実行できるため、AIの制御下で複雑なWebアプリケーション(JavaScriptやCAPTCHAの負荷が高いチャレンジなど)を簡単に処理できます。 実際のGUI自動化(レガシーシステム): 各エージェントは実際のデスクトップOSを備えているため、従来のGUIアプリケーションやリモートデスクトップセッションを自動化でき、基本的にはロボティックプロセスオートメーション(RPA)のように機能しますが、AIによって駆動されます。たとえば、エージェントは Windows VM で Excel スプレッドシートを開いたり、API がない古いターミナル アプリケーションとインターフェイスしたりできます。 Codecのサイトでは、「レガシーオートメーション」を有効にすることが明示的に言及されています。これにより、最新のAPIではアクセスできないソフトウェアをAIを使用して操作することが可能になりますが、これは、封じ込められた環境がなければ非常にハッキーで安全でないタスクです。含まれているnoVNC統合は、エージェントがVNCを介して監視または制御できることを示唆しており、GUIを駆動するAIを監視するのに役立ちます。 SaaSワークフローのシミュレーション: 企業は、複数のSaaSアプリケーションやレガシーシステムが関与する複雑なプロセスを抱えていることがよくあります。たとえば、従業員が Salesforce からデータを取得し、それを内部 ERP からのデータと組み合わせて、概要をクライアントにメールで送信できます。Codecを使用すると、AIエージェントは、人間と同じように、VM内のブラウザまたはクライアントソフトウェアを介してこれらのアプリに実際にログインすることで、このシーケンス全体を実行できます。これはRPAに似ていますが、意思決定を行い、変動性を処理できるLLMによって駆動されます。 重要なのは、これらのアプリの資格情報を VM に安全に (さらには TEE で囲んで) 提供できるため、エージェントはプレーンテキストの資格情報を "表示" したり、外部に公開したりすることなく、アプリを使用できることです。これにより、日常的なバックオフィスタスクの自動化を加速すると同時に、各エージェントが最小限の権限と完全な監査可能性で実行されるITを満足させることができます(VM内のすべてのアクションをログに記録または記録できるため)。 ロードマップ - 月末に公開デモを開始 - 他の類似プラットフォームとの機能比較(web3の競合相手なし) - TAOインテグレーション - 大規模なゲーミングパートナーシップ オリジナリティの面では、Codecは既存のテクノロジーを基盤として構築されていますが、AIエージェントの使用に斬新な方法でそれらを統合しています。分離された実行環境のアイデアは新しいものではありませんが(コンテナ、VM、TEEはクラウドコンピューティングの標準です)、シームレスAPIレイヤー(MCP)を備えた自律型AIエージェントにそれらを適用することは非常に斬新です。 このプラットフォームは、可能な限りオープンスタンダードとツールを活用しており、ブラウザ制御にはMicrosoftのPlaywrightのようなMCPサーバーを使用し、仮想化を高速化するためにAWSのFirecrackerマイクロVMをサポートする予定です。また、ストリーミングデスクトップ用のnoVNCなどの既存のソリューションも分岐しました。このプロジェクトは、実績のある技術(Kubernetes、エンクレーブハードウェア、オープンソースライブラリ)の基盤の上に立っており、元の開発はグルーロジックとオーケストレーションに焦点を当てています(「秘密のソース」はすべてがどのように連携するかです)。 オープンソースのコンポーネントと今後のクラウドサービスの組み合わせ($CODECトークンユーティリティとパブリック製品アクセスの言及によって示唆されています)は、Codecがまもなく複数の形式(サービスとして、または自己ホストとして)でアクセスできるようになることを意味します。 チーム Moyai:15 +年の開発者経験、現在ElixirGamesでAI開発をリードしています。 lil'km:5 +年のAI開発者で、現在LeRobotプロジェクトのHuggingFaceと協力しています。 HuggingFaceは巨大なロボット工学企業であり、Moyaiはelixir games(スクウェア・エニックスとsolanafdnが支援)でAIの責任者として働いています。 私は個人的にチーム全員にビデオ通話をしましたが、彼らがもたらすエネルギーがとても気に入っています。彼らを私のレーダーに載せた私の友人もToken2049で彼ら全員に会い、良いことばかりを言いました。 最終的な感想 まだカバーすべきことがたくさん残っているので、今後の更新やテレグラムチャンネルへの投稿のために取っておきます。 私は長い間、クラウドインフラストラクチャがオペレーターエージェントの未来であると信じてきました。私は常にNuitが構築しているものを尊重してきましたが、Codecは私が探していたフルスタックの確信を示してくれた最初のプロジェクトです。 チームは明らかにトップクラスのエンジニアです。彼らは、マーケティングは自分たちの強みではないと公言しており、それがおそらくこれがレーダーの下を飛んでいる理由です。私は彼らと緊密に協力して、彼らが構築しているものの深さを実際に反映するGTM戦略を形作るのを助けます。 時価総額が400万ドルで、このレベルのインフラがあると、かなり割安に感じられます。使える製品を提供できれば、次のAIインフラサイクルの始まりを容易に示すことができると思います。 いつものように、リスクはあり、私は過去数週間にわたってチームをこっそりと吟味してきましたが、完全にラグプルーフのプロジェクトはありません。 価格目標?はるかに高いです。
11.86K