Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Po prostu zrób sobie przysługę i przeczytaj wyjaśnienie Trissy, dlaczego @codecopenflow to jeden z najlepszych zakładów dla operatorów AI.
OpenAI właśnie wydało swojego agenta operatorów, więc jasne jest, że wielkie firmy również pracują nad VLA.
Wciąż wysokie ryzyko, ale stratosfera to pierdolony sufit dla tego projektu.

18 lip, 16:10
OpenAI właśnie potwierdziło moją tezę o gwieździe północnej dla AI, wydając dzisiaj swojego agenta operatora.
Nie tylko była to moja przewodnia teza dla $CODEC, ale także dla każdej innej inwestycji w AI, którą poczyniłem, w tym tych z początku roku podczas szaleństwa AI.
Było wiele dyskusji z Codec w odniesieniu do robotyki, podczas gdy ten sektor wkrótce będzie miał swoją własną narrację, podstawowym powodem, dla którego od samego początku byłem tak optymistyczny wobec Codec, jest to, jak jego architektura napędza agentów operatorów.
Ludzie wciąż niedoceniają, jak wiele udziału w rynku jest na szali, budując oprogramowanie, które działa autonomicznie, przewyższając ludzkich pracowników bez potrzeby ciągłych wskazówek czy nadzoru.
Widziałem wiele porównań do $NUIT. Po pierwsze, chcę powiedzieć, że jestem wielkim fanem tego, co buduje Nuit i życzę im tylko sukcesów. Jeśli wpiszesz „nuit” w moim telegramie, zobaczysz, że w kwietniu powiedziałem, że gdybym miał trzymać jedną monetę przez kilka miesięcy, byłaby to Nuit z powodu mojej tezy o operatorach.
Nuit był najbardziej obiecującym projektem operatora na papierze, ale po dokładnych badaniach odkryłem, że ich architektura nie miała głębokości potrzebnej do uzasadnienia dużej inwestycji lub postawienia za nią mojej reputacji.
Mając to na uwadze, byłem już świadomy luk architektonicznych w istniejących zespołach agentów operatorów i aktywnie szukałem projektu, który by je adresował. Niedługo po tym pojawił się Codec (dzięki @0xdetweiler, który nalegał, żebym przyjrzał się im bliżej) i to jest różnica między tymi dwoma:
$CODEC vs $NUIT
Architektura Codec jest zbudowana na trzech warstwach: Maszyna, System i Inteligencja, które oddzielają infrastrukturę, interfejs środowiska i logikę AI. Każdy agent operatora w Codec działa w swoim własnym izolowanym VM lub kontenerze, co pozwala na niemal natywną wydajność i izolację błędów. Ten warstwowy projekt oznacza, że komponenty mogą skalować się lub ewoluować niezależnie, nie łamiąc systemu.
Architektura Nuit podąża inną drogą, będąc bardziej monolityczna. Ich stos opiera się na wyspecjalizowanym agencie przeglądarki internetowej, który łączy analizę, rozumowanie AI i działanie. Oznacza to, że głęboko analizują strony internetowe na strukturalne dane, które AI może konsumować, i polegają na przetwarzaniu w chmurze dla ciężkich zadań AI.
Podejście Codec do osadzania lekkiego modelu Vision-Language-Action (VLA) w każdym agencie oznacza, że może działać całkowicie lokalnie. Co nie wymaga ciągłego pingowania do chmury po instrukcje, eliminując opóźnienia i unikając zależności od dostępności i przepustowości.
Agent Nuit przetwarza zadania, najpierw przekształcając strony internetowe w semantyczny format, a następnie używając mózgu LLM, aby ustalić, co zrobić, co poprawia się z czasem dzięki uczeniu przez wzmocnienie. Chociaż skuteczne w automatyzacji sieci, ten proces zależy od ciężkiego przetwarzania AI po stronie chmury i zdefiniowanych struktur stron. Inteligencja lokalnego urządzenia Codec oznacza, że decyzje podejmowane są bliżej danych, co zmniejsza obciążenie i sprawia, że system jest bardziej stabilny na nieoczekiwane zmiany (brak kruchych skryptów lub założeń DOM).
Operatorzy Codec podążają za ciągłym cyklem postrzegania–myślenia–działania. Warstwa maszyny przesyła środowisko (np. na żywo aplikację lub feed robota) do warstwy inteligencji za pośrednictwem zoptymalizowanych kanałów warstwy systemu, dając AI „oczy” na aktualny stan. Model VLA agenta następnie interpretuje wizualizacje i instrukcje razem, aby zdecydować o działaniu, które warstwa systemu wykonuje za pomocą zdarzeń klawiatury/myszy lub kontroli robota. Ta zintegrowana pętla oznacza, że dostosowuje się do wydarzeń na żywo, nawet jeśli UI się zmienia, nie przerwie to przepływu.
Aby to wszystko uprościć, pomyśl o operatorach Codec jak o samowystarczalnym pracowniku, który dostosowuje się do niespodzianek w pracy. Agent Nuit jest jak pracownik, który musi się zatrzymać, opisać sytuację przełożonemu przez telefon i czekać na instrukcje.
Nie chcąc zbytnio zagłębiać się w techniczne szczegóły, to powinno dać ci ogólny pomysł, dlaczego wybrałem Codec jako moją główną stawkę na operatorów.
Tak, Nuit ma wsparcie od YC, zespół z doświadczeniem i S tier github. Chociaż architektura Codec została zbudowana z myślą o poziomej skali, co oznacza, że możesz wdrożyć tysiące agentów równolegle bez dzielenia pamięci lub kontekstu wykonania między agentami. Zespół Codec również nie jest przeciętnymi programistami.
Ich architektura VLA otwiera wiele przypadków użycia, które nie były możliwe z wcześniejszymi modelami agentów z powodu widzenia przez piksele, a nie zrzuty ekranu.
Mógłbym kontynuować, ale to zostawię na przyszłe posty.
1,91K
Najlepsze
Ranking
Ulubione