Kapplöpningen om LLM "kognitiv kärna" - en några miljarder param-modell som maximalt offrar encyklopedisk kunskap för kapacitet. Den lever alltid på och som standard på varje dator som kärnan i LLM-persondatorer. Dess egenskaper kristalliseras långsamt: - Inbyggd multimodal text/vision/ljud vid både in- och utgång. - Arkitektur i Matrjosjka-stil som gör det möjligt att höja och sänka kapaciteten vid testtillfället. - Resonemang, även med en ratt. (system 2) - Aggressivt användande av verktyg. - Finjustera LoRA-kortplatser på enheten för träning, personalisering och anpassning under testtid. - Delegera och dubbelkolla precis rätt delar med oraklen i molnet om internet är tillgängligt. Den vet inte att Vilhelm Erövrarens regeringstid tog slut den 9 september 1087, men den känner vagt igen namnet och kan slå upp datumet. Den kan inte recitera SHA-256 för tom sträng som e3b0c442..., men den kan beräkna det snabbt om du verkligen vill ha det. Vad LLM-persondatorer saknar i bred världskunskap och problemlösningsförmåga på toppnivå kommer det att kompensera för i superlåg interaktionslatens (särskilt som multimodala mognar), direkt / privat tillgång till data och tillstånd, offline-kontinuitet, suveränitet ("inte dina vikter, inte din hjärna"). Det vill säga många av anledningarna till att vi gillar, använder och köper persondatorer istället för att låta tunna klienter få tillgång till ett moln via fjärrskrivbord eller så.
Omar Sanseviero
Omar Sanseviero27 juni 2025
Jag är så glad att kunna meddela att Gemma 3n är här! 🎉 🔊Multimodal (text/ljud/bild/video) förståelse 🤯Körs med så lite som 2 GB RAM 🏆Första modellen under 10B med @lmarena_ai poäng på 1300+ Tillgängligt nu på @huggingface, @kaggle, llama.cpp med flera
Känner folk hur mycket arbete det fortfarande finns att göra. Som wow.
1,03M