Tokenisering är bara ett specialfall av "chunking" - att bygga in data på låg nivå i abstraktioner på hög nivå - vilket i sin tur är grundläggande för intelligens. Vår nya arkitektur, som möjliggör hierarkisk *dynamisk segmentering*, är inte bara tokeniserarfri, utan skalar helt enkelt bättre.
Sukjun (June) Hwang
Sukjun (June) Hwang12 juli 00:06
Tokenisering har varit det sista hindret för verkligt heltäckande språkmodeller. Vi utvecklade H-Net: ett hierarkiskt nätverk som ersätter tokenisering med en dynamisk chunking-process direkt i modellen, som automatiskt upptäcker och fungerar över meningsfulla dataenheter
Det här var ett otroligt viktigt projekt för mig - jag har velat lösa det i flera år, men inte haft någon aning om hur. Allt detta var @sukjun_hwang och @fluorane fantastiska arbete! Jag skrev om historien om dess utveckling och vad som kan komma härnäst. H-nätet:
194,7K