Tokenizacja to tylko szczególny przypadek "dzielenia" - budowania danych niskiego poziomu w wysokopoziomowe abstrakcje - co z kolei jest fundamentalne dla inteligencji. Nasza nowa architektura, która umożliwia hierarchiczne *dynamiczne dzielenie*, jest nie tylko wolna od tokenizatorów, ale po prostu lepiej się skaluje.
Sukjun (June) Hwang
Sukjun (June) Hwang12 lip, 00:06
Tokenization has been the final barrier to truly end-to-end language models. We developed the H-Net: a hierarchical network that replaces tokenization with a dynamic chunking process directly inside the model, automatically discovering and operating over meaningful units of data
To był dla mnie niezwykle ważny projekt - chciałem go rozwiązać od lat, ale nie miałem pojęcia jak. To wszystko było niesamowitą pracą @sukjun_hwang i @fluorane! Napisałem o historii jego rozwoju i o tym, co może nadejść w przyszłości. H-Net:
194,68K