A tokenização é apenas um caso especial de "fragmentação" - construção de dados de baixo nível em abstrações de alto nível - o que, por sua vez, é fundamental para a inteligência. Nossa nova arquitetura, que permite o *agrupamento dinâmico* hierárquico, não é apenas livre de tokens, mas simplesmente escala melhor.
Sukjun (June) Hwang
Sukjun (June) Hwang12 de jul., 00:06
Tokenization has been the final barrier to truly end-to-end language models. We developed the H-Net: a hierarchical network that replaces tokenization with a dynamic chunking process directly inside the model, automatically discovering and operating over meaningful units of data
Este foi um projeto incrivelmente importante para mim - eu queria resolvê-lo há anos, mas não tinha ideia de como. Tudo isso foi @sukjun_hwang e @fluorane trabalho incrível! Escrevi sobre a história de seu desenvolvimento e o que pode estar por vir. A H-Net:
194,7K