Tokenisasi hanyalah kasus khusus dari "chunking" - membangun data tingkat rendah menjadi abstraksi tingkat tinggi - yang pada gilirannya mendasar bagi kecerdasan. Arsitektur baru kami, yang memungkinkan *pemotongan dinamis* hierarkis, tidak hanya bebas tokenizer, tetapi hanya menskalakan lebih baik.
Sukjun (June) Hwang
Sukjun (June) Hwang12 Jul, 00.06
Tokenization has been the final barrier to truly end-to-end language models. We developed the H-Net: a hierarchical network that replaces tokenization with a dynamic chunking process directly inside the model, automatically discovering and operating over meaningful units of data
Ini adalah proyek yang sangat penting bagi saya - saya sudah ingin menyelesaikannya selama bertahun-tahun, tetapi tidak tahu caranya. Ini semua @sukjun_hwang dan @fluorane pekerjaan yang luar biasa! Saya menulis tentang kisah perkembangannya, dan apa yang mungkin akan terjadi selanjutnya. The H-Net:
194,69K