Token hóa chỉ là một trường hợp đặc biệt của "phân đoạn" - xây dựng dữ liệu cấp thấp thành các trừu tượng cấp cao - điều này lại là nền tảng cho trí tuệ. Kiến trúc mới của chúng tôi, cho phép *phân đoạn động theo cấp bậc*, không chỉ không cần bộ phân tích mà còn đơn giản là mở rộng tốt hơn.
Sukjun (June) Hwang
Sukjun (June) Hwang00:06 12 thg 7
Tokenization has been the final barrier to truly end-to-end language models. We developed the H-Net: a hierarchical network that replaces tokenization with a dynamic chunking process directly inside the model, automatically discovering and operating over meaningful units of data
Đây là một dự án vô cùng quan trọng đối với tôi - Tôi đã muốn giải quyết nó trong nhiều năm, nhưng không biết bắt đầu từ đâu. Tất cả đều là công việc tuyệt vời của @sukjun_hwang và @fluorane! Tôi đã viết về câu chuyện phát triển của nó, và những gì có thể sẽ đến tiếp theo. H-Net:
194,69K