标记化一直是实现真正端到端语言模型的最后障碍。 我们开发了H-Net:一个分层网络,它在模型内部用动态分块过程替代了标记化,自动发现并处理有意义的数据单元。
我们非常兴奋地看到 H-Nets 将如何使模型在各种模态中以更少的先验和预处理更高效地学习! 这项工作是与 @cartesia_ai 的合作 10/10
653.27K