一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

很高兴分享我们的新工作：“当预训练数据与目标任务匹配时，语言模型会得到改善” 是的，这听起来很明显（确实如此！），但通常这只是隐性和间接发生的：直观选择数据 → 基准测试 → 精炼 → 重复。我们想知道：如果我们明确将预训练数据与基准匹配，会发生什么？结果是一个简单的方法，能够在强基线之上实现2倍以上的计算倍增，并为我们提供了一种原则性的方法来研究基准选择如何塑造（和限制！）模型能力。额外内容：从训练500多个模型中获得的广泛扩展法则，揭示了随着模型扩展，最佳数据选择如何演变。 🧵 (1/14)

51.99K