Сегодня мы представляем ether0, нашу первую модель научного рассуждения. Мы обучили Mistral 24B с использованием RL на нескольких задачах молекулярного дизайна в химии. Удивительно, но мы обнаружили, что LLM могут изучать некоторые научные задачи гораздо более эффективно с точки зрения данных, чем специализированные модели, обученные с нуля на тех же данных, и могут значительно превосходить передовые модели и людей в этих задачах. По крайней мере, для подмножества научных задач классификации, регрессии и генерации, LLM после обучения могут предложить гораздо более эффективный подход с точки зрения данных, чем традиционные методы машинного обучения. 1/n
90,25K