本日、私たちは最初の科学的推論モデルであるether0をリリースします。 私たちは、化学におけるいくつかの分子設計課題について、RLを使用してMistral 24Bを訓練しました。驚くべきことに、LLMは、同じデータでゼロから訓練された特殊なモデルよりも効率的に多くの科学的課題を学習でき、それらの課題ではフロンティアモデルや人間を大幅に上回るパフォーマンスを発揮できることがわかりました。科学的な分類、回帰、生成の問題の少なくとも一部については、トレーニング後の LLM は、従来の機械学習アプローチよりもはるかにデータ効率の高いアプローチを提供する可能性があります。1/n
90.23K