Hari ini kami merilis ether0, model penalaran ilmiah pertama kami. Kami melatih Mistral 24B dengan RL pada beberapa tugas desain molekuler dalam kimia. Hebatnya, kami menemukan bahwa LLM dapat mempelajari beberapa tugas ilmiah secara lebih efisien daripada model khusus yang dilatih dari awal pada data yang sama, dan dapat sangat mengungguli model perbatasan dan manusia dalam tugas-tugas tersebut. Untuk setidaknya sebagian dari masalah klasifikasi ilmiah, regresi, dan generasi, LLM pasca-pelatihan dapat memberikan pendekatan yang jauh lebih efisien data daripada pendekatan pembelajaran mesin tradisional. 1/n
90,23K