Hôm nay chúng tôi phát hành ether0, mô hình lý luận khoa học đầu tiên của chúng tôi. Chúng tôi đã huấn luyện Mistral 24B với RL trên một số nhiệm vụ thiết kế phân tử trong hóa học. Đáng chú ý, chúng tôi phát hiện rằng các LLM có thể học một số nhiệm vụ khoa học hiệu quả hơn nhiều so với các mô hình chuyên biệt được huấn luyện từ đầu trên cùng một dữ liệu, và có thể vượt trội hơn nhiều so với các mô hình tiên tiến và con người trong những nhiệm vụ đó. Đối với ít nhất một tập hợp các vấn đề phân loại, hồi quy và sinh dữ liệu khoa học, các LLM sau huấn luyện có thể cung cấp một phương pháp hiệu quả hơn nhiều về dữ liệu so với các phương pháp học máy truyền thống. 1/n
90,25K