Es fácil ajustar pequeños modelos con RL para superar a los modelos base en tareas verticales. Estamos liberando el código de Osmosis-Apply-1.7B: un pequeño modelo que fusiona código (similar a la aplicación instantánea de Cursor) mejor que los modelos base. ¡Enlaces para descargar y probar el modelo a continuación!
111,36K