openAI Noam Brown confirmó 2 puntos clave: 1) el modelo que alcanzó el rendimiento de nivel oro de la OMI es de propósito general: no afinado para las matemáticas y lo logró sin usar herramientas 2) openAI desarrolló nuevas técnicas que hacen que los LLM sean mucho mejores ¿podría ser un nuevo avance de RL o una mejora algorítmica?
27.89K