Мой лучший предположение: Рубрики + LLM Судья - атомизировать каждую точку в доказательстве истинности и проверить по сравнению с выводом модели. Мое предположение о том, как они сделали это масштабируемым - раньше это не было так, людям приходилось тщательно их разрабатывать, они обучили или сделали что-то, чтобы создать очень хорошие рубрики для каждой конкретной проблемы или ее ответа.
Alexander Wei
Alexander Wei19 июл., 15:50
5/N Кроме самого результата, я взволнован нашим подходом: мы достигаем этого уровня возможностей не через узкую, специфическую для задач методологию, а прокладывая новый путь в общем-purpose обучении с подкреплением и масштабировании вычислений во время тестирования.
.@polynoamial @alexwei_ моргни дважды, если я прав, и трижды, если я не прав - прежде чем слепые будут вести слепых xD
22,25K