Моє найкраще припущення: Рубрики + LLM Judge - Атомізуйте кожну точку в наземному доказі істинності та звіряйте з виходом моделі Моє припущення про те, як вони зробили це масштабованим - як раніше це не було, людям доводилося скрупульозно їх створювати, чи вони навчалися або робили щось, щоб зробити дуже хороші рубрики, згенеровані для кожної конкретної проблеми або її відповіді.
Alexander Wei
Alexander Wei19 лип., 15:50
5/N Окрім самого результату, я в захваті від нашого підходу: ми досягаємо цього рівня спроможності не за допомогою вузької методології, що залежить від конкретного завдання, а завдяки відкриттю нових шляхів у загальноцільовому навчанні з підкріпленням та масштабуванні обчислень під час тестування.
.@polynoamial @alexwei_ моргаю двічі, якщо я правий, і 3 рази, якщо я помиляюся - перед сліпими веде сліпий xD
21,31K