Moje najlepsze przypuszczenie: Rubryki + Sędzia LLM - Rozdziel każdy punkt w dowodzie prawdy i sprawdź w porównaniu z wyjściem modelu. Moje przypuszczenie, jak uczynili to skalowalnym - wcześniej nie było to możliwe, ludzie musieli starannie je tworzyć, to to, że wytrenowali lub zrobili coś, aby stworzyć bardzo dobre rubryki generowane dla każdego konkretnego problemu lub jego odpowiedzi.
Alexander Wei
Alexander Wei19 lip, 15:50
5/N Oprócz samego wyniku, cieszę się z naszego podejścia: osiągamy ten poziom zdolności nie poprzez wąską, specyficzną dla zadania metodologię, ale poprzez przełamywanie nowych granic w ogólnym uczeniu przez wzmocnienie i skalowaniu obliczeń w czasie testu.
.@polynoamial @alexwei_ mrugnij dwa razy, jeśli mam rację, a trzy razy, jeśli się mylę - zanim niewidomi będą prowadzeni przez niewidomych xD
21,67K