Min beste gjetning: Rubrikker + LLM-dommer - Forstøv hvert punkt i bakkens sannhetsbevis og sjekk mot modellutgangen Min gjetning på hvordan de gjorde dette skalerbart - som før var det ikke, mennesker måtte omhyggelig lage dem, er de trente eller gjorde noe for å lage veldig gode rubrikker generert for hvert spesifikt problem eller dets svar.
Alexander Wei
Alexander Wei19. juli, 15:50
5/N I tillegg til selve resultatet, er jeg begeistret for tilnærmingen vår: Vi når dette kapasitetsnivået ikke via smal, oppgavespesifikk metodikk, men ved å bryte ny innen generell forsterkningslæring og beregningsskalering på testtid.
.@polynoamial @alexwei_ blinke to ganger hvis jeg har rett og 3 ganger hvis jeg tar feil - før persiennen føres av persiennen xD
21,31K