Якщо ви працюєте в ICML і цікавитеся RL або багатомовністю, будь ласка, привітайтеся з @marafinkels! Протягом останніх кількох місяців ми тісно співпрацювали, щоб випустити метод RL для вирішення критичної проблеми з якістю Gemini. У неї також є чудові дослідницькі ідеї! Сподіваюся, Gemini x academia залишаться на зв'язку.
Mara Finkelstein
Mara Finkelstein27 лист. 2024 р.
LLM зазвичай оцінюються за допомогою автоматичних метрик на стандартних тестових наборах, але метрики + тестові набори розробляються незалежно. У зв'язку з цим постає важливе питання: чи можемо ми розробляти автоматичні показники спеціально для того, щоб досягти успіху в тестових наборах, які ми ставимо пріоритетними? Відповідь: Так!
5,75K