如果你在 ICML 并对 RL 或多语言感兴趣,请向 @marafinkels 打个招呼!我们在过去几个月里紧密合作,推出了一种 RL 方法来解决一个关键的 Gemini 质量问题。她也有很棒的研究想法!希望 Gemini 和学术界保持联系。
Mara Finkelstein
Mara Finkelstein2024年11月27日
大型语言模型(LLMs)通常在标准测试集上使用自动化指标进行评估,但指标和测试集是独立开发的。这引发了一个关键问题:我们能否专门设计自动化指标,以在我们优先考虑的测试集上表现出色?答案是:可以!
5.75K