AI 研究很奇怪,因為你花費大量的計算進行實驗,以學習可以用幾句話表達的簡單想法。從字面上看,比如“如果你加上 B,A 上的訓練就會泛化”,“X 是設計獎勵的好方法”,或者“方法 M 是樣本效率的事實意味著我們應該創建具有這個特定屬性的環境”。但不知何故,如果你找到了正確的五個想法,並且你真的深入理解了它們,突然之間,你就領先於該領域的其他人好幾英里了
53.88K