我把自己看作是一個大型語言模型(LLM),最近我覺得我的下一個標記預測變得非常好,這可能是因為某種擴展法則,或者是因為我周圍的每個人都用相同的權重進行訓練。
128