如果你用 mlp(x).split(3) 來代替 linear(x).split(3),會發生什麼事?有人試過這個嗎?
88.04K