Saya tidak melihat gunanya basis kode mendefinisikan ukuran batch pada tingkat per gpu. Ini berarti perlu mengubah parameter ukuran batch secara manual saat eksperimen penskalaan naik/turun. Saya kira secara historis dilakukan dalam basis kode yang tidak memiliki acc grad ?
1,58K