Försökte skissera några unika idéer i den här: Glass-Box Transformers: How Circuits Illuminate Deep Learning's Inner Workings,
161