Una dintre lucrările mele preferate din ultimii ani a inclus această diagramă. Arată impactul controlului pentru trei tipuri diferite de variabile: factori de confuzie, colisori și mediatori. Cu factorii de confuzie, controlul este bun. Cu ceilalți, îți distrugi rezultatul controlând.
Dacă aveți variabile cu eroare de măsurare, puteți întâlni o altă variabilă problematică: proxy-ul. Variabilele proxy pot face toate aceste distorsiuni mult mai grave și mult mai dificil de tratat.
Lucrarea face această observație simplă: controlul statistic necesită o justificare cauzală. Acesta este de fapt titlul. Au dat mai multe exemple bazate pe DAG. Gândiți-vă la aceasta: este edutainmentul un factor de confuzie sau un mediator? Ar trebui să controlezi pentru asta sau asta ți-ar părtini estimarea?
Acesta este întotdeauna un lucru pe care trebuie să-l luați în considerare, dar este, sincer, excepțional să vă gândiți cauzal la controlul statistic. Multe lucrări fac lucruri precum controlul variabilelor irelevante din aval (proxy) sau controlează neintenționat mediatorii. Aceasta este norma!
Articolul meu abordează mult mai multe probleme legate de utilizarea și utilizarea greșită a controalelor. De exemplu, notează că poate fi nevoie de multe date și efort pentru a obține scorul de înclinație pentru a se potrivi cu experimentele:
Acesta notează că o anumită constatare poate să nu însemne ceea ce spune că face:
Și arată că chiar și standardul de aur al inferenței cauzale – RCT – trebuie făcut corect, altfel vei ajunge într-o situație în care estimările tale de efect sunt umflate și concluziile tale sunt greșite.
65,35K