Jednym z moich ulubionych artykułów w ostatnich latach był ten diagram. Pokazuje on wpływ kontrolowania trzech różnych typów zmiennych: zmiennych zakłócających, kolidujących i mediatorów. W przypadku zmiennych zakłócających kontrola jest korzystna. W przypadku pozostałych psujesz swój wynik przez kontrolowanie.
Jeśli masz zmienne z błędem pomiaru, możesz napotkać inny problematyczny zmienną: proxy. Zmienne proxy mogą znacznie pogorszyć wszystkie te zniekształcenia i znacznie utrudnić ich rozwiązanie.
Artykuł przedstawia tę prostą obserwację: kontrola statystyczna wymaga uzasadnienia przyczynowego. To właściwie tytuł. Podano kilka przykładów opartych na DAG. Rozważ ten: czy edutainment jest zmienną zakłócającą, czy mediatorem? Czy powinieneś to kontrolować, czy to zniekształci twoje oszacowanie?
To zawsze coś, co musisz wziąć pod uwagę, ale szczerze mówiąc, wyjątkowe jest myślenie przyczynowo o kontroli statystycznej. Wiele prac robi rzeczy takie jak kontrolowanie za nieistotnymi zmiennymi pośrednimi (proksy), lub nieumyślnie kontrolują mediatory. To norma!
Mój artykuł porusza znacznie więcej kwestii związanych z używaniem i nadużywaniem kontroli. Na przykład zauważa, że może to wymagać dużej ilości danych i wysiłku, aby dopasować scoring skłonności do eksperymentów:
Zauważa, że dane ustalenie może nie oznaczać tego, co mówi, że oznacza:
I pokazuje, że nawet złoty standard wnioskowania przyczynowego—RCT—musi być przeprowadzony prawidłowo, w przeciwnym razie znajdziesz się w sytuacji, w której twoje oszacowania efektów są zawyżone, a twoje wnioski są błędne.
55,86K