Um dos meus artigos favoritos nos últimos anos incluiu este diagrama. Ele mostra o impacto do controle de três tipos diferentes de variáveis: fatores de confusão, colisores e mediadores. Com fatores de confusão, o controle é bom. Com os outros, você estraga seu resultado controlando.
Se você tiver variáveis com erro de medição, poderá encontrar outra variável problemática: o proxy. As variáveis proxy podem tornar todas essas distorções muito piores e muito mais difíceis de lidar.
O artigo faz esta observação simples: o controle estatístico requer justificativa causal. Esse é realmente o título. Eles deram vários exemplos baseados no DAG. Considere este: o edutainment é um confundidor ou um mediador? Você deve controlar isso ou isso influenciaria sua estimativa?
Isso é sempre algo que você deve considerar, mas é, francamente, excepcional pensar causalmente sobre o controle estatístico. Muitos artigos fazem coisas como controlar variáveis irrelevantes a jusante (proxies) ou controlam involuntariamente os mediadores. Essa é a norma!
Meu artigo aborda muito mais questões com o uso e uso indevido de controles. Por exemplo, ele observa que pode ser necessário muitos dados e esforço para obter a pontuação de propensão para corresponder aos experimentos:
Ele observa que uma determinada descoberta pode não significar o que diz significar:
E mostra que mesmo o padrão-ouro da inferência causal - o RCT - precisa ser feito corretamente, ou você acabará em uma situação em que suas estimativas de efeito são infladas e suas conclusões estão erradas.
65,35K