Correspondência de pontuação de propensão - Propensity score matching

Na análise estatística de dados observacionais , o propensity score matching ( PSM ) é uma técnica de correspondência estatística que tenta estimar o efeito de um tratamento, política ou outra intervenção contabilizando as covariáveis que prevêem o recebimento do tratamento. O PSM tenta reduzir o viés devido a variáveis de confusão que podem ser encontradas em uma estimativa do efeito do tratamento obtida simplesmente comparando os resultados entre as unidades que receberam o tratamento e aquelas que não o fizeram . Paul R. Rosenbaum e Donald Rubin introduziu a técnica em 1983.

A possibilidade de viés surge porque uma diferença no resultado do tratamento (como o efeito médio do tratamento ) entre os grupos tratados e não tratados pode ser causada por um fator que prediz o tratamento, e não o próprio tratamento. Em experimentos randomizados , a randomização permite uma estimativa imparcial dos efeitos do tratamento; para cada covariável, a randomização implica que os grupos de tratamento serão equilibrados em média, pela lei dos grandes números . Infelizmente, para estudos observacionais, a atribuição de tratamentos a sujeitos de pesquisa normalmente não é aleatória. A correspondência tenta reduzir o viés de atribuição de tratamento e simular a randomização, criando uma amostra de unidades que receberam o tratamento que é comparável em todas as covariáveis observadas a uma amostra de unidades que não receberam o tratamento.

Por exemplo, alguém pode estar interessado em saber as consequências de fumar . É necessário um estudo observacional, uma vez que não é ético designar aleatoriamente pessoas para o tratamento 'tabagismo'. O efeito do tratamento estimado simplesmente comparando aqueles que fumam com aqueles que não fumam seria enviesado por quaisquer fatores que predizem o tabagismo (por exemplo: sexo e idade). PSM tenta controlar esses vieses, tornando os grupos que recebem tratamento e não-tratamento comparáveis com relação às variáveis de controle.

Visão geral

PSM é para casos de inferência causal e viés de seleção simples em ambientes não experimentais nos quais: (i) poucas unidades no grupo de comparação sem tratamento são comparáveis às unidades de tratamento; e (ii) selecionar um subconjunto de unidades de comparação semelhantes à unidade de tratamento é difícil porque as unidades devem ser comparadas através de um conjunto de características de pré-tratamento de alta dimensão.

Na correspondência normal, características únicas que distinguem os grupos de tratamento e controle são combinadas em uma tentativa de tornar os grupos mais semelhantes. Mas se os dois grupos não tiverem uma sobreposição substancial, um erro substancial pode ser introduzido. Por exemplo, se apenas os piores casos do grupo de "comparação" não tratado forem comparados apenas com os melhores casos do grupo de tratamento , o resultado pode ser uma regressão em direção à média , o que pode fazer o grupo de comparação parecer melhor ou pior do que a realidade.

O PSM emprega uma probabilidade prevista de associação ao grupo - por exemplo, grupo de tratamento versus grupo de controle - com base em preditores observados, geralmente obtidos de regressão logística para criar um grupo contrafactual . Os escores de propensão podem ser usados para correspondência ou como covariáveis , isoladamente ou com outras variáveis ou covariáveis de correspondência.

Procedimento geral

1. Execute a regressão logística :

Variável dependente: Z = 1, se a unidade participou (ou seja, é membro do grupo de tratamento); Z = 0, se a unidade não participou (ou seja, é membro do grupo de controle).
Escolha os fatores de confusão apropriados (variáveis que supostamente estão associadas ao tratamento e ao resultado)
Obtenha uma estimativa para o escore de propensão: probabilidade prevista ( p ) ou log [ p / (1 - p )].

2. Verifique se as covariáveis estão equilibradas entre os grupos de tratamento e comparação dentro dos estratos do escore de propensão.

Use diferenças padronizadas ou gráficos para examinar as distribuições

3. Corresponda cada participante a um ou mais não participantes no escore de propensão, usando um destes métodos:

Vizinho mais próximo correspondente
Correspondência de calibrador: unidades de comparação dentro de uma certa largura do escore de propensão das unidades tratadas são combinadas, onde a largura é geralmente uma fração do desvio padrão do escore de propensão
Correspondência métrica Mahalanobis em conjunto com PSM
Correspondência de estratificação
Correspondência de diferença em diferenças (kernel e pesos lineares locais)
Correspondência exata

4. Verifique se as covariáveis estão equilibradas entre os grupos de tratamento e comparação na amostra combinada ou ponderada

5. Análise multivariada com base em nova amostra

Use análises apropriadas para amostras não independentes combinadas se mais de um não participante for correspondido a cada participante

Nota: Quando você tem várias correspondências para uma única observação tratada, é essencial usar Mínimos Quadrados Ponderados em vez de Mínimos Quadrados Ordinários.

Definições formais

Configurações básicas

O caso básico é de dois tratamentos (numerados 1 e 0), com N [variáveis aleatórias independentes e distribuídas de forma idêntica | iid] sujeitos. Cada sujeito eu responderia ao tratamento com e ao controle com . A quantidade a ser avaliado é o efeito de tratamento médio : . A variável indica se sujeita i obteve tratamento ( Z = 1) ou de controlo ( Z = 0). Let Ser um vetor de medição de pré-tratamento observada (ou covariável) para o i ésimo sujeito. As observações de são feitas antes da designação de tratamento, mas os recursos em podem não incluir todos (ou nenhum) dos usados para decidir sobre a designação de tratamento. A numeração das unidades (ou seja: i = 1, ..., i = N ) é considerada como não contendo qualquer informação além do que está contido em . As seções a seguir omitirão o índice i enquanto ainda discutem sobre o comportamento estocástico de algum assunto. ${\ displaystyle r_ {1i}}$ ${\ displaystyle r_ {0i}}$ ${\ displaystyle E [r_ {1}] - E [r_ {0}]}$ ${\ displaystyle Z_ {i}}$ ${\ displaystyle X_ {i}}$ ${\ displaystyle X_ {i}}$ ${\ displaystyle X_ {i}}$ ${\ displaystyle X_ {i}}$

Atribuição de tratamento fortemente ignorável

Deixe alguns sujeitos têm um vector de co-variáveis X (isto é: condicionalmente unconfounded), e alguns resultados potenciais r ₀ e r ₁ , sob o controlo e de tratamento, respectivamente. Tratamento atribuição é dito para ser fortemente ignorable se os resultados potenciais são independentes de tratamento ( Z ) condicional no fundo variáveis X . Isso pode ser escrito de forma compacta como

{\ displaystyle r_ {0}, r_ {1} \ perp Z \ mid X}

onde denota independência estatística . ${\ displaystyle \ perp}$

Pontuação de equilíbrio

Uma pontuação de equilíbrio b ( X ) é uma função das covariáveis X observadas, de modo que a distribuição condicional de X dada b ( X ) é a mesma para unidades tratadas ( Z = 1) e de controle ( Z = 0):

{\ displaystyle Z \ perp X \ mid b (X).}

A função mais trivial é . ${\ displaystyle b (X) = X}$

Pontuação de propensão

Um escore de propensão é a probabilidade de uma unidade (por exemplo, pessoa, sala de aula, escola) ser atribuída a um determinado tratamento dado um conjunto de covariáveis observadas. Os escores de propensão são usados para reduzir o viés de seleção , equacionando grupos com base nessas covariáveis.

Suponha que temos um indicador de tratamento binário Z , uma variável de resposta r e covariáveis X de fundo observadas . O escore de propensão é definido como a probabilidade condicional de tratamento dadas as variáveis de fundo:

{\ displaystyle e (x) \ {\ stackrel {\ mathrm {def}} {=}} \ \ Pr (Z = 1 \ mid X = x).}

No contexto de inferência causal e metodologia de pesquisa , os escores de propensão são estimados (por meio de métodos como regressão logística , florestas aleatórias ou outros), usando algum conjunto de covariáveis. Esses escores de propensão são então usados como estimadores para pesos a serem usados com métodos de ponderação de probabilidade inversa .

Teoremas principais

Os seguintes foram apresentados e comprovados pela primeira vez por Rosenbaum e Rubin em 1983:

A pontuação de propensão é uma pontuação de equilíbrio. ${\ displaystyle e (x)}$
Qualquer pontuação que seja 'mais precisa' do que a pontuação de propensão é uma pontuação de equilíbrio (isto é: para alguma função f ). O escore de propensão é a função de pontuação de balanceamento mais grosseira, pois pega um objeto (possivelmente) multidimensional ( X _i ) e o transforma em uma dimensão (embora outras, obviamente, também existam), embora seja a melhor. ${\ displaystyle e (X) = f (b (X))}$ ${\ displaystyle b (X) = X}$
Se a atribuição de tratamento for fortemente ignorável, dado X, então:

Também é fortemente ignorável dada qualquer função de equilíbrio. Especificamente, dado o índice de propensão:

{\ displaystyle (r_ {0}, r_ {1}) \ perp Z \ mid e (X).}

Para qualquer valor de uma pontuação de equilíbrio, a diferença entre as médias de tratamento e controle das amostras em mãos (ou seja:) , com base em indivíduos que têm o mesmo valor da pontuação de equilíbrio, pode servir como um estimador imparcial do efeito médio do tratamento : . ${\ displaystyle {\ bar {r}} _ {1} - {\ bar {r}} _ {0}}$ ${\ displaystyle E [r_ {1}] - E [r_ {0}]}$

Usar estimativas de amostra de pontuações de equilíbrio pode produzir equilíbrio de amostra em X

Relação com a suficiência

Se pensarmos o valor de Z como um parâmetro da população que afeta a distribuição de X , em seguida, a pontuação equilibrar serve como uma estatística suficiente para Z . Além disso, os teoremas acima indicam que o marcador é uma propensão estatística suficiente mínima se pensar em Z como um parâmetro de X . Por último, se a atribuição de tratamento Z for fortemente ignorável dado X, então o escore de propensão é uma estatística mínima suficiente para a distribuição conjunta de . ${\ displaystyle (r_ {0}, r_ {1})}$

Teste gráfico para detectar a presença de variáveis de confusão

Judea Pearl mostrou que existe um teste gráfico simples, chamado de critério da porta dos fundos, que detecta a presença de variáveis de confusão. Para estimar o efeito do tratamento, as variáveis de fundo X devem bloquear todos os caminhos de porta dos fundos no gráfico. Esse bloqueio pode ser feito adicionando a variável de confusão como um controle na regressão ou combinando a variável de confusão.

Desvantagens

Foi demonstrado que o PSM aumenta o "desequilíbrio, ineficiência, dependência do modelo e viés" do modelo, o que não é o caso com a maioria dos outros métodos de correspondência. As percepções por trás do uso de correspondência ainda são válidas, mas devem ser aplicadas com outros métodos de correspondência; Os escores de propensão também têm outros usos produtivos na ponderação e estimativa duplamente robusta.

Como outros procedimentos de correspondência, o PSM estima um efeito médio do tratamento a partir de dados observacionais. As principais vantagens do PSM eram, no momento de sua introdução, que usando uma combinação linear de covariáveis para um único escore, ele equilibra os grupos de tratamento e controle em um grande número de covariáveis sem perder um grande número de observações. Se as unidades no tratamento e controle fossem equilibradas em um grande número de covariáveis, uma de cada vez, um grande número de observações seria necessário para superar o "problema de dimensionalidade", pelo qual a introdução de uma nova covariável de equilíbrio aumenta o número mínimo necessário de observações em a amostra geometricamente .

Uma desvantagem do PSM é que ele contabiliza apenas covariáveis observadas (e observáveis) e não características latentes. Fatores que afetam a atribuição de tratamento e resultado, mas que não podem ser observados, não podem ser contabilizados no procedimento de correspondência. Como o procedimento controla apenas as variáveis observadas, qualquer viés oculto devido às variáveis latentes pode permanecer após a correspondência. Outro problema é que o PSM requer grandes amostras, com sobreposição substancial entre os grupos de tratamento e controle.

Preocupações gerais com a correspondência também foram levantadas por Judea Pearl , que argumentou que o viés oculto pode na verdade aumentar porque a correspondência nas variáveis observadas pode desencadear o viés devido a fatores de confusão inativos e não observados. Da mesma forma, Pearl argumentou que a redução do viés só pode ser garantida (assintoticamente) modelando as relações causais qualitativas entre o tratamento, o resultado, as covariáveis observadas e não observadas. A confusão ocorre quando o experimentador é incapaz de controlar explicações alternativas e não causais para uma relação observada entre variáveis independentes e dependentes. Esse controle deve satisfazer o " critério da porta dos fundos " de Pearl.

Implementações em pacotes de estatísticas

R : a correspondência do escore de propensão está disponível como parte do MatchIt pacote. Também pode ser facilmente implementado manualmente.
SAS : O procedimento PSMatch e OneToManyMTCH observações de correspondência macro com base em uma pontuação de propensão.
Stata : vários comandos implementam a correspondência do escore de propensão, incluindo o escrito pelo usuário psmatch2 . O Stata versão 13 e posterior também oferece o comando integrado teffects psmatch .
SPSS : uma caixa de diálogo para correspondência de pontuação de propensão está disponível no menu IBM SPSS Statistics (correspondência de pontuação de dados / propensão) e permite ao usuário definir a tolerância de correspondência, randomizar a ordem dos casos ao extrair amostras, priorizar correspondências exatas, amostrar com ou sem substituição, defina uma semente aleatória e maximize o desempenho aumentando a velocidade de processamento e minimizando o uso de memória. O procedimento FUZZY Python também pode ser facilmente adicionado como uma extensão do software por meio da caixa de diálogo Extensões. Este procedimento combina casos e controles utilizando sorteios aleatórios dos controles, com base em um conjunto especificado de variáveis-chave. O comando FUZZY suporta correspondência exata e difusa.

Veja também

Referências

Bibliografia

Abadie, Alberto ; Imbens, Guido W. (2006). "Propriedades de grandes amostras de estimadores correspondentes para efeitos de tratamento médios". Econometrica . 74 (1): 235–267. CiteSeerX 10.1.1.559.6313 . doi : 10.1111 / j.1468-0262.2006.00655.x .
Leite, Walter L. (2017). Práticas Métodos escore de propensão usando R . Washington, DC: Sage Publications. ISBN 978-1-4522-8888-8 .
Austin, Peter C. (31 de maio de 2011). "Uma introdução aos métodos de pontuação de propensão para reduzir os efeitos de confusão em estudos observacionais" . Multivariate Behavioral Research . 46 (3): 399–424. doi : 10.1080 / 00273171.2011.568786 . PMC 3144483 .

Languages

In other projects

Correspondência de pontuação de propensão - Propensity score matching

Conteúdo

Visão geral

Procedimento geral