Lema de Neyman-Pearson - Neyman–Pearson lemma

Na estatística , o lema de Neyman-Pearson foi introduzido por Jerzy Neyman e Egon Pearson em um artigo em 1933. O lema de Neyman-Pearson é parte da teoria de testes estatísticos de Neyman-Pearson, que introduziu conceitos como erros de segundo tipo , poder função e comportamento indutivo. A teoria de Fisherian do teste de significância postulou apenas uma hipótese. Ao introduzir uma hipótese concorrente, o sabor Neyman-Pearsonian dos testes estatísticos permite investigar os dois tipos de erros . Os casos triviais em que sempre rejeitamos ou aceitamos a hipótese nula são de pouco interesse, mas isso prova que não se deve abrir mão do controle sobre um tipo de erro enquanto calibra o outro. Neyman e Pearson, consequentemente, passaram a restringir sua atenção à classe de todos os testes de nível, enquanto subsequentemente minimizavam o erro do tipo II, tradicionalmente denotado por . Seu artigo seminal de 1933, incluindo o lema de Neyman-Pearson, vem no final deste esforço, não apenas mostrando a existência de testes com maior poder que retêm um nível pré-especificado de erro tipo I ( ), mas também fornecendo uma maneira de construir tais testes. O teorema de Karlin-Rubin estende o lema de Neyman-Pearson para configurações envolvendo hipóteses compostas com razões de verossimilhança monótonas.

Proposição

Considere um teste com hipóteses e , onde a função de densidade de probabilidade (ou função de massa de probabilidade ) é para . Denotando a região de rejeição por , o lema de Neyman-Pearson afirma que um teste mais poderoso (MP) satisfaz o seguinte: para alguns ,

  • se ,
  • se ,
  • para um nível de significância prefixado .

Além disso, se houver pelo menos um teste de MP que satisfaça as duas condições, o lema de Neyman-Pearson afirma que todo teste de MP de nível existente deve obedecer às desigualdades da razão de verossimilhança. Observe que o teste mais poderoso nem sempre pode ser único, como pode ser inferido a partir do lema. Na verdade, pode nem existir.

Na prática, a razão de verossimilhança é freqüentemente usada diretamente para construir testes - veja teste de razão de verossimilhança . No entanto, também pode ser usado para sugerir estatísticas de teste particulares que possam ser de interesse ou para sugerir testes simplificados - para isso, considera-se a manipulação algébrica da razão para ver se há estatísticas-chave relacionadas ao tamanho da razão ( ou seja, se uma grande estatística corresponde a uma proporção pequena ou grande).

Prova

Defina a região de rejeição da hipótese nula para o teste de Neyman – Pearson (NP) como

onde é escolhido para que

Qualquer teste alternativo terá uma região de rejeição diferente que denotamos .

A probabilidade de os dados caírem em qualquer região ou parâmetro fornecido é

Para que o teste com região crítica tenha nível de significância , deve ser verdade que , portanto

Será útil dividi-los em integrais em regiões distintas:

onde é o complemento da região R . Ambiente , essas duas expressões e a desigualdade acima produzem que

Os poderes dos dois testes são e , e gostaríamos de provar que:

No entanto, conforme mostrado acima, isso é equivalente a:

a seguir, mostramos que a desigualdade acima se mantém:

Exemplo

Vamos ser uma amostra aleatória da distribuição, onde a média é conhecido, e suponha que nós desejamos para testar contra . A probabilidade para este conjunto de dados normalmente distribuídos é

Podemos calcular a razão de verossimilhança para encontrar a estatística-chave neste teste e seu efeito no resultado do teste:

Essa proporção depende apenas dos dados transmitidos . Portanto, pelo lema de Neyman-Pearson, o teste mais poderoso desse tipo de hipótese para esses dados dependerá apenas de . Além disso, por inspeção, podemos ver que se , então, é uma função decrescente de . Portanto, devemos rejeitar se for suficientemente grande. O limite de rejeição depende do tamanho do teste. Neste exemplo, a estatística de teste pode ser mostrada como uma variável aleatória distribuída de qui-quadrado em escala e um valor crítico exato pode ser obtido.

Aplicação em economia

Uma variante do lema de Neyman-Pearson encontrou uma aplicação no domínio aparentemente não relacionado da economia do valor da terra. Um dos problemas fundamentais na teoria do consumidor é calcular a função de demanda do consumidor dados os preços. Em particular, dada uma propriedade de terra heterogênea, uma medida de preço sobre a terra e uma medida de utilidade subjetiva sobre a terra, o problema do consumidor é calcular a melhor parcela de terra que ele pode comprar - ou seja, a parcela de terra com maior utilidade, cujo preço é no máximo seu orçamento. Acontece que esse problema é muito semelhante ao problema de encontrar o teste estatístico mais poderoso e, portanto, o lema de Neyman-Pearson pode ser usado.

Usos em engenharia elétrica

O lema de Neyman-Pearson é bastante útil em engenharia eletrônica , nomeadamente no projeto e uso de sistemas de radar , sistemas de comunicação digital e em sistemas de processamento de sinais . Em sistemas de radar, o lema de Neyman-Pearson é usado para definir primeiro a taxa de detecções perdidas em um nível desejado (baixo) e, em seguida, minimizar a taxa de alarmes falsos , ou vice-versa. Nem falsos alarmes nem detecções perdidas podem ser definidos em taxas arbitrariamente baixas, incluindo zero. Todos os itens acima também se aplicam a muitos sistemas de processamento de sinais.

Usos em física de partículas

O lema de Neyman-Pearson é aplicado à construção de razões de verossimilhança específicas de análise, usadas para, por exemplo, testar assinaturas de novas físicas contra a previsão do Modelo Padrão nominal em conjuntos de dados de colisão próton-próton coletados no LHC .

Veja também

Referências

  • EL Lehmann, Joseph P. Romano, Testing Statistical Hypotheses , Springer, 2008, p. 60

links externos