Problema da Unidade de Área Modificável - Modifiable areal unit problem

Exemplo de distorção MAUP
Um exemplo do problema de unidade de área modificável e a distorção dos cálculos de taxas

O problema de unidade de área modificável ( MAUP ) é uma fonte de viés estatístico que pode impactar significativamente os resultados dos testes de hipóteses estatísticas . O MAUP afeta os resultados quando medidas pontuais de fenômenos espaciais são agregadas em distritos, por exemplo, densidade populacional ou taxas de doença . Os valores de resumo resultantes (por exemplo, totais, taxas, proporções, densidades) são influenciados pela forma e escala da unidade de agregação.

Por exemplo, os dados do censo podem ser agregados em distritos municipais, setores censitários, áreas de código postal, delegacias de polícia ou qualquer outra partição espacial arbitrária. Assim, os resultados da agregação de dados dependem da escolha do cartógrafo de qual "unidade de área modificável" usar em sua análise. Um mapa coroplético do censo calculando a densidade populacional usando as fronteiras estaduais produzirá resultados radicalmente diferentes do que um mapa que calcula a densidade com base nas fronteiras municipais. Além disso, os limites do distrito do censo também estão sujeitos a mudanças ao longo do tempo, o que significa que o MAUP deve ser considerado ao comparar os dados anteriores com os atuais.

Fundo

A questão foi reconhecida pela primeira vez por Gehlke e Biehl em 1934 e posteriormente descrita em detalhes em um famoso artigo de Openshaw (1984) e no livro de Arbia (1988). Em particular, Openshaw (1984) observou que "as unidades de área (objetos zonais) usadas em muitos estudos geográficos são arbitrárias, modificáveis ​​e sujeitas aos caprichos e fantasias de quem está fazendo, ou fez, a agregação". O problema é especialmente aparente quando os dados agregados são usados ​​para análise de agrupamento para epidemiologia espacial , estatísticas espaciais ou mapeamento coroplético , em que interpretações errôneas podem ser facilmente feitas sem perceber. Muitos campos da ciência, especialmente a geografia humana, tendem a desconsiderar o MAUP ao fazer inferências a partir de estatísticas baseadas em dados agregados. O MAUP está intimamente relacionado ao tópico da falácia ecológica e preconceito ecológico (Arbia, 1988).

O enviesamento ecológico causado pelo MAUP foi documentado como dois efeitos separados que geralmente ocorrem simultaneamente durante a análise de dados agregados. Primeiro, o efeito de escala causa variação nos resultados estatísticos entre diferentes níveis de agregação (distância radial). Portanto, a associação entre as variáveis ​​depende do tamanho das unidades de área para as quais os dados são relatados. Geralmente, a correlação aumenta à medida que o tamanho da unidade de área aumenta. O efeito de zona descreve a variação nas estatísticas de correlação causadas pelo reagrupamento de dados em diferentes configurações na mesma escala (formato de área).

Desde a década de 1930, a pesquisa encontrou variações extras nos resultados estatísticos por causa do MAUP. Os métodos padrão de cálculo da variância dentro e entre os grupos não levam em consideração a variância extra vista nos estudos do MAUP à medida que os agrupamentos mudam. O MAUP pode ser usado como uma metodologia para calcular os limites superior e inferior, bem como os parâmetros de regressão média para vários conjuntos de agrupamentos espaciais. O MAUP é uma fonte crítica de erro em estudos espaciais, sejam eles observacionais ou experimentais. Como tal, a consistência da unidade, particularmente em um contexto de seção transversal de série temporal (TSCS), é essencial. Além disso, verificações de robustez da sensibilidade da unidade para agregação espacial alternativa devem ser realizadas rotineiramente para mitigar vieses associados nas estimativas estatísticas resultantes.

Soluções sugeridas

Várias sugestões foram feitas na literatura para reduzir o viés de agregação durante a análise de regressão . Um pesquisador pode corrigir a matriz de variância-covariância usando amostras de dados de nível individual. Alternativamente, pode-se focar na regressão espacial local ao invés da regressão global. Um pesquisador também pode tentar projetar unidades de área para maximizar um determinado resultado estatístico. Outros argumentaram que pode ser difícil construir um único conjunto de unidades de agregação ótimas para variáveis ​​múltiplas, cada uma das quais pode exibir não estacionariedade e autocorrelação espacial através do espaço de maneiras diferentes. Outros sugeriram desenvolver estatísticas que mudam entre as escalas de uma forma previsível, talvez usando a dimensão fractal como uma medida independente da escala das relações espaciais. Outros sugeriram modelos hierárquicos bayesianos como uma metodologia geral para combinar dados agregados e de nível individual para inferência ecológica.

Os estudos do MAUP com base em dados empíricos podem fornecer apenas um insight limitado devido à incapacidade de controlar as relações entre várias variáveis ​​espaciais. A simulação de dados é necessária para ter controle sobre várias propriedades dos dados de nível individual. Estudos de simulação têm demonstrado que o suporte espacial de variáveis ​​pode afetar a magnitude do viés ecológico causado pela agregação de dados espaciais.

Análise de sensibilidade MAUP

Usando simulações para dados univariados, Larsen defendeu o uso de uma razão de variância para investigar o efeito da configuração espacial, associação espacial e agregação de dados. Uma descrição detalhada da variação das estatísticas devido ao MAUP é apresentada por Reynolds, que demonstra a importância do arranjo espacial e da autocorrelação espacial dos valores dos dados. Os experimentos de simulação de Reynold foram expandidos por Swift, que em que uma série de nove exercícios começou com análise de regressão simulada e tendência espacial, então enfocou o tópico do MAUP no contexto da epidemiologia espacial. É apresentado um método de análise de sensibilidade do MAUP que demonstra que o MAUP não é inteiramente um problema. O MAUP pode ser usado como uma ferramenta analítica para ajudar a entender a heterogeneidade espacial e a autocorrelação espacial .

Este tópico é de particular importância porque, em alguns casos, a agregação de dados pode obscurecer uma forte correlação entre as variáveis, fazendo com que a relação pareça fraca ou mesmo negativa. Por outro lado, o MAUP pode fazer com que variáveis ​​aleatórias apareçam como se houvesse uma associação significativa onde não há. Os parâmetros de regressão multivariada são mais sensíveis ao MAUP do que os coeficientes de correlação. Até que uma solução mais analítica para o MAUP seja descoberta, a análise de sensibilidade espacial usando uma variedade de unidades de área é recomendada como uma metodologia para estimar a incerteza dos coeficientes de correlação e regressão devido ao viés ecológico. Um exemplo de simulação de dados e reagregação usando a biblioteca ArcPy está disponível.

No planejamento de transportes, o MAUP está associado ao Zoneamento de Análise de Tráfego (TAZ). Um ponto de partida importante na compreensão de problemas na análise de transporte é o reconhecimento de que a análise espacial tem algumas limitações associadas à discretização do espaço. Entre eles, unidades de área modificáveis ​​e problemas de fronteira estão direta ou indiretamente relacionados ao planejamento e análise de transporte por meio do projeto de zonas de análise de tráfego - a maioria dos estudos de transporte requer direta ou indiretamente a definição de TAZs. O limite modificável e as questões de escala devem receber atenção específica durante a especificação de uma TAZ por causa dos efeitos que esses fatores exercem sobre as propriedades estatísticas e matemáticas dos padrões espaciais (isto é, o problema da unidade de área modificável - MAUP). Nos estudos de Viegas, Martinez e Silva (2009, 2009b) os autores propõem um método onde os resultados obtidos no estudo de dados espaciais não são independentes da escala e os efeitos de agregação estão implícitos na escolha dos limites zonais. O delineamento dos limites zonais das TAZs tem um impacto direto na realidade e precisão dos resultados obtidos a partir de modelos de previsão de transporte. Neste artigo, os efeitos do MAUP na definição de TAZ e nos modelos de demanda de transporte são medidos e analisados ​​usando diferentes grades (em tamanho e localização de origem). Esta análise foi desenvolvida através da construção de uma aplicação integrada em software GIS comercial e através da utilização de um estudo de caso (Área Metropolitana de Lisboa) para testar a sua implementabilidade e desempenho. Os resultados revelam o conflito entre a precisão estatística e a precisão geográfica, e sua relação com a perda de informação na etapa de atribuição de tráfego dos modelos de planejamento de transporte.

Veja também

Tópicos gerais

Aplicações específicas

Referências

Origens

  • Arbia, Giuseppe (1988). Configuração de dados espaciais na análise estatística de problemas econômicos regionais e afins . Dordrecht: Kluwer Academic Publishers.
  • CC-BY icon.svgEste artigo contém citações de Modifiable areal unit problem no GIS Wiki, que está disponível sob a licença Creative Commons Attribution 3.0 Unported (CC BY 3.0) .
  • Gehlke, CE; Biehl, Katherine (março de 1934). “Certos efeitos do agrupamento sobre o tamanho do coeficiente de correlação no material do setor censitário”. Journal of the American Statistical Association . 29 (185A): 169-170. doi : 10.2307 / 2277827 . JSTOR  2277827 .
  • OpenShaw, Stan (1983). O problema da unidade de área modificável . Norwick: Geo Books. ISBN 0860941345. OCLC  12052482 .
  • Unwin, DJ (1996). "GIS, análise espacial e estatísticas espaciais." Progresso na Geografia Humana. 20 : 540–551.
  • Cressie, N. (1996). “Mudança de suporte e o problema da unidade de área modificável.” “Geographical Systems“, 3: 159-180.
  • Viegas, J., EA Silva, L. Martinez (2009a). “Efeitos do Problema de Unidade de Área Modificável na Delineação de Zonas de Análise de Tráfego” “Ambiente e Planejamento B - Planejamento e Projeto“, 36 (4): 625–643.
  • Viegas, J., EA Silva, L. Martinez (2009a). “Uma definição de zona de análise de tráfego: uma nova metodologia e algoritmo” “Transporte“. 36 (5): 6 “, 36 (5): 6.

Leitura adicional