Gráfico enganoso - Misleading graph
Parte de uma série de estatísticas |
Visualização de dados |
---|
Dimensões principais |
Figuras importantes |
Tipos gráficos de informação |
tópicos relacionados |
Em estatística , um gráfico enganoso , também conhecido como gráfico distorcido , é um gráfico que deturpa os dados , constituindo um uso indevido da estatística e com o resultado de que uma conclusão incorreta pode ser derivada dele.
Os gráficos podem ser enganosos por serem excessivamente complexos ou mal construídos. Mesmo quando construídos para exibir as características de seus dados com precisão, os gráficos podem estar sujeitos a diferentes interpretações, ou tipos de dados não intencionais podem ser derivados de forma aparente e errônea.
Gráficos enganosos podem ser criados intencionalmente para impedir a interpretação adequada dos dados ou acidentalmente devido à falta de familiaridade com o software gráfico , má interpretação dos dados ou porque os dados não podem ser transmitidos com precisão. Gráficos enganosos são freqüentemente usados em propaganda enganosa . Um dos primeiros autores a escrever sobre gráficos enganosos foi Darrell Huff , editor do livro de 1954 How to Lie with Statistics .
O campo de visualização de dados descreve maneiras de apresentar informações que evitam a criação de gráficos enganosos.
Métodos gráficos enganosos
Ele [um gráfico enganoso] é muito mais eficaz, no entanto, porque não contém adjetivos ou advérbios para estragar a ilusão de objetividade, não há nada que alguém possa atribuir a você.
- Como mentir com estatísticas (1954)
Existem várias maneiras de construir um gráfico enganoso.
Uso excessivo
O uso de gráficos onde eles não são necessários pode levar a confusão / interpretação desnecessária. Geralmente, quanto mais explicação um gráfico precisa, menos o gráfico em si é necessário. Os gráficos nem sempre transmitem informações melhor do que as tabelas.
Rotulagem tendenciosa
O uso de palavras tendenciosas ou carregadas no título do gráfico, nos rótulos dos eixos ou na legenda pode preparar o leitor de maneira inadequada .
Tendências fabricadas
Da mesma forma, tentar traçar linhas de tendência por meio de dados não correlacionados pode levar o leitor a acreditar que existe uma tendência onde não há nenhuma. Isso pode ser o resultado de uma tentativa intencional de enganar o leitor ou devido ao fenômeno da correlação ilusória .
Gráfico de pizza
- Comparar gráficos de pizza de tamanhos diferentes pode ser enganoso, pois as pessoas não podem ler com precisão a área comparativa dos círculos.
- O uso de fatias finas, que são difíceis de discernir, pode ser difícil de interpretar.
- O uso de porcentagens como rótulos em um gráfico de pizza pode ser enganoso quando o tamanho da amostra é pequeno.
- Tornar um gráfico de pizza 3D ou adicionar uma inclinação tornará a interpretação difícil devido ao efeito distorcido da perspectiva . Gráficos de pizza em gráfico de barras nos quais a altura das fatias é variada podem confundir o leitor.
Perspectiva da fatia do gráfico circular 3D
Um gráfico de pizza em perspectiva (3D) é usado para dar ao gráfico uma aparência 3D . Freqüentemente usada por razões estéticas, a terceira dimensão não melhora a leitura dos dados; pelo contrário, esses gráficos são difíceis de interpretar devido ao efeito distorcido da perspectiva associado à terceira dimensão. O uso de dimensões supérfluas não utilizadas para exibir os dados de interesse é desencorajado para gráficos em geral, não apenas para gráficos de pizza. Em um gráfico de pizza 3D, as fatias mais próximas do leitor parecem ser maiores do que as da parte de trás devido ao ângulo em que são apresentadas. Este efeito torna os leitores menos eficientes no julgamento da magnitude relativa de cada fatia ao usar 3D do que 2D
O item C parece ser pelo menos tão grande quanto o item A no gráfico de pizza enganoso, enquanto na realidade é menos da metade.
Edward Tufte , um estatístico americano proeminente, observou por que as tabelas podem ser preferidas aos gráficos de pizza em The Visual Display of Quantitative Information :
As tabelas são preferíveis aos gráficos para muitos conjuntos de dados pequenos. Uma tabela quase sempre é melhor do que um gráfico de pizza idiota; a única coisa pior do que um gráfico de pizza são vários deles, pois então o visualizador é solicitado a comparar as quantidades localizadas em desordem espacial dentro e entre as tortas - Dada sua baixa densidade de dados e falha em ordenar os números ao longo de uma dimensão visual, gráficos de pizza nunca deve ser usado.
Escala imprópria
O uso de pictogramas em gráficos de barras não deve ser dimensionado de maneira uniforme, pois isso cria uma comparação perceptualmente enganosa. A área do pictograma é interpretada em vez de apenas sua altura ou largura. Isso faz com que a escala faça a diferença parecer quadrada.
No gráfico de barras do pictograma dimensionado incorretamente, a imagem de B é, na verdade, 9 vezes maior que A.
O tamanho percebido aumenta durante o dimensionamento.
O efeito da escala inadequada de pictogramas é ainda exemplificado quando o pictograma tem 3 dimensões, caso em que o efeito é em cubos.
O gráfico de vendas de casas (à esquerda) é enganoso. Parece que as vendas de residências aumentaram oito vezes em 2001 em relação ao ano anterior, quando na verdade dobraram. Além disso, o número de vendas não é especificado.
Um pictograma dimensionado incorretamente também pode sugerir que o tamanho do item em si mudou.
Assumindo que as imagens representam quantidades equivalentes, o gráfico enganoso mostra que há mais bananas porque as bananas ocupam a maior área e estão mais à direita.
Escala logarítmica
Escalas logarítmicas (ou logarítmicas) são um meio válido de representar dados. Mas quando usados sem serem claramente identificados como escalas de registro ou exibidos para um leitor não familiarizado com eles, eles podem ser enganosos. As escalas de registro colocam os valores de dados em termos de um número escolhido (a base do registro) para uma potência particular. A base é frequentemente e (2,71828 ...) ou 10. Por exemplo, escalas logísticas podem fornecer uma altura de 1 para um valor de 10 nos dados e uma altura de 6 para um valor de 1.000.000 (10 6 ) nos dados . Escalas logísticas e variantes são comumente usadas, por exemplo, para o índice de explosividade vulcânica, a escala Richter para terremotos, a magnitude das estrelas e o pH de soluções ácidas e alcalinas. Mesmo nesses casos, a escala logarítmica pode tornar os dados menos aparentes a olho nu. Freqüentemente, a razão para o uso de escalas logarítmicas é que o autor do gráfico deseja exibir escalas muito diferentes no mesmo eixo. Sem escalas logarítmicas, comparar quantidades como 10 3 versus 10 9 torna-se visualmente impraticável. Um gráfico com uma escala logarítmica que não foi claramente rotulada como tal, ou um gráfico com uma escala logarítmica apresentado a um visualizador que não conhecia as escalas logarítmicas, geralmente resultaria em uma representação que fazia os valores dos dados parecerem de tamanho semelhante, de fato, sendo de magnitudes amplamente diferentes. O uso incorreto de uma escala logarítmica pode fazer com que valores muito diferentes (como 10 e 10.000) pareçam próximos (em uma escala logarítmica de base 10, eles seriam apenas 1 e 4). Ou pode fazer com que pequenos valores pareçam negativos devido à forma como as escalas logarítmicas representam números menores do que a base.
O uso incorreto de escalas logísticas também pode fazer com que as relações entre as quantidades pareçam lineares, enquanto essas relações são exponenciais ou leis de potência que aumentam muito rapidamente em direção a valores mais altos. Afirmou-se, embora principalmente de forma humorística, que "qualquer coisa parece linear em uma trama de toras de madeira com caneta hidrocor espessa".
Ambos os gráficos mostram uma função exponencial idêntica de f ( x ) = 2 x . O gráfico à esquerda usa uma escala linear, mostrando claramente uma tendência exponencial. O gráfico à direita, porém, usa uma escala logarítmica, que gera uma linha reta. Se o visualizador do gráfico não estivesse ciente disso, o gráfico pareceria mostrar uma tendência linear.
Gráfico truncado
Um gráfico truncado (também conhecido como gráfico interrompido ) tem um eixo y que não começa em 0. Esses gráficos podem criar a impressão de uma mudança importante onde há relativamente pouca mudança.
Embora gráficos truncados possam ser usados para sobrepor diferenças ou para economizar espaço, seu uso é frequentemente desencorajado. Softwares comerciais como o MS Excel tendem a truncar os gráficos por padrão se os valores estiverem todos dentro de uma faixa estreita, como neste exemplo. Para mostrar as diferenças relativas nos valores ao longo do tempo, um gráfico de índice pode ser usado. Os diagramas truncados sempre distorcerão os números subjacentes visualmente. Vários estudos descobriram que, mesmo que as pessoas fossem informadas corretamente de que o eixo y estava truncado, elas ainda superestimavam as diferenças reais, muitas vezes de forma substancial.
Esses gráficos exibem dados idênticos ; no entanto, no gráfico de barras truncado à esquerda, os dados parecem mostrar diferenças significativas, ao passo que, no gráfico de barras regular à direita, essas diferenças são dificilmente visíveis.
Existem várias maneiras de indicar quebras no eixo y :
Mudanças de eixo
Alterar o máximo do eixo y afeta a forma como o gráfico aparece. Um máximo mais alto fará com que o gráfico pareça ter menos volatilidade, menos crescimento e uma linha menos inclinada do que um máximo mais baixo.
Alteração da proporção das dimensões do gráfico Gráfico original Meia largura, duas vezes a altura Duas vezes largura, meia altura
Alterar a proporção das dimensões de um gráfico afetará a aparência do gráfico.
Sem escala
As escalas de um gráfico são freqüentemente usadas para exagerar ou minimizar diferenças.
Gráfico de barras enganoso sem escala Menos diferença Mais diferença
A falta de um valor inicial para o eixo y não deixa claro se o gráfico está truncado. Além disso, a falta de marcas de escala impede que o leitor determine se as barras do gráfico estão dimensionadas corretamente. Sem escala, a diferença visual entre as barras pode ser facilmente manipulada.
Embora todos os três gráficos compartilhem os mesmos dados e, portanto, a inclinação real dos dados ( x , y ) seja a mesma, a maneira como os dados são plotados pode alterar a aparência visual do ângulo feito pela linha no gráfico. Isso ocorre porque cada gráfico possui uma escala diferente em seu eixo vertical. Como a escala não é mostrada, esses gráficos podem ser enganosos.
Intervalos ou unidades impróprios
Os intervalos e unidades usados em um gráfico podem ser manipulados para criar ou mitigar a expressão de mudança.
Omitindo dados
Os gráficos criados com dados omitidos removem informações nas quais basear uma conclusão.
Gráfico de dispersão com categorias ausentes Gráfico de dispersão com categorias ausentes Gráfico de dispersão regular
No gráfico de dispersão com categorias ausentes à esquerda, o crescimento parece ser mais linear com menos variação.
Em relatórios financeiros, retornos negativos ou dados que não se correlacionam com uma perspectiva positiva podem ser excluídos para criar uma impressão visual mais favorável.
3D
O uso de uma terceira dimensão supérflua, que não contenha informações, é fortemente desencorajado, pois pode confundir o leitor.
Complexidade
Os gráficos são projetados para permitir uma interpretação mais fácil dos dados estatísticos. No entanto, gráficos com complexidade excessiva podem ofuscar os dados e dificultar a interpretação.
Construção ruim
Gráficos mal construídos podem tornar os dados difíceis de discernir e, portanto, interpretar.
Extrapolação
Gráficos enganosos podem ser usados, por sua vez, para extrapolar tendências enganosas.
Medindo distorção
Vários métodos foram desenvolvidos para determinar se os gráficos estão distorcidos e para quantificar essa distorção.
Fator de mentira
Onde
Um gráfico com um fator de mentira alto (> 1) exageraria a alteração nos dados que representa, enquanto um com um fator de mentira pequeno (> 0, <1) obscureceria a alteração nos dados. Um gráfico perfeitamente preciso exibiria um fator de mentira de 1.
Índice de discrepância do gráfico
Onde
O índice de discrepância do gráfico , também conhecido como índice de distorção do gráfico ( GDI ), foi originalmente proposto por Paul John Steinbart em 1998. O GDI é calculado como uma porcentagem que varia de -100% a infinito positivo, com zero por cento indicando que o gráfico foi construída corretamente e qualquer coisa fora da margem de ± 5% é considerada distorcida. A pesquisa sobre o uso do GDI como uma medida de distorção de gráficos revelou que ele é inconsistente e descontínuo, dificultando o uso do GDI como uma medida para comparações.
Relação dados-tinta
A proporção dados-tinta deve ser relativamente alta. Caso contrário, o gráfico pode ter gráficos desnecessários.
Densidade de dados
A densidade de dados deve ser relativamente alta, caso contrário, uma tabela pode ser mais adequada para exibir os dados.
Uso em relatórios financeiros e corporativos
Os gráficos são úteis no resumo e interpretação dos dados financeiros. Os gráficos permitem que as tendências em grandes conjuntos de dados sejam vistas, ao mesmo tempo que permitem que os dados sejam interpretados por não especialistas.
Os gráficos são freqüentemente usados em relatórios anuais corporativos como uma forma de gerenciamento de impressão . Nos Estados Unidos, os gráficos não têm de ser auditados, uma vez que se enquadram na Secção 550 da UA, Outras Informações em Documentos que Contêm Demonstrações Financeiras Auditadas .
Vários estudos publicados analisaram o uso de gráficos em relatórios corporativos para diferentes empresas em diferentes países e encontraram o uso frequente de design impróprio, seletividade e distorção de medição nesses relatórios. A presença de gráficos enganosos nos relatórios anuais levou a pedidos de definição de padrões.
A pesquisa descobriu que, embora os leitores com baixos níveis de compreensão financeira tenham uma chance maior de serem mal informados por gráficos enganosos, mesmo aqueles com compreensão financeira, como agentes de crédito, podem ser enganados.
Academia
A percepção de gráficos é estudada em psicofísica , psicologia cognitiva e visões computacionais .
Veja também
- Chartjunk
- Gerenciamento de impressão
- Uso indevido de estatísticas
- Paradoxo de Simpson
- Como mentir com estatísticas
Referências
Livros
- Huff, Darrell (1954). Como mentir com estatísticas . imagens de Irving Geis (1ª ed.). Nova York: Norton. ISBN 0393052648.
- Hurley, Patrick J. (2000). Uma introdução concisa à lógica . Publicação de Wadsworth. ISBN 9780534520069.
- Keller, Gerald (2011). Statistics for Management and Economics (abreviado, 9ª ed.). Mason, OH: South-Western. ISBN 978-1111527327.
- Kirk, Roger E. (2007). Estatísticas: uma introdução . Cengage Learning. ISBN 978-0-534-56478-0. Página visitada em 28 de junho de 2012 .
- Nolan, Susan; Heinzen, Thomas (2011). Estatística para Ciências do Comportamento . Macmillan. ISBN 978-1-4292-3265-4. Página visitada em 28 de junho de 2012 .
- Rumsey, Deborah (2010). Estatística Essentials For Dummies . John Wiley & Sons. ISBN 978-0-470-61839-4. Página visitada em 28 de junho de 2012 .
- Weiss, Neil A. (1993). Estatísticas elementares . Addison-Wesley. ISBN 978-0-201-56640-6. Página visitada em 28 de junho de 2012 .
- Tufte, Edward (1997). Explicações visuais: imagens e quantidades, evidências e narrativa . Cheshire, CT: Graphics Press. ISBN 978-0961392123.
- Utts, Jessica M. (2005). Ver através das estatísticas (3ª ed.). Belmont: Thomson, Brooks / Cole. ISBN 9780534394028.
- Wainer, Howard (2000). Revelações visuais: contos gráficos do destino e da decepção de Napoleão Bonaparte a Ross Perot . Psychology Press. ISBN 978-0-8058-3878-7. Retirado em 19 de julho de 2012 .
- Whitbread, David (2001). O manual de design (2ª ed.). Sydney: University of New South Wales Press. ISBN 0868406589.
Leitura adicional
- Uma discussão sobre gráficos enganosos , Mark Harbison, Sacramento City College
- Robbins, Naomi B. (2005). Criação de gráficos mais eficazes . Hoboken, NJ: Wiley-Interscience. ISBN 9780471698180.
- Durbin CG, Jr (outubro de 2004). "Uso eficaz de tabelas e figuras em resumos, apresentações e artigos". Cuidados respiratórios . 49 (10): 1233–7. PMID 15447809 .
- Goundar, Nadesa (2009). "Gerenciamento de impressões em relatórios financeiros que envolvem a rotatividade do CEO" (PDF) . Dissertação de Mestrado . Instituto de Tecnologia Unitec. hdl : 10652/1250 . Retirado em 9 de julho de 2012 .
- Huff, Darrell; Geis, Irving (17 de outubro de 1993). Como mentir com estatísticas . WW Norton & Company. ISBN 978-0-393-31072-6. Página visitada em 28 de junho de 2012 .
- Bracey, Gerald (2003). "Vendo através dos gráficos". Compreender e usar estatísticas educacionais: é mais fácil do que você pensa . Serviço de Pesquisa Educacional. ISBN 9781931762267.
- Harvey, J. Motulsky (junho de 2009). "O uso e abuso de eixos logarítmicos" (PDF) . GraphPad Software Inc. Arquivado do original em 2010-11-23.CS1 maint: bot: status do URL original desconhecido ( link )
- Chandar, N .; Collier, D .; Miranti, P. (15 de fevereiro de 2012). "Padronização de grafos e contabilidade gerencial na AT&T durante os anos 1920". História da Contabilidade . 17 (1): 35–62. doi : 10.1177 / 1032373211424889 .
- Mather, Paul; Ramsay, Alan; Steen, Adam (1 de janeiro de 2000). "O uso e fidelidade representacional de gráficos em prospectos de IPO australianos" . Diário de contabilidade, auditoria e responsabilidade . 13 (1): 65–83. doi : 10.1108 / 09513570010316144 . Arquivado do original em 09/07/2012.
- Beattie, Vivien; Jones, Michael John (1996). Gráficos financeiros em relatórios anuais corporativos: uma revisão da prática em seis países . Londres: Institute of Chartered Accounants na Inglaterra e País de Gales. ISBN 9781853557071.
- Galliat, Tobias (verão de 2005). "Visualisierung von Informationsräumen" (PDF) . Fachhochschule Köln, Universidade de Ciências Aplicadas de Colônia. Arquivado do original (PDF) em 04-01-2006 . Retirado em 9 de julho de 2012 .
- Carvalho, Clark R .; McMillan, Michael D. (setembro de 1992). "Representação Gráfica na Tomada de Decisão Gerencial: O Efeito da Quebra de Escala no Eixo Dependente" (PDF) . FORÇA AÉREA INST DE TECH WRIGHT-PATTERSON AFB OH.
- Johnson, R. Rice; Roemmich, R. (outubro de 1980). "Imagens que mentem: o abuso dos gráficos nos relatórios anuais". Contabilidade de gerenciamento : 50–56.
- Davis, Alan J. (1 de agosto de 1999). "Gráficos ruins, boas lições" . ACM SIGGRAPH Computação Gráfica . 33 (3): 35–38. doi : 10.1145 / 330572.330586 . Arquivado do original em 05/03/2000.
- Louwers, T .; Radtke, R; Pitman, M. (maio-junho de 1999). "Por favor, passe o sal: uma análise dos relatórios criativos em relatórios anuais". CPA de hoje : 20–23.
- Beattie, Vivien; Jones, Michael John (maio de 2001). "Uma comparação de seis países do uso de gráficos em relatórios anuais". The International Journal of Accounting . 36 (2): 195–222. doi : 10.1016 / S0020-7063 (01) 00094-2 .
- Wainer, Howard (1984). "Como exibir dados incorretamente". The American Statistician . 38 (2): 137–147. doi : 10.1080 / 00031305.1984.10483186 .
- Lane, David M .; Sándor, Anikó (1 de janeiro de 2009). "Projetando gráficos melhores, incluindo informações de distribuição e integrando palavras, números e imagens" (PDF) . Métodos psicológicos . 14 (3): 239–257. doi : 10.1037 / a0016620 . PMID 19719360 .
- Campbell, Mary Pat (fevereiro de 2010). "Problemas da planilha: armadilhas, práticas recomendadas e dicas práticas" . Fórum de Prática Atuarial . Arquivado do original em 23/04/2019.
- Arocha, Carlos (maio de 2011). "Palavras ou gráficos?" . O trampolim . Arquivado do original em 23/04/2019.
- Raschke, Robyn L .; Steinbart, Paul John (1 de setembro de 2008). "Atenuando os efeitos de gráficos enganosos nas decisões, educando os usuários sobre os princípios do design de gráficos". Journal of Information Systems . 22 (2): 23–52. doi : 10.2308 / jis.2008.22.2.23 .