Gráfico enganoso - Misleading graph

Em estatística , um gráfico enganoso , também conhecido como gráfico distorcido , é um gráfico que deturpa os dados , constituindo um uso indevido da estatística e com o resultado de que uma conclusão incorreta pode ser derivada dele.

Os gráficos podem ser enganosos por serem excessivamente complexos ou mal construídos. Mesmo quando construídos para exibir as características de seus dados com precisão, os gráficos podem estar sujeitos a diferentes interpretações, ou tipos de dados não intencionais podem ser derivados de forma aparente e errônea.

Gráficos enganosos podem ser criados intencionalmente para impedir a interpretação adequada dos dados ou acidentalmente devido à falta de familiaridade com o software gráfico , má interpretação dos dados ou porque os dados não podem ser transmitidos com precisão. Gráficos enganosos são freqüentemente usados ​​em propaganda enganosa . Um dos primeiros autores a escrever sobre gráficos enganosos foi Darrell Huff , editor do livro de 1954 How to Lie with Statistics .

O campo de visualização de dados descreve maneiras de apresentar informações que evitam a criação de gráficos enganosos.

Métodos gráficos enganosos

Ele [um gráfico enganoso] é muito mais eficaz, no entanto, porque não contém adjetivos ou advérbios para estragar a ilusão de objetividade, não há nada que alguém possa atribuir a você.

Existem várias maneiras de construir um gráfico enganoso.

Uso excessivo

O uso de gráficos onde eles não são necessários pode levar a confusão / interpretação desnecessária. Geralmente, quanto mais explicação um gráfico precisa, menos o gráfico em si é necessário. Os gráficos nem sempre transmitem informações melhor do que as tabelas.

Rotulagem tendenciosa

O uso de palavras tendenciosas ou carregadas no título do gráfico, nos rótulos dos eixos ou na legenda pode preparar o leitor de maneira inadequada .

Tendências fabricadas

Da mesma forma, tentar traçar linhas de tendência por meio de dados não correlacionados pode levar o leitor a acreditar que existe uma tendência onde não há nenhuma. Isso pode ser o resultado de uma tentativa intencional de enganar o leitor ou devido ao fenômeno da correlação ilusória .

Gráfico de pizza

  • Comparar gráficos de pizza de tamanhos diferentes pode ser enganoso, pois as pessoas não podem ler com precisão a área comparativa dos círculos.
  • O uso de fatias finas, que são difíceis de discernir, pode ser difícil de interpretar.
  • O uso de porcentagens como rótulos em um gráfico de pizza pode ser enganoso quando o tamanho da amostra é pequeno.
  • Tornar um gráfico de pizza 3D ou adicionar uma inclinação tornará a interpretação difícil devido ao efeito distorcido da perspectiva . Gráficos de pizza em gráfico de barras nos quais a altura das fatias é variada podem confundir o leitor.

Perspectiva da fatia do gráfico circular 3D

Um gráfico de pizza em perspectiva (3D) é usado para dar ao gráfico uma aparência 3D . Freqüentemente usada por razões estéticas, a terceira dimensão não melhora a leitura dos dados; pelo contrário, esses gráficos são difíceis de interpretar devido ao efeito distorcido da perspectiva associado à terceira dimensão. O uso de dimensões supérfluas não utilizadas para exibir os dados de interesse é desencorajado para gráficos em geral, não apenas para gráficos de pizza. Em um gráfico de pizza 3D, as fatias mais próximas do leitor parecem ser maiores do que as da parte de trás devido ao ângulo em que são apresentadas. Este efeito torna os leitores menos eficientes no julgamento da magnitude relativa de cada fatia ao usar 3D do que 2D

Comparação de gráficos de pizza
Gráfico de pizza enganoso Gráfico de pizza regular
Misleading Pie Chart.png Sample Pie Chart.png

O item C parece ser pelo menos tão grande quanto o item A no gráfico de pizza enganoso, enquanto na realidade é menos da metade.

Edward Tufte , um estatístico americano proeminente, observou por que as tabelas podem ser preferidas aos gráficos de pizza em The Visual Display of Quantitative Information :

As tabelas são preferíveis aos gráficos para muitos conjuntos de dados pequenos. Uma tabela quase sempre é melhor do que um gráfico de pizza idiota; a única coisa pior do que um gráfico de pizza são vários deles, pois então o visualizador é solicitado a comparar as quantidades localizadas em desordem espacial dentro e entre as tortas - Dada sua baixa densidade de dados e falha em ordenar os números ao longo de uma dimensão visual, gráficos de pizza nunca deve ser usado.

Escala imprópria

O uso de pictogramas em gráficos de barras não deve ser dimensionado de maneira uniforme, pois isso cria uma comparação perceptualmente enganosa. A área do pictograma é interpretada em vez de apenas sua altura ou largura. Isso faz com que a escala faça a diferença parecer quadrada.

Escala imprópria de pictograma 2D em um gráfico de barras
Escala imprópria Regular Comparação
Graph.svg de imagem dimensionada incorretamente Picture Graph.svg Comparação de gráfico de imagem dimensionado de forma adequada e inadequada.

No gráfico de barras do pictograma dimensionado incorretamente, a imagem de B é, na verdade, 9 vezes maior que A.

Comparação de escala de forma 2D
Quadrado Círculo Triângulo
Box scaling.svg Circle scaling.svg Triangle scaling.svg

O tamanho percebido aumenta durante o dimensionamento.

O efeito da escala inadequada de pictogramas é ainda exemplificado quando o pictograma tem 3 dimensões, caso em que o efeito é em cubos.

Gráfico mostrando dimensionamento impróprio de pictogramas 3D.

O gráfico de vendas de casas (à esquerda) é enganoso. Parece que as vendas de residências aumentaram oito vezes em 2001 em relação ao ano anterior, quando na verdade dobraram. Além disso, o número de vendas não é especificado.

Um pictograma dimensionado incorretamente também pode sugerir que o tamanho do item em si mudou.

Errôneo Regular
Pictograma não alinhado e de tamanho diferente.svg Pictograma alinhado e tamanho similar.svg

Assumindo que as imagens representam quantidades equivalentes, o gráfico enganoso mostra que há mais bananas porque as bananas ocupam a maior área e estão mais à direita.

Escala logarítmica

Escalas logarítmicas (ou logarítmicas) são um meio válido de representar dados. Mas quando usados ​​sem serem claramente identificados como escalas de registro ou exibidos para um leitor não familiarizado com eles, eles podem ser enganosos. As escalas de registro colocam os valores de dados em termos de um número escolhido (a base do registro) para uma potência particular. A base é frequentemente e (2,71828 ...) ou 10. Por exemplo, escalas logísticas podem fornecer uma altura de 1 para um valor de 10 nos dados e uma altura de 6 para um valor de 1.000.000 (10 6 ) nos dados . Escalas logísticas e variantes são comumente usadas, por exemplo, para o índice de explosividade vulcânica, a escala Richter para terremotos, a magnitude das estrelas e o pH de soluções ácidas e alcalinas. Mesmo nesses casos, a escala logarítmica pode tornar os dados menos aparentes a olho nu. Freqüentemente, a razão para o uso de escalas logarítmicas é que o autor do gráfico deseja exibir escalas muito diferentes no mesmo eixo. Sem escalas logarítmicas, comparar quantidades como 10 3 versus 10 9 torna-se visualmente impraticável. Um gráfico com uma escala logarítmica que não foi claramente rotulada como tal, ou um gráfico com uma escala logarítmica apresentado a um visualizador que não conhecia as escalas logarítmicas, geralmente resultaria em uma representação que fazia os valores dos dados parecerem de tamanho semelhante, de fato, sendo de magnitudes amplamente diferentes. O uso incorreto de uma escala logarítmica pode fazer com que valores muito diferentes (como 10 e 10.000) pareçam próximos (em uma escala logarítmica de base 10, eles seriam apenas 1 e 4). Ou pode fazer com que pequenos valores pareçam negativos devido à forma como as escalas logarítmicas representam números menores do que a base.

O uso incorreto de escalas logísticas também pode fazer com que as relações entre as quantidades pareçam lineares, enquanto essas relações são exponenciais ou leis de potência que aumentam muito rapidamente em direção a valores mais altos. Afirmou-se, embora principalmente de forma humorística, que "qualquer coisa parece linear em uma trama de toras de madeira com caneta hidrocor espessa".

Comparação de escalas lineares e logarítmicas para dados idênticos
Escala linear Escala logarítmica
Linear scale.png Escala logarítmica (2) .png

Ambos os gráficos mostram uma função exponencial idêntica de f ( x ) = 2 x . O gráfico à esquerda usa uma escala linear, mostrando claramente uma tendência exponencial. O gráfico à direita, porém, usa uma escala logarítmica, que gera uma linha reta. Se o visualizador do gráfico não estivesse ciente disso, o gráfico pareceria mostrar uma tendência linear.


Gráfico truncado

Um gráfico truncado (também conhecido como gráfico interrompido ) tem um eixo y que não começa em 0. Esses gráficos podem criar a impressão de uma mudança importante onde há relativamente pouca mudança.

Embora gráficos truncados possam ser usados ​​para sobrepor diferenças ou para economizar espaço, seu uso é frequentemente desencorajado. Softwares comerciais como o MS Excel tendem a truncar os gráficos por padrão se os valores estiverem todos dentro de uma faixa estreita, como neste exemplo. Para mostrar as diferenças relativas nos valores ao longo do tempo, um gráfico de índice pode ser usado. Os diagramas truncados sempre distorcerão os números subjacentes visualmente. Vários estudos descobriram que, mesmo que as pessoas fossem informadas corretamente de que o eixo y estava truncado, elas ainda superestimavam as diferenças reais, muitas vezes de forma substancial.

Gráfico de barras truncado
Gráfico de barras truncado Gráfico de barra regular
Truncated Bar Graph.svg Bar graph.svg

Esses gráficos exibem dados idênticos ; no entanto, no gráfico de barras truncado à esquerda, os dados parecem mostrar diferenças significativas, ao passo que, no gráfico de barras regular à direita, essas diferenças são dificilmente visíveis.

EU 3.png


Existem várias maneiras de indicar quebras no eixo y :

Indicando uma quebra do eixo y
Gráfico de barras break.svg Break.svg do eixo Y

Mudanças de eixo

Alterando o máximo do eixo y
Gráfico original Máximo menor Máximo maior
Line graph1.svg Gráfico de linha3.svg Line graph2.svg

Alterar o máximo do eixo y afeta a forma como o gráfico aparece. Um máximo mais alto fará com que o gráfico pareça ter menos volatilidade, menos crescimento e uma linha menos inclinada do que um máximo mais baixo.

Alteração da proporção das dimensões do gráfico
Gráfico original Meia largura, duas vezes a altura Duas vezes largura, meia altura
Line graph1.svg Gráfico de linha 1-3.svg Gráfico de linhas 1-4.svg

Alterar a proporção das dimensões de um gráfico afetará a aparência do gráfico.

Sem escala

As escalas de um gráfico são freqüentemente usadas para exagerar ou minimizar diferenças.

Gráfico de barras enganoso sem escala
Menos diferença Mais diferença
Exemplo de gráfico de barras truncado.svg
Gráfico de barras sem zero1.svg

A falta de um valor inicial para o eixo y não deixa claro se o gráfico está truncado. Além disso, a falta de marcas de escala impede que o leitor determine se as barras do gráfico estão dimensionadas corretamente. Sem escala, a diferença visual entre as barras pode ser facilmente manipulada.

Gráfico de linha enganoso sem escala
Volatilidade Crescimento rápido e constante Crescimento lento
Sem escala de linha graph1.svg Sem escala de linha graph2.svg Sem escala de linha graph3.svg

Embora todos os três gráficos compartilhem os mesmos dados e, portanto, a inclinação real dos dados ( x , y ) seja a mesma, a maneira como os dados são plotados pode alterar a aparência visual do ângulo feito pela linha no gráfico. Isso ocorre porque cada gráfico possui uma escala diferente em seu eixo vertical. Como a escala não é mostrada, esses gráficos podem ser enganosos.

Intervalos ou unidades impróprios

Os intervalos e unidades usados ​​em um gráfico podem ser manipulados para criar ou mitigar a expressão de mudança.

Omitindo dados

Os gráficos criados com dados omitidos removem informações nas quais basear uma conclusão.

Gráfico de dispersão com categorias ausentes
Gráfico de dispersão com categorias ausentes Gráfico de dispersão regular
Gráfico de dispersão sem categorias.svg Um gráfico de dispersão sem categorias.svg ausentes

No gráfico de dispersão com categorias ausentes à esquerda, o crescimento parece ser mais linear com menos variação.

Em relatórios financeiros, retornos negativos ou dados que não se correlacionam com uma perspectiva positiva podem ser excluídos para criar uma impressão visual mais favorável.

3D

O uso de uma terceira dimensão supérflua, que não contenha informações, é fortemente desencorajado, pois pode confundir o leitor.

Complexidade

Os gráficos são projetados para permitir uma interpretação mais fácil dos dados estatísticos. No entanto, gráficos com complexidade excessiva podem ofuscar os dados e dificultar a interpretação.

Construção ruim

Gráficos mal construídos podem tornar os dados difíceis de discernir e, portanto, interpretar.

Extrapolação

Gráficos enganosos podem ser usados, por sua vez, para extrapolar tendências enganosas.

Medindo distorção

Vários métodos foram desenvolvidos para determinar se os gráficos estão distorcidos e para quantificar essa distorção.

Fator de mentira

Onde

Um gráfico com um fator de mentira alto (> 1) exageraria a alteração nos dados que representa, enquanto um com um fator de mentira pequeno (> 0, <1) obscureceria a alteração nos dados. Um gráfico perfeitamente preciso exibiria um fator de mentira de 1.

Índice de discrepância do gráfico

Onde

O índice de discrepância do gráfico , também conhecido como índice de distorção do gráfico ( GDI ), foi originalmente proposto por Paul John Steinbart em 1998. O GDI é calculado como uma porcentagem que varia de -100% a infinito positivo, com zero por cento indicando que o gráfico foi construída corretamente e qualquer coisa fora da margem de ± 5% é considerada distorcida. A pesquisa sobre o uso do GDI como uma medida de distorção de gráficos revelou que ele é inconsistente e descontínuo, dificultando o uso do GDI como uma medida para comparações.

Relação dados-tinta

A proporção dados-tinta deve ser relativamente alta. Caso contrário, o gráfico pode ter gráficos desnecessários.

Densidade de dados

A densidade de dados deve ser relativamente alta, caso contrário, uma tabela pode ser mais adequada para exibir os dados.

Uso em relatórios financeiros e corporativos

Os gráficos são úteis no resumo e interpretação dos dados financeiros. Os gráficos permitem que as tendências em grandes conjuntos de dados sejam vistas, ao mesmo tempo que permitem que os dados sejam interpretados por não especialistas.

Os gráficos são freqüentemente usados ​​em relatórios anuais corporativos como uma forma de gerenciamento de impressão . Nos Estados Unidos, os gráficos não têm de ser auditados, uma vez que se enquadram na Secção 550 da UA, Outras Informações em Documentos que Contêm Demonstrações Financeiras Auditadas .

Vários estudos publicados analisaram o uso de gráficos em relatórios corporativos para diferentes empresas em diferentes países e encontraram o uso frequente de design impróprio, seletividade e distorção de medição nesses relatórios. A presença de gráficos enganosos nos relatórios anuais levou a pedidos de definição de padrões.

A pesquisa descobriu que, embora os leitores com baixos níveis de compreensão financeira tenham uma chance maior de serem mal informados por gráficos enganosos, mesmo aqueles com compreensão financeira, como agentes de crédito, podem ser enganados.

Academia

A percepção de gráficos é estudada em psicofísica , psicologia cognitiva e visões computacionais .

Veja também

Referências

Livros

Leitura adicional

links externos