Como NÃO mentir usando gráficos?

Seis dicas simples para a sua visualização de dados não desinformar

Quando eu criei a Catolé, eu prometi que algumas edições seriam dicas e boas práticas de como trabalhar com jornalismo de dados de forma simples. Aqui vai a primeria delas.


No dia 15 de outubro de 2020, a Juventude do PSB em Pernambuco publicou um gráfico com os resultados da pesquisa Ibope para mostrar que o então candidato do partido à Prefeitura do Recife, João Campos, liderava a corrida eleitoral naquele momento. Os números usados na imagem eram verdadeiros, mas o modo como o gráfico foi construído inflava a vantagem que o socialista tinha sobre os demais candidatos.

Ele não foi o único. Como eu mostrei na época, Marília Arraes (PT), Mendonça Filho (DEM) e Patrícia Domingos (Podemos) também manipularam informações sobre pesquisas para favorecer suas posições na corrida eleitoral. Candidatos fazem isso porque a presença de gráficos, tabelas e números dão um elemento de credibilidade para a mensagem.

Não à toa, estatísticas de comportamento de audiência dizem que quando veículos de imprensa adicionam uma visualização de dados, ainda que simples, em suas matérias, os leitores tendem a permanecer por mais tempo na página. Esse processo se tornou ainda mais fácil com a popularização de ferramentas gratuitas de construção de gráficos como Flourish, DataWrapper e Infogram.

Mas se, por um lado, ficou mais fácil e democrático criar e publicar sua própria dataviz, é preciso ficar atento a boas práticas para garantir que você não passe a informação errada para o seu leitor. Afinal, por melhor que sejam as suas intenções, ninguém está livre de cometer erros. Esse post no blog do Heap, por exemplo, mostra vários momentos em que gráficos distorcidos foram ao ar na TV americana. O designer espanhol Alberto Cairo, que já trabalhou na Revista Época, publicou um livro inteiro sobre o assunto.

Mas, então, o que eu devo fazer?

Comece do zero: Um dos erros principais ao fazer comparações é não ter a base do seu gráfico (o eixo Y) começando do zero. Isso pode fazer com que números que, na verdade, são muito próximos pareçam ser muito distantes, o que distorce os resultados que você está apresentando. A imagem abaixo ajuda a mostrar como é possível ter duas visões diferentes dos mesmos dados por causa disso.

Não coma pizza: Gráficos de pizza (ou rosca) podem ser úteis se, no conjunto de dados, você tiver uma categoria que se destaca muito das demais. Por exemplo, se 82% dos candidatos a prefeito em Pernambuco têm a pele branca, pode ser útil usar esse tipo de visualização para mostrar o quão gritante é essa diferença. Mas, quando esse não for o caso ou quanto mais categorias você quiser representar no mesmo gráfico, mais confuso fica usar uma pizza como comparação.

Na dúvida, pegue a linha e faça a barra: Ok, a piada foi ruim. Mas os gráficos de barra e de linha não são os mais usados por acaso. Eles são mais simples de serem interpretados a olho nu, principalmente se o leitor não tem experiência em analisar dados (o que sempre tem que ser levado em conta já que, como jornalistas, nós escrevemos para diversos públicos). A barra costuma ser usada para comparar categorias diferentes, como votos entre candidatos, por exemplo. Já a linha facilita ver a evolução de números ao longo do tempo.

De baixo para cima, da esquerda para a direita: Eu sei o que você está pensando, essa é a dica mais óbvia. Mas uma vez que você começa a trabalhar com dataviz, você pode se empolgar e ficar tentado a usar abordagens criativas. Tenha cuidado com elas. A vida toda, desde a escola, nós nos acostumamos com gráficos em que o ponto zero está embaixo e à esquerda  (no encontro entre os eixos X e Y). Se a sua visualização for construída de outra forma, as chances de ela ser mal interpretada são enormes.

Prefira o 2D: Lembre que o objetivo de todo gráfico é facilitar a comparação entre diferentes números ou categorias. Uma barra em 3D pode parecer muito bonita e estilosa. Mas, na prática, ela torna mais difícil para as pessoas comparar um resultado com o outro. E só piora se as barras tiverem espessuras diferentes. Lembre do gráfico que o PSB fez para João Campos e não faça igual.

Quanto mais simples, melhor: Uma visualização de dados deve ser fácil de ser interpretada. O ideal é que o leitor bata o olho e consiga entender de cara do que aquele gráfico está tratando. Então tente manter ele o mais simples e claro possível. Isso vale para trabalhar com gráficos de dispersão ou grafos de interação em redes sociais também. Ambos são lindos e, dependendo do fenômeno que você quer representar, eles são também necessários. Mas por, em geral, incluírem muitos elementos, eles são mais complexos de serem interpretados. Então, devem ser usados com parcimônia.


Governo federal frauda a LAI: Hoje é o Dia Internacional do Acesso Universal à Informação. Por isso, a minha sugestão dessa edição é a matéria escrita pelo repórter recifense Breno Pires para o Estadão no dia 18 deste mês mostrando como o governo federal fraudou a Lei de Acesso à Informação (LAI) ao esconder documentos públicos por causa do “risco político” de vê-los na imprensa. Sempre se suspeitou que governos nos mais diversos níveis editem respostas de pedidos para torná-las mais palatáveis quando sabem que o solicitante é um jornalista (Raphael Guerra falou mais sobre isso em outra edição). Mas essa é a primeira vez que, por erro do próprio governo, uma manipulação da lei é documentada.