Arquivo de Julho de 2008

Hoje foi publicado pelo UOL Notícias um exemplo prático de manipulação de dados:

17/07/2008 - 16h30
Record ilude com manipulação de gráfico de Ibope
Ricardo Feltrin
Colunista do UOL
A Record manipulou graficamente dados de audiência durante reportagem do “Jornal da Record”, exibida na semana passada. O objetivo foi reduzir graficamente a diferença que separa a emissora da Globo.
Leia mais em http://noticias.uol.com.br/ooops/ultnot/2008/07/17/ult2548u558.jhtm

Esse golpe é velho e, diga-se de passagem, muito utilizado em aulas de estatística para mostrar como a apresentação de dados pode ser torcida de forma leviana para iludir o leitor. O argumento de que os números estão lá não se sustenta, já que não há sentido de usar dois gráficos com proporções de eixo y completamente diferentes para valores tão próximos. Montei um pequeno exemplo para ilustrar essa manipulação grosseira.

manipula1 - manipula1

manipula2 - manipula2


Os dois gráficos acima tem EXATAMENTE os mesmos valores, mas atentem para o eixo y (vertical). A impressão que fica na mente das pessoas que olham ambos é que no segundo a diferença entre os dois produtos é abissal. É possível considerar que leitores atentos e com conhecimento não irão cair nesse golpe, mas a maior parte vai, pois vai esquecer de olhar para o eixo de ambos, QUE ESTÁ DIFERENTE. Acho que até pessoas atentas caem às vezes nesse golpe, porque não se espera que alguém tenha coragem de fazer uma manipulação tão tosca como essa.

Ontem (04/07/2008) a Folha de São Paulo publicou reportagem sobre a produção científica brasileira no ano de 2007. De acordo com a reportagem, a nossa produção científica cresceu 133% em 10 anos.

producao cientifica2 - producao cientifica2


E a tabela seguinte mostra a produção científica no ano de 2007:

producao cientifica - producao cientifica

Esta última tabela deve ser olhada com certo cuidado, pois embora a China apareça em 2º lugar, é preciso não esquecer que ela tem a maior população do mundo. Ainda que esteja investindo pesado em ciência HOJE, ela ainda é um país tentando tirar o atraso de décadas de comunismo estatizante (se é que se pode dizer que existe comunismo capitalista). Inclusive na tabela anterior seu aumento de produção científica deve ser visto sob esse prisma também.

Para visualizar isso melhor, produzi uma nova tabela no Excel cruzando dados de população com a produção científica:

producao cientifica3 - producao cientifica3

Os dados populacionais foram retirados do seguinte endereço: https://www.cia.gov/library/publications/the-world-factbook/ É possível notar que nossa posição piora um pouco e a da China despenca. Compare o primeiro colocado com o último. Na Suiça, há um artigo para cada trezentos habitantes; na Índia, um para cada vinte e oito mil. Um resultado quase 100 vezes pior. Há várias análises possíveis cruzando esses dados com os dados de PIB per capita, nível de liberdade econômica, grau de informatização da sociedade, etc.. Isso fica para uma próxima postagem.

Com relação ao resultado do Brasil, fiquei pessoalmente surpreso pela posição, pois dados de alguns anos atrás não eram tão bons.

Outro detalhe importante: estas tabelas se referem a NÚMERO de artigos publicados, e não à sua QUALIDADE. Atualmente há uma incrível pressão em cima de professores e pesquisadores para publicarem (daí o famoso “Publish or perish”). Isso acaba causando um pouco de distorção, pois um trabalho que poderia sair completo numa boa revista acaba sendo “fatiado” (”salami science”) e enviado para várias revistas. Por isso, para se ter uma medida mais realista, seria necessário ter um ranking que levasse em conta o número de publicações E a qualidade dos trabalhos, via ÍNDICE DE IMPACTO dos periódicos que veicularam esses artigos e o ÍNDICE DE CITAÇÃO desses artigos.

O endereço para a reportagem completa pode ser acessado em:

http://www1.folha.uol.com.br/folha/ciencia/ult306u419160.shtml