[1] O documento discute como jornalistas podem analisar e apresentar dados de forma a contar histórias. [2] Inclui dicas sobre entrevistar e padronizar dados, encontrar padrões e ideias para reportagens. [3] Também fornece exemplos de visualização de dados e ferramentas para jornalismo de dados.
Jornalismo de dados - manipular, entender, apresentar
1. Jornalismo de dados - manipular,
entender, apresentar
Leonardo Foletto - 2014/1
2. Coletei dados. E agora?
_ “Entrevistar os dados”:
o que eles querem dizer?
preciso de mais dados para fazer uma pauta?
preciso de outras informações (entrevistas, de contexto) para ter
uma reportagem?
_ Não basta dados, tem que ter boas ideias; dados sozinhos não
contam uma história;
_ Fundamental: padronizar os dados para poder cruzá-los.
3. Que notícia pode ser encontrada?
Medição
"Prefeituras de todo o país gastaram tantos bilhões em clipes de
papel no último ano." Frequentemente, é difícil saber se isso é
muito ou pouco. Para isso, é necessário contexto, que pode ser
obtido por meio de:
Proporção
"No último ano, as prefeituras gastaram dois terços de seu
orçamento de papelaria em clipes de papel."
Fonte: Martin Rosenbaum, BBC, Datajournalism Handbook (http://datajournalismhandbook.org/pt/entendendo_os_dados_5.html)
4. Que notícia pode ser encontrada?
Comparação interna: "As prefeituras gastaram mais em clipes
de papel do que enviando refeições a domicílio para idosos."
Comparação externa
"O gasto das prefeituras em clipes de papel ao longo do último
ano foi o dobro do orçamento nacional de ajuda externa."
Mudança ao longo do tempo
"Os gastos das prefeituras em clipes de papel triplicou ao longo
dos últimos quatro anos."
Fonte: Martin Rosenbaum, BBC, Datajournalism Handbook (http://datajournalismhandbook.org/pt/entendendo_os_dados_5.html)
5. Que notícia pode ser encontrada?
"Tabelas de classificação"
São normalmente geográficas ou por instituição. "A prefeitura de
Chapecó gasta mais em clipes para cada funcionário do que
qualquer outra autoridade local, cerca de quatro vezes a média
nacional."
Análise por categorias
"Prefeituras administradas pelo Partido Roxo gastam 50% mais
em clipes de papel do que as administradas pelo Partido
Amarelo."
Fonte: Martin Rosenbaum, BBC, Datajournalism Handbook (http://datajournalismhandbook.org/pt/entendendo_os_dados_5.html)
6. Que notícia pode ser encontrada?
Associação
"Prefeituras administradas por políticos que receberam doações
de empresas de papelaria gastam mais em clipes de papel, com
gastos médios de 100 reais para cada real doado."
Ao investigar gastos com clipes de papel, certifique-se de que
Gastos totais (contexto), relações geográficas/históricas/outras
(dados comparativos).
Os dados adicionais que você precisa para dar credibilidade às
comparações são justos?
Fonte: Martin Rosenbaum, BBC, Datajournalism Handbook (http://datajournalismhandbook.org/pt/entendendo_os_dados_5.html)
7. Visualização (1)
Dados por si só, bits e bytes armazenados em um disco rígido,
são invisíveis. Para avaliá-los e encontrar neles algum sentido,
precisamos primeiro visualizá-los.
_ Abrir um conjunto de dados em um programa de planilhas
ajuda a ver o que antes era “invisível”;
_ O que posso ver ali? É isso que eu esperava? Existe algum
padrão interessante? O que isso significa no contexto dos
dados?
8. Visualização (2) - apresentação
Há muitas maneiras de apresentar dados ao público. As mais
comuns são:
_ publicação de bancos de dados brutos em reportagens;
http://zerohora.clicrbs.com.br/rs/politica/pagina/administracoes-municipais.html
_visualizações/infográficos, incluindo mapas;
http://estadaodados.com/biomas2012/, http://contario.net/cervejinha-tem-preco-justo/
_ aplicativos interativos;
http://maps.latimes.com/neighborhoods/region/westside/
10. Mapas
Google Maps - Waze
Open Street Maps - http://www.openstreetmap.org/, http:
//desliga.tv/
Mapbox (https://www.mapbox.com/), Tilemil (editor de mapas)
http://infoamazonia.org/pt, http://www.npr.org/censusmap/
Mapas de Vista (wordpress http://mapasdevista.hacklab.com.br
Ushaidi: http://ushahidi.com/
11. Analisando exemplos (1)
Compromissos de Campanha prefeitura SP - 2012
http://folhaspdados.blogfolha.uol.com.br/2012/10/27/mapa-
mostra-compromissos-de-campanha-de-serra-e-haddad/
_ Quais dados/informações obtiveram?
_ Relacionaram com o quê?
_ De que forma apresentaram?
12. Respostas (1)
_ Como extraíram os dados?
Comunicados enviados à imprensa, 59 compromissos foram
registrados, sendo 35 realizados pelo candidato petista e 24
pelo tucano;
_ Com o que foi cruzado?
Com as regiões onde os candidatos visitarem em SP e com os
dois turnos de eleição
_ Como apresentaram?
Mapa simples (Mapbox)
13. Analisando exemplos (2)
Os Caminhos da Corrupção
(http://www.apublica.org/2012/07/infografico-interativo-os-
caminhos-da-corrupcao/)
_ Como extraíram os dados?
_ Com o que foi cruzado?
_ Como apresentaram?
14. Respostas (2)
_ Como extraíram os dados?
Relatórios CGU, em especial sobre Educação, na Amazônia
(disponíveis na rede)
_ Com o que foi cruzado?
Listas de: irregularidades, cidades, tipos de irregularidades,
programas de governo,
_ Como apresentaram?
Infográfico interativo
15. Analisando exemplos (3)
Trem do Samba - http://super.abril.com.br/multimidia/trem-
samba-722528.shtml
_ Como extraíram os dados?
_ Com o que foi cruzado?
_ Como apresentaram?
17. Ferramentas & sites &
conceitos
_ API: conjunto de rotinas e padrões estabelecidos por um
(software) - interface para programação de aplicativos. Permite a
“conversa” dos sistemas de dados; Google Maps e Twitter, por
exemplo; enquanto você usufrui de um aplicativo ou site, a sua
API pode estar conectada a diversos outros sistemas e
aplicativos
_ Linked data: dados publicados na web legíveis por máquina.
Web semântica: interliga significados de palavras e atribui um
significado (sentido) aos conteúdos publicados na Internet -
tanto para humanos quanto para computadores;
18. Ferramentas & sites &
conceitos
_ CKAN: aplicação web de catalogação de dados. Sistema “wiki”
de dados: http://ckan.org. Permite publicar, organizar, engajar
outras pessoas a colaborar, compartilhar, customizar...
_ GitHub: “rede social” de códigos. https://github.com/
Permite ver como foi construído o site: http://matehackers.
github.io/tarifapoa/
19. Linguagens de programação
(1)
Baixo nível - Linguagem que precisam compreender a
arquitetura do computador, são linguagem que interagem diretor
na “carne” da maquina”. Assembly
Alto nível - Linguagens que abstraem as compreençoes sobre a
arquitetura do computador; mais “humanas”. Java, Ruby, PHP,
C, CSS
Linguagens boas pra jornalista aprender: Python, Ruby, PHP
(linguagem de script, interpretadas, dinâmicas) - Scrapping,
acessar APIs e controlá-las
20. Linguagens de programação
(2)
Quando acessamos um site, várias linguagens são acionadas,
pelo menos 5:
_ Marcação (HTML, XHTML)
_ Estilo (CSS):
_ Interpretadas: funcionam dentro de outras linguagens e
programas e “chamam” outros dados
PHP, Python: scrappers, comunicam com os bancos de dados;
Javascript: cliente-servidor (formulários, busca)