O documento discute o jornalismo de dados, definindo-o como jornalismo produzido com dados e descrevendo suas origens na reportagem assistida por computador e no jornalismo de precisão. Também explica como os dados podem ser coletados, combinados e visualizados para contar histórias, dando exemplos de ferramentas e fontes de dados públicos.
2. O que é?
Jornalismo produzido com dados
(e no mundo digital tudo é dado, bit, 0 e 1)
"Faro jornalístico" + diferentes possibilidades
de combinar dados + estratégias para
narrar/visualizar uma história
3. Antepassados
_ Reportagem Assistida por Computador (desde 1950)
Toda e qualquer apuração jornalística que faça uso de informática para
encontrar as informações desejadas.
_ Jornalismo de precisão (1960, 1970)
Uso de técnicas de pesquisa das ciências sociais para a prática de jornalismo
Philip Meyer. É uma maneira de expandir o kit de ferramentas do repórter para
acessar informações pouco acessadas por jornalistas.
4. Tecnologia digital
_ Populariza e expande a ideia da Reportagem assistida
por computador
_ Tira do "nicho" de reportagens especiais/investigativas;
_ Informação é abundante, o desafio não é tanto achar,
mas processar e relacionar;
5. Por que fazer?
_ Ganhar tempo;
_ Novas abordagens para contar histórias;
_ Interpretações independentes de informação oficial;
_ Valorizar o jornalismo local;
_ Ver relações de interesse onde antes não se via;
_ Organizar informações dispersas na rede e dar sentido a
elas;
6. Como?
_ Pauta (não precisa ser fixa);
_ Busca e extração de dados, geralmente de bancos de
dados públicos;
_ Combinação de dados entre si ou com outras fontes
(imagens, vídeos, entrevistas, textos)
_ Edição
_ Apresentação (infográfico, mapa, reportagem, vídeo,
áudio, etc)
7. Scrapping
"Extrair" informações (geralmente em grande quantidade)
da internet;
Scrapers são programas simples de lidar, o grande desafio
e o exercício constante é encontrar um padrão nos dados
das páginas web - algumas páginas são bem simples,
outras complexas.
11. Outras ferramentas
_ Mozenda (http://www.mozenda.com/) um software de
interface simples que automatiza boa parte do trabalho
_ Screen Scraper (http://www.screen-scraper.com/), uma
ferramenta mais complexa, que trabalha com diversas
linguagens de programação para extrair dados da Web.
_ Google Refine (http://code.google.com/p/google-refine/)
para manipular dados confusos e transportá-los para
formatos maleáveis.
12. Fontes de dados públicos
_ IBGE (http://www.ibge.gov.br/)
_ http://dados.gov.br/
_ Transparência Pública (http://www3.transparencia.gov.br/)
_ Transparência RS: http://www.transparencia.rs.gov.br/
_ Transparência no Legislativo: http://www2.al.rs.gov.br/transparenciaalrs/
_ Transparência Porto Alegre: http://transparencia.portoalegre.rs.gov.br/
_ No Reino Unido: http://data.gov.uk/
18. Exemplo 1
Os Caminhos da Corrupção
(http://www.apublica.org/2012/07/infografico-interativo-os-caminhos-da-
corrupcao/)
_ Como extraíram os dados?
_ Com o que foi cruzado?
_ Como apresentaram?
19.
20. Respostas
_ Como extraíram os dados?
Relatórios CGU, em especial sobre Educação, na Amazônia
(disponíveis na rede)
_ Com o que foi cruzado?
Listas de: irregularidades, cidades, tipos de irregularidades, programas de
governo,
_ Como apresentaram?
Infográfico interativo
23. Respostas
_ Como extraíram os dados?
Comunicados enviados à imprensa, 59 compromissos foram registrados,
sendo 35 realizados pelo candidato petista e 24 pelo tucano;
_ Com o que foi cruzado?
Com as regiões onde os candidatos visitarem em SP e com os dois turnos de
eleição
_ Como apresentaram?
Mapa simples (Mapbox)
24. Exemplo 3
O trem do samba
http://super.abril.com.br/multimidia/trem-samba
_ Quais dados/informações obtiveram?
_ Relacionaram com o quê?
_ De que forma apresentaram?
25.
26. Mais casos
_Los Angeles Times (http://datadesk.latimes.com/)
_ The Guardian (http://www.guardian.co.uk/data)
_ ZH Dados (http://zerohora.clicrbs.com.br/rs/pagina/zh-
dados.html)
_ Folha SP Dados (http://folhaspdados.blogfolha.uol.com.
br/)