SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
Projeto Brasil.IO COVID-19:Projeto Brasil.IO COVID-19:
Dados Públicos AcessíveisDados Públicos Acessíveis
TuricasTuricas akaaka Álvaro JustenÁlvaro Justen
TableauTableau WebinarsWebinars
15 de abril de 202015 de abril de 2020
Slides disponíveis em:Slides disponíveis em:
bit.ly/brasilio-tableaubit.ly/brasilio-tableau
$ whoami$ whoami
TuricasTuricas, prazer! =), prazer! =)
Sigam-me os bons:Sigam-me os bons:
{{ ,,
,,
,,
,,
}}
//turicasturicas
twittertwitter
githubgithub
youtubeyoutube
slideshareslideshare
instagraminstagram
turicas@brasil.ioturicas@brasil.io
AgendaAgenda
Dados abertos
O que são
Aplicações
Problemas
Brasil.IO
O que é
Projeto COVID-19
Dificuldades
Dados
Minha história com dadosMinha história com dados
Instagram @turicas
Dados: meio para responderDados: meio para responder
perguntasperguntas
Data PipelineData Pipeline
schoolofdata.org/methodology
-- (definição de )
Dados AbertosDados Abertos
“ Dados abertos são dados que podem
ser livremente usados, reutilizados e
redistribuídos por qualquer pessoa -
sujeitos, no máximo, à exigência de
atribuição da fonte e
compartilhamento pelas mesmas
regras. ”
OpenData Handbook Open Definition
Mais detalhes:
Lei de Acesso à Informação: 12.527/2011
kit.dados.gov.br
escoladedados.org
Dados Abertos - AplicaçõesDados Abertos - Aplicações
Eficiência em gestão pública
Controle social
Jornalismo/Combate à desinformação
Negócios/aumento de produtividade
R$ 191 em um restaurante cujos pratos não custam R$ 40,
deputado?
Rosie, a robôRosie, a robô
twitter.com/tOa_D/status/1058495655184871425
(em conjunto com Juan Torres, para )
RealidadeRealidade versusversus SensoSenso
ComumComum
correio24horas.com.br
Acesse a matéria
(em conjunto com Giulliana Biaconi, para )generonumero.media
Leia a matéria
Driva: Inteligência em VendasDriva: Inteligência em Vendas
(B2B)(B2B)
driva.com.br
Maior parte do tempo dos projetos deMaior parte do tempo dos projetos de
análise de dados:análise de dados:
Qualidade dos DadosQualidade dos Dados
5stardata.info
Causos da TransparênciaCausos da Transparência
BrasileiraBrasileira
Dados muito dispersos (centenas de XLS)
Formatos não estruturados (PDF, imagens)
Formatos proprietários
Dados deletados com o tempo
Dados pagos (!?)
Veja os slides da palestra
Problemas de Usabilidade deProblemas de Usabilidade de
DadosDados
Formato (qualidade técnica)
Exemplo: Boletim de balneabilidade em PDF (INEMA/BA)
Dispersão
Exemplo: Filiações partidárias em 945 ZIPs com CSVs (TSE)
Quantidade de dados
Exemplo: 18 milhões de sócios (RFB)
Domínio da área
Exemplo: o que é unidade eleitoral? (TSE)
Veja mais detalhes
SoluçõesSoluções
Educação tecnológica
Melhorar ferramentas
Libertação de dados
Pressão por dados melhores
Fonte:
Jornalismo de DadosJornalismo de Dados
4300+ estudantes!4300+ estudantes!
Knight Center, Texas University
rows convert arquivo.pdf arquivo.csv
github.com/turicas/balneabilidade-brasil
Brasil.IOBrasil.IO
O Brasil em dados libertos
Software livre e colaborativo
Python + Django + PostgreSQL
Brasil.IO COVID-19Brasil.IO COVID-19
Dados: Ministério da SaúdeDados: Ministério da Saúde
Histórico não disponível
Site fora do ar constantemente
Falta de dados locais
Dados: Secretarias EstaduaisDados: Secretarias Estaduais
de Saúdede Saúde
Formato não estruturado (PDF, imagem etc.)
Local não centralizado (mais de um site, Twitter, Instagram
etc.)
Falta de indexação dos boletins diários
Metodologia alterada e sem aviso
Falta de detalhes e padronização (recuperados, faixa etária
etc.)
Processo de coleta de dadosProcesso de coleta de dados
35+ voluntários!
Robô que detecta novos boletins
Alinhamentos no
Coleta manual
Planilhas no Google Spreadsheets
Checagem manual
Checagem automática
Atualização da base de dados
chat.brasil.io
Dados: Brasil.IODados: Brasil.IO
boletim
caso
obito_cartorio
LinksLinks
Para quem quer usar:
Para quem quer colaborar:
Dataset covid19
Download dos dados
Documentação da API
FAQ
Repositório do Brasil.IO no GitHub
Repositório do Brasil.IO/covid19 no GitHub
Recomendações para Secretarias de Saúde
Apoie o Projeto!Apoie o Projeto!
brasil.io/colaborebrasil.io/colabore
Sugerindo datasets e melhorias
Melhorando os scripts de coleta atuais
Criando novos scripts de coleta
Publicando tutoriais no
Doando no
blog.brasil.io
apoia.se/brasilio
--
Dúvidas?Dúvidas?
“ Restringir acesso a dados públicos é
elitizar a democracia. ”
Manifesto Brasil.IO
{{ ,,
,,
,,
,,
}}
//turicasturicas
twittertwitter
githubgithub
youtubeyoutube
slideshareslideshare
instagraminstagram
turicas@brasil.ioturicas@brasil.io

Mais conteúdo relacionado

Semelhante a Projeto Brasil.IO COVID-19: Dados Públicos Acessíveis sobre a Pandemia

Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Thiago Avila, Msc
 
Ciência de Dados em Governo
Ciência de Dados em GovernoCiência de Dados em Governo
Ciência de Dados em GovernoSérgio Dias
 
Dados Abertos e Meio Ambiente
Dados Abertos e Meio AmbienteDados Abertos e Meio Ambiente
Dados Abertos e Meio AmbienteÁlvaro Justen
 
Big Data Analytics em Governo
Big Data Analytics em GovernoBig Data Analytics em Governo
Big Data Analytics em GovernoSérgio Dias
 
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Claudio Martins
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendataRicardo Poppi
 
Jornalismo de Dados: Programando a Democracia no Brasil
Jornalismo de Dados: Programando a Democracia no BrasilJornalismo de Dados: Programando a Democracia no Brasil
Jornalismo de Dados: Programando a Democracia no BrasilÁlvaro Justen
 
Cenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão DigitalCenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão DigitalLeonardo Diogo Silva
 
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Thiago Avila, Msc
 
Jornalismo de dados - manipular, entender, apresentar
Jornalismo de dados - manipular, entender, apresentarJornalismo de dados - manipular, entender, apresentar
Jornalismo de dados - manipular, entender, apresentarLeonardo Foletto
 
Data analysis open data
Data analysis open dataData analysis open data
Data analysis open dataLiber UFPE
 
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...Suelybcs .
 
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdfDARLINTONBARBOSAFERE
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeThiago Avila, Msc
 
DataViva: Visualizando a economia de Minas Geras e do Brasil
DataViva: Visualizando a economia de Minas Geras e do BrasilDataViva: Visualizando a economia de Minas Geras e do Brasil
DataViva: Visualizando a economia de Minas Geras e do BrasilBig Data Week São Paulo
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Roberto C. S. Pacheco
 
Palestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoPalestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoLuiz Agner
 
The future of digital marketing
The future of digital marketingThe future of digital marketing
The future of digital marketingDébora Duarte
 

Semelhante a Projeto Brasil.IO COVID-19: Dados Públicos Acessíveis sobre a Pandemia (20)

Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectado...
 
Ciência de Dados em Governo
Ciência de Dados em GovernoCiência de Dados em Governo
Ciência de Dados em Governo
 
Dados Abertos e Meio Ambiente
Dados Abertos e Meio AmbienteDados Abertos e Meio Ambiente
Dados Abertos e Meio Ambiente
 
Big Data Analytics em Governo
Big Data Analytics em GovernoBig Data Analytics em Governo
Big Data Analytics em Governo
 
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
 
Pesquisas IBICT
Pesquisas IBICTPesquisas IBICT
Pesquisas IBICT
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendata
 
Jornalismo de Dados: Programando a Democracia no Brasil
Jornalismo de Dados: Programando a Democracia no BrasilJornalismo de Dados: Programando a Democracia no Brasil
Jornalismo de Dados: Programando a Democracia no Brasil
 
Cenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão DigitalCenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão Digital
 
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
 
Jornalismo de dados - manipular, entender, apresentar
Jornalismo de dados - manipular, entender, apresentarJornalismo de dados - manipular, entender, apresentar
Jornalismo de dados - manipular, entender, apresentar
 
Data analysis open data
Data analysis open dataData analysis open data
Data analysis open data
 
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...
Oficina ORCID: gere o seu código junto conosco e aprenda mais sobre o ORCID |...
 
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf
2022-07-30-IF Sudeste MG - SJDR - VIII INTEGRA IF.pdf
 
Políticas Públicas Temáticas e Desafios da Inclusão Digital
Políticas Públicas Temáticas e Desafios da Inclusão DigitalPolíticas Públicas Temáticas e Desafios da Inclusão Digital
Políticas Públicas Temáticas e Desafios da Inclusão Digital
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo Sociedade
 
DataViva: Visualizando a economia de Minas Geras e do Brasil
DataViva: Visualizando a economia de Minas Geras e do BrasilDataViva: Visualizando a economia de Minas Geras e do Brasil
DataViva: Visualizando a economia de Minas Geras e do Brasil
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
 
Palestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de DoutoradoPalestra na Unirio - Tese de Doutorado
Palestra na Unirio - Tese de Doutorado
 
The future of digital marketing
The future of digital marketingThe future of digital marketing
The future of digital marketing
 

Mais de Álvaro Justen

Sobre os ombos de gigantes
Sobre os ombos de gigantesSobre os ombos de gigantes
Sobre os ombos de gigantesÁlvaro Justen
 
A era da pós-verdade - minhas reflexões e crenças
A era da pós-verdade - minhas reflexões e crençasA era da pós-verdade - minhas reflexões e crenças
A era da pós-verdade - minhas reflexões e crençasÁlvaro Justen
 
Realmente precisamos de big data?
Realmente precisamos de big data?Realmente precisamos de big data?
Realmente precisamos de big data?Álvaro Justen
 
Ciência de Dados na Linha de Comando
Ciência de Dados na Linha de ComandoCiência de Dados na Linha de Comando
Ciência de Dados na Linha de ComandoÁlvaro Justen
 
#opendata #fail: Causos da Transparência Brasileira
#opendata #fail: Causos da Transparência Brasileira#opendata #fail: Causos da Transparência Brasileira
#opendata #fail: Causos da Transparência BrasileiraÁlvaro Justen
 
Dados abertos, direito autoral e democracia
Dados abertos, direito autoral e democraciaDados abertos, direito autoral e democracia
Dados abertos, direito autoral e democraciaÁlvaro Justen
 
Introdução a programação com Python (para jornalistas)
Introdução a programação com Python (para jornalistas)Introdução a programação com Python (para jornalistas)
Introdução a programação com Python (para jornalistas)Álvaro Justen
 
Libertando dados públicos com ferramentas livres
Libertando dados públicos com ferramentas livresLibertando dados públicos com ferramentas livres
Libertando dados públicos com ferramentas livresÁlvaro Justen
 
Introdução a Programação com Python
Introdução a Programação com PythonIntrodução a Programação com Python
Introdução a Programação com PythonÁlvaro Justen
 
Software Livre versus Open Source
Software Livre versus Open SourceSoftware Livre versus Open Source
Software Livre versus Open SourceÁlvaro Justen
 
Datos Tabulares: La Manera Pythónica
Datos Tabulares: La Manera PythónicaDatos Tabulares: La Manera Pythónica
Datos Tabulares: La Manera PythónicaÁlvaro Justen
 
[FISL17] Liberando dados com um comando, por Álvaro Justen
[FISL17] Liberando dados com um comando, por Álvaro Justen[FISL17] Liberando dados com um comando, por Álvaro Justen
[FISL17] Liberando dados com um comando, por Álvaro JustenÁlvaro Justen
 
Arduino (para fazedores)
Arduino (para fazedores)Arduino (para fazedores)
Arduino (para fazedores)Álvaro Justen
 
Dados tabulares: A Maneira Pythônica
Dados tabulares: A Maneira PythônicaDados tabulares: A Maneira Pythônica
Dados tabulares: A Maneira PythônicaÁlvaro Justen
 
[PyBr11] Lendo dados tabulares: versão pythônica
[PyBr11] Lendo dados tabulares: versão pythônica[PyBr11] Lendo dados tabulares: versão pythônica
[PyBr11] Lendo dados tabulares: versão pythônicaÁlvaro Justen
 
Arduino: Robótica e Automação com Software e Hardware Livres
Arduino: Robótica e Automação com Software e Hardware LivresArduino: Robótica e Automação com Software e Hardware Livres
Arduino: Robótica e Automação com Software e Hardware LivresÁlvaro Justen
 
Capturando dados com Python - UAI Python
Capturando dados com Python - UAI PythonCapturando dados com Python - UAI Python
Capturando dados com Python - UAI PythonÁlvaro Justen
 
Introdução ao Arduino: ArduinoDay Rio 2015
Introdução ao Arduino: ArduinoDay Rio 2015Introdução ao Arduino: ArduinoDay Rio 2015
Introdução ao Arduino: ArduinoDay Rio 2015Álvaro Justen
 
Arduino + Python: produtividade ao extremo
Arduino + Python: produtividade ao extremoArduino + Python: produtividade ao extremo
Arduino + Python: produtividade ao extremoÁlvaro Justen
 

Mais de Álvaro Justen (20)

Sobre os ombos de gigantes
Sobre os ombos de gigantesSobre os ombos de gigantes
Sobre os ombos de gigantes
 
A era da pós-verdade - minhas reflexões e crenças
A era da pós-verdade - minhas reflexões e crençasA era da pós-verdade - minhas reflexões e crenças
A era da pós-verdade - minhas reflexões e crenças
 
Realmente precisamos de big data?
Realmente precisamos de big data?Realmente precisamos de big data?
Realmente precisamos de big data?
 
Ciência de Dados na Linha de Comando
Ciência de Dados na Linha de ComandoCiência de Dados na Linha de Comando
Ciência de Dados na Linha de Comando
 
#opendata #fail: Causos da Transparência Brasileira
#opendata #fail: Causos da Transparência Brasileira#opendata #fail: Causos da Transparência Brasileira
#opendata #fail: Causos da Transparência Brasileira
 
Dados abertos, direito autoral e democracia
Dados abertos, direito autoral e democraciaDados abertos, direito autoral e democracia
Dados abertos, direito autoral e democracia
 
Python no Jornalismo
Python no JornalismoPython no Jornalismo
Python no Jornalismo
 
Introdução a programação com Python (para jornalistas)
Introdução a programação com Python (para jornalistas)Introdução a programação com Python (para jornalistas)
Introdução a programação com Python (para jornalistas)
 
Libertando dados públicos com ferramentas livres
Libertando dados públicos com ferramentas livresLibertando dados públicos com ferramentas livres
Libertando dados públicos com ferramentas livres
 
Introdução a Programação com Python
Introdução a Programação com PythonIntrodução a Programação com Python
Introdução a Programação com Python
 
Software Livre versus Open Source
Software Livre versus Open SourceSoftware Livre versus Open Source
Software Livre versus Open Source
 
Datos Tabulares: La Manera Pythónica
Datos Tabulares: La Manera PythónicaDatos Tabulares: La Manera Pythónica
Datos Tabulares: La Manera Pythónica
 
[FISL17] Liberando dados com um comando, por Álvaro Justen
[FISL17] Liberando dados com um comando, por Álvaro Justen[FISL17] Liberando dados com um comando, por Álvaro Justen
[FISL17] Liberando dados com um comando, por Álvaro Justen
 
Arduino (para fazedores)
Arduino (para fazedores)Arduino (para fazedores)
Arduino (para fazedores)
 
Dados tabulares: A Maneira Pythônica
Dados tabulares: A Maneira PythônicaDados tabulares: A Maneira Pythônica
Dados tabulares: A Maneira Pythônica
 
[PyBr11] Lendo dados tabulares: versão pythônica
[PyBr11] Lendo dados tabulares: versão pythônica[PyBr11] Lendo dados tabulares: versão pythônica
[PyBr11] Lendo dados tabulares: versão pythônica
 
Arduino: Robótica e Automação com Software e Hardware Livres
Arduino: Robótica e Automação com Software e Hardware LivresArduino: Robótica e Automação com Software e Hardware Livres
Arduino: Robótica e Automação com Software e Hardware Livres
 
Capturando dados com Python - UAI Python
Capturando dados com Python - UAI PythonCapturando dados com Python - UAI Python
Capturando dados com Python - UAI Python
 
Introdução ao Arduino: ArduinoDay Rio 2015
Introdução ao Arduino: ArduinoDay Rio 2015Introdução ao Arduino: ArduinoDay Rio 2015
Introdução ao Arduino: ArduinoDay Rio 2015
 
Arduino + Python: produtividade ao extremo
Arduino + Python: produtividade ao extremoArduino + Python: produtividade ao extremo
Arduino + Python: produtividade ao extremo
 

Projeto Brasil.IO COVID-19: Dados Públicos Acessíveis sobre a Pandemia

  • 1. Projeto Brasil.IO COVID-19:Projeto Brasil.IO COVID-19: Dados Públicos AcessíveisDados Públicos Acessíveis TuricasTuricas akaaka Álvaro JustenÁlvaro Justen TableauTableau WebinarsWebinars 15 de abril de 202015 de abril de 2020
  • 2. Slides disponíveis em:Slides disponíveis em: bit.ly/brasilio-tableaubit.ly/brasilio-tableau
  • 3. $ whoami$ whoami TuricasTuricas, prazer! =), prazer! =) Sigam-me os bons:Sigam-me os bons: {{ ,, ,, ,, ,, }} //turicasturicas twittertwitter githubgithub youtubeyoutube slideshareslideshare instagraminstagram turicas@brasil.ioturicas@brasil.io
  • 4. AgendaAgenda Dados abertos O que são Aplicações Problemas Brasil.IO O que é Projeto COVID-19 Dificuldades Dados
  • 5. Minha história com dadosMinha história com dados Instagram @turicas
  • 6. Dados: meio para responderDados: meio para responder perguntasperguntas Data PipelineData Pipeline schoolofdata.org/methodology
  • 7. -- (definição de ) Dados AbertosDados Abertos “ Dados abertos são dados que podem ser livremente usados, reutilizados e redistribuídos por qualquer pessoa - sujeitos, no máximo, à exigência de atribuição da fonte e compartilhamento pelas mesmas regras. ” OpenData Handbook Open Definition Mais detalhes: Lei de Acesso à Informação: 12.527/2011 kit.dados.gov.br escoladedados.org
  • 8. Dados Abertos - AplicaçõesDados Abertos - Aplicações Eficiência em gestão pública Controle social Jornalismo/Combate à desinformação Negócios/aumento de produtividade
  • 9. R$ 191 em um restaurante cujos pratos não custam R$ 40, deputado? Rosie, a robôRosie, a robô twitter.com/tOa_D/status/1058495655184871425
  • 10. (em conjunto com Juan Torres, para ) RealidadeRealidade versusversus SensoSenso ComumComum correio24horas.com.br Acesse a matéria
  • 11. (em conjunto com Giulliana Biaconi, para )generonumero.media Leia a matéria
  • 12. Driva: Inteligência em VendasDriva: Inteligência em Vendas (B2B)(B2B) driva.com.br
  • 13. Maior parte do tempo dos projetos deMaior parte do tempo dos projetos de análise de dados:análise de dados:
  • 14. Qualidade dos DadosQualidade dos Dados 5stardata.info
  • 15. Causos da TransparênciaCausos da Transparência BrasileiraBrasileira Dados muito dispersos (centenas de XLS) Formatos não estruturados (PDF, imagens) Formatos proprietários Dados deletados com o tempo Dados pagos (!?) Veja os slides da palestra
  • 16. Problemas de Usabilidade deProblemas de Usabilidade de DadosDados Formato (qualidade técnica) Exemplo: Boletim de balneabilidade em PDF (INEMA/BA) Dispersão Exemplo: Filiações partidárias em 945 ZIPs com CSVs (TSE) Quantidade de dados Exemplo: 18 milhões de sócios (RFB) Domínio da área Exemplo: o que é unidade eleitoral? (TSE) Veja mais detalhes
  • 18. Fonte: Jornalismo de DadosJornalismo de Dados 4300+ estudantes!4300+ estudantes! Knight Center, Texas University
  • 19. rows convert arquivo.pdf arquivo.csv github.com/turicas/balneabilidade-brasil
  • 20. Brasil.IOBrasil.IO O Brasil em dados libertos Software livre e colaborativo Python + Django + PostgreSQL
  • 22. Dados: Ministério da SaúdeDados: Ministério da Saúde Histórico não disponível Site fora do ar constantemente Falta de dados locais
  • 23. Dados: Secretarias EstaduaisDados: Secretarias Estaduais de Saúdede Saúde Formato não estruturado (PDF, imagem etc.) Local não centralizado (mais de um site, Twitter, Instagram etc.) Falta de indexação dos boletins diários Metodologia alterada e sem aviso Falta de detalhes e padronização (recuperados, faixa etária etc.)
  • 24. Processo de coleta de dadosProcesso de coleta de dados 35+ voluntários! Robô que detecta novos boletins Alinhamentos no Coleta manual Planilhas no Google Spreadsheets Checagem manual Checagem automática Atualização da base de dados chat.brasil.io
  • 26. LinksLinks Para quem quer usar: Para quem quer colaborar: Dataset covid19 Download dos dados Documentação da API FAQ Repositório do Brasil.IO no GitHub Repositório do Brasil.IO/covid19 no GitHub Recomendações para Secretarias de Saúde
  • 27. Apoie o Projeto!Apoie o Projeto! brasil.io/colaborebrasil.io/colabore Sugerindo datasets e melhorias Melhorando os scripts de coleta atuais Criando novos scripts de coleta Publicando tutoriais no Doando no blog.brasil.io apoia.se/brasilio
  • 28. -- Dúvidas?Dúvidas? “ Restringir acesso a dados públicos é elitizar a democracia. ” Manifesto Brasil.IO {{ ,, ,, ,, ,, }} //turicasturicas twittertwitter githubgithub youtubeyoutube slideshareslideshare instagraminstagram turicas@brasil.ioturicas@brasil.io