O documento discute o ecossistema de dados abertos, incluindo: 1) A definição de dados abertos; 2) Exemplos de impactos sociais e econômicos dos dados abertos; 3) Desafios e necessidades para o desenvolvimento de um ecossistema de dados aberto robusto.
1. Ecossistema e impacto
dos dados abertos
Augusto Herrmann Batista
Workshop de Alinhamento Conceitual e
Estratégia para Dados Abertos – Embrapa
21/3/2017
Secretaria de
Tecnologia da Informação
Ministério do
Planejamento, Desenvolvimento
e Gestão
5. Dados abertos
“Abertos quer dizer que qualquer pessoa pode
livremente acessar, utilizar, modificar e
compartilhar para qualquer finalidade (sujeito, ao
máximo, a requisitos que preservem a proveniência e abertura).
opendefinition.org
365 /
6. Dados abertos
● Dados abertos governamentais = dados
abertos no âmbito da administração pública
● O que há além disso?
● Dados abertos do setor privado (empresas)
● Dados abertos do setor acadêmico (dados de
pesquisas)
● Dados abertos do terceiro setor
366 /
7. Exemplo
● Reino Unido: emissora BBC
● Opening up the BBC's Linked Data with /things
367 /
8. Futuro utópico dos dados abertos
● Todos os dados governamentais não restritos
já são abertos
● Assistentes pessoais e inteligência artificial
fazem (ainda mais) parte do cotidiano
● Pressão da sociedade passa a ser para que
alguns dados privados sejam também abertos,
direito do consumidor
368 /
9. Situação hipotética do cotidiano
Lista de material escolar
● Todas as papelarias têm seu e-commerce com
produtos listados no padrão GoodRelations
● Escolas disponibilizam lista de material escolar
utilizando Product Types Ontology
● Seu assistente pessoal (aplicativo/site) escolhe
os melhores preços e encomenda tudo para
ser entregue no endereço da escola
369 /
10. Padrões
Os padrões para isso já existem hoje!
Usado por: Google, Yahoo, Volkswagen, Renault e cerca de
10.000 outras pequenas e grandes empresas
● Product Types Ontology
● Mais de 300.000 tipos de produtos
● ex.: Apple, ferro de solda, batata doce
3610 /
11. Volume de mercado
● Capgemini
● 2010: 32 bilhões de Euros na Europa
● McKinsey & Company
● 2013: 3 trilhões de dólares no mundo
3611 /
12. Potencial de impacto na economia e
na sociedade
● ONU: Data revolution group
● A World that Counts
● Objetivos de Desenvolvimento
Sustentável
● Lateral Economics
● Open for Business
● Como os dados abertos podem
ajudar a alcançar as metas de
crescimento do G20
3612 /
13. Como medir a efetividade
de uma política de dados abertos?
14. 3614 /
Medida do impacto
dos dados abertos no Brasil
●
No Open Data Barometer (3a
edição, 2015), o Brasil é:
●
17o
no mundo
●
2o
na América Latina e Caribe
– Pontuação: 61.16 (em comparação, o México tem 61.76
e é o 16o
no mundo)
– Prontidão: 60
– Implementação: 80
● Pontuação de Impacto: 36
– Político: 50
– Social: 26
– Econômico: 31
15. 3615 /
Exemplos: impacto social
● Organizações da sociedade civil que usam
dados abertos
● Qedu
– Encontre e compare
a qualidade da educação
em cada escola
brasileira
● Cadê a minha escola?
– Cidadãos poderão
monitorar a construção
de escolas
16. 3616 /
Exemplos: impacto social
● Organizações da sociedade civil que usam dados
abertos
● Olho neles!
– Monitora o uso de verbas
indenizatórias por
parlamentares
● Diferentonas
– Usa aprendizagem de máquina
para ajudar cidadãos a encontrar
anomalias nos gastos de
transferências voluntárias
17. 3617 /
Exemplos: impacto econômico
● Empresas que usam dados abertos
● Neoway
– Business analytics para que
empresas reduzam custos,
ex. para encontrar bons clientes
empresariais em potencial
● Grafeno6
– Usa aprendizagem de máquina para
descobrir os preços esperados na
região para cada tipo de produto
praticado nas compras
governamentais
18. Como medir o impacto?
● Open Data Barometer
● Levantamento feito pela World Wide Web
Foundation
● 92 países
● Impacto: político, social e econômico
3618 /
19. Como medir o impacto?
http://opendataimpactmap.org/
Levantamento feito pelo Center for the Open Data
Enterprise 3619 /
20. 3620 /
Obstáculos comuns
no uso de dados
● Dados que não estão disponíveis
● Dados que não estão atualizados
● Dados que não são confiáveis
● Dados que não são legíveis por máquina (ter
que recorrer a scrapping ou redigitação)
● Dados que não têm informação sobre
licenciamento / direitos de uso
21. Necessidades de um
ecossistema de dados
● Disponibilidade dos dados
● Largura
● Profundidade
● Confiabilidade (minimizar indisponibilidade)
● Qualidade de dados
● Usar padrões onde for aplicável
● Documentação
● Facilidade de uso
3621 /
22. Necessidades de um
ecossistema de dados
● Conhecer o tema dados abertos
● Meios efetivos de descoberta
● Canal efetivo de feedback sobre os dados
● Governança participativa
● utilizadores dos dados devem ter voz na condução
da política governamental
Efetivamente promover tanto o lado
da oferta quanto o lado da demanda
3622 /
23. Lado da oferta:
Capacitação
● 13 oficinas, 3 seminários, 1 turma de EAD
● 709 participações presenciais, 659 remotas
● resultados: 38 novos PDAs
● manuais e guias
● federação: harvesting
de metadados em
13 catálogos
institucionais
3623 /
24. Lado da demanda:
Promover o uso
● Apresentações para o setor privado conhecer o tema dados
abertos governamentais (2015)
● associações de empresas de TI e de startups
● mostrar o potencial de oportunidades e os relatórios econômicos
(McKinsey, Deloitte, Lateral Economics, etc.)
● Semana da Inovação Governamental (2016)
●
3o
Plano de Ação na Parceria para Governo Aberto
● desafio: aproximar a oferta e a demanda de dados abertos
● Pesquisa com utilizadores dos dados (auditoria do TCU)
3624 /
26. Recomendação:
● Planejar:
● ações de disponibilização de dados
● ações de melhoria de qualidade e capacidade
● ações de promoção do uso
3626 /
27. Kit para dados abertos:
Exemplos
●
Ações de melhoria de qualidade e capacidade:
● melhorias na qualidade de dados de dados que já são publicados
● melhorias na frequência de atualização automatizada dos dados já
publicados
● melhorias na documentação dos dados já publicados (incluindo
dicionários de dados, metadados, etc.)
● criação de catálogos de dados institucionais
● ações de integração de catálogos de dados existentes na instituição com
o Portal Brasileiro de Dados Abertos
● ações de capacitação interna
Fonte:
http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-crono
3627 /
28. Kit para dados abertos:
Exemplos
● Ações de promoção do uso:
● realizar encontros com os interessados nos dados (por exemplo, promover
uma expedição de dados)
● realizar concursos de aplicativos (exemplos pioneiros: concursos do MJ,
concursos do INEP, concurso do Ministério do Planejamento, Desarrollando
América Latina)
● produzir guias de utilização dos dados
● apresentar em destaque os dados mais pedidos pelo SIC
● estimular o uso interno e por outros órgãos públicos dos dados publicados
● disseminar na organização a cultura de acesso à informação e de
disponibilização de dados públicos.
Fonte:
http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-cronogram
3628 /
29. E o mais importante:
Conectar-se à rede!
● Outras organizações da mesma área de atuação
● Empresas que utilizam os dados
● Pesquisadores que utilizam os dados
● Organizações da sociedade civil que utilizam os
dados
3629 /
30. 3630 /
Conferência Internacional dos
Dados Abertos
Madri, 6 a7 de outubro de 2016
Temas diversos:
●Saúde
●Educação
●Agricultura
●Transportes
●e outros...
Relatório completo do evento:
http://od4d.com/roadmap/assets/files/report-iodc-2016-web.pdf
●Cultura
●Geografia
●Estatística
●Uso da terra
●Questões de gênero
32. GODAN
● Uma iniciativa global que visa “apoiar esforços globais
para tornar dados relevantes sobre agricultura e
nutrição disponíveis, acessíveis e utilizáveis para o uso
irrestrito em todo o mundo”.
● Elaborar políticas
● Apoio institucional
● Apoio à pesquisa
● A Global Data Ecosystem for Agriculture and Food –
Setembro de 2016
● Conferência: GODAN Summit 2016
3632 /
33. Open Research Data 2020
● Projeto da União Europeia com metas para 2020
● Acesso livre às publicações “open access”
● Acesso livre aos dados utilizados nas pesquisas
3633 /
34. Linked Open Data
● Padrões do W3C para adicionar semântica aos
dados
● Possibilita raciocínio e integrações
automatizadas
● Grande parte dos dados
que integram a rede são
do mundo acadêmico
3634 /