Ecossistema e impacto
dos dados abertos
Augusto Herrmann Batista
Workshop de Alinhamento Conceitual e
Estratégia para Dados Abertos – Embrapa
21/3/2017
Secretaria de
Tecnologia da Informação
Ministério do
Planejamento, Desenvolvimento
e Gestão
Pergunta:
Dados abertos
=
Dados abertos governamentais
?
Dados abertos
≠
Dados abertos governamentais
!
Dados abertos
“Abertos quer dizer que qualquer pessoa pode
livremente acessar, utilizar, modificar e
compartilhar para qualquer finalidade (sujeito, ao
máximo, a requisitos que preservem a proveniência e abertura).
opendefinition.org
365 /
Dados abertos
● Dados abertos governamentais = dados
abertos no âmbito da administração pública
● O que há além disso?
● Dados abertos do setor privado (empresas)
● Dados abertos do setor acadêmico (dados de
pesquisas)
● Dados abertos do terceiro setor
366 /
Exemplo
● Reino Unido: emissora BBC
● Opening up the BBC's Linked Data with /things
367 /
Futuro utópico dos dados abertos
● Todos os dados governamentais não restritos
já são abertos
● Assistentes pessoais e inteligência artificial
fazem (ainda mais) parte do cotidiano
● Pressão da sociedade passa a ser para que
alguns dados privados sejam também abertos,
direito do consumidor
368 /
Situação hipotética do cotidiano
Lista de material escolar
● Todas as papelarias têm seu e-commerce com
produtos listados no padrão GoodRelations
● Escolas disponibilizam lista de material escolar
utilizando Product Types Ontology
● Seu assistente pessoal (aplicativo/site) escolhe
os melhores preços e encomenda tudo para
ser entregue no endereço da escola
369 /
Padrões
Os padrões para isso já existem hoje!
Usado por: Google, Yahoo, Volkswagen, Renault e cerca de
10.000 outras pequenas e grandes empresas
● Product Types Ontology
● Mais de 300.000 tipos de produtos
● ex.: Apple, ferro de solda, batata doce
3610 /
Volume de mercado
● Capgemini
● 2010: 32 bilhões de Euros na Europa
● McKinsey & Company
● 2013: 3 trilhões de dólares no mundo
3611 /
Potencial de impacto na economia e
na sociedade
● ONU: Data revolution group
● A World that Counts
● Objetivos de Desenvolvimento
Sustentável
● Lateral Economics
● Open for Business
● Como os dados abertos podem
ajudar a alcançar as metas de
crescimento do G20
3612 /
Como medir a efetividade
de uma política de dados abertos?
3614 /
Medida do impacto
dos dados abertos no Brasil
●
No Open Data Barometer (3a
edição, 2015), o Brasil é:
●
17o
no mundo
●
2o
na América Latina e Caribe
– Pontuação: 61.16 (em comparação, o México tem 61.76
e é o 16o
no mundo)
– Prontidão: 60
– Implementação: 80
● Pontuação de Impacto: 36
– Político: 50
– Social: 26
– Econômico: 31
3615 /
Exemplos: impacto social
● Organizações da sociedade civil que usam
dados abertos
● Qedu
– Encontre e compare
a qualidade da educação
em cada escola
brasileira
● Cadê a minha escola?
– Cidadãos poderão
monitorar a construção
de escolas
3616 /
Exemplos: impacto social
● Organizações da sociedade civil que usam dados
abertos
● Olho neles!
– Monitora o uso de verbas
indenizatórias por
parlamentares
● Diferentonas
– Usa aprendizagem de máquina
para ajudar cidadãos a encontrar
anomalias nos gastos de
transferências voluntárias
3617 /
Exemplos: impacto econômico
● Empresas que usam dados abertos
● Neoway
– Business analytics para que
empresas reduzam custos,
ex. para encontrar bons clientes
empresariais em potencial
● Grafeno6
– Usa aprendizagem de máquina para
descobrir os preços esperados na
região para cada tipo de produto
praticado nas compras
governamentais
Como medir o impacto?
● Open Data Barometer
● Levantamento feito pela World Wide Web
Foundation
● 92 países
● Impacto: político, social e econômico
3618 /
Como medir o impacto?
http://opendataimpactmap.org/
Levantamento feito pelo Center for the Open Data
Enterprise 3619 /
3620 /
Obstáculos comuns
no uso de dados
● Dados que não estão disponíveis
● Dados que não estão atualizados
● Dados que não são confiáveis
● Dados que não são legíveis por máquina (ter
que recorrer a scrapping ou redigitação)
● Dados que não têm informação sobre
licenciamento / direitos de uso
Necessidades de um
ecossistema de dados
● Disponibilidade dos dados
● Largura
● Profundidade
● Confiabilidade (minimizar indisponibilidade)
● Qualidade de dados
● Usar padrões onde for aplicável
● Documentação
● Facilidade de uso
3621 /
Necessidades de um
ecossistema de dados
● Conhecer o tema dados abertos
● Meios efetivos de descoberta
● Canal efetivo de feedback sobre os dados
● Governança participativa
● utilizadores dos dados devem ter voz na condução
da política governamental
Efetivamente promover tanto o lado
da oferta quanto o lado da demanda
3622 /
Lado da oferta:
Capacitação
● 13 oficinas, 3 seminários, 1 turma de EAD
● 709 participações presenciais, 659 remotas
● resultados: 38 novos PDAs
● manuais e guias
● federação: harvesting
de metadados em
13 catálogos
institucionais
3623 /
Lado da demanda:
Promover o uso
● Apresentações para o setor privado conhecer o tema dados
abertos governamentais (2015)
● associações de empresas de TI e de startups
● mostrar o potencial de oportunidades e os relatórios econômicos
(McKinsey, Deloitte, Lateral Economics, etc.)
● Semana da Inovação Governamental (2016)
●
3o
Plano de Ação na Parceria para Governo Aberto
● desafio: aproximar a oferta e a demanda de dados abertos
● Pesquisa com utilizadores dos dados (auditoria do TCU)
3624 /
Desafio:
3625 /
Como promover tanto a oferta
quanto a demanda de dados no
âmbito da sua organização?
Recomendação:
● Planejar:
● ações de disponibilização de dados
● ações de melhoria de qualidade e capacidade
● ações de promoção do uso
3626 /
Kit para dados abertos:
Exemplos
●
Ações de melhoria de qualidade e capacidade:
● melhorias na qualidade de dados de dados que já são publicados
● melhorias na frequência de atualização automatizada dos dados já
publicados
● melhorias na documentação dos dados já publicados (incluindo
dicionários de dados, metadados, etc.)
● criação de catálogos de dados institucionais
● ações de integração de catálogos de dados existentes na instituição com
o Portal Brasileiro de Dados Abertos
● ações de capacitação interna
Fonte:
http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-crono
3627 /
Kit para dados abertos:
Exemplos
● Ações de promoção do uso:
● realizar encontros com os interessados nos dados (por exemplo, promover
uma expedição de dados)
● realizar concursos de aplicativos (exemplos pioneiros: concursos do MJ,
concursos do INEP, concurso do Ministério do Planejamento, Desarrollando
América Latina)
● produzir guias de utilização dos dados
● apresentar em destaque os dados mais pedidos pelo SIC
● estimular o uso interno e por outros órgãos públicos dos dados publicados
● disseminar na organização a cultura de acesso à informação e de
disponibilização de dados públicos.
Fonte:
http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-cronogram
3628 /
E o mais importante:
Conectar-se à rede!
● Outras organizações da mesma área de atuação
● Empresas que utilizam os dados
● Pesquisadores que utilizam os dados
● Organizações da sociedade civil que utilizam os
dados
3629 /
3630 /
Conferência Internacional dos
Dados Abertos
Madri, 6 a7 de outubro de 2016
Temas diversos:
●Saúde
●Educação
●Agricultura
●Transportes
●e outros...
Relatório completo do evento:
http://od4d.com/roadmap/assets/files/report-iodc-2016-web.pdf
●Cultura
●Geografia
●Estatística
●Uso da terra
●Questões de gênero
3631 /
GODAN
● Uma iniciativa global que visa “apoiar esforços globais
para tornar dados relevantes sobre agricultura e
nutrição disponíveis, acessíveis e utilizáveis para o uso
irrestrito em todo o mundo”.
● Elaborar políticas
● Apoio institucional
● Apoio à pesquisa
● A Global Data Ecosystem for Agriculture and Food –
Setembro de 2016
● Conferência: GODAN Summit 2016
3632 /
Open Research Data 2020
● Projeto da União Europeia com metas para 2020
● Acesso livre às publicações “open access”
● Acesso livre aos dados utilizados nas pesquisas
3633 /
Linked Open Data
● Padrões do W3C para adicionar semântica aos
dados
● Possibilita raciocínio e integrações
automatizadas
● Grande parte dos dados
que integram a rede são
do mundo acadêmico
3634 /
3635 /
Obrigado!
@dadosgovbr
contato@dados.gov.br
augusto.herrmann@planejamento.gov.br
Secretaria de
Tecnologia da Informação
Ministério do
Planejamento, Desenvolvimento
e Gestão

Ecossistema e impacto dos dados abertos

  • 1.
    Ecossistema e impacto dosdados abertos Augusto Herrmann Batista Workshop de Alinhamento Conceitual e Estratégia para Dados Abertos – Embrapa 21/3/2017 Secretaria de Tecnologia da Informação Ministério do Planejamento, Desenvolvimento e Gestão
  • 2.
  • 3.
  • 4.
  • 5.
    Dados abertos “Abertos querdizer que qualquer pessoa pode livremente acessar, utilizar, modificar e compartilhar para qualquer finalidade (sujeito, ao máximo, a requisitos que preservem a proveniência e abertura). opendefinition.org 365 /
  • 6.
    Dados abertos ● Dadosabertos governamentais = dados abertos no âmbito da administração pública ● O que há além disso? ● Dados abertos do setor privado (empresas) ● Dados abertos do setor acadêmico (dados de pesquisas) ● Dados abertos do terceiro setor 366 /
  • 7.
    Exemplo ● Reino Unido:emissora BBC ● Opening up the BBC's Linked Data with /things 367 /
  • 8.
    Futuro utópico dosdados abertos ● Todos os dados governamentais não restritos já são abertos ● Assistentes pessoais e inteligência artificial fazem (ainda mais) parte do cotidiano ● Pressão da sociedade passa a ser para que alguns dados privados sejam também abertos, direito do consumidor 368 /
  • 9.
    Situação hipotética docotidiano Lista de material escolar ● Todas as papelarias têm seu e-commerce com produtos listados no padrão GoodRelations ● Escolas disponibilizam lista de material escolar utilizando Product Types Ontology ● Seu assistente pessoal (aplicativo/site) escolhe os melhores preços e encomenda tudo para ser entregue no endereço da escola 369 /
  • 10.
    Padrões Os padrões paraisso já existem hoje! Usado por: Google, Yahoo, Volkswagen, Renault e cerca de 10.000 outras pequenas e grandes empresas ● Product Types Ontology ● Mais de 300.000 tipos de produtos ● ex.: Apple, ferro de solda, batata doce 3610 /
  • 11.
    Volume de mercado ●Capgemini ● 2010: 32 bilhões de Euros na Europa ● McKinsey & Company ● 2013: 3 trilhões de dólares no mundo 3611 /
  • 12.
    Potencial de impactona economia e na sociedade ● ONU: Data revolution group ● A World that Counts ● Objetivos de Desenvolvimento Sustentável ● Lateral Economics ● Open for Business ● Como os dados abertos podem ajudar a alcançar as metas de crescimento do G20 3612 /
  • 13.
    Como medir aefetividade de uma política de dados abertos?
  • 14.
    3614 / Medida doimpacto dos dados abertos no Brasil ● No Open Data Barometer (3a edição, 2015), o Brasil é: ● 17o no mundo ● 2o na América Latina e Caribe – Pontuação: 61.16 (em comparação, o México tem 61.76 e é o 16o no mundo) – Prontidão: 60 – Implementação: 80 ● Pontuação de Impacto: 36 – Político: 50 – Social: 26 – Econômico: 31
  • 15.
    3615 / Exemplos: impactosocial ● Organizações da sociedade civil que usam dados abertos ● Qedu – Encontre e compare a qualidade da educação em cada escola brasileira ● Cadê a minha escola? – Cidadãos poderão monitorar a construção de escolas
  • 16.
    3616 / Exemplos: impactosocial ● Organizações da sociedade civil que usam dados abertos ● Olho neles! – Monitora o uso de verbas indenizatórias por parlamentares ● Diferentonas – Usa aprendizagem de máquina para ajudar cidadãos a encontrar anomalias nos gastos de transferências voluntárias
  • 17.
    3617 / Exemplos: impactoeconômico ● Empresas que usam dados abertos ● Neoway – Business analytics para que empresas reduzam custos, ex. para encontrar bons clientes empresariais em potencial ● Grafeno6 – Usa aprendizagem de máquina para descobrir os preços esperados na região para cada tipo de produto praticado nas compras governamentais
  • 18.
    Como medir oimpacto? ● Open Data Barometer ● Levantamento feito pela World Wide Web Foundation ● 92 países ● Impacto: político, social e econômico 3618 /
  • 19.
    Como medir oimpacto? http://opendataimpactmap.org/ Levantamento feito pelo Center for the Open Data Enterprise 3619 /
  • 20.
    3620 / Obstáculos comuns nouso de dados ● Dados que não estão disponíveis ● Dados que não estão atualizados ● Dados que não são confiáveis ● Dados que não são legíveis por máquina (ter que recorrer a scrapping ou redigitação) ● Dados que não têm informação sobre licenciamento / direitos de uso
  • 21.
    Necessidades de um ecossistemade dados ● Disponibilidade dos dados ● Largura ● Profundidade ● Confiabilidade (minimizar indisponibilidade) ● Qualidade de dados ● Usar padrões onde for aplicável ● Documentação ● Facilidade de uso 3621 /
  • 22.
    Necessidades de um ecossistemade dados ● Conhecer o tema dados abertos ● Meios efetivos de descoberta ● Canal efetivo de feedback sobre os dados ● Governança participativa ● utilizadores dos dados devem ter voz na condução da política governamental Efetivamente promover tanto o lado da oferta quanto o lado da demanda 3622 /
  • 23.
    Lado da oferta: Capacitação ●13 oficinas, 3 seminários, 1 turma de EAD ● 709 participações presenciais, 659 remotas ● resultados: 38 novos PDAs ● manuais e guias ● federação: harvesting de metadados em 13 catálogos institucionais 3623 /
  • 24.
    Lado da demanda: Promovero uso ● Apresentações para o setor privado conhecer o tema dados abertos governamentais (2015) ● associações de empresas de TI e de startups ● mostrar o potencial de oportunidades e os relatórios econômicos (McKinsey, Deloitte, Lateral Economics, etc.) ● Semana da Inovação Governamental (2016) ● 3o Plano de Ação na Parceria para Governo Aberto ● desafio: aproximar a oferta e a demanda de dados abertos ● Pesquisa com utilizadores dos dados (auditoria do TCU) 3624 /
  • 25.
    Desafio: 3625 / Como promovertanto a oferta quanto a demanda de dados no âmbito da sua organização?
  • 26.
    Recomendação: ● Planejar: ● açõesde disponibilização de dados ● ações de melhoria de qualidade e capacidade ● ações de promoção do uso 3626 /
  • 27.
    Kit para dadosabertos: Exemplos ● Ações de melhoria de qualidade e capacidade: ● melhorias na qualidade de dados de dados que já são publicados ● melhorias na frequência de atualização automatizada dos dados já publicados ● melhorias na documentação dos dados já publicados (incluindo dicionários de dados, metadados, etc.) ● criação de catálogos de dados institucionais ● ações de integração de catálogos de dados existentes na instituição com o Portal Brasileiro de Dados Abertos ● ações de capacitação interna Fonte: http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-crono 3627 /
  • 28.
    Kit para dadosabertos: Exemplos ● Ações de promoção do uso: ● realizar encontros com os interessados nos dados (por exemplo, promover uma expedição de dados) ● realizar concursos de aplicativos (exemplos pioneiros: concursos do MJ, concursos do INEP, concurso do Ministério do Planejamento, Desarrollando América Latina) ● produzir guias de utilização dos dados ● apresentar em destaque os dados mais pedidos pelo SIC ● estimular o uso interno e por outros órgãos públicos dos dados publicados ● disseminar na organização a cultura de acesso à informação e de disponibilização de dados públicos. Fonte: http://kit.dados.gov.br/Elabora%C3%A7%C3%A3o-do-PDA/#definir-cronogram 3628 /
  • 29.
    E o maisimportante: Conectar-se à rede! ● Outras organizações da mesma área de atuação ● Empresas que utilizam os dados ● Pesquisadores que utilizam os dados ● Organizações da sociedade civil que utilizam os dados 3629 /
  • 30.
    3630 / Conferência Internacionaldos Dados Abertos Madri, 6 a7 de outubro de 2016 Temas diversos: ●Saúde ●Educação ●Agricultura ●Transportes ●e outros... Relatório completo do evento: http://od4d.com/roadmap/assets/files/report-iodc-2016-web.pdf ●Cultura ●Geografia ●Estatística ●Uso da terra ●Questões de gênero
  • 31.
  • 32.
    GODAN ● Uma iniciativaglobal que visa “apoiar esforços globais para tornar dados relevantes sobre agricultura e nutrição disponíveis, acessíveis e utilizáveis para o uso irrestrito em todo o mundo”. ● Elaborar políticas ● Apoio institucional ● Apoio à pesquisa ● A Global Data Ecosystem for Agriculture and Food – Setembro de 2016 ● Conferência: GODAN Summit 2016 3632 /
  • 33.
    Open Research Data2020 ● Projeto da União Europeia com metas para 2020 ● Acesso livre às publicações “open access” ● Acesso livre aos dados utilizados nas pesquisas 3633 /
  • 34.
    Linked Open Data ●Padrões do W3C para adicionar semântica aos dados ● Possibilita raciocínio e integrações automatizadas ● Grande parte dos dados que integram a rede são do mundo acadêmico 3634 /
  • 35.
  • 36.