SlideShare uma empresa Scribd logo
1 de 43
Baixar para ler offline
Ciência de Dados em
Governo
Sérgio M. Dias
11/17
Agenda
Big Data Analytics
Ciência de dados
• Cientista de dados
• Processo em ciência de dados
Governo e dados
• Algumas soluções de TI para governo
• Necessidades e tecnologias
Big Data Analytics!!!
Big Data
– Quando volume, velocidade ou variedade de dados excede a
capacidade de armazenamento e/ou computação
– Big Data é relativo, não absoluto
Analytics
– Aprendizado de máquinas
– Mercado
• “Relatórios”, painéis, etc
Big Data
A cada segundo1
:
– 100.000 tweets circulam
– 547 websites são criados
– mais de 2 milhões de pesquisas (Google)
– 48h de vídeos são baixadas no YouTube
– 684.478 itens são compartilhados no Facebook...
Em governo (Brasil)2
:
– Mais de 7 milhões de notas fiscais eletrônicas (NFe) por dia
– Mais de 16 bilhões de NFe autorizadas...
1 - Relatório Gartner - 2 - http://www.nfe.fazenda.gov.br/
Como lidar com este “dilúvio” de dados?
A palavra mais importante no termo “ciência de dados” não é
“dados”, mas ciência.
Fonte (2010): http://www.economist.com/node/15579717
Ciência de Dados
A partir da necessidade de análise desse emaranhado de dados
surgiu uma “nova” área da ciência, a chamada ciência de dados
– O “quarto paradigma” da ciência1
– A profissão mais “sexy” do século 212
– Uma nova buzzy word!
As atividades executadas pelo “cientista de dados”, em menor
escala em relação ao volume de dados, são bastante antigas3
1 - Tansley, S.; Tolle, K.M (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research.
2 - https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
3 - www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/
Ciência de Dados
A partir da necessidade de análise desse emaranhado de dados
surgiu uma “nova” área da ciência, a chamada ciência de dados
– O “quarto paradigma” da ciência1
– A profissão mais “sexy” do século 212
– Uma nova buzzy word!
As atividades executadas pelo “cientista de dados”, em menor
escala em relação ao volume de dados, são bastante antigas3
1 - Tansley, S.; Tolle, K.M (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research.
2 - https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
3 - www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/
Ciência de Dados X Mineração de Dados
Cientista de Dados


–
–
Fonte (2014): https://www.wired.com/insights/2014/06/tell-kids-data-scientists-doctors/
Cientista de Dados
Cientista de Dados
O que os cientistas de dados fazem?
Definem hipóteses e perguntas
Definem os conjuntos de dados ideais
Determinam que dados podem ser acessados
Adquirem os dados
Preprocessam os dados
Realizam análise de dados exploratória
Realizam modelagem estatística dos dados
Interpretam resultados de análises
Escrevem relatórios sobre os resultados
Criam modelos/componentes/códigos reusáveis
Compartilham modelos e resultados com outras pessoas
Considerando:
●
Processos
●
Ambientes
●
Projetos
O que os cientistas de dados fazem?
Informação com alto valor agregado!
Processo em ciência de dados
CRISP-DM (CRoss Industry Standard Process for Data Mining)
SEMMA (Sample, Explore, Modify, Model and Assess)
Processo em ciência de dados
Processo em ciência de dados
Ciência de Dados em Governo!!!
 Governo é um grande produtor e consumidor de dados
 Existe um movimento global de governos e autoridades para
publicar dados
– O principal objetivo é aumentar a transparência,
democracia e proporcionar a criação de serviços públicos
Governo e Dados
 Efeitos dos dados (aberto) governamentais sobre as políticas
públicas
– Inclusão: permite que qualquer cidadão utilize qualquer
ferramenta de software para adaptá-los às suas
necessidades
– Transparência: as partes interessadas podem usá-las da
maneira mais adequada ao seu propósito
– Responsabilidade: oferecer vários pontos de vista sobre o
desempenho do governo no cumprimento de suas metas em
políticas públicas
SERPRO e Governo
Serviço Federal de Processamento de Dados (SERPRO)
– Empresa pública de serviços de governo eletrônico
– Vinculada ao Ministério da Fazenda
– Criada em 1º de dezembro de 1964
– Sede em Brasília, conta com 11 Projeções Regionais
– Mais de 10 mil colaboradores
Fornece soluções de TI para o governo
Algumas Soluções de TI para Governo
Sistema Público de Escrituração Digital (SPED)
– NF-e
– EFD ICMS IPI
– E-Financeira
– Esocial
– CT-e
– ...
Receita Federal do Brasil
– Imposto de Renda
Certificação Digital
Algumas Soluções de TI para Governo
Sistema Público de Escrituração Digital (SPED)
– NF-e
– EFD ICMS IPI
– E-Financeira
– Esocial
– CT-e
– ...
Receita Federal do Brasil
– Imposto de Renda
Certificação Digital
Nota Fiscal Eletrônica (NFe)
Modelo nacional de documento fiscal eletrônico que substitui a
sistemática de emissão do documento fiscal em papel
Mais de 200 milhões de NFe por mês
Potencialidade para:
– Acompanhamento em tempo real do cenário econômico
nacional
– Adoção de medidas estratégicas de impacto imediato
Nota Fiscal Eletrônica (NFe)
XML
Mais de 400 tags
Complexo
Diferentes versões (estruturas)
Nota Fiscal Eletrônica (NFe)
Escrituração Fiscal Digital (EFD)
A Escrituração Fiscal Digital - EFD é um arquivo digital, que se
constitui de um conjunto de escriturações de documentos
fiscais e de outras informações de interesse dos fiscos das
unidades federadas e da Receita Federal do Brasil, bem como de
registros de apuração de impostos referentes às operações e
prestações praticadas pelo contribuinte.
Escrituração Fiscal Digital (EFD)
Mais de 100 mil escriturações por mês
Arquivos grandes - Gigas
 Arquivo hierárquico
– Blocos: 0000, ..., C100, C170, … H010, …
Milhões de registros por arquivo
Regras de negócio incluídas na estrutura
Diferentes versões (estruturas)
Alguns Exemplos de Sistemas Legados
Processamento batch e real time
Necessidades
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Necessidades
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
…
Lago de dados (data lake): metáfora para um repositório que
contém uma grande quantidade de dados brutos em formato
nativo
Tecnologias: Lago de Dados
Soluções baseadas no Ecossistema Apache
Soluções empacotadas
Grandes fornecedores
 ...
Necessidades
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
…
Desenvolvimento massivamente paralelo
– Multi thread
– Multi máquina
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
XML em formato AVRO
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
Escriturações
– Desnormalizada
– Diferentes formatos
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Tecnologias: Lago de Dados
Integração de grandes volumes de dados
Acesso e consulta eficiente (sql)
Recuperação de informação
Relatórios gerenciais
Painéis
Análise de dados
...
Análise de Dados
Aplicar algoritmos para:
– Descrição: Os dados utilizados em uma análise podem
descrever um comportamento ou tendência
– Classificação: A tarefa de classificação consiste em
determinar a classe de um registro
– Regressão: Predizer o valor númerico de um registro a
partir de um modelo gerado através de dados conhecidos
Análise de Dados
Aplicar algoritmos para:
– Agrupamento: Identificação de registros similares
– Associação: Identificar atributos relacionados
– Análise de Redes Sociais: Modelar relações por meio de
análise social e teoria dos grafos.
– ...
Análise de Dados: Arquiteturas
Análise de Dados: Tecnologias
Análise de Dados: Tecnologias
Ciência de dadas não é ferramenta.
É ciência!
Dúvidas? Perguntas?
Grato pela atenção!
Sérgio M. Dias | www.sergiomdias.com
– Pós-doutorando em Ciência de Dados | PUC Minas
• http://www.icei.pucminas.br/projetos/dsrgroup/
– Doutor em Ciência da Computação | UFMG
• www.dcc.ufmg.br
– Analista Sênior – Cientista de dados | SERPRO
• www.serpro.gov.br
Contato
– sergiomariano@gmail.com
– mariano@dcc.ufmg.br
– sergio.dias@serpro.gov.br

Mais conteúdo relacionado

Mais procurados

Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - dbDaniela Brauner
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Marcos Luiz Lins Filho
 
Planejando dados abertos - novos compromissos para implementar a Estratégia d...
Planejando dados abertos - novos compromissos para implementar a Estratégia d...Planejando dados abertos - novos compromissos para implementar a Estratégia d...
Planejando dados abertos - novos compromissos para implementar a Estratégia d...Augusto Herrmann Batista
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosDayane Cristine Leite
 
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Claudio Martins
 
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...Claudio Martins
 
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Thiago Avila, Msc
 
A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast dataBIBrasil
 

Mais procurados (10)

Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - db
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Planejando dados abertos - novos compromissos para implementar a Estratégia d...
Planejando dados abertos - novos compromissos para implementar a Estratégia d...Planejando dados abertos - novos compromissos para implementar a Estratégia d...
Planejando dados abertos - novos compromissos para implementar a Estratégia d...
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
Oportunidades e Desafios em Aplicativos de Dados Abertos (open data)
 
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...
Dados Abertos: Oportunidades, Inovação e Transparência (2º Congresso Nacional...
 
Big Data e NoSQL
Big Data e NoSQLBig Data e NoSQL
Big Data e NoSQL
 
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
Uma visão sobre a transparência, dados abertos e acesso a informação nas Inst...
 
A20 paper - perfil business intelligence - big data e fast data
A20   paper - perfil business intelligence - big data e fast dataA20   paper - perfil business intelligence - big data e fast data
A20 paper - perfil business intelligence - big data e fast data
 

Semelhante a Ciência de Dados em Governo

Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Roberto C. S. Pacheco
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendataRicardo Poppi
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeThiago Avila, Msc
 
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingUm novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingJosé Carlos Cavalcanti
 
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 131º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13cictec
 
05 curso ippuc-aula_01
05 curso ippuc-aula_0105 curso ippuc-aula_01
05 curso ippuc-aula_01andressa bonn
 
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane FidelixFundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane FidelixCris Fidelix
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfssuserbd3b69
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 
Apostila Tecnologia da Informação (TI)
Apostila Tecnologia da Informação (TI)Apostila Tecnologia da Informação (TI)
Apostila Tecnologia da Informação (TI)Ricardo Terra
 
O que são Dados Abertos - Open Data Day Maceió 2018
O que são Dados Abertos - Open Data Day Maceió 2018O que são Dados Abertos - Open Data Day Maceió 2018
O que são Dados Abertos - Open Data Day Maceió 2018Thiago Avila, Msc
 
A construção de pontos de acessos a conjuntos de dados governamentais baseado...
A construção de pontos de acessos a conjuntos de dados governamentais baseado...A construção de pontos de acessos a conjuntos de dados governamentais baseado...
A construção de pontos de acessos a conjuntos de dados governamentais baseado...Fernando de Assis Rodrigues
 
The build of access points to Government's Datasets based on a Multidimension...
The build of access points to Government's Datasets based on a Multidimension...The build of access points to Government's Datasets based on a Multidimension...
The build of access points to Government's Datasets based on a Multidimension...Fernando de Assis Rodrigues
 

Semelhante a Ciência de Dados em Governo (20)

Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
Metodologia e Arquitetura e-Gov como propulsoras de cooperação internacional:...
 
Apresentacao geral opendata
Apresentacao geral opendataApresentacao geral opendata
Apresentacao geral opendata
 
Fundamentos de SI
Fundamentos de SIFundamentos de SI
Fundamentos de SI
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Dados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo SociedadeDados Abertos - Transparência e Inovação Governo Sociedade
Dados Abertos - Transparência e Inovação Governo Sociedade
 
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud ComputingUm novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
Um novo "ABC" das TICs: (A)nalytics + (B)ig Data + (C)loud Computing
 
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 131º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
1º Seminário CICTEC - Um Novo ABC das TICs - José Carlos Cavalcanti 22 05 13
 
05 curso ippuc-aula_01
05 curso ippuc-aula_0105 curso ippuc-aula_01
05 curso ippuc-aula_01
 
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane FidelixFundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
Fundamentos em Tecnologia da Informação - Prof.ª Cristiane Fidelix
 
ERP
ERPERP
ERP
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdf
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
A construção do plano de dados abertos de uma organização pública de pesquisa...
A construção do plano de dados abertos de uma organização pública de pesquisa...A construção do plano de dados abertos de uma organização pública de pesquisa...
A construção do plano de dados abertos de uma organização pública de pesquisa...
 
Apostila Tecnologia da Informação (TI)
Apostila Tecnologia da Informação (TI)Apostila Tecnologia da Informação (TI)
Apostila Tecnologia da Informação (TI)
 
O que são Dados Abertos - Open Data Day Maceió 2018
O que são Dados Abertos - Open Data Day Maceió 2018O que são Dados Abertos - Open Data Day Maceió 2018
O que são Dados Abertos - Open Data Day Maceió 2018
 
A construção de pontos de acessos a conjuntos de dados governamentais baseado...
A construção de pontos de acessos a conjuntos de dados governamentais baseado...A construção de pontos de acessos a conjuntos de dados governamentais baseado...
A construção de pontos de acessos a conjuntos de dados governamentais baseado...
 
The build of access points to Government's Datasets based on a Multidimension...
The build of access points to Government's Datasets based on a Multidimension...The build of access points to Government's Datasets based on a Multidimension...
The build of access points to Government's Datasets based on a Multidimension...
 

Mais de Sérgio Dias

Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...Sérgio Dias
 
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...Sérgio Dias
 
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...Sérgio Dias
 
Proposta de Tese: Redução de Reticulados Conceituais
Proposta de Tese: Redução de Reticulados ConceituaisProposta de Tese: Redução de Reticulados Conceituais
Proposta de Tese: Redução de Reticulados ConceituaisSérgio Dias
 
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Sérgio Dias
 
Formal Concept Analysis applied to Professional Social Networks
Formal Concept Analysis applied to Professional Social NetworksFormal Concept Analysis applied to Professional Social Networks
Formal Concept Analysis applied to Professional Social NetworksSérgio Dias
 
Redução de Reticulados Conceituais
Redução de Reticulados ConceituaisRedução de Reticulados Conceituais
Redução de Reticulados ConceituaisSérgio Dias
 
Algoritmos para Geração de Reticulados Conceituais
Algoritmos para Geração de Reticulados ConceituaisAlgoritmos para Geração de Reticulados Conceituais
Algoritmos para Geração de Reticulados ConceituaisSérgio Dias
 
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Sérgio Dias
 

Mais de Sérgio Dias (9)

Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Terceira Lista de Exercícios - Aula sobre...
 
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...
Fundamentos da Teoria da Computação Segunda Lista de Exercícios - Aula sobre ...
 
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...
Fundamentos da Teoria da Computação Primeira Lista de Exercícios - Aula sobre...
 
Proposta de Tese: Redução de Reticulados Conceituais
Proposta de Tese: Redução de Reticulados ConceituaisProposta de Tese: Redução de Reticulados Conceituais
Proposta de Tese: Redução de Reticulados Conceituais
 
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
 
Formal Concept Analysis applied to Professional Social Networks
Formal Concept Analysis applied to Professional Social NetworksFormal Concept Analysis applied to Professional Social Networks
Formal Concept Analysis applied to Professional Social Networks
 
Redução de Reticulados Conceituais
Redução de Reticulados ConceituaisRedução de Reticulados Conceituais
Redução de Reticulados Conceituais
 
Algoritmos para Geração de Reticulados Conceituais
Algoritmos para Geração de Reticulados ConceituaisAlgoritmos para Geração de Reticulados Conceituais
Algoritmos para Geração de Reticulados Conceituais
 
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
 

Último

PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorEdvanirCosta
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesFabianeMartins35
 
Discurso Direto, Indireto e Indireto Livre.pptx
Discurso Direto, Indireto e Indireto Livre.pptxDiscurso Direto, Indireto e Indireto Livre.pptx
Discurso Direto, Indireto e Indireto Livre.pptxferreirapriscilla84
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdfLeloIurk1
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfPROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfHELENO FAVACHO
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.Mary Alvarenga
 
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇ
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇ
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇJaineCarolaineLima
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMHELENO FAVACHO
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéisines09cachapa
 
Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?AnabelaGuerreiro7
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteVanessaCavalcante37
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números Mary Alvarenga
 
Historia da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfHistoria da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfEmanuel Pio
 
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfRecomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfFrancisco Márcio Bezerra Oliveira
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médiorosenilrucks
 
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia TecnologiaPROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia TecnologiaHELENO FAVACHO
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfmaurocesarpaesalmeid
 

Último (20)

PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
INTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de ProfessorINTERVENÇÃO PARÁ - Formação de Professor
INTERVENÇÃO PARÁ - Formação de Professor
 
Revolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividadesRevolução russa e mexicana. Slides explicativos e atividades
Revolução russa e mexicana. Slides explicativos e atividades
 
Discurso Direto, Indireto e Indireto Livre.pptx
Discurso Direto, Indireto e Indireto Livre.pptxDiscurso Direto, Indireto e Indireto Livre.pptx
Discurso Direto, Indireto e Indireto Livre.pptx
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdfPROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
PROJETO DE EXTENSÃO I - SERVIÇOS JURÍDICOS, CARTORÁRIOS E NOTARIAIS.pdf
 
Atividade - Letra da música Esperando na Janela.
Atividade -  Letra da música Esperando na Janela.Atividade -  Letra da música Esperando na Janela.
Atividade - Letra da música Esperando na Janela.
 
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇ
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇ
ATIVIDADE - CHARGE.pptxDFGHJKLÇ~ÇLJHUFTDRSEDFGJHKLÇ
 
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEMPRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
PRÁTICAS PEDAGÓGICAS GESTÃO DA APRENDIZAGEM
 
About Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de HotéisAbout Vila Galé- Cadeia Empresarial de Hotéis
About Vila Galé- Cadeia Empresarial de Hotéis
 
Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?
 
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcanteCOMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
COMPETÊNCIA 2 da redação do enem prodção textual professora vanessa cavalcante
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números
 
Historia da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdfHistoria da Arte europeia e não só. .pdf
Historia da Arte europeia e não só. .pdf
 
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfRecomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
 
apostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médioapostila projeto de vida 2 ano ensino médio
apostila projeto de vida 2 ano ensino médio
 
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia TecnologiaPROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
 
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdfplanejamento_estrategico_-_gestao_2021-2024_16015654.pdf
planejamento_estrategico_-_gestao_2021-2024_16015654.pdf
 
Aula sobre o Imperialismo Europeu no século XIX
Aula sobre o Imperialismo Europeu no século XIXAula sobre o Imperialismo Europeu no século XIX
Aula sobre o Imperialismo Europeu no século XIX
 

Ciência de Dados em Governo

  • 1. Ciência de Dados em Governo Sérgio M. Dias 11/17
  • 2. Agenda Big Data Analytics Ciência de dados • Cientista de dados • Processo em ciência de dados Governo e dados • Algumas soluções de TI para governo • Necessidades e tecnologias
  • 3. Big Data Analytics!!! Big Data – Quando volume, velocidade ou variedade de dados excede a capacidade de armazenamento e/ou computação – Big Data é relativo, não absoluto Analytics – Aprendizado de máquinas – Mercado • “Relatórios”, painéis, etc
  • 4. Big Data A cada segundo1 : – 100.000 tweets circulam – 547 websites são criados – mais de 2 milhões de pesquisas (Google) – 48h de vídeos são baixadas no YouTube – 684.478 itens são compartilhados no Facebook... Em governo (Brasil)2 : – Mais de 7 milhões de notas fiscais eletrônicas (NFe) por dia – Mais de 16 bilhões de NFe autorizadas... 1 - Relatório Gartner - 2 - http://www.nfe.fazenda.gov.br/
  • 5. Como lidar com este “dilúvio” de dados? A palavra mais importante no termo “ciência de dados” não é “dados”, mas ciência. Fonte (2010): http://www.economist.com/node/15579717
  • 6. Ciência de Dados A partir da necessidade de análise desse emaranhado de dados surgiu uma “nova” área da ciência, a chamada ciência de dados – O “quarto paradigma” da ciência1 – A profissão mais “sexy” do século 212 – Uma nova buzzy word! As atividades executadas pelo “cientista de dados”, em menor escala em relação ao volume de dados, são bastante antigas3 1 - Tansley, S.; Tolle, K.M (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. 2 - https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century 3 - www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/
  • 7. Ciência de Dados A partir da necessidade de análise desse emaranhado de dados surgiu uma “nova” área da ciência, a chamada ciência de dados – O “quarto paradigma” da ciência1 – A profissão mais “sexy” do século 212 – Uma nova buzzy word! As atividades executadas pelo “cientista de dados”, em menor escala em relação ao volume de dados, são bastante antigas3 1 - Tansley, S.; Tolle, K.M (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. 2 - https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century 3 - www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/ Ciência de Dados X Mineração de Dados
  • 8. Cientista de Dados   – – Fonte (2014): https://www.wired.com/insights/2014/06/tell-kids-data-scientists-doctors/
  • 11. O que os cientistas de dados fazem? Definem hipóteses e perguntas Definem os conjuntos de dados ideais Determinam que dados podem ser acessados Adquirem os dados Preprocessam os dados Realizam análise de dados exploratória Realizam modelagem estatística dos dados Interpretam resultados de análises Escrevem relatórios sobre os resultados Criam modelos/componentes/códigos reusáveis Compartilham modelos e resultados com outras pessoas Considerando: ● Processos ● Ambientes ● Projetos
  • 12. O que os cientistas de dados fazem? Informação com alto valor agregado!
  • 13. Processo em ciência de dados CRISP-DM (CRoss Industry Standard Process for Data Mining) SEMMA (Sample, Explore, Modify, Model and Assess)
  • 16. Ciência de Dados em Governo!!!  Governo é um grande produtor e consumidor de dados  Existe um movimento global de governos e autoridades para publicar dados – O principal objetivo é aumentar a transparência, democracia e proporcionar a criação de serviços públicos
  • 17. Governo e Dados  Efeitos dos dados (aberto) governamentais sobre as políticas públicas – Inclusão: permite que qualquer cidadão utilize qualquer ferramenta de software para adaptá-los às suas necessidades – Transparência: as partes interessadas podem usá-las da maneira mais adequada ao seu propósito – Responsabilidade: oferecer vários pontos de vista sobre o desempenho do governo no cumprimento de suas metas em políticas públicas
  • 18. SERPRO e Governo Serviço Federal de Processamento de Dados (SERPRO) – Empresa pública de serviços de governo eletrônico – Vinculada ao Ministério da Fazenda – Criada em 1º de dezembro de 1964 – Sede em Brasília, conta com 11 Projeções Regionais – Mais de 10 mil colaboradores Fornece soluções de TI para o governo
  • 19. Algumas Soluções de TI para Governo Sistema Público de Escrituração Digital (SPED) – NF-e – EFD ICMS IPI – E-Financeira – Esocial – CT-e – ... Receita Federal do Brasil – Imposto de Renda Certificação Digital
  • 20. Algumas Soluções de TI para Governo Sistema Público de Escrituração Digital (SPED) – NF-e – EFD ICMS IPI – E-Financeira – Esocial – CT-e – ... Receita Federal do Brasil – Imposto de Renda Certificação Digital
  • 21. Nota Fiscal Eletrônica (NFe) Modelo nacional de documento fiscal eletrônico que substitui a sistemática de emissão do documento fiscal em papel Mais de 200 milhões de NFe por mês Potencialidade para: – Acompanhamento em tempo real do cenário econômico nacional – Adoção de medidas estratégicas de impacto imediato
  • 22. Nota Fiscal Eletrônica (NFe) XML Mais de 400 tags Complexo Diferentes versões (estruturas)
  • 24. Escrituração Fiscal Digital (EFD) A Escrituração Fiscal Digital - EFD é um arquivo digital, que se constitui de um conjunto de escriturações de documentos fiscais e de outras informações de interesse dos fiscos das unidades federadas e da Receita Federal do Brasil, bem como de registros de apuração de impostos referentes às operações e prestações praticadas pelo contribuinte.
  • 25. Escrituração Fiscal Digital (EFD) Mais de 100 mil escriturações por mês Arquivos grandes - Gigas  Arquivo hierárquico – Blocos: 0000, ..., C100, C170, … H010, … Milhões de registros por arquivo Regras de negócio incluídas na estrutura Diferentes versões (estruturas)
  • 26. Alguns Exemplos de Sistemas Legados Processamento batch e real time
  • 27. Necessidades Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 28. Necessidades Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados … Lago de dados (data lake): metáfora para um repositório que contém uma grande quantidade de dados brutos em formato nativo
  • 29. Tecnologias: Lago de Dados Soluções baseadas no Ecossistema Apache Soluções empacotadas Grandes fornecedores  ...
  • 30. Necessidades Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados … Desenvolvimento massivamente paralelo – Multi thread – Multi máquina
  • 31. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 32. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados XML em formato AVRO
  • 33. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados Escriturações – Desnormalizada – Diferentes formatos
  • 34. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 35. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 36. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 37. Tecnologias: Lago de Dados Integração de grandes volumes de dados Acesso e consulta eficiente (sql) Recuperação de informação Relatórios gerenciais Painéis Análise de dados ...
  • 38. Análise de Dados Aplicar algoritmos para: – Descrição: Os dados utilizados em uma análise podem descrever um comportamento ou tendência – Classificação: A tarefa de classificação consiste em determinar a classe de um registro – Regressão: Predizer o valor númerico de um registro a partir de um modelo gerado através de dados conhecidos
  • 39. Análise de Dados Aplicar algoritmos para: – Agrupamento: Identificação de registros similares – Associação: Identificar atributos relacionados – Análise de Redes Sociais: Modelar relações por meio de análise social e teoria dos grafos. – ...
  • 40. Análise de Dados: Arquiteturas
  • 41. Análise de Dados: Tecnologias
  • 42. Análise de Dados: Tecnologias Ciência de dadas não é ferramenta. É ciência!
  • 43. Dúvidas? Perguntas? Grato pela atenção! Sérgio M. Dias | www.sergiomdias.com – Pós-doutorando em Ciência de Dados | PUC Minas • http://www.icei.pucminas.br/projetos/dsrgroup/ – Doutor em Ciência da Computação | UFMG • www.dcc.ufmg.br – Analista Sênior – Cientista de dados | SERPRO • www.serpro.gov.br Contato – sergiomariano@gmail.com – mariano@dcc.ufmg.br – sergio.dias@serpro.gov.br