SlideShare uma empresa Scribd logo
1 de 19
Baixar para ler offline
DATA
SCIENCE
A ARTE DE ESTUDAR E
ANALISAR DADOS
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DE AUTORIA DE MIGUEL DE OLIVEIRA.
ATENÇÃO
Como é um slide mais
visual, os textos de apoio
que estão a partir do
slide 10 são de extrema
importância, leia-os
para compreender sobre
o tema.
CIÊNCIA DOS DADOS
• O que é?
• Dados x Informação
• A ciência de dados
• Padrões, mineração de
dados, informações
CIÊNCIA
CONHECIMENTO
INFORMAÇÃO
DADOS
O CIENTISTA DE DADOS
QUEM USA DATA SCIENCE?
PythonEstatísticas e Análises
A Linguagem Python: versatilidade,
extensibilidade
• Aplicações estatísticas
• Machine learning
• Plotagem e visualização de
gráficos, etc
A importância
de conhecer
os dados
números e relevânciaProjeçõesfuturas
Referências
Ciência de Dados: O que é, conceito e definição. Disponível em:
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/. Acesso em:
15 nov. 2018.
What is Data Science?. Disponível em: https://datajobs.com/what-is-data-
science/. Acesso em: 15 nov. 2018.
Understanding How Python is Used in Data Science. Disponível em:
https://www.datasciencegraduateprograms.com/python/. Acesso em: 15 nov.
2018.
TEXTOS DE APOIO SLIDE 3
O QUE É DATA SCIENCE - CIÊNCIA DE DADOS
• Dados: De maneira geral, é o conteúdo quantificável e que por si só não transmite nenhuma mensagem que
possibilite o entendimento sobre determinada situação. Os dados podem ser considerados a unidade básica da
informação. Sem dados, não temos informações, pois estas são criadas a partir daqueles.
• Informação: É o resultado do processamento dos dados. Ou seja, os dados foram analisados e interpretados
sob determinada ótica, e a partir dessa análise se torna possível qualificar esses dados. Em diversas profissões,
vários processos são descritos como o a ser seguir:
Entrada (dados) >> Processamento (análise dos dados) >> Saída (informação).
RESUMINDO
Dado é a base para a informação. Ele não é capaz de descrever uma situação por completo. Ele pode
ser quantificado, mas não qualificado. Já a informação tem conteúdo entendível, capaz de expressar uma situação.
TEXTOS DE APOIO SLIDE 3
• Conceito básico da ciência de dados
A ciência de dados é uma mistura multidisciplinar de inferência de dados, desenvolvimento de
algoritmos e tecnologia para resolver problemas analiticamente complexos.No núcleo é dados. Maneiras
de informações brutas, streaming e armazenadas em armazéns de dados corporativos. Muito para
aprender minerando-o. Capacidades avançadas que podemos construir com isso. A ciência de dados é,
em última instância, sobre o uso desses dados de maneiras criativas para gerar valor comercial.
• (Inferência de dados, desenvolvimento de algoritmos e tecnologia)
• Resolver problemas analíticos
• Minerar dados, encontrar padrões e perfis; transformar essas informações em valor de negócios
TEXTOS DE APOIO SLIDE 4
QUEM FAZ? O CIENTISTA DE DADOS
• Um profissional diverso, não possui uma definição exata.
• Possui habilidades em matemática, tecnologia e negócios
“Há uma piada que diz que um cientista de dados é alguém que sabe mais sobre estatística do que um cientista da
computação e mais sobre ciência da computação do que um estatístico (eu não disse que a piada era boa). Na
verdade, alguns cientistas de dados são — para todos os propósitos práticos — estatísticos, enquanto outros são
quase indistinguíveis dos engenheiros de software. Alguns são experts em aprendizado de máquina, enquanto outros
não conseguiram aprender muita coisa sobre o assunto. Alguns são PhDs com um impressionante registro de
publicações, enquanto outros nunca leram um trabalho acadêmico (apesar de ser uma vergonha). Resumindo,
basicamente não importa como você define data science, pois você encontrará praticantes para quem a definição
está total e absolutamente errada.” - Joel Grus, Data Science do Zero
TEXTOS DE APOIO SLIDE 5PRA QUEM FAZ? – QUEM USA DATA SCIENCE?
Quando analisamos essas informações parece tudo muito assustador e impossível de ser controlado, certo?
– Errado! – A ciência de dados está cada vez mais consistente no mercado para que possamos acompanhar esse
crescimento sem tropeços no futuro. E sabe qual o resultado dessa evolução toda de informações? – O Big Bang
do Dataverse. – Hpa afirmações que essa será a próxima onda.
Portanto, inevitavelmente grande parte das empresas fazem parte desse ecossistema de dados, e sem um
acompanhamento e analises cuidadosas em um curto prazo será quase impossível tomar decisões inteligentes a
favor de bons resultados. É importante destacar que os dados permitem que as empresas e organizações
entendam melhor seus clientes e consumidores e possam aprimorar cada vez mais os seus processos.
Diante de todos esses fatos, a Data Science ou Ciência de Dados tem sido muito mais relevante em
noticias sobre indústria e negócios, e não é pra menos, pois trata-se de uma disciplina acadêmica e profissão
totalmente em alta no mercado.
TEXTOS DE APOIO SLIDE 5
• Target e Data Science
Como a Target previa quais consumidoras estavam grávidas: http://nyti.ms/1EQTznL (LINK NA
DESCRIÇÃO).
• Todo e qualquer negócio deveria estar usando a ciência de dados para o seu benefício
• Campanhas Políticas de 2012 nos estados unidos usaram Data Science para descobrir quais
potenciais eleitores precisavam de mais atenção e garantiram a reeleição de Obama Instituições de
pesquisa também usam data Science
TEXTOS DE APOIO SLIDE 6
COMO FAZ? – PYTHON, ESTATÍSTICAS E ANÁLISES DE PERFIL
• A Linguagem Python: versatilidade, extensibilidade
• Pandas, NumPy, SciPy, Statsmodels, Scilkit-Learn, PyBrain
• Aplicações estatísticas, machine learning, plotagem e visualização de gráficos, armazenamento e
formatação
• Não é apenas estatística, outros conhecimentos matemáticos são igualmente necessários para buscar
padrões durante a mineração de dados.
• É de extrema importância para o cientista de dados conhecer os negócios ao qual as suas análises
servem, pois torna-se mais fácil buscar o perfil de clientes específicos, relaciona-los a determinados
produtos ou serviços.
TEXTOS DE APOIO SLIDE 7
PRA QUE FAZ? – A IMPORTÂNCIA DE CONHECER OS DADOS.
1. Dados podem ser usados na ciência pra detectar doenças em ascenção, para descobrir padrões de doenças,
assim como podem ser usados na política, usando deep learning pode-se treinar uma IA para ela identificar
padrões de doenças como a tuberculose.
2. Melhorar costumer/user experience. Analisando reviews e feedbacks dos consumidores as empresas podem
mudar o comportamento virtual, comportamento dos funcionários e estilo da loja.
3. Mapear usuários pra entender como eles estão reagindo por exemplo a uma campanha de marketing.
4. Dados podem ser fonte de dinheiro: Há muitas empresas especializadas em vender dados e analisá-los
5. Usando dados pra proteger dados: Bancos por exemplo usam reconhecimento de voz para acessar o usuário
a acessar sua informação financeira. Estes sistemas também podem identificar comportamentos diferentes
do usual identificando também suspeitos
TEXTOS DE APOIO SLIDE 7
Criar bases de dados sobre os usuários de um produto ou serviço é de extrema importância e pode servir
como ferramenta de impulsionamento dos negócios. Com isso, pode-se realizar recomendação de
produtos que possam interessar o cliente; músicas e filmes em serviços de mídia; amigos com interesses
ou conexões em comum nas redes sociais.
O Facebook utiliza análise dos dados de localização dos usuários (onde nasceu/onde mora) para gerar
um relatório de migração http://on.fb.me/1EQTq3A (LINK NA DESCRIÇÃO).
Sistemas de apoio a decisão de uma organização também podem ser construídos com base nos padrões
encontrados na inferência de dados internos.
TEXTOS DE APOIO SLIDE 8
PORQUE É TÃO IMPORTANTE? – PROJEÇÕES FUTURAS, NÚMEROS E RELEVÂNCIA.
Segundo o 38o Webshoppers, do Ebit/Nielsen, o e-commerce brasileiro cresceu 12,1% no
primeiro semestre de 2018 com relação ao mesmo período do ano passado. Esse aumento representa um
faturamento de R$ 23,6 bilhões. Cerca de 1 bilhão de páginas ativas na web 2,2 Bilhões de usuários
ativos no Facebook (jul/2018) - 29% da população mundial.
O mundo é cada vez mais digital, quase toda a nossa interação com a tecnologia é registrada
e utilizada para descobrir qual o nosso perfil e o quanto ele é valioso para determinado negócio.
OBRIGADX!

Mais conteúdo relacionado

Mais procurados

Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Bruno Rocha
 
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Marcos Vinicius Fidelis
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosAmbiente Livre
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Ambiente Livre
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaMarcio Junior Vieira
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Marcos Luiz Lins Filho
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data scienceCaio Gomes
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesAmbiente Livre
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaDaniel Checchia
 
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Ambiente Livre
 

Mais procurados (20)

Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
 
Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
Big Data
Big DataBig Data
Big Data
 
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
 
TDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativosTDC2017 - Misturando dados com Pentaho para insights mais significativos
TDC2017 - Misturando dados com Pentaho para insights mais significativos
 
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
Open Source Data Science - Elaborando uma plataforma de Big Data & Analytics ...
 
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - CuritibaPalestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
Palestra: Big Data Open Source com Hadoop - FLISOL 2014 - Curitiba
 
FGV - Data Science Day - Gabriela Queiroz
FGV - Data Science Day - Gabriela QueirozFGV - Data Science Day - Gabriela Queiroz
FGV - Data Science Day - Gabriela Queiroz
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Big data
Big dataBig data
Big data
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data science
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
Pentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data LakesPentaho, Hadoop , Big Data e Data Lakes
Pentaho, Hadoop , Big Data e Data Lakes
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
Pentaho com Hadoop – O Canivete Suíço do Cientistas de Dados para Big Data An...
 

Semelhante a A Arte de Estudar e Analisar Dados com Ciência

Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesGabriel Prado
 
Big data e Inteligência Artificial
Big data e Inteligência ArtificialBig data e Inteligência Artificial
Big data e Inteligência ArtificialJoão Gabriel Lima
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxVitorFaust
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoLuis Borges Gouveia
 
Curso Business Analytics.pdf
Curso Business Analytics.pdfCurso Business Analytics.pdf
Curso Business Analytics.pdfLuiz Alves
 
Cultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioCultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioMJV Technology & Innovation Brasil
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonLuiz Eduardo Le Masson
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfssuserbd3b69
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações FaBIana Ravanêda Vercezes
 

Semelhante a A Arte de Estudar e Analisar Dados com Ciência (20)

Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e Oportunidades
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Big data e Inteligência Artificial
Big data e Inteligência ArtificialBig data e Inteligência Artificial
Big data e Inteligência Artificial
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceito
 
Curso Business Analytics.pdf
Curso Business Analytics.pdfCurso Business Analytics.pdf
Curso Business Analytics.pdf
 
Cultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócioCultura de dados: por que kpis garantem a saúde do seu negócio
Cultura de dados: por que kpis garantem a saúde do seu negócio
 
Dutra (2)
Dutra (2)Dutra (2)
Dutra (2)
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdf
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações
Ciência de Dados: tudo sobre a área que está mudando o futuro das organizações
 
Jac data management
Jac   data managementJac   data management
Jac data management
 
Big Data e Hadoop - o poder da informação
Big Data e Hadoop - o poder da informaçãoBig Data e Hadoop - o poder da informação
Big Data e Hadoop - o poder da informação
 
Sig unidade i
Sig   unidade iSig   unidade i
Sig unidade i
 

A Arte de Estudar e Analisar Dados com Ciência

  • 1. DATA SCIENCE A ARTE DE ESTUDAR E ANALISAR DADOS DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE. ROTEIRO DE AUTORIA DE MIGUEL DE OLIVEIRA.
  • 2. ATENÇÃO Como é um slide mais visual, os textos de apoio que estão a partir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
  • 3. CIÊNCIA DOS DADOS • O que é? • Dados x Informação • A ciência de dados • Padrões, mineração de dados, informações CIÊNCIA CONHECIMENTO INFORMAÇÃO DADOS
  • 5. QUEM USA DATA SCIENCE?
  • 6. PythonEstatísticas e Análises A Linguagem Python: versatilidade, extensibilidade • Aplicações estatísticas • Machine learning • Plotagem e visualização de gráficos, etc
  • 9. Referências Ciência de Dados: O que é, conceito e definição. Disponível em: https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/. Acesso em: 15 nov. 2018. What is Data Science?. Disponível em: https://datajobs.com/what-is-data- science/. Acesso em: 15 nov. 2018. Understanding How Python is Used in Data Science. Disponível em: https://www.datasciencegraduateprograms.com/python/. Acesso em: 15 nov. 2018.
  • 10. TEXTOS DE APOIO SLIDE 3 O QUE É DATA SCIENCE - CIÊNCIA DE DADOS • Dados: De maneira geral, é o conteúdo quantificável e que por si só não transmite nenhuma mensagem que possibilite o entendimento sobre determinada situação. Os dados podem ser considerados a unidade básica da informação. Sem dados, não temos informações, pois estas são criadas a partir daqueles. • Informação: É o resultado do processamento dos dados. Ou seja, os dados foram analisados e interpretados sob determinada ótica, e a partir dessa análise se torna possível qualificar esses dados. Em diversas profissões, vários processos são descritos como o a ser seguir: Entrada (dados) >> Processamento (análise dos dados) >> Saída (informação). RESUMINDO Dado é a base para a informação. Ele não é capaz de descrever uma situação por completo. Ele pode ser quantificado, mas não qualificado. Já a informação tem conteúdo entendível, capaz de expressar uma situação.
  • 11. TEXTOS DE APOIO SLIDE 3 • Conceito básico da ciência de dados A ciência de dados é uma mistura multidisciplinar de inferência de dados, desenvolvimento de algoritmos e tecnologia para resolver problemas analiticamente complexos.No núcleo é dados. Maneiras de informações brutas, streaming e armazenadas em armazéns de dados corporativos. Muito para aprender minerando-o. Capacidades avançadas que podemos construir com isso. A ciência de dados é, em última instância, sobre o uso desses dados de maneiras criativas para gerar valor comercial. • (Inferência de dados, desenvolvimento de algoritmos e tecnologia) • Resolver problemas analíticos • Minerar dados, encontrar padrões e perfis; transformar essas informações em valor de negócios
  • 12. TEXTOS DE APOIO SLIDE 4 QUEM FAZ? O CIENTISTA DE DADOS • Um profissional diverso, não possui uma definição exata. • Possui habilidades em matemática, tecnologia e negócios “Há uma piada que diz que um cientista de dados é alguém que sabe mais sobre estatística do que um cientista da computação e mais sobre ciência da computação do que um estatístico (eu não disse que a piada era boa). Na verdade, alguns cientistas de dados são — para todos os propósitos práticos — estatísticos, enquanto outros são quase indistinguíveis dos engenheiros de software. Alguns são experts em aprendizado de máquina, enquanto outros não conseguiram aprender muita coisa sobre o assunto. Alguns são PhDs com um impressionante registro de publicações, enquanto outros nunca leram um trabalho acadêmico (apesar de ser uma vergonha). Resumindo, basicamente não importa como você define data science, pois você encontrará praticantes para quem a definição está total e absolutamente errada.” - Joel Grus, Data Science do Zero
  • 13. TEXTOS DE APOIO SLIDE 5PRA QUEM FAZ? – QUEM USA DATA SCIENCE? Quando analisamos essas informações parece tudo muito assustador e impossível de ser controlado, certo? – Errado! – A ciência de dados está cada vez mais consistente no mercado para que possamos acompanhar esse crescimento sem tropeços no futuro. E sabe qual o resultado dessa evolução toda de informações? – O Big Bang do Dataverse. – Hpa afirmações que essa será a próxima onda. Portanto, inevitavelmente grande parte das empresas fazem parte desse ecossistema de dados, e sem um acompanhamento e analises cuidadosas em um curto prazo será quase impossível tomar decisões inteligentes a favor de bons resultados. É importante destacar que os dados permitem que as empresas e organizações entendam melhor seus clientes e consumidores e possam aprimorar cada vez mais os seus processos. Diante de todos esses fatos, a Data Science ou Ciência de Dados tem sido muito mais relevante em noticias sobre indústria e negócios, e não é pra menos, pois trata-se de uma disciplina acadêmica e profissão totalmente em alta no mercado.
  • 14. TEXTOS DE APOIO SLIDE 5 • Target e Data Science Como a Target previa quais consumidoras estavam grávidas: http://nyti.ms/1EQTznL (LINK NA DESCRIÇÃO). • Todo e qualquer negócio deveria estar usando a ciência de dados para o seu benefício • Campanhas Políticas de 2012 nos estados unidos usaram Data Science para descobrir quais potenciais eleitores precisavam de mais atenção e garantiram a reeleição de Obama Instituições de pesquisa também usam data Science
  • 15. TEXTOS DE APOIO SLIDE 6 COMO FAZ? – PYTHON, ESTATÍSTICAS E ANÁLISES DE PERFIL • A Linguagem Python: versatilidade, extensibilidade • Pandas, NumPy, SciPy, Statsmodels, Scilkit-Learn, PyBrain • Aplicações estatísticas, machine learning, plotagem e visualização de gráficos, armazenamento e formatação • Não é apenas estatística, outros conhecimentos matemáticos são igualmente necessários para buscar padrões durante a mineração de dados. • É de extrema importância para o cientista de dados conhecer os negócios ao qual as suas análises servem, pois torna-se mais fácil buscar o perfil de clientes específicos, relaciona-los a determinados produtos ou serviços.
  • 16. TEXTOS DE APOIO SLIDE 7 PRA QUE FAZ? – A IMPORTÂNCIA DE CONHECER OS DADOS. 1. Dados podem ser usados na ciência pra detectar doenças em ascenção, para descobrir padrões de doenças, assim como podem ser usados na política, usando deep learning pode-se treinar uma IA para ela identificar padrões de doenças como a tuberculose. 2. Melhorar costumer/user experience. Analisando reviews e feedbacks dos consumidores as empresas podem mudar o comportamento virtual, comportamento dos funcionários e estilo da loja. 3. Mapear usuários pra entender como eles estão reagindo por exemplo a uma campanha de marketing. 4. Dados podem ser fonte de dinheiro: Há muitas empresas especializadas em vender dados e analisá-los 5. Usando dados pra proteger dados: Bancos por exemplo usam reconhecimento de voz para acessar o usuário a acessar sua informação financeira. Estes sistemas também podem identificar comportamentos diferentes do usual identificando também suspeitos
  • 17. TEXTOS DE APOIO SLIDE 7 Criar bases de dados sobre os usuários de um produto ou serviço é de extrema importância e pode servir como ferramenta de impulsionamento dos negócios. Com isso, pode-se realizar recomendação de produtos que possam interessar o cliente; músicas e filmes em serviços de mídia; amigos com interesses ou conexões em comum nas redes sociais. O Facebook utiliza análise dos dados de localização dos usuários (onde nasceu/onde mora) para gerar um relatório de migração http://on.fb.me/1EQTq3A (LINK NA DESCRIÇÃO). Sistemas de apoio a decisão de uma organização também podem ser construídos com base nos padrões encontrados na inferência de dados internos.
  • 18. TEXTOS DE APOIO SLIDE 8 PORQUE É TÃO IMPORTANTE? – PROJEÇÕES FUTURAS, NÚMEROS E RELEVÂNCIA. Segundo o 38o Webshoppers, do Ebit/Nielsen, o e-commerce brasileiro cresceu 12,1% no primeiro semestre de 2018 com relação ao mesmo período do ano passado. Esse aumento representa um faturamento de R$ 23,6 bilhões. Cerca de 1 bilhão de páginas ativas na web 2,2 Bilhões de usuários ativos no Facebook (jul/2018) - 29% da população mundial. O mundo é cada vez mais digital, quase toda a nossa interação com a tecnologia é registrada e utilizada para descobrir qual o nosso perfil e o quanto ele é valioso para determinado negócio.