ATENÇÃO: Como é um slide mais visual, os texto de apoio que estão apartir do slide 10 são de extrema importância, leia-os para compreender sobre o tema.
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DO SLIDE DE AUTORIA DE MIGUEL DE OLIVEIRA.
Trabalho apresentado em equipe para a matéria de Fundamentos de Sistemas de Informação em 2018.
Links utilizados:
http://nyti.ms/1EQTznL
http://on.fb.me/1EQTq3A
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/
https://datajobs.com/what-is-data-science
https://www.datasciencegraduateprograms.com/python/
1. DATA
SCIENCE
A ARTE DE ESTUDAR E
ANALISAR DADOS
DESIGN DO SLIDE DE AUTORIA DE DAYANE CRISTINE LEITE.
ROTEIRO DE AUTORIA DE MIGUEL DE OLIVEIRA.
2. ATENÇÃO
Como é um slide mais
visual, os textos de apoio
que estão a partir do
slide 10 são de extrema
importância, leia-os
para compreender sobre
o tema.
3. CIÊNCIA DOS DADOS
• O que é?
• Dados x Informação
• A ciência de dados
• Padrões, mineração de
dados, informações
CIÊNCIA
CONHECIMENTO
INFORMAÇÃO
DADOS
9. Referências
Ciência de Dados: O que é, conceito e definição. Disponível em:
https://www.cetax.com.br/blog/data-science-ou-ciencia-de-dados/. Acesso em:
15 nov. 2018.
What is Data Science?. Disponível em: https://datajobs.com/what-is-data-
science/. Acesso em: 15 nov. 2018.
Understanding How Python is Used in Data Science. Disponível em:
https://www.datasciencegraduateprograms.com/python/. Acesso em: 15 nov.
2018.
10. TEXTOS DE APOIO SLIDE 3
O QUE É DATA SCIENCE - CIÊNCIA DE DADOS
• Dados: De maneira geral, é o conteúdo quantificável e que por si só não transmite nenhuma mensagem que
possibilite o entendimento sobre determinada situação. Os dados podem ser considerados a unidade básica da
informação. Sem dados, não temos informações, pois estas são criadas a partir daqueles.
• Informação: É o resultado do processamento dos dados. Ou seja, os dados foram analisados e interpretados
sob determinada ótica, e a partir dessa análise se torna possível qualificar esses dados. Em diversas profissões,
vários processos são descritos como o a ser seguir:
Entrada (dados) >> Processamento (análise dos dados) >> Saída (informação).
RESUMINDO
Dado é a base para a informação. Ele não é capaz de descrever uma situação por completo. Ele pode
ser quantificado, mas não qualificado. Já a informação tem conteúdo entendível, capaz de expressar uma situação.
11. TEXTOS DE APOIO SLIDE 3
• Conceito básico da ciência de dados
A ciência de dados é uma mistura multidisciplinar de inferência de dados, desenvolvimento de
algoritmos e tecnologia para resolver problemas analiticamente complexos.No núcleo é dados. Maneiras
de informações brutas, streaming e armazenadas em armazéns de dados corporativos. Muito para
aprender minerando-o. Capacidades avançadas que podemos construir com isso. A ciência de dados é,
em última instância, sobre o uso desses dados de maneiras criativas para gerar valor comercial.
• (Inferência de dados, desenvolvimento de algoritmos e tecnologia)
• Resolver problemas analíticos
• Minerar dados, encontrar padrões e perfis; transformar essas informações em valor de negócios
12. TEXTOS DE APOIO SLIDE 4
QUEM FAZ? O CIENTISTA DE DADOS
• Um profissional diverso, não possui uma definição exata.
• Possui habilidades em matemática, tecnologia e negócios
“Há uma piada que diz que um cientista de dados é alguém que sabe mais sobre estatística do que um cientista da
computação e mais sobre ciência da computação do que um estatístico (eu não disse que a piada era boa). Na
verdade, alguns cientistas de dados são — para todos os propósitos práticos — estatísticos, enquanto outros são
quase indistinguíveis dos engenheiros de software. Alguns são experts em aprendizado de máquina, enquanto outros
não conseguiram aprender muita coisa sobre o assunto. Alguns são PhDs com um impressionante registro de
publicações, enquanto outros nunca leram um trabalho acadêmico (apesar de ser uma vergonha). Resumindo,
basicamente não importa como você define data science, pois você encontrará praticantes para quem a definição
está total e absolutamente errada.” - Joel Grus, Data Science do Zero
13. TEXTOS DE APOIO SLIDE 5PRA QUEM FAZ? – QUEM USA DATA SCIENCE?
Quando analisamos essas informações parece tudo muito assustador e impossível de ser controlado, certo?
– Errado! – A ciência de dados está cada vez mais consistente no mercado para que possamos acompanhar esse
crescimento sem tropeços no futuro. E sabe qual o resultado dessa evolução toda de informações? – O Big Bang
do Dataverse. – Hpa afirmações que essa será a próxima onda.
Portanto, inevitavelmente grande parte das empresas fazem parte desse ecossistema de dados, e sem um
acompanhamento e analises cuidadosas em um curto prazo será quase impossível tomar decisões inteligentes a
favor de bons resultados. É importante destacar que os dados permitem que as empresas e organizações
entendam melhor seus clientes e consumidores e possam aprimorar cada vez mais os seus processos.
Diante de todos esses fatos, a Data Science ou Ciência de Dados tem sido muito mais relevante em
noticias sobre indústria e negócios, e não é pra menos, pois trata-se de uma disciplina acadêmica e profissão
totalmente em alta no mercado.
14. TEXTOS DE APOIO SLIDE 5
• Target e Data Science
Como a Target previa quais consumidoras estavam grávidas: http://nyti.ms/1EQTznL (LINK NA
DESCRIÇÃO).
• Todo e qualquer negócio deveria estar usando a ciência de dados para o seu benefício
• Campanhas Políticas de 2012 nos estados unidos usaram Data Science para descobrir quais
potenciais eleitores precisavam de mais atenção e garantiram a reeleição de Obama Instituições de
pesquisa também usam data Science
15. TEXTOS DE APOIO SLIDE 6
COMO FAZ? – PYTHON, ESTATÍSTICAS E ANÁLISES DE PERFIL
• A Linguagem Python: versatilidade, extensibilidade
• Pandas, NumPy, SciPy, Statsmodels, Scilkit-Learn, PyBrain
• Aplicações estatísticas, machine learning, plotagem e visualização de gráficos, armazenamento e
formatação
• Não é apenas estatística, outros conhecimentos matemáticos são igualmente necessários para buscar
padrões durante a mineração de dados.
• É de extrema importância para o cientista de dados conhecer os negócios ao qual as suas análises
servem, pois torna-se mais fácil buscar o perfil de clientes específicos, relaciona-los a determinados
produtos ou serviços.
16. TEXTOS DE APOIO SLIDE 7
PRA QUE FAZ? – A IMPORTÂNCIA DE CONHECER OS DADOS.
1. Dados podem ser usados na ciência pra detectar doenças em ascenção, para descobrir padrões de doenças,
assim como podem ser usados na política, usando deep learning pode-se treinar uma IA para ela identificar
padrões de doenças como a tuberculose.
2. Melhorar costumer/user experience. Analisando reviews e feedbacks dos consumidores as empresas podem
mudar o comportamento virtual, comportamento dos funcionários e estilo da loja.
3. Mapear usuários pra entender como eles estão reagindo por exemplo a uma campanha de marketing.
4. Dados podem ser fonte de dinheiro: Há muitas empresas especializadas em vender dados e analisá-los
5. Usando dados pra proteger dados: Bancos por exemplo usam reconhecimento de voz para acessar o usuário
a acessar sua informação financeira. Estes sistemas também podem identificar comportamentos diferentes
do usual identificando também suspeitos
17. TEXTOS DE APOIO SLIDE 7
Criar bases de dados sobre os usuários de um produto ou serviço é de extrema importância e pode servir
como ferramenta de impulsionamento dos negócios. Com isso, pode-se realizar recomendação de
produtos que possam interessar o cliente; músicas e filmes em serviços de mídia; amigos com interesses
ou conexões em comum nas redes sociais.
O Facebook utiliza análise dos dados de localização dos usuários (onde nasceu/onde mora) para gerar
um relatório de migração http://on.fb.me/1EQTq3A (LINK NA DESCRIÇÃO).
Sistemas de apoio a decisão de uma organização também podem ser construídos com base nos padrões
encontrados na inferência de dados internos.
18. TEXTOS DE APOIO SLIDE 8
PORQUE É TÃO IMPORTANTE? – PROJEÇÕES FUTURAS, NÚMEROS E RELEVÂNCIA.
Segundo o 38o Webshoppers, do Ebit/Nielsen, o e-commerce brasileiro cresceu 12,1% no
primeiro semestre de 2018 com relação ao mesmo período do ano passado. Esse aumento representa um
faturamento de R$ 23,6 bilhões. Cerca de 1 bilhão de páginas ativas na web 2,2 Bilhões de usuários
ativos no Facebook (jul/2018) - 29% da população mundial.
O mundo é cada vez mais digital, quase toda a nossa interação com a tecnologia é registrada
e utilizada para descobrir qual o nosso perfil e o quanto ele é valioso para determinado negócio.