O documento resume o que é ciência de dados, quem é Rodrigo Senra e como ele realiza seu trabalho como cientista de dados. Ele descreve as ferramentas e técnicas usadas, incluindo estatísticas descritivas, modelagem preditiva, aprendizado de máquina e análise de grandes conjuntos de dados.
6. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
2009
0.8 Zettabytes CRESCIMENTO
DA INFORMAÇÃO
2020
44
X
MAIOR
35.2 ZB
IN 2010 THE DIGITAL UNIVERSE WAS
1.2 ZETTABYTES
1,200,000,000,000,000,000,000
Zetta Exa Peta Tera Giga Mega Kilo Byte
fonte: http://thehumanfaceofbigdata.com/
11. Data Science is a newly emerging field dedicated to
analyzing and manipulating data to derive insights
and build data products.
https://beta.oreilly.com/ideas/what-is-data-science
It combines skill-sets ranging from
computer science, to mathematics, to art.
http://images.fineartamerica.com/images-medium-large-5/1-pi-transition-paths-martin-krzywinski.jpg
32. Big Data a cada passo da exploração de petróleo
Navigation
Seismic: Pre-stack
Seismic: Post-stack
Log Curves
Culture Data
Geologic Model
Pressure Data
Velocity Data Interpretation
35. Fernando Perez, lead PI at BIDS and creator of IPython, demonstrates brain imaging
analyses performed using the IPython Notebook, an interactive web-based
computational environment.
credit: Peg Skorpinski
36.
37.
38.
39.
40.
41.
42.
43. https://www.kaggle.com
Kaggle is the world's
largest community of data scientists.
They compete with each other
to solve complex data science problems,
and the top competitors are invited to work on the most
interesting and sensitive business problems from some
of the world’s biggest companies through Masters
competitions.
55. Obrigado a todos
pela atenção.
Rodrigo Dias Arruda Senra
http://rodrigo.senra.nom.br
rodsenra@gmail.com
@rodsenra
As opiniões e conclusões expressas nesta apresentação são de exclusiva responsabilidade de Rodrigo Senra.
Não é necessário requisitar permissão do autor para o uso de partes ou do todo desta apresentação, desde que não sejam
feitas alterações no conteúdo reutilizado e que esta nota esteja presente na íntegra no material resultante.
Imagens e referências para outros trabalhos nesta apresentação permanecem propriedade daqueles que detêm seus direitos de
copyright. Agradecimento especial a Ana Oliveira e Diego Salomone que contribuíram com alguns slides de suas apresentações
sobre o mesmo tema.