Vamos fazer uma pequena demonstração.... vamos analisar o dataset do naufrágio do Titanic somente com Python sem utilizar nenhuma lib ou framework
Explicando como podemos organizar, alinhar, deletar dentre outras funcionalidade.
Assim deixando com curiosidade para conhecer ou como funcionam as famosas bibliotecas de análise de dados em python, e tambem conhecer mais sobre o que vc pode fazer somente com python.
1. Fazendo análise de dados SÓ
com Python (Just Python)
Cesar Augusto Bruschetta
2. Cesar Augusto Bruschetta
Quem sou Eu
Olá, sou o Cesar, tenho 30 anos,
casado, tenho um cachorro... Tenho
quase 10 anos de experiência com
programação em diferentes
linguagens, mas minha maior
habilidade sempre foi com Python.
Adoro tecnologia e o que se pode
fazer com ela, sou curioso,
autodidata. Sou o clássico nerd que
adora trabalhar com novas
linguagens e desafios, não sou de
sair muito para ir em baladas, mas
adoro uma boa conversa, amigos,
risadas, comida, café e uma coca-
cola.
De vez em quando tenho um lado
Gourmet, gosto de cozinhar e
resolvo me aventurar na cozinha.
4. Just Python
● O objetivo é oferecer um espaço
para conferências de python
puro.
● Buscando levar tanto
participantes quanto palestrantes
para fora da zona de conforto
estimulando palestras utilizando
apenas a linguagem Python
preenchendo o tempo e a mente
com novas e empolgantes ideias.
● https://justpython.style/
Cesar Augusto Bruschetta
5. Cesar Augusto Bruschetta
► Vamos fazer uma pequena demonstração.... Analisar o dataset do naufrágio do
Titanic somente com Python sem utilizar nenhuma lib ou framework.
► Assim deixando com curiosidade para conhecer ou como funcionam as
famosas bibliotecas de análise de dados em python, e também conhecer mais
sobre o que vc pode fazer somente com python
Nosso objetivo
7. Mas, porque sobre o Titanic?
Cesar Augusto Bruschetta
► É um caso mundialmente
conhecido e marcante.
► Ficou marcado na cultura e além
disso virou um sucesso através do
filme de James Cameron (1997).
► É considerado um dos maiores
desastres da navegação levando a
morte 1514 pessoas.
► Na época o Titanic era conhecido
como o maior avanço tecnológico.
► Entre outras curiosidades e
conspirações...
8. Cesar Augusto Bruschetta
► Por ser um dataset simples e fácil
de entender, facilitando o
aprendizado e a manipulação dos
dados
► DataSet com poucas colunas e com
nomes até “amigáveis”
► DataSet com “dados válidos” não
necessitando de muitas
transformações ou tratamentos nos
dados
… Maaasss, porque analisar o naufrágio
do Titanic?
► CSV de dados públicos
► Dataset retirado do kaggle (existem
vários exemplos e testes que usam
ele)
10. ► csv.DictReader:
► Classe responsável por ler o csv e parsear ele em uma lista de Dicionários
► https://docs.python.org/3/library/csv.html#csv.DictReader
► io.StringIO:
► Classe responsável por receber uma string e retorna um byteIO como um file
► https://docs.python.org/3/library/io.html#io.StringIO
► urllib.request.urlopen:
► Método responsável por fazer uma requisição http e retornar uma string com o body
► https://docs.python.org/3/library/urllib.request.html#urllib.request.urlopen
► itertools.groupby:
► Retorna um iterator agrupando os dados do iterator recebido, com base na chave
fornecida
► https://docs.python.org/3.7/library/itertools.html#itertools.groupby
► operator.itemgetter:
► Retorna uma função que buscará o item informado, tanto um index ou uma chave
► https://docs.python.org/3/library/operator.html#operator.itemgetter
Principais módulos de Python
Cesar Augusto Bruschetta
11. Principais módulos de Python
► functools.partial:
► Retorna uma nova função que envolve um ou mais parâmetros, assim abstrai os
parâmetros repetidos da função
► https://docs.python.org/3.7/library/functools.html#functools.partial
► filter:
► Retorna um iterável com os item que atenderam a condição apresentada pela
função validadora
► https://docs.python.org/3/library/functions.html#filter
► lambda:
► Cria uma função anônima e simples
► https://docs.python.org/3/tutorial/controlflow.html#lambda-expressions
► sorted:
► Retorne uma nova lista classificada dos itens em iterável.
► https://docs.python.org/3/library/functions.html#sorted
► round:
► Retorna um número float arredondado
► https://docs.python.org/3/library/functions.html#round
Cesar Augusto Bruschetta
22. Projeto utilizando PlainChart
A text-based, no-dependencies, pip-installable, open-source charting utility in
Python.
https://github.com/gduverger/plainchart
Visualização dos dados
Cesar Augusto Bruschetta
23. Agrupando a Idade dos passageiros para
o Gráfico
Cesar Augusto Bruschetta