2. 1. Post no Coloriza Brasil
2. Código Aberto com Github
3. Por que criar um portfólio?
4. Blogging, do modo fácil ao difícil
5. Visualizações de Dados – Data is Beautiful
6. Competições de Ciência de Dados – Kaggle
Aula 2 – Portfólio de Data Science
Agenda
4. • Vamos fazer nossa primeira contribuição para um projeto Open Source
• Vamos ter o nosso primeiro exemplo de portfólio no Github
• Vamos ter um exemplo de portfólio em um blog
Plano de Ação
prática blog
5. • Blog Coloriza Brazil
• Instruções:
• Passo a passo sobre como contribuir
Contribuindo para o blog Coloriza Brasil
prática blog
7. O que é GitHub?
github
• É o maior espaço para hospedagem de trabalhos colaborativos e
códigos no mundo
• Permite também o controle e versionamento de códigos
8. O que são repositórios do GitHub?
github
• É como se fosse uma pasta pública para o seu projeto
• Um repositório não apenas armazenam todos os arquivos atuais
do projeto como também contém o histórico de modificações de
cada respectivo arquivo
9. Como criar um repositório?
github
https://github.com/awarischool/meu-primeiro-repo
1 2 3
12. Como copiar repositórios de terceiros?
github
Um fork é uma cópia de um repositório. Forks permitem que você
experimente livremente modificações sem afetar o projeto original.
13. Como contribuir para projetos open
source de terceiros?
github
Repositório Original Modifica Cópia
Faz cópia do repo
Submete Modificação
1
2
3
4
aceita/rejeita/altera
modificação
15. • Estudo de Caso + documentação (PDF ou Medium)
ou
• Competição de Ciência de dados (Kaggle) + documentação
e
• 3 elementos de portfólio:
• blogging, data visualizations, contribuição Open Source, Youtube,
Kaggle
Projeto Final
Aula 2 – Portfólio de Data Science
16. motivação > blog > visual > kaggle
Por que blogar criar um portfólio?
Post no medium
17. motivação > blog > visual > kaggle
Por que blogar criar um portfólio?
25. Vantagens e Desvantagens
motivação > blog > visual > kaggle
Vantagens Desvantagens
LinkedIn • Não exige nenhum cadastro
• Imediatamente compartilhado à
rede de contatos
• Não amigável para códigos
Medium • ”Ranqueia” fácil no Google
• Opção preferida pela comunidade
de DS
• Tem funcionalidades para
compartilhar códigos, no entanto são
limitadas
FastPages • 100% open source, gratuíto e sem
propagandas ou paywalls
• Compatibilidade para blogar
diretamente com cadernos do
jupyter
• Permite personalizar o domínio
• Exige esforço extra para
configuração de página
• Precisa ser divulgado manualmente
• Solução nova, com pouca aderência
nas comunidades
26. • Comece pelo Medium
• Se começar a blogar com frequência códigos criados pelo Jupyter ou
Google Colab, passe para o FastPages
Nossa recomendação
motivação > blog > visual > kaggle
27. • Criar conta no Medium
• Clicar em New Story (https://medium.com/new-story)
• Caso queira inserir códigos utilize o ` para pequenos blocos,
gist para partes grandes ou print screen
• Antes de publicar, é possível compartilhar um esboço para revisão
(share draft link)
Primeiros passos com Medium
motivação > blog > visual > kaggle
28. • Seguir instruções disponíveis no Github do FastPages, em resumo:
• Acessar https://github.com/fastai/fastpages/generate para fazer uso
do template deles
• Seguir instruções na aba Pull Requests
• Tutorial com instruções: criando um blog com FastPages
Primeiros passos com FastPages
motivação > blog > visual > kaggle
30. Data is Beautiful
motivação > blog > visual > kaggle
• https://www.reddit.com/r/dataisbeautiful
• Comunidade com 14 milhões de membros
• Todos os compartilhamentos são em código aberto
31. Exemplos
motivação > blog > visual > kaggle
• Ranking com média de episódios de séries de tv
• Corona-v versus outras epidemias
35. • Contribuir para o blog Coloriza Brasil usando o GitHub
• Reforço de Python
• Consumir Unidade 3 - Porfólio de Data Science
Para a próxima semana
Próxima aula