Turicas apresenta a biblioteca rows para Python, que facilita a importação e normalização de dados tabulares de diferentes formatos como CSV, HTML e XLS em uma única API. Com rows, os dados são automaticamente convertidos para os tipos corretos como datetime e decimal, e podem ser facilmente exportados de volta aos mesmos ou diferentes formatos. A biblioteca também inclui funcionalidades como interface de linha de comando e testes automatizados.
12. Jornalismo de
Dados1. Captura: buscar e baixar
2. Normalização: converter aum formato melhor (ex: HTML
paraCSV)
3. Análise: ver o que te serve
4. Visualização: mostrar pro mundo!
13. Jornalismo de
Dados [2]4. Visualização: cerejado bolo
3. Análise: desa ador
2. Normalização: chato pracaralho
1. Captura: chato, de vez em quando desa ador
27. Por que csv, lxml,
xlrd etc. são
ruins?Aprender sobre o formato (mesmo que você só queiraos
dados)
Aprender umabibliotecapor formato (APIs diferentes)
Converter os dados (nem sempre as bibliotecas convertem)
Testar as funções de conversão (você usaTDD, certo?)
Exemplos só de leitura(escritapode ser pior!)
28. rows to the
rescue!
pip install rows # Python Package Index
apt-get install rows # Debian!
dnf install rows # Fedora
github.com/turicas/rows
29. csv com Python + rows
importrows
table1=rows.import_from_csv('tesouro-direto.csv')
forrowintable1:
printrow
37. Funcionalidades
API única(não importao formato)
Escrever é tão fácilquanto ler (pythonic way)
CSV, HTML, XLS, XLSX, JSON, TXT, SQLite...
Conversão automática de dados
Command-line interface!o/
Eujá z os testes