Charla hecha en el Meetup de Python Montevideo en 17 de agosto de 2016. Video disponible en: https://www.youtube.com/watch?v=4yHwSJCQL70
Versión interactiva (en HTML) dos slides: http://turicas.info/slides/rows/meetup-mvd/
Descripción:
La información disponible en la Web es distribuida y no tiene un patrón específico. Quien necesita de estos datos usualmente necesita bajar, convertir y normalizar antes de hacer lo que realmente interesa: análisis. Muchos de estos datos se encuentran en formatos de tablas: CSV, HTML (con <table>), XLS, XLSX, ODS y otros. En esta charla será presentado el proyecto rows: una librería que unifica el acceso y conversión de datos tabulares, independiente del formato. La librería fue desarrollada por Álvaro y es software libre (GPLv3).
36. HTML con rows - Codigo
importrows
filename='examples/data/tesouro-direto.html'
table3=rows.import_from_html(filename)
forrowintable3:
print(row)
37. HTML con rows - Resultado
Row(timestamp=datetime.datetime(2015,11,6,17,43),
titulo=u'TesouroIPCA+comJurosSemestrais2017(NTNB)',
vencimento=datetime.date(2017,5,15),
taxa_compra=Decimal('0.0702'),
taxa_venda=Decimal('0.063'),
preco_compra=0.0,
preco_venda=2792.97)
#namedtuple#FTWo/
38. rows
Interfaz única(independiente de formato)
Escrebir es tan facilcuanto leer
Muchos plugins
Command-line interface!o/
Conversión automática de datos
Yohehecolas pruebas