SlideShare uma empresa Scribd logo
1 de 16
Data Analytics!
sobre Votaciones
Nominales!
Taller Transparencia & TIC !
Lic. Gabriela Perez, Lic. Ernesto Mislej!
gabriela, ernesto [@7puentes.com]!


Marzo 2011!

                                        7puentes.com!
Resumen Hackathon OpenGov
           GarageLab - UdeSA!
Durante Septiembre de 2010 participamos de la hackathon
OpenGov, organizada por GarageLab y la Universidad de San
Andrés, quien convocaba a Hackers(*) y a Cientistas Sociales a
elaborar herramientas para promover la transparencia en los
datos públicos. !

De ese encuentro de dos días de trabajo surgieron 4 proyectos,
vinculados a gasto público, registro de audiencias, información
georeferenciada sobre la cuenca matanza-riachuelo y análisis
de grupos de afinidad de legisladores según votaciones
nominales, éste último integrado por 7P.!

(*): Léase “informáticos con iniciativa”!

  7puentes.com!              Data Analytics sobre Votaciones Nominales!
Resumen Hackathon OpenGov
           GarageLab - UdeSA!




http://garagelab.tumblr.com/post/1985840685/votosdiputados!

  7puentes.com!          Data Analytics sobre Votaciones Nominales!
Análisis de Legislaturas!

Objetivo: !
               Construir una herramienta para el "
                  Análisis de Legislaturas.!
Análisis de votaciones nominales, descripción y predicción
de comportamiento, inducción de grupos de afinidad. !


Audiencia: !
- Investigadores en Ciencia Política!
- Periodistas especializados!


  7puentes.com!            Data Analytics sobre Votaciones Nominales!
Análisis de Grupos de Afinidad de
               Legisladores!

              ¿Qué son 2 legisladores afines?!
           Modelar y caracterizar a los actores y !
        luego encontrar grupos de actores similares!

Según su forma/contenido:!
  - Bloque, edad, sexo, provincia, comisión…!
- Según su comportamiento:!
  - Co-firma en presentaciones de proyectos de ley!
  - Votaciones Nominales "!

  7puentes.com!             Data Analytics sobre Votaciones Nominales!
Pipeline de análisis!


Recuperar y extraer la información de las fuentes!


    Completar el modelo de datos !


        Preparar los datos para el análisis!


             Aplicar las técnicas y algoritmos!


                 Presentar los resultados!




 7puentes.com!                  Data Analytics sobre Votaciones Nominales!
Grupos de actores
con características
similares.
En este caso, secuencia
de votos similares.




                          Matriz vis, similitud=votos
Inducción de metabloques,
grupo de legisladores con
patrones de votos similares




        Heat map color=tipo_voto, filas=legislador,
          columnas=votación, filas reordenadas
2



                                1

                         Casos outliers, que quiebran el patrón común
                         1. la modificación al Código Civil incorporando el
                         matrimonio entre personas del mismo sexo;
                         2. Fondo del Bicentenario para el Desendeudamiento y
                         la Estabilidad (la utilización de reservas del tesoro
                         nacional para el pago de deuda externa, cuya discusión
                         llevó a la destitución/renuncia de Martín Redrado del
                         Banco Central);
http://bit.ly/9VPqCg !
Insights - eurekas!!
Votaciones outliers, fuera del patrón común.!
El meta-bloque de oposición.!
El comportamiento de bloques pequeños como Proyecto Sur.!

Membresía partidaria como principal descriptor.!
Caso Matrimonio Igualitario, donde se quiebra el patrón. !
Otras variables descriptivas y predictoras.!

Dimensionalidad del espacio de votaciones.!

Trabajo Futuro!
Desarrollar una herramienta de análisis interactiva.!
Sumar componente temporal al análisis.!
Especificar similitud de actores a partir de otras fórmulas.!

   7puentes.com!                   Data Analytics sobre Votaciones Nominales!
Dimensionalidad y !
     poder descriptivo de variables !




                                                              !



7puentes.com!    Data Analytics sobre Votaciones Nominales!
Herramientas utilizadas!
Recuperación de datos: Se construyeron robots para la recuperación de las
planillas de votaciones nominales publicadas en el sitio del HCDN. Las planillas
están en formato PDF. Los robots fueron programados en Ruby utilizando librerías
de scrapping (open-uri, Hpricot)!

Preparación de datos: Se armaron pequeños programas de procesamiento de
textos para la traducción de formatos también en Ruby. Para trabajar con los
formatos PDF, se utilizó la librería pdfreader. !

Análisis: Se aplicaron técnicas de clustering, métodos de agrupamiento de
individuos según su similitud. En este proyecto se utilizaron las suites de Data
Mining Weka y CLUTO.!

Presentación y Visualización de Datos: Se aplicaron las metáforas visuales de
visualización de matrices, heatmaps y treemaps. Se utilizaron las herramientas
Protovis y ManyEyes. !


   7puentes.com!                  Data Analytics sobre Votaciones Nominales!
Referencias!
Ruby: http://www.ruby-lang.org/es/ !
Hpricot: https://github.com/hpricot/hpricot/wiki !
PDFReader: http://rubyforge.org/projects/pdf-reader!
Weka: http://www.cs.waikato.ac.nz/ml/weka/!
CLUTO: http://glaros.dtc.umn.edu/gkhome/views/cluto/!
Protovis: http://vis.stanford.edu/protovis/!
Manyeyes: http://www-958.ibm.com/software/data/cognos/manyeyes/!
Heatmaps: http://en.wikipedia.org/wiki/Heat_map!
Matrix Visualization: http://vis.stanford.edu/protovis/ex/matrix.html!
Treemaps: http://www.cs.umd.edu/hcil/treemap/!




   7puentes.com!                   Data Analytics sobre Votaciones Nominales!
Nuestra empresa – 7Puentes!

7Puentes está conformada por un equipo de jóvenes
profesionales de computación egresados de la
Universidad de Buenos Aires (UBA) con amplia
experiencia en el campo laboral y académico. !

Fundada en el año 2007 el objetivo de la empresa está
focalizado en soluciones de sofware y análisis de datos
de alto valor e investigación científica para el
tratamiento eficaz de información compleja.!

Contamos con experiencias exitosas de constucción de software y consultoría en el mercado
local e internacional; en la actualidad poseemos proyectos activos y propuestas en desarrollo. !

Nuestro grupo posee una organización horizontal y flexible lo que permite adaptarnos a la
magnitud y particularidad de cada proyecto de manera efectiva, valiéndonos de profesionales
en cada área específica. En nuestra historia hemos contado con la colaboración de expertos
de diferentes disciplinas como ciencias políticas, económicas y de la comunicación.!

7Puentes de Königsberg Gerli La empresa posee sus oficinas en Banfield, situadas al sur del
gran Buenos Aires, a 15 km. del obelisco porteño de la Ciudad Autónoma de Buenos Aires.!


   7puentes.com!                         Data Analytics sobre Votaciones Nominales!
Nuestro Equipo!
Lic. Ernesto Mislej Responsable del área 7PLabs. Su área de experiencia profesional y académica
es en Inteligencia Artificial, Aprendizaje Automático y Visualización de Datos. Actualmente está
liderando proyectos en Opinion Mining. Es Lic. en Cs. de la Computación graduado de la Facultad
de Ciencias Exactas y Naturales de la UBA, donde se desempeña como docente en la maestría de
Data Mining & Knowledge Discovery y JTP del área Inteligencia Artificial en la licenciatura.!

Lic. Gabriela Perez Licenciada en Ciencia Política de la Universidad Nacional de Rosario (1999), se
especializó en Administración y Políticas Públicas en la Universidad de San Andrés (2001-2003). Fue
asesora parlamentaria en el H. Senado de la Nación (2002-2006). Desde entonces es consultora en
proyectos de cooperación internacional (Proyecto de Modernización del Estado (BIRF), 2006-2007 y
Proyecto de Fortalecimiento del Sistema de Protección de los Derechos Humanos (UE) desde 2008 y
continua), desarrollando tareas de investigación, análisis, planificación y coordinación de actividades. !


En conjunto trabajan en el Proyecto Ventura,
una herramienta de monitoreo de opinión pública
sobre temas políticos en la websocial; utilizando
tecnología de Text Analytics, recuperación y
procesamiento de textos, Procesamiento del
Lenguaje, Sentiment Analysis y Visualización de
Datos.



    7puentes.com!                           Data Analytics sobre Votaciones Nominales!
Data Analytics!
sobre Votaciones
Nominales!
Taller Transparencia & TIC !
Lic. Gabriela Perez, Lic. Ernesto Mislej!
gabriela, ernesto [@7puentes.com]!


Marzo 2011!

                                        7puentes.com!

Mais conteúdo relacionado

Destaque

Calidad de la salud en colombia
Calidad de la salud en colombiaCalidad de la salud en colombia
Calidad de la salud en colombialuisamariaamariles
 
Energie solaire et photovoltaïque avis Ademe - avril2013
Energie solaire et photovoltaïque avis Ademe -  avril2013Energie solaire et photovoltaïque avis Ademe -  avril2013
Energie solaire et photovoltaïque avis Ademe - avril2013Build Green
 
Globekid NeoDoc Presentation Bookcamp
Globekid NeoDoc Presentation BookcampGlobekid NeoDoc Presentation Bookcamp
Globekid NeoDoc Presentation Bookcampguest41b263
 
Webinaire : les soins pour la peau - TENAQUIP et GOJO
Webinaire : les soins pour la peau - TENAQUIP et GOJOWebinaire : les soins pour la peau - TENAQUIP et GOJO
Webinaire : les soins pour la peau - TENAQUIP et GOJOTENAQUIP
 
Datos históricos del tiempo en España
Datos históricos del tiempo en EspañaDatos históricos del tiempo en España
Datos históricos del tiempo en Españamariocueto96
 
Ley de fomento ambiental
Ley de fomento ambientalLey de fomento ambiental
Ley de fomento ambientalMalu Penafiel
 
[Odimat] tarifs et detail des prestations de referencement
[Odimat] tarifs et detail des prestations de referencement[Odimat] tarifs et detail des prestations de referencement
[Odimat] tarifs et detail des prestations de referencementODIMAT Referencement
 
Dos aspirinas disueltas en agua g
Dos aspirinas disueltas en agua gDos aspirinas disueltas en agua g
Dos aspirinas disueltas en agua gEnrique Lucha
 
P resentacion generalidades unidad 3
P resentacion generalidades unidad 3P resentacion generalidades unidad 3
P resentacion generalidades unidad 3Rosa Ma Barrón
 
Diapositives Societat Coneixement
Diapositives Societat ConeixementDiapositives Societat Coneixement
Diapositives Societat Coneixementesthersv
 
Recursos Digitales
Recursos DigitalesRecursos Digitales
Recursos Digitalesyuliguerrero
 

Destaque (20)

Calidad de la salud en colombia
Calidad de la salud en colombiaCalidad de la salud en colombia
Calidad de la salud en colombia
 
Energie solaire et photovoltaïque avis Ademe - avril2013
Energie solaire et photovoltaïque avis Ademe -  avril2013Energie solaire et photovoltaïque avis Ademe -  avril2013
Energie solaire et photovoltaïque avis Ademe - avril2013
 
Globekid NeoDoc Presentation Bookcamp
Globekid NeoDoc Presentation BookcampGlobekid NeoDoc Presentation Bookcamp
Globekid NeoDoc Presentation Bookcamp
 
Pp joelle habchy
Pp joelle habchyPp joelle habchy
Pp joelle habchy
 
Webinaire : les soins pour la peau - TENAQUIP et GOJO
Webinaire : les soins pour la peau - TENAQUIP et GOJOWebinaire : les soins pour la peau - TENAQUIP et GOJO
Webinaire : les soins pour la peau - TENAQUIP et GOJO
 
Datos históricos del tiempo en España
Datos históricos del tiempo en EspañaDatos históricos del tiempo en España
Datos históricos del tiempo en España
 
agriculteurs
agriculteursagriculteurs
agriculteurs
 
Présentation travaux
Présentation travauxPrésentation travaux
Présentation travaux
 
Cambios de la materia
Cambios de la materiaCambios de la materia
Cambios de la materia
 
Ley de fomento ambiental
Ley de fomento ambientalLey de fomento ambiental
Ley de fomento ambiental
 
[Odimat] tarifs et detail des prestations de referencement
[Odimat] tarifs et detail des prestations de referencement[Odimat] tarifs et detail des prestations de referencement
[Odimat] tarifs et detail des prestations de referencement
 
Dos aspirinas disueltas en agua g
Dos aspirinas disueltas en agua gDos aspirinas disueltas en agua g
Dos aspirinas disueltas en agua g
 
Anitapaute
AnitapauteAnitapaute
Anitapaute
 
P resentacion generalidades unidad 3
P resentacion generalidades unidad 3P resentacion generalidades unidad 3
P resentacion generalidades unidad 3
 
Beautes Du Monde
Beautes Du MondeBeautes Du Monde
Beautes Du Monde
 
Ivon diaz
Ivon diazIvon diaz
Ivon diaz
 
Diapositives Societat Coneixement
Diapositives Societat ConeixementDiapositives Societat Coneixement
Diapositives Societat Coneixement
 
Recursos Digitales
Recursos DigitalesRecursos Digitales
Recursos Digitales
 
Buenas prácticas docentes
Buenas prácticas docentesBuenas prácticas docentes
Buenas prácticas docentes
 
Glosario de internet
Glosario de internetGlosario de internet
Glosario de internet
 

Semelhante a Data analytics sobre votaciones nominales

Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de TextosErnesto Mislej
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Fernando Santamaría
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando SantamariaNivel 7
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosSandra Crucianelli
 
Periodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasPeriodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasSandra Crucianelli
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
LA NACIÓN Data
LA NACIÓN DataLA NACIÓN Data
LA NACIÓN DataFopea
 
Plan de Incidencia Política: Ley infogobierno 2014 /Venezuela
Plan de Incidencia Política: Ley infogobierno 2014 /VenezuelaPlan de Incidencia Política: Ley infogobierno 2014 /Venezuela
Plan de Incidencia Política: Ley infogobierno 2014 /VenezuelaJuan Blanco
 
Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016Roberto Muñoz
 
Informe final de análisis de estimadores de razón
Informe final de análisis de estimadores de razónInforme final de análisis de estimadores de razón
Informe final de análisis de estimadores de razónRonaldo Leal
 
Aplicaciones basada en datos publicos
Aplicaciones basada en datos publicosAplicaciones basada en datos publicos
Aplicaciones basada en datos publicosDario Wainer
 
Buscadores Internet - Corresponsales PIJ 2011
Buscadores Internet - Corresponsales PIJ 2011Buscadores Internet - Corresponsales PIJ 2011
Buscadores Internet - Corresponsales PIJ 2011Gabriel Navarro
 
Técnicas investigación social
Técnicas investigación socialTécnicas investigación social
Técnicas investigación socialMarjorie Picott
 
Atrapados en las redes caught in networks
Atrapados en las redes caught in networksAtrapados en las redes caught in networks
Atrapados en las redes caught in networksFrancisca garc?
 
Atrapados en las redes caught in networks
Atrapados en las redes caught in networksAtrapados en las redes caught in networks
Atrapados en las redes caught in networksFrancisca garc?
 
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogias
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogiasPredicciónes tecnológicas: Metodos descriptivos y matrices, analogias
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogiasIleana Garza Ibarra
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.www.cathedratic.com
 

Semelhante a Data analytics sobre votaciones nominales (20)

Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de Textos
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria"Educación y datos masivos (Big Data)" - Fernando Santamaria
"Educación y datos masivos (Big Data)" - Fernando Santamaria
 
White paper
White paperWhite paper
White paper
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de Datos
 
Periodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas PrácticasPeriodismo de Datos: Definiciones y Buenas Prácticas
Periodismo de Datos: Definiciones y Buenas Prácticas
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
LA NACIÓN Data
LA NACIÓN DataLA NACIÓN Data
LA NACIÓN Data
 
Plan de Incidencia Política: Ley infogobierno 2014 /Venezuela
Plan de Incidencia Política: Ley infogobierno 2014 /VenezuelaPlan de Incidencia Política: Ley infogobierno 2014 /Venezuela
Plan de Incidencia Política: Ley infogobierno 2014 /Venezuela
 
Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016Ciencia de datos - CIO Update 2016
Ciencia de datos - CIO Update 2016
 
Informe final de análisis de estimadores de razón
Informe final de análisis de estimadores de razónInforme final de análisis de estimadores de razón
Informe final de análisis de estimadores de razón
 
Aplicaciones basada en datos publicos
Aplicaciones basada en datos publicosAplicaciones basada en datos publicos
Aplicaciones basada en datos publicos
 
Buscadores Internet - Corresponsales PIJ 2011
Buscadores Internet - Corresponsales PIJ 2011Buscadores Internet - Corresponsales PIJ 2011
Buscadores Internet - Corresponsales PIJ 2011
 
Técnicas investigación social
Técnicas investigación socialTécnicas investigación social
Técnicas investigación social
 
Atrapados en las redes caught in networks
Atrapados en las redes caught in networksAtrapados en las redes caught in networks
Atrapados en las redes caught in networks
 
Atrapados en las redes caught in networks
Atrapados en las redes caught in networksAtrapados en las redes caught in networks
Atrapados en las redes caught in networks
 
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogias
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogiasPredicciónes tecnológicas: Metodos descriptivos y matrices, analogias
Predicciónes tecnológicas: Metodos descriptivos y matrices, analogias
 
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
Procesamiento de lenguaje natural y Analítica de Texto - Primera parte.
 

Mais de transparenciatic

Presentación vota inteligente vc 31 de marzo
Presentación vota inteligente vc 31 de marzoPresentación vota inteligente vc 31 de marzo
Presentación vota inteligente vc 31 de marzotransparenciatic
 
Congreso visible ppt 31 vc de marzo
Congreso visible ppt 31 vc de marzoCongreso visible ppt 31 vc de marzo
Congreso visible ppt 31 vc de marzotransparenciatic
 
Tecnologia para la transparencia en Latinoamérica
Tecnologia para la transparencia en LatinoaméricaTecnologia para la transparencia en Latinoamérica
Tecnologia para la transparencia en Latinoaméricatransparenciatic
 
Transparencia 2.0: TIC y gestión pública.
Transparencia 2.0: TIC y  gestión pública.Transparencia 2.0: TIC y  gestión pública.
Transparencia 2.0: TIC y gestión pública.transparenciatic
 
La web latinoamericana, ¿un espacio para la transparencia?
La web latinoamericana, ¿un espacio para la transparencia?La web latinoamericana, ¿un espacio para la transparencia?
La web latinoamericana, ¿un espacio para la transparencia?transparenciatic
 

Mais de transparenciatic (6)

Presentación vota inteligente vc 31 de marzo
Presentación vota inteligente vc 31 de marzoPresentación vota inteligente vc 31 de marzo
Presentación vota inteligente vc 31 de marzo
 
Congreso visible ppt 31 vc de marzo
Congreso visible ppt 31 vc de marzoCongreso visible ppt 31 vc de marzo
Congreso visible ppt 31 vc de marzo
 
Tecnologia para la transparencia en Latinoamérica
Tecnologia para la transparencia en LatinoaméricaTecnologia para la transparencia en Latinoamérica
Tecnologia para la transparencia en Latinoamérica
 
Transparencia 2.0: TIC y gestión pública.
Transparencia 2.0: TIC y  gestión pública.Transparencia 2.0: TIC y  gestión pública.
Transparencia 2.0: TIC y gestión pública.
 
La web latinoamericana, ¿un espacio para la transparencia?
La web latinoamericana, ¿un espacio para la transparencia?La web latinoamericana, ¿un espacio para la transparencia?
La web latinoamericana, ¿un espacio para la transparencia?
 
Footer
FooterFooter
Footer
 

Data analytics sobre votaciones nominales

  • 1. Data Analytics! sobre Votaciones Nominales! Taller Transparencia & TIC ! Lic. Gabriela Perez, Lic. Ernesto Mislej! gabriela, ernesto [@7puentes.com]! Marzo 2011! 7puentes.com!
  • 2. Resumen Hackathon OpenGov GarageLab - UdeSA! Durante Septiembre de 2010 participamos de la hackathon OpenGov, organizada por GarageLab y la Universidad de San Andrés, quien convocaba a Hackers(*) y a Cientistas Sociales a elaborar herramientas para promover la transparencia en los datos públicos. ! De ese encuentro de dos días de trabajo surgieron 4 proyectos, vinculados a gasto público, registro de audiencias, información georeferenciada sobre la cuenca matanza-riachuelo y análisis de grupos de afinidad de legisladores según votaciones nominales, éste último integrado por 7P.! (*): Léase “informáticos con iniciativa”! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 3. Resumen Hackathon OpenGov GarageLab - UdeSA! http://garagelab.tumblr.com/post/1985840685/votosdiputados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 4. Análisis de Legislaturas! Objetivo: ! Construir una herramienta para el " Análisis de Legislaturas.! Análisis de votaciones nominales, descripción y predicción de comportamiento, inducción de grupos de afinidad. ! Audiencia: ! - Investigadores en Ciencia Política! - Periodistas especializados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 5. Análisis de Grupos de Afinidad de Legisladores! ¿Qué son 2 legisladores afines?! Modelar y caracterizar a los actores y ! luego encontrar grupos de actores similares! Según su forma/contenido:! - Bloque, edad, sexo, provincia, comisión…! - Según su comportamiento:! - Co-firma en presentaciones de proyectos de ley! - Votaciones Nominales "! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 6. Pipeline de análisis! Recuperar y extraer la información de las fuentes! Completar el modelo de datos ! Preparar los datos para el análisis! Aplicar las técnicas y algoritmos! Presentar los resultados! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 7. Grupos de actores con características similares. En este caso, secuencia de votos similares. Matriz vis, similitud=votos
  • 8. Inducción de metabloques, grupo de legisladores con patrones de votos similares Heat map color=tipo_voto, filas=legislador, columnas=votación, filas reordenadas
  • 9. 2 1 Casos outliers, que quiebran el patrón común 1. la modificación al Código Civil incorporando el matrimonio entre personas del mismo sexo; 2. Fondo del Bicentenario para el Desendeudamiento y la Estabilidad (la utilización de reservas del tesoro nacional para el pago de deuda externa, cuya discusión llevó a la destitución/renuncia de Martín Redrado del Banco Central); http://bit.ly/9VPqCg !
  • 10. Insights - eurekas!! Votaciones outliers, fuera del patrón común.! El meta-bloque de oposición.! El comportamiento de bloques pequeños como Proyecto Sur.! Membresía partidaria como principal descriptor.! Caso Matrimonio Igualitario, donde se quiebra el patrón. ! Otras variables descriptivas y predictoras.! Dimensionalidad del espacio de votaciones.! Trabajo Futuro! Desarrollar una herramienta de análisis interactiva.! Sumar componente temporal al análisis.! Especificar similitud de actores a partir de otras fórmulas.! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 11. Dimensionalidad y ! poder descriptivo de variables ! ! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 12. Herramientas utilizadas! Recuperación de datos: Se construyeron robots para la recuperación de las planillas de votaciones nominales publicadas en el sitio del HCDN. Las planillas están en formato PDF. Los robots fueron programados en Ruby utilizando librerías de scrapping (open-uri, Hpricot)! Preparación de datos: Se armaron pequeños programas de procesamiento de textos para la traducción de formatos también en Ruby. Para trabajar con los formatos PDF, se utilizó la librería pdfreader. ! Análisis: Se aplicaron técnicas de clustering, métodos de agrupamiento de individuos según su similitud. En este proyecto se utilizaron las suites de Data Mining Weka y CLUTO.! Presentación y Visualización de Datos: Se aplicaron las metáforas visuales de visualización de matrices, heatmaps y treemaps. Se utilizaron las herramientas Protovis y ManyEyes. ! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 13. Referencias! Ruby: http://www.ruby-lang.org/es/ ! Hpricot: https://github.com/hpricot/hpricot/wiki ! PDFReader: http://rubyforge.org/projects/pdf-reader! Weka: http://www.cs.waikato.ac.nz/ml/weka/! CLUTO: http://glaros.dtc.umn.edu/gkhome/views/cluto/! Protovis: http://vis.stanford.edu/protovis/! Manyeyes: http://www-958.ibm.com/software/data/cognos/manyeyes/! Heatmaps: http://en.wikipedia.org/wiki/Heat_map! Matrix Visualization: http://vis.stanford.edu/protovis/ex/matrix.html! Treemaps: http://www.cs.umd.edu/hcil/treemap/! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 14. Nuestra empresa – 7Puentes! 7Puentes está conformada por un equipo de jóvenes profesionales de computación egresados de la Universidad de Buenos Aires (UBA) con amplia experiencia en el campo laboral y académico. ! Fundada en el año 2007 el objetivo de la empresa está focalizado en soluciones de sofware y análisis de datos de alto valor e investigación científica para el tratamiento eficaz de información compleja.! Contamos con experiencias exitosas de constucción de software y consultoría en el mercado local e internacional; en la actualidad poseemos proyectos activos y propuestas en desarrollo. ! Nuestro grupo posee una organización horizontal y flexible lo que permite adaptarnos a la magnitud y particularidad de cada proyecto de manera efectiva, valiéndonos de profesionales en cada área específica. En nuestra historia hemos contado con la colaboración de expertos de diferentes disciplinas como ciencias políticas, económicas y de la comunicación.! 7Puentes de Königsberg Gerli La empresa posee sus oficinas en Banfield, situadas al sur del gran Buenos Aires, a 15 km. del obelisco porteño de la Ciudad Autónoma de Buenos Aires.! 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 15. Nuestro Equipo! Lic. Ernesto Mislej Responsable del área 7PLabs. Su área de experiencia profesional y académica es en Inteligencia Artificial, Aprendizaje Automático y Visualización de Datos. Actualmente está liderando proyectos en Opinion Mining. Es Lic. en Cs. de la Computación graduado de la Facultad de Ciencias Exactas y Naturales de la UBA, donde se desempeña como docente en la maestría de Data Mining & Knowledge Discovery y JTP del área Inteligencia Artificial en la licenciatura.! Lic. Gabriela Perez Licenciada en Ciencia Política de la Universidad Nacional de Rosario (1999), se especializó en Administración y Políticas Públicas en la Universidad de San Andrés (2001-2003). Fue asesora parlamentaria en el H. Senado de la Nación (2002-2006). Desde entonces es consultora en proyectos de cooperación internacional (Proyecto de Modernización del Estado (BIRF), 2006-2007 y Proyecto de Fortalecimiento del Sistema de Protección de los Derechos Humanos (UE) desde 2008 y continua), desarrollando tareas de investigación, análisis, planificación y coordinación de actividades. ! En conjunto trabajan en el Proyecto Ventura, una herramienta de monitoreo de opinión pública sobre temas políticos en la websocial; utilizando tecnología de Text Analytics, recuperación y procesamiento de textos, Procesamiento del Lenguaje, Sentiment Analysis y Visualización de Datos. 7puentes.com! Data Analytics sobre Votaciones Nominales!
  • 16. Data Analytics! sobre Votaciones Nominales! Taller Transparencia & TIC ! Lic. Gabriela Perez, Lic. Ernesto Mislej! gabriela, ernesto [@7puentes.com]! Marzo 2011! 7puentes.com!