SlideShare una empresa de Scribd logo
1 de 42
¿Qué hace la gente en Monterrey?
Foro: Data Science & Python MTY Join Meetup
Análisis de Datos de Twitter y Foursquare
Impartida por:
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Acerca de Nosotros: Equipo Datlas
blogdatlas.
wordpress.com
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Objetivos de la sesión:
¿Qué hace la gente en Monterrey?
Queremos entender la dinámica
recreativa por medio de check-ins:
• ¿A qué lugares salen?
• ¿En qué horarios y qué días de la
semana salen?
• ¿Cuáles son sus lugares
favoritos?
• ¿Qué plaza comercial es la más
visitada?
• ¿Cuál es su cine favorito?
• Entre otros….
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Datos que hablan…
• Utilizamos los registros de & compartidos en
• ¿Cómo haces check-in?
• ¿Por qué hacer check-in? → Recomendaciones, calificas los lugares y
puedes ver donde están tus amigos.
Podemos interpretar la información de
checkins para entender la dinámica de una
ciudad
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Metodología
• Método: Analizamos información de check-ins compartida en Twitter
por usuarios de Nuevo León
• ¿Cómo? Utilizamos en Python la librería de “tweepy” que permite
autentificarte y extraer los tweets de una manera relativamente
sencilla
• Para el Análisis: Usamos tweets con check-ins geo referenciados en la
zona metropolitana de Monterrey
• Para Visualizar: Usamos Google Fusion Tables por su facilidad para
manejar grandes cantidades de datos en la nube, usar Google Maps
para hacer mapeo de puntos, además de ser muy intuitivo.
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Primeros pasos: Registrarse para API
Twitter
• Registrarse como Developer en el sitio de Twitter
Primeros pasos: Registrarse para API
Twitter
• Registrarse como Developer en el sitio de Twitter
• Con eso te dan una clave para usar su API y descargar Tweets
• Limitante: Sólo se pueden bajar los últimos 100 tweets por
llamada.
• Tip: Hacer un ciclo con un máximo de 450 llamadas cada 15
minutos.
¿Cómo es la estructura del Tweet? Pt.1
• La llamada a la API de twitter te regresa un JSON que se ve así…
¿Cómo es la estructura del Tweet? Pt.2
• La llamada a la API de twitter te regresa un JSON que se ve así…
¿Cómo es la estructura del Tweet? Pt.3
Pasos a Seguir: → Variables
• Hacemos una extracción y filtrado de las variables que nos interesan
• Ajustamos la zona horaria a la correspondiente a México
• Filtramos por location (eliminamos los tweets que no estén
georeferenciados)
• Quitamos caracteres, signos, links o fotos para una mejor lectura del
tweet
• Extraemos y damos formato a la fecha
• Limpiamos los nombres de los usuarios
Pasos a Seguir: Variables → Diccionario
• Se hace un “diccionario” en Python que contiene las variables de
interés del tweet
• Se renombran las variables
Pasos a Seguir: Diccionario →
• Se utiliza la librería pandas para manipular datos y conservar el
rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
• Se utiliza la librería pandas para manipular datos y conservar el
rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
• Se realiza la conversión a CSV, facilitado por la misma librería.
Pasos a Seguir: →
Pasos a Seguir: → Spreadsheet
• Hacemos una validación visual de que las columnas estén en orden.
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Pasos a Seguir: Spreadsheet → Visualización
• Creamos una Fusion Table seleccionando nuestro archivo CSV.
(En nuestro caso cargamos un nuevo archivo cada semana)
http://fusiontables.google.com
Pasos a Seguir: Spreadsheet → Visualización
• Fusion Tables detecta las columnas lat y long como geo referencia
para proponernos un mapa por default con la información
• Tomando esta referencia podemos tener un mapa como este…
Mapa de Tweets
También se pueden hacer otras personalizaciones como
una Categorización de Tweets por hora
Personalización de pop-ups
Resumen de estadísticas
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
Nuestro ejemplo de Mapa para Monterrey:
Analizando por Mapas de Calor
Analizando por Mapas de Calor las
zonas más “calientes” en fin de semana
Aeropuerto Internac.
Parque Fundidora
Paseo La Fe
Esfera City Center
Nuevo Sur
Galerías Monterrey
Centrito Valle
Plaza Fiesta San Ag.
Galerías Valle Oriente
Tec de Monterrey
Barrio Antiguo
¿Qué días hubo más actividad?
• Los días con más actividad son los días después de la
quincena y los fines de semana. Tiene lógica, ¿no?
¿A qué horas incrementa la actividad?
• A partir de las 6 de la tarde hay un incremento en las visitas a
parques, estadios, restaurantes y al cine.
Resumen de Hallazgos
• ¿Qué actividades ocasionaron más tráfico?
• Más de 6,000 lugares que registraron check-ins,
encontramos como principales motivadores:
eventos deportivos y estrenos de cine
• En los 3 sábados de Julio:
• Partidos de fútbol 45-52% de los check-ins
• Peliculas de estreno
Hallazgos recientes
Y todo esto ¿Para qué?
• ¿Dónde pongo mi negocio o dónde me expando?
• ¿En qué zonas me puedo anunciar dado que hay más
tráfico de personas en fin de semana?
• ¿En qué lugares los clientes son más exigentes con
sus comentarios?
Este tipo de análisis es útil para comercios que quieren posicionarse con sus
consumidores, entender la dinámica diaria de su mercado meta, y responder
preguntas como:
Agenda
1. Acerca de Nosotros
2. Objetivos de la sesión
3. Datos de Foursquare & Twitter ¿Cómo funcionan?
4. Análisis de Datos
1. Metodología
2. Extracción y procesamiento: Twitter → Python
3. Visualización: Python → Google Fusion Tables
5. Potencial de Uso – Caso de Monterrey
6. ¿Qué hacemos en Datlas?
¿Qué es Datlas?
Link: http://www.thedatlas.com/
Invitación a DEMO y Taller en INCMTY
Suscríbanse para un DEMO y
si nos dan retro les mandaremos
Un archivo con una semana de tweets:
http://www.thedatlas.com/
Daremos un taller en INCMTY 2016
Título: “Datlas: tengo una idea ¿Dónde la pongo?”
Contacto:
contacto@thedatlas.com
Suscríbanse para demo gratis en:
www.thedatlas.com
Lean nuestro blog:
https://blogdatlas.wordpress.com/
Gracias por su tiempo

Más contenido relacionado

Similar a Datlas - BigData con Twitter - Qué hace la gente en Monterrey

Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)
Jio Nox
 
Analítica web para consultores ux
Analítica web para consultores uxAnalítica web para consultores ux
Analítica web para consultores ux
Jordi Galobart
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de Datos
SocialTIC
 
Metodologia de investigacion
Metodologia de investigacionMetodologia de investigacion
Metodologia de investigacion
Rodolfo Alvarez
 

Similar a Datlas - BigData con Twitter - Qué hace la gente en Monterrey (20)

Ii curso oficial de coolhunting marzo 11
Ii curso oficial de coolhunting   marzo 11Ii curso oficial de coolhunting   marzo 11
Ii curso oficial de coolhunting marzo 11
 
Minería de datos (práctica twitter)
Minería de datos (práctica twitter)Minería de datos (práctica twitter)
Minería de datos (práctica twitter)
 
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de TwitterSocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
SocialBro: Cómo sacar el máximo partido a tus contactos de Twitter
 
Curs 2.7. Análisis de datos de redes sociales
Curs 2.7. Análisis de datos de redes socialesCurs 2.7. Análisis de datos de redes sociales
Curs 2.7. Análisis de datos de redes sociales
 
Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)Sumo Logic Cert Jam - Fundamentals (Spanish)
Sumo Logic Cert Jam - Fundamentals (Spanish)
 
Analítica de datos en comunicación política
Analítica de datos en comunicación políticaAnalítica de datos en comunicación política
Analítica de datos en comunicación política
 
Otra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo RuizOtra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
Otra forma de escuchar a través de Internet (BiMe), Gonzalo Ruiz
 
Tutorial Buscar Informacion. 1
Tutorial Buscar Informacion. 1Tutorial Buscar Informacion. 1
Tutorial Buscar Informacion. 1
 
Analítica web para consultores ux
Analítica web para consultores uxAnalítica web para consultores ux
Analítica web para consultores ux
 
Taller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineTaller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa online
 
Obtención de datos de redes sociales
Obtención de datos de redes socialesObtención de datos de redes sociales
Obtención de datos de redes sociales
 
My tools @ridehf
My tools @ridehfMy tools @ridehf
My tools @ridehf
 
Coolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena AgroalimentariaCoolhunting Empresarial para Gestores de la Cadena Agroalimentaria
Coolhunting Empresarial para Gestores de la Cadena Agroalimentaria
 
Exprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBroExprime tu Comunidad de Twitter con SocialBro
Exprime tu Comunidad de Twitter con SocialBro
 
Maestros del tweet - Spa Mencey
Maestros del tweet - Spa MenceyMaestros del tweet - Spa Mencey
Maestros del tweet - Spa Mencey
 
Estrategia para la Apertura de Datos
Estrategia para la Apertura de DatosEstrategia para la Apertura de Datos
Estrategia para la Apertura de Datos
 
Vigilancia 2.0
Vigilancia 2.0Vigilancia 2.0
Vigilancia 2.0
 
Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0Vigilancia Tecnologica 2.0
Vigilancia Tecnologica 2.0
 
Seminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMOSeminario Sevilla: Content Manager y SMO
Seminario Sevilla: Content Manager y SMO
 
Metodologia de investigacion
Metodologia de investigacionMetodologia de investigacion
Metodologia de investigacion
 

Último

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 

Último (20)

biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 

Datlas - BigData con Twitter - Qué hace la gente en Monterrey

  • 1. ¿Qué hace la gente en Monterrey? Foro: Data Science & Python MTY Join Meetup Análisis de Datos de Twitter y Foursquare Impartida por:
  • 2. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 3. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 4. Acerca de Nosotros: Equipo Datlas blogdatlas. wordpress.com
  • 5. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 6. Objetivos de la sesión: ¿Qué hace la gente en Monterrey? Queremos entender la dinámica recreativa por medio de check-ins: • ¿A qué lugares salen? • ¿En qué horarios y qué días de la semana salen? • ¿Cuáles son sus lugares favoritos? • ¿Qué plaza comercial es la más visitada? • ¿Cuál es su cine favorito? • Entre otros….
  • 7. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 8. Datos que hablan… • Utilizamos los registros de & compartidos en • ¿Cómo haces check-in? • ¿Por qué hacer check-in? → Recomendaciones, calificas los lugares y puedes ver donde están tus amigos.
  • 9. Podemos interpretar la información de checkins para entender la dinámica de una ciudad
  • 10. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 11. Metodología • Método: Analizamos información de check-ins compartida en Twitter por usuarios de Nuevo León • ¿Cómo? Utilizamos en Python la librería de “tweepy” que permite autentificarte y extraer los tweets de una manera relativamente sencilla • Para el Análisis: Usamos tweets con check-ins geo referenciados en la zona metropolitana de Monterrey • Para Visualizar: Usamos Google Fusion Tables por su facilidad para manejar grandes cantidades de datos en la nube, usar Google Maps para hacer mapeo de puntos, además de ser muy intuitivo.
  • 12. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 13. Primeros pasos: Registrarse para API Twitter • Registrarse como Developer en el sitio de Twitter
  • 14. Primeros pasos: Registrarse para API Twitter • Registrarse como Developer en el sitio de Twitter • Con eso te dan una clave para usar su API y descargar Tweets • Limitante: Sólo se pueden bajar los últimos 100 tweets por llamada. • Tip: Hacer un ciclo con un máximo de 450 llamadas cada 15 minutos.
  • 15. ¿Cómo es la estructura del Tweet? Pt.1 • La llamada a la API de twitter te regresa un JSON que se ve así…
  • 16. ¿Cómo es la estructura del Tweet? Pt.2 • La llamada a la API de twitter te regresa un JSON que se ve así…
  • 17. ¿Cómo es la estructura del Tweet? Pt.3
  • 18. Pasos a Seguir: → Variables • Hacemos una extracción y filtrado de las variables que nos interesan • Ajustamos la zona horaria a la correspondiente a México • Filtramos por location (eliminamos los tweets que no estén georeferenciados) • Quitamos caracteres, signos, links o fotos para una mejor lectura del tweet • Extraemos y damos formato a la fecha • Limpiamos los nombres de los usuarios
  • 19. Pasos a Seguir: Variables → Diccionario • Se hace un “diccionario” en Python que contiene las variables de interés del tweet • Se renombran las variables
  • 20. Pasos a Seguir: Diccionario → • Se utiliza la librería pandas para manipular datos y conservar el rango de fechas de nuestro interés. (de Lunes anterior al Domingo)
  • 21. • Se utiliza la librería pandas para manipular datos y conservar el rango de fechas de nuestro interés. (de Lunes anterior al Domingo) • Se realiza la conversión a CSV, facilitado por la misma librería. Pasos a Seguir: →
  • 22. Pasos a Seguir: → Spreadsheet • Hacemos una validación visual de que las columnas estén en orden.
  • 23. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 24. Pasos a Seguir: Spreadsheet → Visualización • Creamos una Fusion Table seleccionando nuestro archivo CSV. (En nuestro caso cargamos un nuevo archivo cada semana) http://fusiontables.google.com
  • 25. Pasos a Seguir: Spreadsheet → Visualización • Fusion Tables detecta las columnas lat y long como geo referencia para proponernos un mapa por default con la información • Tomando esta referencia podemos tener un mapa como este…
  • 27. También se pueden hacer otras personalizaciones como una Categorización de Tweets por hora
  • 30. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 31. Nuestro ejemplo de Mapa para Monterrey:
  • 33. Analizando por Mapas de Calor las zonas más “calientes” en fin de semana Aeropuerto Internac. Parque Fundidora Paseo La Fe Esfera City Center Nuevo Sur Galerías Monterrey Centrito Valle Plaza Fiesta San Ag. Galerías Valle Oriente Tec de Monterrey Barrio Antiguo
  • 34. ¿Qué días hubo más actividad? • Los días con más actividad son los días después de la quincena y los fines de semana. Tiene lógica, ¿no?
  • 35. ¿A qué horas incrementa la actividad? • A partir de las 6 de la tarde hay un incremento en las visitas a parques, estadios, restaurantes y al cine.
  • 36. Resumen de Hallazgos • ¿Qué actividades ocasionaron más tráfico? • Más de 6,000 lugares que registraron check-ins, encontramos como principales motivadores: eventos deportivos y estrenos de cine • En los 3 sábados de Julio: • Partidos de fútbol 45-52% de los check-ins • Peliculas de estreno
  • 38. Y todo esto ¿Para qué? • ¿Dónde pongo mi negocio o dónde me expando? • ¿En qué zonas me puedo anunciar dado que hay más tráfico de personas en fin de semana? • ¿En qué lugares los clientes son más exigentes con sus comentarios? Este tipo de análisis es útil para comercios que quieren posicionarse con sus consumidores, entender la dinámica diaria de su mercado meta, y responder preguntas como:
  • 39. Agenda 1. Acerca de Nosotros 2. Objetivos de la sesión 3. Datos de Foursquare & Twitter ¿Cómo funcionan? 4. Análisis de Datos 1. Metodología 2. Extracción y procesamiento: Twitter → Python 3. Visualización: Python → Google Fusion Tables 5. Potencial de Uso – Caso de Monterrey 6. ¿Qué hacemos en Datlas?
  • 40. ¿Qué es Datlas? Link: http://www.thedatlas.com/
  • 41. Invitación a DEMO y Taller en INCMTY Suscríbanse para un DEMO y si nos dan retro les mandaremos Un archivo con una semana de tweets: http://www.thedatlas.com/ Daremos un taller en INCMTY 2016 Título: “Datlas: tengo una idea ¿Dónde la pongo?”
  • 42. Contacto: contacto@thedatlas.com Suscríbanse para demo gratis en: www.thedatlas.com Lean nuestro blog: https://blogdatlas.wordpress.com/ Gracias por su tiempo