Este documento describe el uso del análisis de datos sociales (social mining) para obtener conocimiento a partir de datos en redes sociales y aplicarlo a la toma de decisiones de marketing digital. Explica el desarrollo de un prototipo que almacena y consulta datos de Twitter e Instagram sobre intereses de viaje usando la base de datos Cassandra, aunque se requiere más análisis de datos no estructurados para mejorar las búsquedas. Finalmente, propone expandir el almacenamiento y análisis de datos a otras aplicaciones web y móviles
7. Social Mining
• Análisis de Datos (Analytics) en “Social Media”
para obtener conocimiento para la toma
efectiva de decisiones.
• Va más allá de información estadística
8. Introducción
• Proyecto de Estímulo a la Innovación
CONACyT: Efecto Mescalina-ITM-ITESM
Campus Morelia
• Sistema de Interconexión entre la Web 2.0 y el
Internet de las Cosas para Aplicaciones de
Marketing Digital
9. Introducción
• Análisis de Tweets y de Mensajes en Instagram
para detectar intereses de viajes.
• Problemática en el almacenamiento de datos y
búsqueda de información
10. Desarrollo
• Revisión Teórica del Estado del Arte
• Esquemas de Almacenamiento Físico
• Bases de Datos NOSQL
• Herramientas para Análisis
11. Desarrollo
• Se utilizó el manejador de base de datos
Cassandra debido a su facilidad de migración
con su lenguaje CQL (Muy Similar a SQL de
Dialectos como MySQL)
13. Conclusiones
• Se cuenta con un pequeño prototipo que
almacena, consulta y muestra información
usando un esquema de Big Data.
• Hace falta realizar un análisis de información
no estructurada para mejorar búsquedas.
14. Trabajo Futuro
• Análisis en profundidad de almacenamiento
físico para otras bases de datos (Diabetes)
• Explotación de datos en aplicaciones Web y
Móviles.
15.
16. Agradecimientos
• M.C. Cristhian Torres Millarez
• Lic. Jorge Sánchez Vega
• Programa Delfín: ITS Huetamo, Puruándiro y
De los Ríos
M.C. Juan Carlos Olivares Rojas
jcolivares@itmorelia.edu.mx
En los últimos años, el volumen de información en las aplicaciones ha crecido de forma exponecialmente. Desafortunadamente las bases de datos relacionales comienzan a mostrar signos de estrés en entornos donde el almacenamiento, la búsqueda, y la compartición de los datos en grandes volúmenes son el pan nuestro de cada día, por tal motivo se necesita de nuevos esquemas de almacenamiento de información como el “Big Data”.
Consiste en convertir datos imperfectos, no estructurados y complejos acerca del estado de bienestar de las personas, en información procesable, que reduzca las brechas temporales y de conocimiento para:
Tomar decisiones de política pública que respondan oportunamente a determinadas situaciones
Tener rápida retroalimentación sobre el impacto de tales políticas.
Permite generar información inteligente que puede ahorrar recursos en la generación de estadísticas para políticas de desarrollo.
La analítica de grandes datos se refiere a las herramientas y metodologías par transformar cantidades masivas de datos brutos en “datos sobre datos” con propósitos analíticos
Se originó en las áreas de biología intensiva en cómputo, ingeniería biomédica, medicina y electrónica
Algoritmos para detectar patrones, tendencias y correlaciones, en varios horizontes temporales, en los datos
Uso de técnicas avanzadas de visualización: datos que hacen sentido
En este trabajo, se utiliza un esquema de Big Data para dar soluciónes a almacenamiento de aplicaciones de redes sociales, donde en grandes volumenes de datos se pretende encontrar conocimiento, a esto se le denomina social mining.
Resultando como herramientas viables para el análisis de los datos: Pentaho, InfiniDB, InfoBright, base de datos no relacionales (MongoDB, Cassandra). Dichas herramientas fueron instaladas y utilizadas. Teniendo como modelo relacional una BD de una aplicación social que usa la API detwitter, se normalizo a la estructura NoSQL de Cassandra del cual se realizaron consultas para obtener información específica sobre el planteamiento del problema
Resultando como herramientas viables para el análisis de los datos: Pentaho, InfiniDB, InfoBright, base de datos no relacionales (MongoDB, Cassandra). Dichas herramientas fueron instaladas y utilizadas. Teniendo como modelo relacional una BD de una aplicación social que usa la API detwitter, se normalizo a la estructura NoSQL de Cassandra del cual se realizaron consultas para obtener información específica sobre el planteamiento del problema