SlideShare una empresa de Scribd logo
1 de 54
Descargar para leer sin conexión
Big Data

Valor y Mercado

Óscar Marín Miró
@outliers_es
www.outliers.es

1
Contenidos
¿Qué es Big Data?
‣Historia
‣Las 3 V’s
‣Problema, Solución y Fenómeno

Valor del Big Data
‣Los Gigantes de la Generación de Datos
‣Nadamos en un mar de datos
‣Sectores de Aplicación

Pitfalls

‣Data vs Big Data
‣Data Science vs Big Data
‣Costes ocultos

Herramientas
+Escenarios
‣Ecosistema Hadoop
‣NoSQL
‣Real-time

Bibliografía
2
¿Qué es el Big Data?

“Data will help us” - Jonathan Harris
3
Historia

http:/
/assets.outliers.es/infographics/BigData_A_Brief_History.pdf

4
¿Qué es el Big Data?
“Big Data is a collection of data sets so large
and complex that it becomes difficult to
process using on-hand database management
tools or traditional data processing
applications”

http://en.wikipedia.org/wiki/Big_data
5
¿Qué es el Big Data?
-

Big Data y las 3 ‘V’

-

Velocidad
Volumen
Variedad

http://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-DataVolume-Velocity-and-Variety.pdf

6
¿Qué es el Big Data? (de verdad)
- Twitter: 340 millones de

tweets diarios (~= 1TB/día)

- Facebook: 800 millones de
status diarios

- Google: 1000 millones de
consultas diarias

http:/
/www.slideshare.net/gigaom/the-3vs-of-big-data-variety-velocityand-volume-from-structuredata-2012
7
¿Qué es el Big Data? (de verdad)

Explosión de Uso

Explosión Social

Explosión Móvil
8
Big Data: Dimensiones
‣Problema: 3 V’s
‣Solución: Herramientas
‣Fenómeno: Posibilidades

9
El Valor de Big Data

http://labratrevenge.com/pdx

10
El Valor de Big Data
http://7.mshcdn.com/wp-content/uploads/2012/06/DataNeverSleeps.jpg
11
El Valor de Big Data:
Big Data Analysis
‣Estadístico
‣Texto
‣Análisis de Redes Sociales
‣Análisis GeoEspacial

12
El Valor de Big Data:
Ámbitos de Aplicación
‣Marketing/Publicidad/Comunicación
‣Customer Insights
‣Growth Hacking
‣Salud
‣Escalabilidad

13
El Valor de Big Data:
Publicidad

https://de5w14y12gh72.cloudfront.net/website/bluefin_mit-tech-review.pdf
14
El Valor de Big Data:
Customer Insights

http://innovabbva.outliers.es/mapas.html
15
El Valor de Big Data:
Growth Hacking
‣Impactos de tests A/B
‣Incrementar el Retention Rate
‣Incrementar los leads
‣Incremental el engagement

16
El Valor de Big Data:
Growth Hacking

https://www.youtube.com/watch?v=eqeS8US10_k
17
El Valor de Big Data:
Salud

https://www.23andme.com/ancestry/
18
El Valor de Big Data
Ciencias Sociales

http://www.pewinternet.org/2014/02/20/part-2-conversational-archetypes-six-conversation-and-group-network-structures-in-twitter/
#network-type-6-support-network
19
El Valor de Big Data:
Publicidad

http://blog.marketo.com/2013/09/get-more-email-opens-and-clicks-using-behavioral-targeting.html

20
El Valor de Big Data
Escalabilidad

http://www.slideshare.net/davidpoblador/spotify-bcn2013slideshare
21
El Valor de Big Data
Antropología

http://www.ted.com/talks/what_we_learned_from_5_million_books.html
http://www.brainpickings.org/index.php/2014/01/17/uncharted-big-data/
22
El Valor de Big Data
Urbanismo

http://bcnbeats.outliers.es/

23
Big Data Pitfalls

24
Big Data vs Data
‣Big Data ~= MB/s o volúmenes de TB
‣El 90% de los trabajos hablan de Big Data y
quieren decir Data
‣No es lo mismo coger datos de Twitter
que ser Twitter
‣Se confunde el fenómeno con el problema

25
Data Science vs Big Data
‣Técnicamente:
‣Data Science crea modelos
‣Big Data provee de infraestructura
‣En la práctica:
‣Si creas un modelo a partir de una

muestra de Big Data haces Big Data
‣Los perfiles son COMPLETAMENTE
diferentes!!
‣Big Data sin Data Science no es NADA
26
Big Data: Costes Ocultos
‣Computer Science First, Big Data Second!!
‣Probar en muestras significativas, SIEMPRE
‣Llegar hasta la presentación de los datos
con la muestra, lo más rápido posible
‣Funcionar con hipótesis

27
Herramientas

28
El ecosistema Hadoop
¿Qué es un Cluster Hadoop?
Un conjunto de servidores (nodos), sobre el que se
ejecutan procesos MapReduce y que comparten
datos mediante HDFS (Hadoop Distributed File
System

29
Ecosistema Hadoop
MAPREDUCE: Divide y vencerás
MAP:
Función de procesado.
Los datos se particionan y se pasa cada ‘trozo’ a una función ‘map’
La función ‘map’ es sin estado

REDUCE
Función de reducción
La salida del map es la entrada del reduce
Se usa para consolidar y eliminar redundancias

30
Ecosistema Hadoop
MAPREDUCE: Contar las palabras de
un fichero
MAP:
< Hello, 1>
< World, 1>
< Bye, 1>
< World, 1>
REDUCE:
< Hello, 1>
< World, 2>
< Bye, 1>

31
Ecosistema Hadoop
MAPREDUCE: Control

‣ Se ejecutan ‘jobs’ que el framework divide
en ‘tasks’

‣ Master JobTracker
‣ TaskTracker por nodo
32
Ecosistema Hadoop
HDFS

‣ Implementa un único sistema de ficheros
‘juntando las capacidades’ de todos los
nodos

‣ Es transparente para el programador
‣ Se implementa tolerancia a fallos con nodos
de ‘backup’

33
Ecosistema Hadoop
HDFS

http://codemphasis.wordpress.com/2012/09/27/big-data-hadoop-hdfsand-mapreduce/
34
Ecosistema Hadoop

http://oreilly.com/data/radarreports/planning-for-big-data.csp
35
Soluciones NoSQL

VS

36
Soluciones NoSQL: MongoDB

37
Problemas de las BBDD
relacionales

‣ Leer datos completos es costoso (‘joins’)
‣ Transacciones (‘integridad’)
‣ Escalabilidad
‣ Cambio del modelo de datos (migraciones)
38
Soluciones NoSQL

‣ Almacenes clave-valor (Redis, BerkeleyDB,
Tokyo Cabinet)

‣ Orientadas a documento (MongoDB,
CouchDB, ElasticSearch, Solr)

‣ Orientadas a columnas (Cassandra, HBase,
BigTable)

39
Real-time processing

‣ Batch vs Real-time
‣ Hadoop anclado en Java
‣ Spark (Scala)
‣ Storm (Clojure)
http://www.ibm.com/developerworks/library/os-spark/#resources

40
Outliers Collective: Nuestras
Herramientas

‣ Visualización: D3.js
‣ Análisis:
‣ Texto: Python + Pattern
‣ Redes: Networkx + Gephi
‣ Estadística: R
‣ Persistencia: MongoDB, ElasticSearch
‣
41
Trabajos y ejemplos

http://assets.outliers.es/15memociones/

42
Outliers Collective+Prodigioso Volcán, 2014
http://elpais.com/especiales/2014/planeta-futuro/mapa-de-migraciones/
43
Outliers Collective, 2012
http://www.324.cat/eleccions-catalunya-2012/tuitometre
44
En Paradigma Tecnológico, 2009-2011
http://www.paginasamarillas.es/

45
En Paradigma Tecnológico, 2008
http://www.lainformacion.com/
46
Outliers Collective y Yolanda Quintana, 2013
http://viralgezi.outliers.es/
47
Outliers Collective, Alberto González Paje, Rafael Höhr, 2013
http://innovabbva.outliers.es/
48
Outliers Collective, 2013
http://flocker.outliers.es

49
Outliers Collective + Alberto González, 2013
http://assets.outliers.es/SocialGood/

50
Outliers Collective + Telenoika + Rocío Márquez + Patricia Benitez + Alberto González, 2013
http://vimeo.com/71084828
http://bcnbeats.outliers.es/
51
#LoQueCrece: IdeasForChange + Outliers Collective

52
Referencias

http://www.goodreads.com/shelf/show/big-data

53
¿Preguntas?
¡Gracias por el interés!

54

Más contenido relacionado

Destacado

Bpmn modelado negocios
Bpmn modelado negociosBpmn modelado negocios
Bpmn modelado negocios
gmp0079
 
Gestión de procesos del negocio bpmn
Gestión de procesos del negocio   bpmnGestión de procesos del negocio   bpmn
Gestión de procesos del negocio bpmn
Julio Pari
 
Ppt bonita
Ppt bonitaPpt bonita
Ppt bonita
lorena
 

Destacado (20)

Big Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxitoBig Data y Redes Sociales: Ejemplos y casos de éxito
Big Data y Redes Sociales: Ejemplos y casos de éxito
 
4. José Manuel Martínez. "Mitos y realidades del big data en salud"
4. José Manuel Martínez. "Mitos y realidades del big data en salud"4. José Manuel Martínez. "Mitos y realidades del big data en salud"
4. José Manuel Martínez. "Mitos y realidades del big data en salud"
 
Curso Procesos de ITIL Fundamental (contenidos)
Curso Procesos de ITIL Fundamental (contenidos)Curso Procesos de ITIL Fundamental (contenidos)
Curso Procesos de ITIL Fundamental (contenidos)
 
Frameworks JAVA EE 5 de marzo de 2.012
Frameworks JAVA EE 5 de marzo de 2.012Frameworks JAVA EE 5 de marzo de 2.012
Frameworks JAVA EE 5 de marzo de 2.012
 
Curso BPM Avanzado (contenidos)
Curso BPM Avanzado (contenidos)Curso BPM Avanzado (contenidos)
Curso BPM Avanzado (contenidos)
 
Curso bhh bpmn 2.0 ver 2013 s
Curso bhh bpmn 2.0 ver 2013 sCurso bhh bpmn 2.0 ver 2013 s
Curso bhh bpmn 2.0 ver 2013 s
 
01 semana-arena
01 semana-arena01 semana-arena
01 semana-arena
 
¿Cuándo entra en acción BPM?
¿Cuándo entra en acción BPM?¿Cuándo entra en acción BPM?
¿Cuándo entra en acción BPM?
 
Modelación de Procesos con BPMN
Modelación de Procesos con BPMNModelación de Procesos con BPMN
Modelación de Procesos con BPMN
 
Business Process Management
Business Process ManagementBusiness Process Management
Business Process Management
 
20.seminario ventas bpm
20.seminario ventas bpm20.seminario ventas bpm
20.seminario ventas bpm
 
Bpmn modelado negocios
Bpmn modelado negociosBpmn modelado negocios
Bpmn modelado negocios
 
Bpm soa
Bpm soaBpm soa
Bpm soa
 
Big Data y Salud
Big Data y SaludBig Data y Salud
Big Data y Salud
 
Gestión de procesos del negocio bpmn
Gestión de procesos del negocio   bpmnGestión de procesos del negocio   bpmn
Gestión de procesos del negocio bpmn
 
Introduccion bpmn
Introduccion bpmnIntroduccion bpmn
Introduccion bpmn
 
Business Intelligence con Excel
Business Intelligence con ExcelBusiness Intelligence con Excel
Business Intelligence con Excel
 
BIG DATA: Un nuevo reto para la estadística pública
BIG DATA: Un nuevo reto para la estadística públicaBIG DATA: Un nuevo reto para la estadística pública
BIG DATA: Un nuevo reto para la estadística pública
 
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de usoEl futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
 
Ppt bonita
Ppt bonitaPpt bonita
Ppt bonita
 

Similar a SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data

Similar a SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data (20)

Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UABBig data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
Big data: Valor y Mercado: Escola Universitària Salesians de Sarrià - UAB
 
Big Data Business
Big Data BusinessBig Data Business
Big Data Business
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Big Data perspectiva DevOps
Big Data perspectiva DevOpsBig Data perspectiva DevOps
Big Data perspectiva DevOps
 
Big Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open SourceBig Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open Source
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datos
 
Cbs big data-fundamentals-1
Cbs big data-fundamentals-1Cbs big data-fundamentals-1
Cbs big data-fundamentals-1
 
William cloud computing
William cloud computingWilliam cloud computing
William cloud computing
 
Que es big data huejutla uaeh
Que es big data huejutla uaehQue es big data huejutla uaeh
Que es big data huejutla uaeh
 
BigData
BigDataBigData
BigData
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Presentación open data upv, donostia
Presentación open data   upv, donostiaPresentación open data   upv, donostia
Presentación open data upv, donostia
 

Más de Escoles Universitàries Gimbernat i Tomàs Cerdà

Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Escoles Universitàries Gimbernat i Tomàs Cerdà
 

Más de Escoles Universitàries Gimbernat i Tomàs Cerdà (20)

Grau Informatica Serveis - Tomas Cerda.pdf
Grau Informatica Serveis - Tomas Cerda.pdfGrau Informatica Serveis - Tomas Cerda.pdf
Grau Informatica Serveis - Tomas Cerda.pdf
 
La nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivosLa nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivos
 
Los datos genómicos en el ámbito de la salud
Los datos genómicos en el ámbito de la saludLos datos genómicos en el ámbito de la salud
Los datos genómicos en el ámbito de la salud
 
Módulo de BIOINFORMATICA
Módulo de BIOINFORMATICA Módulo de BIOINFORMATICA
Módulo de BIOINFORMATICA
 
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitatEU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
EU Gimbernat Desenvolupament Habilitats Digitals per la iProductivitat
 
EUG Informatica Serveis a Empreses
EUG Informatica Serveis a EmpresesEUG Informatica Serveis a Empreses
EUG Informatica Serveis a Empreses
 
Diseño de videojuegos
Diseño de videojuegosDiseño de videojuegos
Diseño de videojuegos
 
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
Material de la sesión técnica sobre “Patrones de diseño de interacción de int...
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
Sesión técnica sobre Game Design, Gameplay y metologías agile para proyectos ...
 
El impacto tecnologico de la imagen para el diagnostico
El impacto tecnologico de la imagen para el diagnosticoEl impacto tecnologico de la imagen para el diagnostico
El impacto tecnologico de la imagen para el diagnostico
 
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
Ricoh empresa de producto a empresa de servicios 9 de mayo 2013
 
Experiencia del HSJD en el campo del eHealth
Experiencia del HSJD en el campo del eHealthExperiencia del HSJD en el campo del eHealth
Experiencia del HSJD en el campo del eHealth
 
Sesión técnica sobre gestion documental
Sesión técnica sobre gestion documentalSesión técnica sobre gestion documental
Sesión técnica sobre gestion documental
 
El camino para implantar soa con éxito
El camino para implantar soa con éxitoEl camino para implantar soa con éxito
El camino para implantar soa con éxito
 
Grado d'informàtica i serveis
Grado d'informàtica i serveisGrado d'informàtica i serveis
Grado d'informàtica i serveis
 
Guiametabolica org gimbernat enero 2013
Guiametabolica org  gimbernat enero 2013Guiametabolica org  gimbernat enero 2013
Guiametabolica org gimbernat enero 2013
 
Guiadiabetes gimbernat enero 2013
Guiadiabetes  gimbernat enero 2013Guiadiabetes  gimbernat enero 2013
Guiadiabetes gimbernat enero 2013
 
Portal de salud faros gimbernat-enero 2013
Portal de salud faros gimbernat-enero 2013Portal de salud faros gimbernat-enero 2013
Portal de salud faros gimbernat-enero 2013
 
Sesión SOA-BPM Joan Carles Agustí (ORACLE)
Sesión SOA-BPM Joan Carles Agustí (ORACLE)Sesión SOA-BPM Joan Carles Agustí (ORACLE)
Sesión SOA-BPM Joan Carles Agustí (ORACLE)
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (12)

Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 

SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data