SlideShare uma empresa Scribd logo
1 de 27
Baixar para ler offline
Iván de Prado Alonso – CEO of Datasalt
www.datasalt.es
@ivanprado
@datasalt

Big Data
Una visión pragmática
Consultoría y formación
Big Data
Success stories
Deep Knowledge
Analyzing credit
card transactions

Pangool
Revamped Hadoop API

Extracting insights
from Social Networks

Splout SQL
Making Hadoop data accessible

Dealing with thousands
of millions of classifieds

Managing billions
of events per day

Building the future

ICDM 2012
Big Data Hype
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

BIG
“MAC”
DATA

5 / 27
1. Definición de Big Data

2. Lo disruptivo

3. Ejemplos sectoriales

4. Conclusiones
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Agenda

6 / 27
●

Datos
–
–
–

●

●

–

–

Variedad

Cruce de datos
●
●

Redes sociales
Sensores, etc

●

Esquemas en lectura

–

Velocidad

No tires ni un dato

–

Volumen

Inteligencia de negocio

Filosofía de desarrollo

Tolerancia a fallos humanos

Herramientas
–

Hadoop

–

NoSQL

–

Sistemas distribuidos

7 / 27

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Definición del Big Data – 4 puntos de vista
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Confusión

8 / 27
Big Da
ta

La “caja” del Big Data pinta muy bien ...
¿Pero hay algo realmente nuevo y disruptivo dentro?
1. Definición de Big Data

2. Lo disruptivo

3. Ejemplos sectoriales

4. Conclusiones
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Agenda

12 / 27
●

●

●
●

Big Data → Nuevas tecnologías relevantes
– Capaces de hacer viable lo que antes era inviable
Distribuidas
– Aprovechan el potencial de varias máquinas
– Abstraen al programador de las complejidades de
coordinación
● Pero siguen siendo complejas
Open Source (la mayoría)
De bajo coste

13 / 27

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Tecnologías disruptivas
1. Definición de Big Data

2. Lo disruptivo

3. Ejemplos sectoriales

4. Conclusiones
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Agenda

16 / 27
●

Lo que se podía antes del Big Data
–

Hacer portales de clasificados (inmobiliarios, etc) a nivel de un país

–

Tecnologías principales:
●

●

Bases de datos relacionales (i.e. MySQL)

Lo que era casi imposible y ahora es muy razonable
–

Hacer un buscador de clasificados de escala mundial

–

Tecnologías principales:
●
●

●

Hadoop, Hbase, Storm
Solr, ElasticSearch

Ejemplos

17 / 27

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Anuncios clasificados (I)
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Anuncios clasificados (II)

18 / 27
●

Lo que se podía antes del Big Data
–

Restringido al poder de una máquina (análisis locales)

–

Tecnologías principales:
●

Bases de datos relacionales (i.e. MySQL)

●

●

Analítica monomáquina

Lo que era casi imposible y ahora es muy razonable
–

Analizar la influencia de todos los individuos en una red social

–

Tecnologías principales:
●

Hadoop, Hbase, Storm

●

NoSQL: Voldemort, Cassandra

●

●

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Análisis de influencia online y en redes
sociales (I)

Hamma, Giraph

Ejemplos

19 / 27
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Análisis de influencia online y en redes
sociales (II)

20 / 27
●

Lo que se podía antes del Big Data
–

Datos en silos

–

Presos de los DW (muy poco flexibles)

–

Tecnologías principales:
●

●

EDW MPP

Lo que era casi imposible y ahora es muy razonable
–

Explotar de nuevas maneras los datos y dar valor a terceros

–

Tecnologías principales:
●

Hadoop

●

NoSQL

●

●

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Explotar datos agregados (I)

Gestores geográficos

Ejemplos

21 / 27
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Explotar datos agregados (II)

22 / 27
●

Lo que se podía antes del Big Data
–

Estadísticas básicas en Bds relacionales a clientes

–

Agregados de muy alto nivel (se pierde el grano fino)

–

Tecnologías principales:
●

●

Bds relacionales (i.e. MySql, Oracle)

Lo que era casi imposible y ahora es muy razonable
–

No tirar un sólo dato

–

Estadísticas muy ricas y de gran detalle para cada cliente

–

Tecnologías principales:
●

Hadoop

●

●

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Redes de anuncios (Ad networks)

NoSQL, Splout SQL

Ejemplos

23 / 27
●

Lo que se podía antes del Big Data
–

Recibir y procesar el gran nivel de eventos era casi imposible

–

Tecnologías principales:
●

Bds relacionales (i.e. MySql, Oracle)

●

●

Sistema de colas con consumidores

Lo que era casi imposible y ahora es muy razonable
–

Estadísticas y respuesta a eventos en tiempo real

–

Tecnologías principales:
●

Storm, Erlang

●

●

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Juegos online

NoSQL

Ejemplos

24 / 27
1. Definición de Big Data

2. Lo disruptivo

3. Ejemplos sectoriales

4. Conclusiones
Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Agenda

25 / 27
●
●

●

●

●

El Big Data es algo disruptivo
Razón principal: Nuevas tecnologías
– Que hacen posibles aplicaciones antes casi imposibles
Tecnologías aún no maduras y muy dispersas
– Salvo Hadoop, con alto grado de madurez y que resuelve gran parte de
problemas
Oportunidad: arriesgar y abrazar estas tecnologías
– Hay cierto riesgo (bajo grado de madurez)
– Pero puede suponer una ventaja estratégica
– Apostar por equipos pequeños pero capaces
No centrarse únicamente en tecnología
– Preparar equipos humanos Big Data (científicos de datos)

26 / 27

Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent.

Conclusión
Gracias

Creative Commons images:
http://www.flickr.com/photos/83633410@N07/7658298768/
http://www.flickr.com/photos/meatheadmovers/5346219239/in/photostream/
http://www.flickr.com/photos/meatheadmovers/5346220901/in/photostream/
http://www.flickr.com/photos/jepoirrier/8319130269/

Iván de Prado Alonso
ivan@datasalt.com
@ivanprado
www.datasalt.com

Mais conteúdo relacionado

Semelhante a OpenAnalytics - BigData por Ivan del Prado (Datasalt)

Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big DataKEEDIO
 
Big data intelligence business
Big data intelligence businessBig data intelligence business
Big data intelligence businessALEJANDRA69909
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdflaubritez2001
 
Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Javier Peña
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 
Gestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaGestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaAntonio Soto
 
Pixelscode 2012 04
Pixelscode 2012 04Pixelscode 2012 04
Pixelscode 2012 04Mario3456
 
Big Data: Presente o Futuro
Big Data: Presente o FuturoBig Data: Presente o Futuro
Big Data: Presente o FuturoSteelmood
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesJuan José Domenech
 
Nube. Móviles. Redes Sociales. Big Data.
Nube. Móviles. Redes Sociales. Big Data.Nube. Móviles. Redes Sociales. Big Data.
Nube. Móviles. Redes Sociales. Big Data.Leopoldo Rojas Moguel
 

Semelhante a OpenAnalytics - BigData por Ivan del Prado (Datasalt) (20)

Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Big data: Valor y Mercado
Big data: Valor y MercadoBig data: Valor y Mercado
Big data: Valor y Mercado
 
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big dataSeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
SeminBIG DATA: Qué significa realmente y ejemplos de utilizaciónario big data
 
Cbs big data-fundamentals-1
Cbs big data-fundamentals-1Cbs big data-fundamentals-1
Cbs big data-fundamentals-1
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
2016 ULL Cabildo KEEDIO - Proyecto y Roles Big Data
 
Big Data perspectiva DevOps
Big Data perspectiva DevOpsBig Data perspectiva DevOps
Big Data perspectiva DevOps
 
Big data intelligence business
Big data intelligence businessBig data intelligence business
Big data intelligence business
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 
Big data
Big dataBig data
Big data
 
Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"Laboratorio 3 formato ieee "Tecnologias de Big Data"
Laboratorio 3 formato ieee "Tecnologias de Big Data"
 
Trabajo de bigadata
Trabajo de bigadataTrabajo de bigadata
Trabajo de bigadata
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Gestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaGestiona la Información en Tu Empresa
Gestiona la Información en Tu Empresa
 
Pixelscode 2012 04
Pixelscode 2012 04Pixelscode 2012 04
Pixelscode 2012 04
 
Business Intelligence vs. BiG Data
Business Intelligence vs. BiG DataBusiness Intelligence vs. BiG Data
Business Intelligence vs. BiG Data
 
Big Data: Presente o Futuro
Big Data: Presente o FuturoBig Data: Presente o Futuro
Big Data: Presente o Futuro
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Nube. Móviles. Redes Sociales. Big Data.
Nube. Móviles. Redes Sociales. Big Data.Nube. Móviles. Redes Sociales. Big Data.
Nube. Móviles. Redes Sociales. Big Data.
 

Mais de OpenAnalytics Spain

OpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics Spain
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics Spain
 
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics Spain
 
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpen Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpenAnalytics Spain
 
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...OpenAnalytics Spain
 
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...OpenAnalytics Spain
 
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpen Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpenAnalytics Spain
 
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpen Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpenAnalytics Spain
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpenAnalytics Spain
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 

Mais de OpenAnalytics Spain (10)

OpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs R
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con Hadoop
 
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
 
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpen Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
 
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
 
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
 
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpen Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
 
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpen Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 

Último

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 

Último (13)

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 

OpenAnalytics - BigData por Ivan del Prado (Datasalt)

  • 1. Iván de Prado Alonso – CEO of Datasalt www.datasalt.es @ivanprado @datasalt Big Data Una visión pragmática
  • 3. Success stories Deep Knowledge Analyzing credit card transactions Pangool Revamped Hadoop API Extracting insights from Social Networks Splout SQL Making Hadoop data accessible Dealing with thousands of millions of classifieds Managing billions of events per day Building the future ICDM 2012
  • 5. Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. BIG “MAC” DATA 5 / 27
  • 6. 1. Definición de Big Data 2. Lo disruptivo 3. Ejemplos sectoriales 4. Conclusiones Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Agenda 6 / 27
  • 7. ● Datos – – – ● ● – – Variedad Cruce de datos ● ● Redes sociales Sensores, etc ● Esquemas en lectura – Velocidad No tires ni un dato – Volumen Inteligencia de negocio Filosofía de desarrollo Tolerancia a fallos humanos Herramientas – Hadoop – NoSQL – Sistemas distribuidos 7 / 27 Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Definición del Big Data – 4 puntos de vista
  • 8. Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Confusión 8 / 27
  • 9. Big Da ta La “caja” del Big Data pinta muy bien ...
  • 10. ¿Pero hay algo realmente nuevo y disruptivo dentro?
  • 11.
  • 12. 1. Definición de Big Data 2. Lo disruptivo 3. Ejemplos sectoriales 4. Conclusiones Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Agenda 12 / 27
  • 13. ● ● ● ● Big Data → Nuevas tecnologías relevantes – Capaces de hacer viable lo que antes era inviable Distribuidas – Aprovechan el potencial de varias máquinas – Abstraen al programador de las complejidades de coordinación ● Pero siguen siendo complejas Open Source (la mayoría) De bajo coste 13 / 27 Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Tecnologías disruptivas
  • 14.
  • 15.
  • 16. 1. Definición de Big Data 2. Lo disruptivo 3. Ejemplos sectoriales 4. Conclusiones Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Agenda 16 / 27
  • 17. ● Lo que se podía antes del Big Data – Hacer portales de clasificados (inmobiliarios, etc) a nivel de un país – Tecnologías principales: ● ● Bases de datos relacionales (i.e. MySQL) Lo que era casi imposible y ahora es muy razonable – Hacer un buscador de clasificados de escala mundial – Tecnologías principales: ● ● ● Hadoop, Hbase, Storm Solr, ElasticSearch Ejemplos 17 / 27 Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Anuncios clasificados (I)
  • 18. Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Anuncios clasificados (II) 18 / 27
  • 19. ● Lo que se podía antes del Big Data – Restringido al poder de una máquina (análisis locales) – Tecnologías principales: ● Bases de datos relacionales (i.e. MySQL) ● ● Analítica monomáquina Lo que era casi imposible y ahora es muy razonable – Analizar la influencia de todos los individuos en una red social – Tecnologías principales: ● Hadoop, Hbase, Storm ● NoSQL: Voldemort, Cassandra ● ● Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Análisis de influencia online y en redes sociales (I) Hamma, Giraph Ejemplos 19 / 27
  • 20. Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Análisis de influencia online y en redes sociales (II) 20 / 27
  • 21. ● Lo que se podía antes del Big Data – Datos en silos – Presos de los DW (muy poco flexibles) – Tecnologías principales: ● ● EDW MPP Lo que era casi imposible y ahora es muy razonable – Explotar de nuevas maneras los datos y dar valor a terceros – Tecnologías principales: ● Hadoop ● NoSQL ● ● Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Explotar datos agregados (I) Gestores geográficos Ejemplos 21 / 27
  • 22. Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Explotar datos agregados (II) 22 / 27
  • 23. ● Lo que se podía antes del Big Data – Estadísticas básicas en Bds relacionales a clientes – Agregados de muy alto nivel (se pierde el grano fino) – Tecnologías principales: ● ● Bds relacionales (i.e. MySql, Oracle) Lo que era casi imposible y ahora es muy razonable – No tirar un sólo dato – Estadísticas muy ricas y de gran detalle para cada cliente – Tecnologías principales: ● Hadoop ● ● Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Redes de anuncios (Ad networks) NoSQL, Splout SQL Ejemplos 23 / 27
  • 24. ● Lo que se podía antes del Big Data – Recibir y procesar el gran nivel de eventos era casi imposible – Tecnologías principales: ● Bds relacionales (i.e. MySql, Oracle) ● ● Sistema de colas con consumidores Lo que era casi imposible y ahora es muy razonable – Estadísticas y respuesta a eventos en tiempo real – Tecnologías principales: ● Storm, Erlang ● ● Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Juegos online NoSQL Ejemplos 24 / 27
  • 25. 1. Definición de Big Data 2. Lo disruptivo 3. Ejemplos sectoriales 4. Conclusiones Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Agenda 25 / 27
  • 26. ● ● ● ● ● El Big Data es algo disruptivo Razón principal: Nuevas tecnologías – Que hacen posibles aplicaciones antes casi imposibles Tecnologías aún no maduras y muy dispersas – Salvo Hadoop, con alto grado de madurez y que resuelve gran parte de problemas Oportunidad: arriesgar y abrazar estas tecnologías – Hay cierto riesgo (bajo grado de madurez) – Pero puede suponer una ventaja estratégica – Apostar por equipos pequeños pero capaces No centrarse únicamente en tecnología – Preparar equipos humanos Big Data (científicos de datos) 26 / 27 Copyright © 2012 Datasalt Systems S.L. All rights reserved. Not to be reproduced without prior written consent. Conclusión