SlideShare uma empresa Scribd logo
1 de 21
BIG DATA & SEGURIDAD
UN MATRIMONIO DE FUTURO
PRESENTACIÓN
ANTONIO GONZÁLEZ CASTRO
IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES
antoniogonzalezcastro.esagcastro@pragsis.com
linkedin.com/in/agonzaca@agonzaca
CONTENIDO
¿Qué es esto del Big Data?
¿Son realmente seguras las plataformas Big Data?
¿Podemos aprovechar esta tecnología en las áreas de seguridad?
¿QUÉ ES ESTO DEL BIG DATA?
NO ES SOLO TECNOLOGÍA…
Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en
capturar el valor que los propios datos encierran.
¿Qué lo hace diferente e innovador?
VOLUMEN VARIEDAD VELOCIDAD
CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL
A DÍA DE HOY
El número de dispositivos en red,
equivale a la población mundial.
EN EL AÑO 2016
x2
Fuente: Intel: What Happens in an Internet Minute?
1m
TIPOS DE DATOS
SMART DATA
Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas,
estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los
objetivos de la empresa.
INDENTITY DATA
Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus
gustos, historial de compras, interacciones con nuestros contenidos, etc.
OPEN DATA
Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
¿UNA MODA?
BIG DATA YA ES UNA REALIDAD
Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES.
Empresas como Facebook, Google y Amazon han llegado al éxito
gracias a esta tecnología.
Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
CAPAS FUNCIONALES DE INTEGRACIÓN
TIEMPO REAL
REPOSITORIO BIG DATA
ANALÍTICA
ETL
ALMACENAMIENTO
PROCESAMIENTO BATCH
 Datos estructurados.
 Datos no estructurados.
 Motor de reglas.
 Datos en brutos.
 Datos transformados.
 Modelos analíticos.
 Motor de reglas.
TECNOLOGÍA BIG DATA, HADOOP
OPEN SOURCE (PROYECTO APACHE)
 Almacenar y procesar gran cantidad de datos.
 Implementado en JAVA.
 Posibilidad de desarrollar en otros lenguajes.
 Económico, rápido y eficiente.
HDFS
 Sistema de archivos distribuido.
 Los datos se replican en varias máquinas.
MapReduce
 Procesamiento por lotes.
 Consulta de datos sobre HDFS.
 MapReduce + HDFS = Localidad.
USUARIO
MAPREDUCE HDFS
Job Tracker Name Node
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
Data Node &
Task Tracker
…
…
¿POR QUÉ HADOOP FUNCIONA?
ESCENARIO TRADICIONAL ESCENARIO HADOOP
DATOS DATOS
COMPONENTES DE HADOOP
ECOSISTEMA
HADOOP
CORE
HADOOP
HBase Flume Sqoop Mahout
Hive Pig Impala …
EL HARDWARE Y EL CÁLCULO DE CAPACIDADES
NODOS ESCLAVOS
 Procesadores: 2x6 core 2.9 GHz.
 Memoria RAM: 48-96 GB.
 Red: 10 GB.
 Disco Duro: 12x3 TB (NO-RAID)
NODOS MAESTROS
 Carrier-class.
 Dos tarjetas de red.
 Disco Duro en RAID.
 Dos fuentes de alimentación.
POR NODO = ESPACIO EN DISCO / 4
SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS?
NO!Actualmente existen varios problemas de seguridad
AUTENTICACIÓN AUTORIZACIÓN
CIFRADO EJECUCIÓN DE CÓDIGO
TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA
CONTROL DE ACCESOS
CIFRADO DEL TÁFICO DE RED
ENMASCARADO DE INFORMACIÓN
ARQUITECTURA RED AISLADA
SEGURIDAD SOBRE HADOOP AL DETALLE
 Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.
 Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.
 Tokens de delegación después de la autenticación para evitar carga.
AUTENTICACIÓN
AUTORIZACIÓN
CIFRADO
EJECUCIÓN CÓDIGO
 Autorización a datos en HDFS a través del NameNode basado en el
control de acceso (ACL) de los usuarios y grupos.
 Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.
 Conexiones SASL (Kerberos y Autenticación RPC).
 Consolas Web y Operaciones MapReduce (SSL).
 HDFS Soluciones comerciales.
 Se soluciona con los pasos indicados en autorización (Tokens).
MENSAJE PARA LOS SECURITY RESEARCHER
security@hadoop.apache.org
MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD?
CENTRALIZACIÓN DE EVENTOS
DETECCIÓN DEL FRAUDE
ANÁLISIS FORENSE
CIBERVIGILANCIA
DETECCIÓN DE AMENAZAS Y ATAQUES
CASO DE USO, DETECCIÓN DE FRAUDE
DATOS
TRANSACIONES
PERFIL DE CLIENTE
CIBERVIGILANCIA
ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD
ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL
USUARIOS / TARJETAS
ESCENARIO
[13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150]
[13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45]
[12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900]
CUANDO QUIEN DONDE
EL QUE
¿PREGUNTAS?
MUCHAS GRACIAS!
[X] CERRAR
Fin de la presentación, haga clic para cerrar. Será si quiero!

Mais conteúdo relacionado

Semelhante a Big Data & Seguridad - Un matrimonio de futuro

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Dell EMC
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis CloudAppi
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)pmluque
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Gabriel Eisbruch
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalJavier Gonzales
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 

Semelhante a Big Data & Seguridad - Un matrimonio de futuro (20)

Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
 
Big data y las apis
Big data y  las apis Big data y  las apis
Big data y las apis
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
 
BigData
BigDataBigData
BigData
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Que es big data huejutla uaeh
Que es big data huejutla uaehQue es big data huejutla uaeh
Que es big data huejutla uaeh
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 
Microsoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación DigitalMicrosoft Azure - La plataforma de Nube para su Transformación Digital
Microsoft Azure - La plataforma de Nube para su Transformación Digital
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Smbd (2)
Smbd (2)Smbd (2)
Smbd (2)
 

Último

diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxHhJhv
 
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxPRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxMiguelHernndez589343
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfJC Díaz Herrera
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfJC Díaz Herrera
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxfatimacamilainjantem
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfjosellaqtas
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaItalo838444
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALMANUELVILELA7
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónJhon Jimenez
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptProduvisaCursos
 

Último (20)

diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxPRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 

Big Data & Seguridad - Un matrimonio de futuro

  • 1. BIG DATA & SEGURIDAD UN MATRIMONIO DE FUTURO
  • 2. PRESENTACIÓN ANTONIO GONZÁLEZ CASTRO IT SECURITY DIRECTOR EN PRAGSIS TECHNOLOGIES antoniogonzalezcastro.esagcastro@pragsis.com linkedin.com/in/agonzaca@agonzaca
  • 3. CONTENIDO ¿Qué es esto del Big Data? ¿Son realmente seguras las plataformas Big Data? ¿Podemos aprovechar esta tecnología en las áreas de seguridad?
  • 4. ¿QUÉ ES ESTO DEL BIG DATA? NO ES SOLO TECNOLOGÍA… Conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran. ¿Qué lo hace diferente e innovador? VOLUMEN VARIEDAD VELOCIDAD
  • 5. CRECIMIENTO DE LOS DATOS EN EL MUNDO REAL A DÍA DE HOY El número de dispositivos en red, equivale a la población mundial. EN EL AÑO 2016 x2 Fuente: Intel: What Happens in an Internet Minute? 1m
  • 6. TIPOS DE DATOS SMART DATA Datos referentes al negocio (online/offline). En este grupo podemos encontrar cifras de ventas, estrategia de negocio, datos sobre los clientes, etc. Todo aquello que este relacionado con los objetivos de la empresa. INDENTITY DATA Datos referentes que nos permiten identificar a nuestros clientes actuales, así como datos de sus gustos, historial de compras, interacciones con nuestros contenidos, etc. OPEN DATA Agrupa al resto de datos externos a la empresa y que son accesibles por todo el mundo.
  • 7. ¿UNA MODA? BIG DATA YA ES UNA REALIDAD Las empresas ya están empezando a analizar lo que realmente les interesa: SUS CLIENTES. Empresas como Facebook, Google y Amazon han llegado al éxito gracias a esta tecnología. Ya se esta poniendo un gran foco en desarrollar aquellos productos que el mercado demanda.
  • 8. ALGUNAS EMPRESAS QUE UTILIZAN BIG DATA
  • 9. CAPAS FUNCIONALES DE INTEGRACIÓN TIEMPO REAL REPOSITORIO BIG DATA ANALÍTICA ETL ALMACENAMIENTO PROCESAMIENTO BATCH  Datos estructurados.  Datos no estructurados.  Motor de reglas.  Datos en brutos.  Datos transformados.  Modelos analíticos.  Motor de reglas.
  • 10. TECNOLOGÍA BIG DATA, HADOOP OPEN SOURCE (PROYECTO APACHE)  Almacenar y procesar gran cantidad de datos.  Implementado en JAVA.  Posibilidad de desarrollar en otros lenguajes.  Económico, rápido y eficiente. HDFS  Sistema de archivos distribuido.  Los datos se replican en varias máquinas. MapReduce  Procesamiento por lotes.  Consulta de datos sobre HDFS.  MapReduce + HDFS = Localidad. USUARIO MAPREDUCE HDFS Job Tracker Name Node Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker Data Node & Task Tracker … …
  • 11. ¿POR QUÉ HADOOP FUNCIONA? ESCENARIO TRADICIONAL ESCENARIO HADOOP DATOS DATOS
  • 12. COMPONENTES DE HADOOP ECOSISTEMA HADOOP CORE HADOOP HBase Flume Sqoop Mahout Hive Pig Impala …
  • 13. EL HARDWARE Y EL CÁLCULO DE CAPACIDADES NODOS ESCLAVOS  Procesadores: 2x6 core 2.9 GHz.  Memoria RAM: 48-96 GB.  Red: 10 GB.  Disco Duro: 12x3 TB (NO-RAID) NODOS MAESTROS  Carrier-class.  Dos tarjetas de red.  Disco Duro en RAID.  Dos fuentes de alimentación. POR NODO = ESPACIO EN DISCO / 4
  • 14. SI MUY BIEN, ¿PERO ESTOS DATOS ESTAN SEGUROS? NO!Actualmente existen varios problemas de seguridad AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN DE CÓDIGO
  • 15. TODO TIENE SOLUCIÓN, ARQUITECTURA SEGURA CONTROL DE ACCESOS CIFRADO DEL TÁFICO DE RED ENMASCARADO DE INFORMACIÓN ARQUITECTURA RED AISLADA
  • 16. SEGURIDAD SOBRE HADOOP AL DETALLE  Kerberos RPC (SASL / GSSAPI) autenticar a los usuarios.  Consolas web HTTP (HTTP SPNEGO) conexiones HTTP.  Tokens de delegación después de la autenticación para evitar carga. AUTENTICACIÓN AUTORIZACIÓN CIFRADO EJECUCIÓN CÓDIGO  Autorización a datos en HDFS a través del NameNode basado en el control de acceso (ACL) de los usuarios y grupos.  Bloque de Tokens (HMAC-SHA1) control de acceso a los bloques de datos.  Conexiones SASL (Kerberos y Autenticación RPC).  Consolas Web y Operaciones MapReduce (SSL).  HDFS Soluciones comerciales.  Se soluciona con los pasos indicados en autorización (Tokens).
  • 17. MENSAJE PARA LOS SECURITY RESEARCHER security@hadoop.apache.org
  • 18. MMM! ¿SI LO UTILIZAMOS PARA SEGURIDAD? CENTRALIZACIÓN DE EVENTOS DETECCIÓN DEL FRAUDE ANÁLISIS FORENSE CIBERVIGILANCIA DETECCIÓN DE AMENAZAS Y ATAQUES
  • 19. CASO DE USO, DETECCIÓN DE FRAUDE DATOS TRANSACIONES PERFIL DE CLIENTE CIBERVIGILANCIA ID CLIENTE / IP ORIGEN / FECHA / TARJETA / CANTIDAD ID CLIENTE / MEDIA CONSUMO / POSICION HABITUAL USUARIOS / TARJETAS ESCENARIO [13/06/2014 10:13:52] [5598CM23 1234567890123457] [80.26.83.175] [150] [13/06/2014 10:43:12] [5598CM23 1234567890123457] [148.245.38.39] [45] [12/06/2014 09:20:35] [5598CM23 1234567890123457] [195.60.81.64] [4900] CUANDO QUIEN DONDE EL QUE
  • 21. MUCHAS GRACIAS! [X] CERRAR Fin de la presentación, haga clic para cerrar. Será si quiero!