SlideShare uma empresa Scribd logo
1 de 40
##SQLSatMadrid
Big Data con Hadoop en SQL
Server SSIS 2016
Ángel M. Rayo
##SQLSatMadrid
¿Quién soy?
 Ángel M. Rayo
 twitter.com/oyara
 Technology Lead Expert en Netmind
 Más de 9.000 horas de experiencia formativa
 Microsoft Certified Trainer desde 2005
 MCDBA SQL 2000 – MCSA SQL 2014
##SQLSatMadrid
Agenda
 Hadoop
 HDInsight
 SQL Server SSIS 2016
 Referencias
##SQLSatMadrid
HADOOP
Big Data con Hadoop en SQL Server SSIS 2016
##SQLSatMadrid
Hadoop
Procesado
distribuido
Grandes
conjuntos de
datos
Clústeres de
ordenadores
Modelos de
programación
sencillos
Apache™ Hadoop®
##SQLSatMadrid
Hadoop
• 2003 – Google File System
• 2004 – MapReduce
• 2006 – Hadoop 0.1.0
• 2011 – Hadoop 1.0
• 2015 – Hadoop 1.7
• 25 de agosto de 2016 – Hadoop 2.7.3
##SQLSatMadrid
Hadoop – Componentes
Hadoop
Common
Hadoop
Distributed
File System
(HDFS™)
Hadoop YARN
Hadoop
MapReduce
Apache™ Hadoop®
##SQLSatMadrid
Hadoop – Otros componentes
##SQLSatMadrid
Hadoop
##SQLSatMadrid
HDINSIGHT
Big Data con Hadoop en SQL Server SSIS 2016
##SQLSatMadrid
HDInsight
• Servicio Hadoop alojado en Microsoft Azure
• Gestión de clústeres
• Framework diseñado para:
• Gestión
• Análisis
• Reporting
• Utiliza la distribución Hortonworks Data Platform (HDP)
##SQLSatMadrid
HDInsight
##SQLSatMadrid
HDInsight – Uso
• Hadoop as a Service (HaaS)
• Crear soluciones y servicios Big Data
• Administrar y monitorizar clústeres Hadoop
• Analizar y generar estadísticas de:
• Disponibilidad
• Utilización
##SQLSatMadrid
HDInsight – Creación
##SQLSatMadrid
SQL SERVER SSIS 2016
Big Data con Hadoop en SQL Server SSIS 2016
##SQLSatMadrid
SQL Server
• ¿Hace falta decir qué es? ;-)
• Sistema gestor de bases de datos relacionales Microsoft
• 1989 – SQL Server 1.0
• 1 de junio de 2016 – SQL Server 2016 (14.0)
##SQLSatMadrid
SQL Server 2016 – Servicios y herramientas
Service
Broker
Replication
Services
Analysis
Services
Reporting
Services
Notification
Services
Visual
Studio
Integration
Services
SQL Server
Management
Studio
Full Text
Search
Service
Business
Intelligence
Dev Studio
SQLCMD
##SQLSatMadrid
SQL Server 2016 SSIS
• Plataforma de integración datos y aplicaciones de flujos
de trabajo
• Herramienta Data Warehouse rápida y flexible
• ETL
• Extraction
• Transformation
• Loading
##SQLSatMadrid
SQL Server 2016 SSIS
Data
Transformation
Services (DTS)
SQL Server
Integration
Services (SSIS)
Disponible desde SQL Server 6.5 a
SQL Server 2000
Disponible desde SQL Server 2005
.NET como base de ejecución
Control Flow
Data Flow
Event Handlers
Package Explorer
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Situación desde SQL Server 2016
• Se incluye Hadoop como fuente de datos
• SSIS 2016 se integra con soluciones Big Data
Situación hasta SQL Server 2014
• Podemos utilizar Hadoop mediante conexión ODBC
• Acceso a recursos con scripts PowerShell
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Gestor de conexiones
• WebHCat – API REST
Apache™ Hive
• WebHDFS – API
REST HDFS
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Tareas de flujo de control (Control Flow)
Hadoop File
System Task
Hadoop Hive
Task
Hadoop Pig Task
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop File
System Task
Funcionamiento
• Obtiene, copia o mueve ficheros
• Utiliza la API REST del clúster
• El acceso es directo al almacén HDFS
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop File
System Task
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Hive
Task
Funcionamiento
• Envía consultas HiveQL
• Utiliza la API REST WebHCat (aka Templeton)
• Funcionamiento mediante sistema de colas
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Hive
Task
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Pig
Task
Funcionamiento
• Envía scripts Pig
• Pig Latin + API REST de WebHCat (aka Templeton)
• Funcionamiento mediante sistema de colas
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Hadoop Pig
Task
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Tareas de flujo de datos (Control Flow)
HDFS File
Source
HDFS File
Destination
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
HDFS File
Source
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
HDFS File
Destination
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Otros componentes
• Azure Feature Pack for Integration Services (SSIS)
• Componentes:
• Gestores de conexiones Azure
• Tareas
• Componentes de flujo de datos (Data Flow)
• Azure Blob Enumerator
• https://www.microsoft.com/en-us/download/details.aspx?id=49492
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Gestores de conexiones Azure
Azure Storage
Connection
Manager
Azure
Subscription
Connection
Manager
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Tareas
Azure
HDInsight Hive
Task
Azure
HDInsight Pig
Task
Azure
HDInsight
Create Cluster
Task
Azure
HDInsight
Delete Cluster
Task
Azure Blob
Upload Task
Azure Blob
Download
Task
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Componentes Data Flow
Azure Blob
Source
Azure Blob
Destionation
##SQLSatMadrid
SQL Server 2016 SSIS + Hadoop
Azure Blob
Enumerator
##SQLSatMadrid
Referencias
Hadoop
• http://hadoop.apache.org/
HDInsight
• https://azure.microsoft.com/es-es/services/hdinsight/
SQL Server 2016
• http://www.microsoft.com/es-es/server-cloud/products/sql-server/default.aspx
##SQLSatMadrid
Gracias
¡GRACIAS!
@oyara
@netmindIT
##SQLSatMadrid
BIG Thanks to SQLSatMadrid Sponsors
##SQLSatMadrid
4 Sponsor Sessions at 11:40
Don’t miss them, they might be getting
distributing some awesome prizes!
 HPE
 SolidQ
 KABEL
 TSD Consulting
Also BIG Raffle prizes at the end of the
event provided by:
Plainconcepts, SolidQ, Kabel, TSD
Consulting, Pyramid Analytics & sqlpass.es

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Open analytics. data analytics con hadoop
Open analytics. data analytics con hadoopOpen analytics. data analytics con hadoop
Open analytics. data analytics con hadoop
 
Monta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaMonta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu Empresa
 
Primeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid MeetupPrimeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid Meetup
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementación
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1
 
Introduccion a Apache Spark
Introduccion a Apache SparkIntroduccion a Apache Spark
Introduccion a Apache Spark
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Tutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeTutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtime
 
OpenAnalytics Madrid 2014: Spark
OpenAnalytics Madrid 2014: SparkOpenAnalytics Madrid 2014: Spark
OpenAnalytics Madrid 2014: Spark
 
Creación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaCreación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con Cloudera
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Hadoop: MapReduce para procesar grandes cantidades de datos
Hadoop: MapReduce para procesar grandes cantidades de datosHadoop: MapReduce para procesar grandes cantidades de datos
Hadoop: MapReduce para procesar grandes cantidades de datos
 
Monta una Infraestructura Big Data para tu Empresa - Sesión II
Monta una Infraestructura Big Data para tu Empresa - Sesión IIMonta una Infraestructura Big Data para tu Empresa - Sesión II
Monta una Infraestructura Big Data para tu Empresa - Sesión II
 
ARQCONF2015: Creando una Arquitectura Moderna para Big Data Analytics
ARQCONF2015: Creando una Arquitectura Moderna para Big Data AnalyticsARQCONF2015: Creando una Arquitectura Moderna para Big Data Analytics
ARQCONF2015: Creando una Arquitectura Moderna para Big Data Analytics
 
Hadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadasHadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadas
 
Apache Spark y Big Data
Apache Spark y Big DataApache Spark y Big Data
Apache Spark y Big Data
 
Introducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en RIntroducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en R
 
Instalando Datastax Analytics (Cassandra Y Spark) Con Azure Templates
Instalando Datastax Analytics (Cassandra Y Spark) Con Azure TemplatesInstalando Datastax Analytics (Cassandra Y Spark) Con Azure Templates
Instalando Datastax Analytics (Cassandra Y Spark) Con Azure Templates
 
Panorama BigData (OpenExpo2017)
Panorama BigData (OpenExpo2017)Panorama BigData (OpenExpo2017)
Panorama BigData (OpenExpo2017)
 

Semelhante a Big data con Hadoop y SSIS 2016

Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
John Bulla
 
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAPNovedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
Joseph Lopez
 

Semelhante a Big data con Hadoop y SSIS 2016 (20)

Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint Server
 
Presentacion
PresentacionPresentacion
Presentacion
 
Polybase
PolybasePolybase
Polybase
 
Webinar Oracle Data Integrator 12c (ODI)
Webinar Oracle Data Integrator 12c (ODI)Webinar Oracle Data Integrator 12c (ODI)
Webinar Oracle Data Integrator 12c (ODI)
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
 
Descubriendo windows azure
Descubriendo windows azureDescubriendo windows azure
Descubriendo windows azure
 
Diseña tu propio Office 365 con Azure IaaS y PaaS
Diseña tu propio Office 365 con Azure IaaS y PaaSDiseña tu propio Office 365 con Azure IaaS y PaaS
Diseña tu propio Office 365 con Azure IaaS y PaaS
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8
 
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAPNovedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
Novedades de MS SQL Server 2012 para ambientes tecnológicos OLTP y OLAP
 
SQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de DatosSQL Server 2014 y La Plataforma de Datos
SQL Server 2014 y La Plataforma de Datos
 
Sql server 2014 y la plataforma de datos
Sql server 2014 y la plataforma de datosSql server 2014 y la plataforma de datos
Sql server 2014 y la plataforma de datos
 
DBA para SharePoint
DBA para SharePointDBA para SharePoint
DBA para SharePoint
 
SQL Server 2012 services
SQL Server 2012 servicesSQL Server 2012 services
SQL Server 2012 services
 
Sql server 2012 denali - novedades en ssis integration services - 24 h pass-l...
Sql server 2012 denali - novedades en ssis integration services - 24 h pass-l...Sql server 2012 denali - novedades en ssis integration services - 24 h pass-l...
Sql server 2012 denali - novedades en ssis integration services - 24 h pass-l...
 
Roadmap sap hana 2
Roadmap sap hana 2Roadmap sap hana 2
Roadmap sap hana 2
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Construyedo Aplicaciones Serverless
Construyedo Aplicaciones ServerlessConstruyedo Aplicaciones Serverless
Construyedo Aplicaciones Serverless
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 

Mais de Ángel Rayo (6)

Azure DevOps CrossDvlup
Azure DevOps CrossDvlupAzure DevOps CrossDvlup
Azure DevOps CrossDvlup
 
Power Platform Madrid - Web como fuente de datos - Power BI
Power Platform Madrid - Web como fuente de datos - Power BIPower Platform Madrid - Web como fuente de datos - Power BI
Power Platform Madrid - Web como fuente de datos - Power BI
 
All Day DevOps - Azure DevOps from Start to Star
All Day DevOps - Azure DevOps from Start to StarAll Day DevOps - Azure DevOps from Start to Star
All Day DevOps - Azure DevOps from Start to Star
 
Azure DevOps from rookie to devstar
Azure DevOps from rookie to devstarAzure DevOps from rookie to devstar
Azure DevOps from rookie to devstar
 
Web content as data provider in Power BI
Web content as data provider in Power BIWeb content as data provider in Power BI
Web content as data provider in Power BI
 
La web como fuente de datos en power bi #powerbi
La web como fuente de datos en power bi #powerbiLa web como fuente de datos en power bi #powerbi
La web como fuente de datos en power bi #powerbi
 

Último

Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Último (20)

procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 

Big data con Hadoop y SSIS 2016