SlideShare una empresa de Scribd logo
1 de 49
Cursos Big Data & Machine Learning
Big Data
Machine Learning
Cursos Ofertados
Curso de Introducción a Big Data (3 Jornadas)
Curso de especialista técnico en Data Science (5 Jornadas)
Curso de Introducción a Machine Learning (3 Jornadas)
Sobre StrateBI
Formaciones Big Data & Machine Learning
Big Data
Forma de afrontar el procesamiento, análisis y visualización de
grandes volúmenes de información que por su naturaleza
desestructurada no pueden ser analizados, en un tiempo
aceptable, usando los procesos y herramientas tradicionales de
bases de datos y Business Intelligence
El Big Data es resultado de los cambios que se han producido en
la naturaleza de los datos manejados por las organizaciones
Aumento del Volumen de los datos disponibles para el análisis (Terabytes
(103 Gb) - Petabytes (106))
Incremento de la Velocidad a la que se generan y se distribuyen los datos en
las fuentes (ej. Captura y procesamiento de datos en tiempo real)
La Variedad se refiere al importante aumento en la heterogeneidad de las
fuentes de datos
Big Data
Big Data
La gestión y procesamiento con éxito del Big Data puede dar lugar
a importantes beneficios a las empresas y particulares:
Detección de tendencias de negocio
Detección de fraude y otros delitos
Marketing
…..
Sin embargo, la gestión y aprovechamiento del Big Data no es una
tarea ni mucho menos trivial. Algunos de los problemas más
relevantes son:
Tamaño de datos, nivel de estructura, variedad de formatos de
archivo, calidad de los datos, datos generados en tiempo real y que
además se han de analizar en tiempo real, datos de baja calidad,…
Big Data
Big Data
En los últimos años ha ido surgiendo un amplio abanico de tecnologías
y herramientas
Tecnologías: Hadoop, NoSQL, Bases de datos columnares,…
Herramientas: Almacenamiento (HDFS, Cassandra, MongoDB…),
procesamiento (Spark, Hive, Storm, Pentaho..), visualización (Pentaho
,Tableau, Clickview…),..
La mayoría de estas tecnologías son Open Source
Accesibles a un mayor número de organizaciones que las soluciones
propietarias
Problema (Know-How):
¿Cómo usar y combinar efectivamente las tecnologías disponibles para
rentabilizar con éxito la gestión y procesamiento del Big Data?
Big Data
Big Data. Tecnologías
Big Data. Tecnologías
Big Data. Tecnologías
Big Data. Tecnologías
Machine Learning
Capacidad de un sistema para generalizar sobre la base de la
experiencia . Consiste en el uso de estas generalizaciones para
dar respuesta a las cuestiones relativas a datos recopilados con
anterioridad, así como datos que no se han encontrado antes.
Combina y se aplica en multitud de áreas de conocimiento
Estadística, reconocimiento de patrones, inteligencia artificial,
minería de datos,..
Por aplicación de distintos tipos de algoritmos estos sistemas son
capaces de extraer conocimiento de forma automatizada
Clasificación, agrupamiento, regresión para la generación de
predicciones
Machine Learning
Machine Learning
Machine Learning
En combinación con el Big Data (fuentes de datos y tecnologías)
aumenta su eficacia y el número de aplicaciones en las que puede
ser de utilidad
Gran número de posibles aplicaciones que resuelven problemas
realmente complejos:
Sistemas de recomendación (ej. Carrito de la compra en Amazon)
Predecir un tipo de tumor (benigno o maligno) dado un conjunto de
datos de entrenamiento
Predecir el precio de una vivienda dado un juego de datos de
entrenamiento
….
Machine Learning
Machine Learning
Machine Learning
Técnicas: Clasificación, Regresión, Clustering…
Algoritmos: C4.5, k-means, Support vector machines, Apriori, EM
, PageRank, AdaBoost, k-nearest neighbours class, …
Tecnologías:
Clásicas: WEKA, Python (scikit-learn, pandas, TensorFlow), R,…
Big Data: Apache Mahout, Spark con Mlib,
Problema (De nuevo el Know-How):
¿Cómo usar y combinar efectivamente las técnicas y tecnologías
disponibles para aplicar Machine Learning con éxito?
¿Cómo aplicar Machine Learning sobre Big Data?
Machine Learning
Machine Learning. Tecnologías
Cursos ofertados
1) Curso de Introducción a Big Data (3 Jornadas)
2) Curso de especialista técnico en Data Science (5 Jornadas)
3) Curso de Introducción a Machine Learning (3 Jornadas)
Formaciones Big Data & Machine Learning
1) Curso de Introducción a Big Data
Curso orientado a introducir y explicar los principales conceptos y
tecnologías del campo Big Data
3 jornadas. Entrega de Documentación y Certificado
Dirigido a todo tipo de audiencia interesada en introducirse en el
mundo del Big Data, mediante la realización de ejercicios.
El objetivo de este curso es ofrecer una visión holística de Big
Data, apoyándonos en su capacidad para generar oportunidades
de negocio, así como optimizar los ya existentes.
Se verán ejemplos de arquitecturas ya implantadas en el mercado
y se analizarán los casos de uso en los que Big Data es y ha sido
decisivo.
Formaciones Big Data & Machine Learning
Curso de Introducción a Big Data
1) Introducción a Big Data
Directrices principales en las que se basa Big Data
Visión histórica e introducción al contexto del Big Data a través de
ejemplos intuitivos
Cómo afecta Big Data a los negocios. Se analizarán algunos
ejemplos de aplicación exitosa del Big Data y las potenciales
aplicaciones del mismo.
La relación entre Big Data, Business Intelligence, Machine Learning
& Data Science.
Formaciones Big Data & Machine Learning
Curso de Introducción a Big Data
2) Arquitecturas Big Data
Introducción y clasificación a las diferentes arquitecturas y sistemas
Big Data disponibles en el mercado
Entorno Hadoop: HDFS, Map Reduce, YARN, análisis de la pila de
herramientas disponibles sobre HDFS y Map Reduce (Hive, Pig...),
introducción a las distribuciones de Hadoop, etc.
NoSQL: Cassandra, MongoDB,...
Ejemplos prácticos donde el alumnos pondrá en práctica lo
estudiado sobre el entorno Hadoop
Introducción a una distribución de Hadoop y a la gestión del clúster
Uso del sistema de archivos HDFS
Formaciones Big Data & Machine Learning
Formaciones Big Data & Machine Learning
Curso de Introducción a Big Data
3) Obtención y movimiento de datos en Big Data
Estudio de los principales tipos de fuentes de datos actuales
Datos estructurados, semi estructurados y no estructurados
Batch y streaming
Análisis de las principales herramientas disponibles para la
adquisición y movimiento de datos:
Pentaho Data Integration (multipropósito, DW), Sqoop (datos
relacionales en batch), Flume (datos streaming)
Ejercicios prácticos con algunas de las herramientas anteriores
basados en un caso de estudio para la obtención de datos de logs,
redes sociales...
Formaciones Big Data & Machine Learning
Curso de Introducción a Big Data
4) Procesamiento del Big Data
Análisis de los requerimientos del análisis según nuestros objetivos.
No todos los proyectos Big Data siguen el mismo patrón, por lo que
es importante una correcta elección de las herramientas en función
de los objetivos.
Introducción a las principales herramientas para el procesamiento y
análisis del Big Data
Herramientas sobre MapReduce: Pig, Hive
Herramientas que no usan Map Reduce: Spark, Spark Streaming, …
Continuación del ejercicio basado en un caso de estudio para el
procesamiento de datos de logs, redes sociales...
Formaciones Big Data & Machine Learning
Curso de Introducción a Big Data
5) Casos de estudio
Análisis de algunos los casos de estudio más relevantes del
mercado: Sistema de recomendación de Amazon, análisis de datos
de sensores en empresas de transporte, análisis de clics en páginas
web, elecciones EEUU...
Análisis de casos de estudios basados en nuestra amplia
experiencia en el desarrollo de proyectos Big Data
La revisión de los casos anteriores permitirá comprobar como las
tecnologías y técnicas estudiadas se han aplicado con éxito en
numerosos proyecto Big Data
Formaciones Big Data & Machine Learning
2) Curso de especialista técnico para Data Scientist
Curso orientado a formar especialistas altamente cualificados en
tecnologías del campo Big Data
5 jornadas. Entrega de Documentación y Certificado
Dirigido a ingenieros, analistas, científicos y, en general, a
cualquier profesional con conocimientos básicos de matemáticas,
informática y estadística
El objetivo de este curso es ofrecer una visión detallada y práctica
desde el punto de vista técnico del Big Data, así como la puesta
práctica de las diferentes técnicas y tecnologías estudiadas.
Se verán ejemplos de arquitecturas ya implantadas en el mercado
y se analizarán los casos de uso en los que Big Data es y ha sido
decisivo, mediante ejercicios prácticos.
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
1) Introducción a Big Data
Directrices principales en las que se basa Big Data
Visión histórica e introducción al contexto del Big Data a través de
ejemplos intuitivos
Cómo afecta Big Data a los negocios. Se analizarán algunos
ejemplos de aplicación exitosa del Big Data y las potenciales
aplicaciones del mismo.
La relación entre Big Data, Business Intelligence, Machine Learning
& Data Science
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
2) Arquitecturas Big Data
Introducción y clasificación de las principales arquitecturas Big Data
Estudio en profundidad del entorno Hadoop: HDFS, Map Reduce,
YARN, Hive, Pig, Spark, distribuciones de Hadoop, etc.
Estudio de las principales soluciones NoSQL: Cassandra, MongoDB,...
Introducción a las bases de datos analíticas: HPVertica y MonetDB
Consideraciones para la elección de la arquitectura Big Data idónea
para cada escenario
Ejemplos prácticos con Hadoop (HDFS, gestión del clúster),
Cassandra y Mongo DB
Formaciones Big Data & Machine Learning
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
3) Obtención y movimiento de datos en Big Data
Estudio de los principales tipos de fuentes de datos actuales, para
entender las dificultades que puede entrañar su procesamiento
Análisis de las principales herramientas disponibles:
Pentaho Data Integration (multipropósito, DW), Sqoop (datos
relacionales en batch), Flume (datos streaming), Kafka (sistema de
colas distribuido, datos Streaming)
Ejercicios prácticos con algunas de las herramientas anteriores
basados en un caso de estudio para la obtención de datos de logs,
redes sociales...
Ejercicios para el movimiento y transformación de datos con
Pentaho Data Integration desde y hacia Mongo DB
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
4) Procesamiento del Big Data
Análisis de los requerimientos del análisis según nuestros objetivos
Introducción a las principales herramientas para el procesamiento y
análisis del Big Data
Herramientas sobre MapReduce: Pig, Hive
Herramientas que no usan Map Reduce: Spark, Spark Streaming,
Storm...
Introducción a Spark y al lenguaje Scala
Ejercicios con Spark y lenguaje escala sobre Hadoop
Análisis de las posibilidades de integración con las distintas
arquitecturas Big Data: Cassandra, Mongo DB,etc.
Continuación del ejercicio basado en un caso de estudio
Formaciones Big Data & Machine Learning
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
5) Introducción al procesamiento del Big Data en tiempo real
Análisis de las soluciones para el análisis de datos en tiempo real en
Hadoop:
Spark Streaming
Storm
Integración con otras herramientas del entorno Hadoop
Flume, Kafka, Hive,…
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
6) Introducción a Machine Learning
Introducción a concepto de Machine Learning, donde el alumno
conocerá las técnicas más novedosas para la extracción de
conocimiento implícito en los datos
Definición del concepto de Machine Learning
Análisis de las técnicas más relevantes
Introducción al Machine Learning con Spark: Técnicas y
herramientas para el desarrollo de aplicaciones de Machine
Learning con Spark y MLib
Ejercicio para el desarrollo de un sencillo algoritmo de Machine
Learning con Spark y MLib
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
7) Nuevas tecnologías y posibilidades analíticas en Big Data
Análisis de las más novedosas tecnologías que están surgiendo en el
cambiante contexto del Big Data
Análisis OLAP en Big Data
Apache Kylin: un motor analítico distribuido de eBay que proporciona
una capa SQL y permite un análisis multidimensional (OLAP) en
Hadoop, admitiendo datasets con grandes volúmenes de datos.
Otras alternativas Pinot, FiloDB
Apache Tez: Alternativa de procesamiento sobre Hadoop que
promete mejorar el rendimiento de herramientas como Pig y Hive
en 100x
Formaciones Big Data & Machine Learning
Formaciones Big Data & Machine Learning
Curso de especialista técnico para Data Scientist
8) Casos de estudio
Análisis de algunos los casos de estudio más relevantes del
mercado: Sistema de recomendación de Amazon, análisis de datos
de sensores en empresas de transporte, análisis de clics en páginas
web, elecciones EEUU...
Análisis de casos de estudios basados en nuestra amplia
experiencia en el desarrollo de proyectos Big Data
La revisión de los casos anteriores permitirá comprobar como las
tecnologías y técnicas estudiadas se han aplicado con éxito en
numerosos proyecto Big Data
Formaciones Big Data & Machine Learning
Curso de Introducción a Machine Learning
Curso orientado a introducir y explicar los principales conceptos,
métodos y tecnologías de Machine Learning
3 jornadas. Entrega de Documentación y Certificado
Dirigido a ingenieros, analistas, científicos y, en general, a
cualquier profesional con conocimientos básicos de matemáticas,
informática y estadística
El objetivo de este curso es ofrecer una visión introductoria de
Machine Learning, analizando su capacidad para generar
oportunidades de negocio y para la resolución de problemas de
distinta naturaleza que involucren el uso de datos masivos (Big
Data)
Se verán ejemplos prácticos de los principales algoritmos y su
implementación con las tecnologías existentes
Formaciones Big Data & Machine Learning
Curso de Introducción a Machine Learning
1) Introducción al Machine Learning
Definición de Machine Learning e introducción a los flujos de
procesos de Machine Learning
Aprende a distinguir entre aprendizaje supervisado y no
supervisado
Se analizarán los distintos tipos de algoritmos y sus posibles
aplicaciones: Clustering, Clasificación, Regresión,…
Estudio de las técnicas para la medición de la calidad de un
algoritmo: Matriz de Confusión, Curva ROC (AUC)
Formaciones Big Data & Machine Learning
Curso de Introducción a Machine Learning
2) Extracción de estructura de los datos: Estudio y aplicación de
las principales técnicas de Clustering
K-Medias
Modelos de Mezcla Gaussiana (GMM)
3) Sistemas de recomendación
Introducción al diseño de sistemas recomendación. Estos sistemas son cada
vez más usados en aplicaciones de e-commerce (ej. Amazon)
Estudio en profundidad de las técnicas de Descomposición en valores
singulares de una matriz (SVD) y Filtrado Colaborativo
Ejercicios prácticos donde se pondrán en práctica las técnicas estudiadas
usando Python y Apache Mahout
Sistemas de recomendación sobre conjunto de datos de películas
Formaciones Big Data & Machine Learning
Formaciones Big Data & Machine Learning
Curso de Introducción a Machine Learning
4) Redes Neuronales y Deep Learning
Introducción a las redes neuronales
Perceptrón simple
Perceptrón multicapa
Introdución al Deep Learning
Algoritmo de entrenamiento retropropagación (backpropagation)
Máquinas de Boltzmann restringidas (RBMs)
Formaciones Big Data & Machine Learning
Curso de Introducción a Machine Learning
5) Sistemas de elección
Estudio la técnica de experimentación Test A/B (Experimento de 2
grupos) ampliamente utilizada en el ámbito del marketing
Se llevará a cabo un experimento para el estudio de una máquina
tragaperras con varias palancas
6) Procesamiento de Lenguaje Natural
Introducción a las técnicas de Procesamiento del Lenguaje Natural
(PLN)
Procesamiento del lenguaje natural con Python (NLTK)
Funciones útiles para análisis semántico
Las técnicas anteriores se pondrán en práctica con un ejercicio de
análisis de sentimientos sobre críticas de películas
Formaciones Big Data & Machine Learning
Vea nuestra demo Big Data para el procesamiento de datos de Twitter:
http://151.80.176.180:8080/BgDemoStratebi/real-time/index.htm
Sobre StrateBI
Vea otras de nuestras demos Online:
http://www.pentaho5.stratebi.com
(Credenciales: stratebi / osbipent5)
http://www.tatopagao.es
Sobre StrateBI
¿Por qué Stratebi para la formación en Big Data & Machine Learning?
Grandes Especialistas Big Data en España (Hadoop, Spark, Hive, Flume,
Hortonworks, Cloudera, Cassandra, HP Vértica…)
Proyectos y formaciones en el Grupo de Ciberseguridad de Prosegur,
Telefónica Educación Digital (TED), con el Ministerio de Presidencia,
con el Grupo Schibsted, INCIBE (Instituto Nacional de
Ciberseguridad…)
Primeros especialistas en BI Open Source (Pentaho, Talend, Mondrian,
Ctools, Saiku…) en España
Unica empresa española que ha estado en los 8 Pentaho Developers
celebrados, habiendo organizado la edición de Barcelona
Stratebi ha puesto en producción más de 100 sistemas Business
Intelligence con Pentaho, incluyendo grandes organizaciones como BBVA,
Telefónica, Globalia, Prosegur, ALD, Gobiernos de La Rioja, Extremdura,
Baleares, Eroski, Equifax, Unilever, Amnistía Internacional, Caixa De
Enginyers, Schibsted, etc… y es el principal especialista Business
Intelligence Open Source en España.
Sobre StrateBI
¿Por qué Stratebi para la formación en Big Data & Machine Learning?
Profesores de los Masters en Business Intelligence y Big Data en:
EOI (Escuela de Organización Industrial)
CIFF
UOC
UTAD
Desarrollo de soluciones para la visualización y analítica de datos sobre
código Pentaho (en producción en muchas organizaciones):
Mejoras en Saiku Reporting y adaptación a nuevas versiones
Visor OLAP STPivot
Editor de Cuadros de Mando (STDashboard)
Aplicación de Scorecards (STCard)
Sobre StrateBI
Sector Privado
Referencias y Datos de Contacto
Sector Público
Referencias y Datos de Contacto
www.TodoBI.com
info@stratebi.com
www.stratebi.com
Mas información
Tfno: 91.788.34.10
Madrid: Pº de la Castellana, 164, 1º
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar
Referencias y Datos de Contacto

Más contenido relacionado

La actualidad más candente

La actualidad más candente (19)

Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop Meetup
 
1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos
 
Hadoop
HadoopHadoop
Hadoop
 
Cluster Multinodo en Apache Hadoop - Arquitectura Lambda
Cluster Multinodo en Apache Hadoop - Arquitectura LambdaCluster Multinodo en Apache Hadoop - Arquitectura Lambda
Cluster Multinodo en Apache Hadoop - Arquitectura Lambda
 
Laboratorio 3 big data
Laboratorio 3 big dataLaboratorio 3 big data
Laboratorio 3 big data
 
Bases de datos.docx kethy
Bases de datos.docx kethyBases de datos.docx kethy
Bases de datos.docx kethy
 
Introducción al procesamiento del Big Data
Introducción al procesamiento del Big DataIntroducción al procesamiento del Big Data
Introducción al procesamiento del Big Data
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Curso de Ajax
Curso de AjaxCurso de Ajax
Curso de Ajax
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
1 base de_datos_distribuidas
1 base de_datos_distribuidas1 base de_datos_distribuidas
1 base de_datos_distribuidas
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Funciones de un DBA y tipos de BD
Funciones de un DBA y tipos de BDFunciones de un DBA y tipos de BD
Funciones de un DBA y tipos de BD
 
Access
Access Access
Access
 
J15 45 peset_fernanda
J15 45 peset_fernandaJ15 45 peset_fernanda
J15 45 peset_fernanda
 
Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a Cassandra
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Bases de datos 1
Bases de datos 1Bases de datos 1
Bases de datos 1
 

Similar a Cursos de Big Data y Machine Learning

Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfVernicaPaulinaChimbo
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosOscar Corcho
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...CICE
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleoCICE
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDaniel Jiménez
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasLuis Felipe Tabares Pérez
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Máster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de MadridMáster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de MadridJose Carlos Soto Gómez
 

Similar a Cursos de Big Data y Machine Learning (20)

Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los Datos
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
Business Intelligende& Big Data: Nuevos perfiles y oportunidades de empleo. P...
 
Claves para entender el actual big data
Claves para entender el actual big dataClaves para entender el actual big data
Claves para entender el actual big data
 
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleoPonencia B2C  Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
BIGDATA
BIGDATABIGDATA
BIGDATA
 
capacitación Data science.pptx
capacitación Data science.pptxcapacitación Data science.pptx
capacitación Data science.pptx
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y Tendencias
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Máster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de MadridMáster Big Data y Business Analytics Universidad Complutense de Madrid
Máster Big Data y Business Analytics Universidad Complutense de Madrid
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Último

PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería yocelynsanchezerasmo
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024eluniversocom
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoSantiagoRodriguezLoz
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docxmarthaarroyo16
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOReluniversocom
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILeluniversocom
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILeluniversocom
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfeluniversocom
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOsecundariatecnica891
 

Último (20)

PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRILPREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA J DE CONSULTA POPULAR 21 DE ABRIL
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf SantiagoAREA TECNOLOGIA E INFORMATICA.pdf Santiago
AREA TECNOLOGIA E INFORMATICA.pdf Santiago
 
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
17 PRACTICAS - MODALIDAAD FAMILIAAR.docx
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRILPREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
PREGUNTA I DE LA CONSULTA POPULAR DEL 21 DE ABRIL
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
 
FORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASOFORMATO INVENTARIO MOBILIARIO PASO A PASO
FORMATO INVENTARIO MOBILIARIO PASO A PASO
 

Cursos de Big Data y Machine Learning

  • 1. Cursos Big Data & Machine Learning
  • 2. Big Data Machine Learning Cursos Ofertados Curso de Introducción a Big Data (3 Jornadas) Curso de especialista técnico en Data Science (5 Jornadas) Curso de Introducción a Machine Learning (3 Jornadas) Sobre StrateBI Formaciones Big Data & Machine Learning
  • 3. Big Data Forma de afrontar el procesamiento, análisis y visualización de grandes volúmenes de información que por su naturaleza desestructurada no pueden ser analizados, en un tiempo aceptable, usando los procesos y herramientas tradicionales de bases de datos y Business Intelligence El Big Data es resultado de los cambios que se han producido en la naturaleza de los datos manejados por las organizaciones Aumento del Volumen de los datos disponibles para el análisis (Terabytes (103 Gb) - Petabytes (106)) Incremento de la Velocidad a la que se generan y se distribuyen los datos en las fuentes (ej. Captura y procesamiento de datos en tiempo real) La Variedad se refiere al importante aumento en la heterogeneidad de las fuentes de datos Big Data
  • 4. Big Data La gestión y procesamiento con éxito del Big Data puede dar lugar a importantes beneficios a las empresas y particulares: Detección de tendencias de negocio Detección de fraude y otros delitos Marketing ….. Sin embargo, la gestión y aprovechamiento del Big Data no es una tarea ni mucho menos trivial. Algunos de los problemas más relevantes son: Tamaño de datos, nivel de estructura, variedad de formatos de archivo, calidad de los datos, datos generados en tiempo real y que además se han de analizar en tiempo real, datos de baja calidad,… Big Data
  • 6. En los últimos años ha ido surgiendo un amplio abanico de tecnologías y herramientas Tecnologías: Hadoop, NoSQL, Bases de datos columnares,… Herramientas: Almacenamiento (HDFS, Cassandra, MongoDB…), procesamiento (Spark, Hive, Storm, Pentaho..), visualización (Pentaho ,Tableau, Clickview…),.. La mayoría de estas tecnologías son Open Source Accesibles a un mayor número de organizaciones que las soluciones propietarias Problema (Know-How): ¿Cómo usar y combinar efectivamente las tecnologías disponibles para rentabilizar con éxito la gestión y procesamiento del Big Data? Big Data
  • 11. Machine Learning Capacidad de un sistema para generalizar sobre la base de la experiencia . Consiste en el uso de estas generalizaciones para dar respuesta a las cuestiones relativas a datos recopilados con anterioridad, así como datos que no se han encontrado antes. Combina y se aplica en multitud de áreas de conocimiento Estadística, reconocimiento de patrones, inteligencia artificial, minería de datos,.. Por aplicación de distintos tipos de algoritmos estos sistemas son capaces de extraer conocimiento de forma automatizada Clasificación, agrupamiento, regresión para la generación de predicciones Machine Learning
  • 13. Machine Learning En combinación con el Big Data (fuentes de datos y tecnologías) aumenta su eficacia y el número de aplicaciones en las que puede ser de utilidad Gran número de posibles aplicaciones que resuelven problemas realmente complejos: Sistemas de recomendación (ej. Carrito de la compra en Amazon) Predecir un tipo de tumor (benigno o maligno) dado un conjunto de datos de entrenamiento Predecir el precio de una vivienda dado un juego de datos de entrenamiento …. Machine Learning
  • 15. Machine Learning Técnicas: Clasificación, Regresión, Clustering… Algoritmos: C4.5, k-means, Support vector machines, Apriori, EM , PageRank, AdaBoost, k-nearest neighbours class, … Tecnologías: Clásicas: WEKA, Python (scikit-learn, pandas, TensorFlow), R,… Big Data: Apache Mahout, Spark con Mlib, Problema (De nuevo el Know-How): ¿Cómo usar y combinar efectivamente las técnicas y tecnologías disponibles para aplicar Machine Learning con éxito? ¿Cómo aplicar Machine Learning sobre Big Data? Machine Learning
  • 17. Cursos ofertados 1) Curso de Introducción a Big Data (3 Jornadas) 2) Curso de especialista técnico en Data Science (5 Jornadas) 3) Curso de Introducción a Machine Learning (3 Jornadas) Formaciones Big Data & Machine Learning
  • 18. 1) Curso de Introducción a Big Data Curso orientado a introducir y explicar los principales conceptos y tecnologías del campo Big Data 3 jornadas. Entrega de Documentación y Certificado Dirigido a todo tipo de audiencia interesada en introducirse en el mundo del Big Data, mediante la realización de ejercicios. El objetivo de este curso es ofrecer una visión holística de Big Data, apoyándonos en su capacidad para generar oportunidades de negocio, así como optimizar los ya existentes. Se verán ejemplos de arquitecturas ya implantadas en el mercado y se analizarán los casos de uso en los que Big Data es y ha sido decisivo. Formaciones Big Data & Machine Learning
  • 19. Curso de Introducción a Big Data 1) Introducción a Big Data Directrices principales en las que se basa Big Data Visión histórica e introducción al contexto del Big Data a través de ejemplos intuitivos Cómo afecta Big Data a los negocios. Se analizarán algunos ejemplos de aplicación exitosa del Big Data y las potenciales aplicaciones del mismo. La relación entre Big Data, Business Intelligence, Machine Learning & Data Science. Formaciones Big Data & Machine Learning
  • 20. Curso de Introducción a Big Data 2) Arquitecturas Big Data Introducción y clasificación a las diferentes arquitecturas y sistemas Big Data disponibles en el mercado Entorno Hadoop: HDFS, Map Reduce, YARN, análisis de la pila de herramientas disponibles sobre HDFS y Map Reduce (Hive, Pig...), introducción a las distribuciones de Hadoop, etc. NoSQL: Cassandra, MongoDB,... Ejemplos prácticos donde el alumnos pondrá en práctica lo estudiado sobre el entorno Hadoop Introducción a una distribución de Hadoop y a la gestión del clúster Uso del sistema de archivos HDFS Formaciones Big Data & Machine Learning
  • 21. Formaciones Big Data & Machine Learning
  • 22. Curso de Introducción a Big Data 3) Obtención y movimiento de datos en Big Data Estudio de los principales tipos de fuentes de datos actuales Datos estructurados, semi estructurados y no estructurados Batch y streaming Análisis de las principales herramientas disponibles para la adquisición y movimiento de datos: Pentaho Data Integration (multipropósito, DW), Sqoop (datos relacionales en batch), Flume (datos streaming) Ejercicios prácticos con algunas de las herramientas anteriores basados en un caso de estudio para la obtención de datos de logs, redes sociales... Formaciones Big Data & Machine Learning
  • 23. Curso de Introducción a Big Data 4) Procesamiento del Big Data Análisis de los requerimientos del análisis según nuestros objetivos. No todos los proyectos Big Data siguen el mismo patrón, por lo que es importante una correcta elección de las herramientas en función de los objetivos. Introducción a las principales herramientas para el procesamiento y análisis del Big Data Herramientas sobre MapReduce: Pig, Hive Herramientas que no usan Map Reduce: Spark, Spark Streaming, … Continuación del ejercicio basado en un caso de estudio para el procesamiento de datos de logs, redes sociales... Formaciones Big Data & Machine Learning
  • 24. Curso de Introducción a Big Data 5) Casos de estudio Análisis de algunos los casos de estudio más relevantes del mercado: Sistema de recomendación de Amazon, análisis de datos de sensores en empresas de transporte, análisis de clics en páginas web, elecciones EEUU... Análisis de casos de estudios basados en nuestra amplia experiencia en el desarrollo de proyectos Big Data La revisión de los casos anteriores permitirá comprobar como las tecnologías y técnicas estudiadas se han aplicado con éxito en numerosos proyecto Big Data Formaciones Big Data & Machine Learning
  • 25. 2) Curso de especialista técnico para Data Scientist Curso orientado a formar especialistas altamente cualificados en tecnologías del campo Big Data 5 jornadas. Entrega de Documentación y Certificado Dirigido a ingenieros, analistas, científicos y, en general, a cualquier profesional con conocimientos básicos de matemáticas, informática y estadística El objetivo de este curso es ofrecer una visión detallada y práctica desde el punto de vista técnico del Big Data, así como la puesta práctica de las diferentes técnicas y tecnologías estudiadas. Se verán ejemplos de arquitecturas ya implantadas en el mercado y se analizarán los casos de uso en los que Big Data es y ha sido decisivo, mediante ejercicios prácticos. Formaciones Big Data & Machine Learning
  • 26. Curso de especialista técnico para Data Scientist 1) Introducción a Big Data Directrices principales en las que se basa Big Data Visión histórica e introducción al contexto del Big Data a través de ejemplos intuitivos Cómo afecta Big Data a los negocios. Se analizarán algunos ejemplos de aplicación exitosa del Big Data y las potenciales aplicaciones del mismo. La relación entre Big Data, Business Intelligence, Machine Learning & Data Science Formaciones Big Data & Machine Learning
  • 27. Curso de especialista técnico para Data Scientist 2) Arquitecturas Big Data Introducción y clasificación de las principales arquitecturas Big Data Estudio en profundidad del entorno Hadoop: HDFS, Map Reduce, YARN, Hive, Pig, Spark, distribuciones de Hadoop, etc. Estudio de las principales soluciones NoSQL: Cassandra, MongoDB,... Introducción a las bases de datos analíticas: HPVertica y MonetDB Consideraciones para la elección de la arquitectura Big Data idónea para cada escenario Ejemplos prácticos con Hadoop (HDFS, gestión del clúster), Cassandra y Mongo DB Formaciones Big Data & Machine Learning
  • 28. Formaciones Big Data & Machine Learning
  • 29. Curso de especialista técnico para Data Scientist 3) Obtención y movimiento de datos en Big Data Estudio de los principales tipos de fuentes de datos actuales, para entender las dificultades que puede entrañar su procesamiento Análisis de las principales herramientas disponibles: Pentaho Data Integration (multipropósito, DW), Sqoop (datos relacionales en batch), Flume (datos streaming), Kafka (sistema de colas distribuido, datos Streaming) Ejercicios prácticos con algunas de las herramientas anteriores basados en un caso de estudio para la obtención de datos de logs, redes sociales... Ejercicios para el movimiento y transformación de datos con Pentaho Data Integration desde y hacia Mongo DB Formaciones Big Data & Machine Learning
  • 30. Curso de especialista técnico para Data Scientist 4) Procesamiento del Big Data Análisis de los requerimientos del análisis según nuestros objetivos Introducción a las principales herramientas para el procesamiento y análisis del Big Data Herramientas sobre MapReduce: Pig, Hive Herramientas que no usan Map Reduce: Spark, Spark Streaming, Storm... Introducción a Spark y al lenguaje Scala Ejercicios con Spark y lenguaje escala sobre Hadoop Análisis de las posibilidades de integración con las distintas arquitecturas Big Data: Cassandra, Mongo DB,etc. Continuación del ejercicio basado en un caso de estudio Formaciones Big Data & Machine Learning
  • 31. Formaciones Big Data & Machine Learning
  • 32. Curso de especialista técnico para Data Scientist 5) Introducción al procesamiento del Big Data en tiempo real Análisis de las soluciones para el análisis de datos en tiempo real en Hadoop: Spark Streaming Storm Integración con otras herramientas del entorno Hadoop Flume, Kafka, Hive,… Formaciones Big Data & Machine Learning
  • 33. Curso de especialista técnico para Data Scientist 6) Introducción a Machine Learning Introducción a concepto de Machine Learning, donde el alumno conocerá las técnicas más novedosas para la extracción de conocimiento implícito en los datos Definición del concepto de Machine Learning Análisis de las técnicas más relevantes Introducción al Machine Learning con Spark: Técnicas y herramientas para el desarrollo de aplicaciones de Machine Learning con Spark y MLib Ejercicio para el desarrollo de un sencillo algoritmo de Machine Learning con Spark y MLib Formaciones Big Data & Machine Learning
  • 34. Curso de especialista técnico para Data Scientist 7) Nuevas tecnologías y posibilidades analíticas en Big Data Análisis de las más novedosas tecnologías que están surgiendo en el cambiante contexto del Big Data Análisis OLAP en Big Data Apache Kylin: un motor analítico distribuido de eBay que proporciona una capa SQL y permite un análisis multidimensional (OLAP) en Hadoop, admitiendo datasets con grandes volúmenes de datos. Otras alternativas Pinot, FiloDB Apache Tez: Alternativa de procesamiento sobre Hadoop que promete mejorar el rendimiento de herramientas como Pig y Hive en 100x Formaciones Big Data & Machine Learning
  • 35. Formaciones Big Data & Machine Learning
  • 36. Curso de especialista técnico para Data Scientist 8) Casos de estudio Análisis de algunos los casos de estudio más relevantes del mercado: Sistema de recomendación de Amazon, análisis de datos de sensores en empresas de transporte, análisis de clics en páginas web, elecciones EEUU... Análisis de casos de estudios basados en nuestra amplia experiencia en el desarrollo de proyectos Big Data La revisión de los casos anteriores permitirá comprobar como las tecnologías y técnicas estudiadas se han aplicado con éxito en numerosos proyecto Big Data Formaciones Big Data & Machine Learning
  • 37. Curso de Introducción a Machine Learning Curso orientado a introducir y explicar los principales conceptos, métodos y tecnologías de Machine Learning 3 jornadas. Entrega de Documentación y Certificado Dirigido a ingenieros, analistas, científicos y, en general, a cualquier profesional con conocimientos básicos de matemáticas, informática y estadística El objetivo de este curso es ofrecer una visión introductoria de Machine Learning, analizando su capacidad para generar oportunidades de negocio y para la resolución de problemas de distinta naturaleza que involucren el uso de datos masivos (Big Data) Se verán ejemplos prácticos de los principales algoritmos y su implementación con las tecnologías existentes Formaciones Big Data & Machine Learning
  • 38. Curso de Introducción a Machine Learning 1) Introducción al Machine Learning Definición de Machine Learning e introducción a los flujos de procesos de Machine Learning Aprende a distinguir entre aprendizaje supervisado y no supervisado Se analizarán los distintos tipos de algoritmos y sus posibles aplicaciones: Clustering, Clasificación, Regresión,… Estudio de las técnicas para la medición de la calidad de un algoritmo: Matriz de Confusión, Curva ROC (AUC) Formaciones Big Data & Machine Learning
  • 39. Curso de Introducción a Machine Learning 2) Extracción de estructura de los datos: Estudio y aplicación de las principales técnicas de Clustering K-Medias Modelos de Mezcla Gaussiana (GMM) 3) Sistemas de recomendación Introducción al diseño de sistemas recomendación. Estos sistemas son cada vez más usados en aplicaciones de e-commerce (ej. Amazon) Estudio en profundidad de las técnicas de Descomposición en valores singulares de una matriz (SVD) y Filtrado Colaborativo Ejercicios prácticos donde se pondrán en práctica las técnicas estudiadas usando Python y Apache Mahout Sistemas de recomendación sobre conjunto de datos de películas Formaciones Big Data & Machine Learning
  • 40. Formaciones Big Data & Machine Learning
  • 41. Curso de Introducción a Machine Learning 4) Redes Neuronales y Deep Learning Introducción a las redes neuronales Perceptrón simple Perceptrón multicapa Introdución al Deep Learning Algoritmo de entrenamiento retropropagación (backpropagation) Máquinas de Boltzmann restringidas (RBMs) Formaciones Big Data & Machine Learning
  • 42. Curso de Introducción a Machine Learning 5) Sistemas de elección Estudio la técnica de experimentación Test A/B (Experimento de 2 grupos) ampliamente utilizada en el ámbito del marketing Se llevará a cabo un experimento para el estudio de una máquina tragaperras con varias palancas 6) Procesamiento de Lenguaje Natural Introducción a las técnicas de Procesamiento del Lenguaje Natural (PLN) Procesamiento del lenguaje natural con Python (NLTK) Funciones útiles para análisis semántico Las técnicas anteriores se pondrán en práctica con un ejercicio de análisis de sentimientos sobre críticas de películas Formaciones Big Data & Machine Learning
  • 43. Vea nuestra demo Big Data para el procesamiento de datos de Twitter: http://151.80.176.180:8080/BgDemoStratebi/real-time/index.htm Sobre StrateBI
  • 44. Vea otras de nuestras demos Online: http://www.pentaho5.stratebi.com (Credenciales: stratebi / osbipent5) http://www.tatopagao.es Sobre StrateBI
  • 45. ¿Por qué Stratebi para la formación en Big Data & Machine Learning? Grandes Especialistas Big Data en España (Hadoop, Spark, Hive, Flume, Hortonworks, Cloudera, Cassandra, HP Vértica…) Proyectos y formaciones en el Grupo de Ciberseguridad de Prosegur, Telefónica Educación Digital (TED), con el Ministerio de Presidencia, con el Grupo Schibsted, INCIBE (Instituto Nacional de Ciberseguridad…) Primeros especialistas en BI Open Source (Pentaho, Talend, Mondrian, Ctools, Saiku…) en España Unica empresa española que ha estado en los 8 Pentaho Developers celebrados, habiendo organizado la edición de Barcelona Stratebi ha puesto en producción más de 100 sistemas Business Intelligence con Pentaho, incluyendo grandes organizaciones como BBVA, Telefónica, Globalia, Prosegur, ALD, Gobiernos de La Rioja, Extremdura, Baleares, Eroski, Equifax, Unilever, Amnistía Internacional, Caixa De Enginyers, Schibsted, etc… y es el principal especialista Business Intelligence Open Source en España. Sobre StrateBI
  • 46. ¿Por qué Stratebi para la formación en Big Data & Machine Learning? Profesores de los Masters en Business Intelligence y Big Data en: EOI (Escuela de Organización Industrial) CIFF UOC UTAD Desarrollo de soluciones para la visualización y analítica de datos sobre código Pentaho (en producción en muchas organizaciones): Mejoras en Saiku Reporting y adaptación a nuevas versiones Visor OLAP STPivot Editor de Cuadros de Mando (STDashboard) Aplicación de Scorecards (STCard) Sobre StrateBI
  • 47. Sector Privado Referencias y Datos de Contacto
  • 48. Sector Público Referencias y Datos de Contacto
  • 49. www.TodoBI.com info@stratebi.com www.stratebi.com Mas información Tfno: 91.788.34.10 Madrid: Pº de la Castellana, 164, 1º Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar Referencias y Datos de Contacto