SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
Que es la Ciencia de Datos, el
aprendizaje automático (ML), el Big
Data y cuales son sus usos?
Juan Pablo Mora
Director – Programa MBA, Universidad Javeriana
MS in Urban Data Science – NYU CUSP
Qué es la Ciencia de Datos?
La ciencia de los datos es un paso evolutivo en campos interdisciplinarios como el análisis de
negocios que incorpora la informática, el modelado, las estadísticas, la analítica y las
matemáticas en uno solo proceso (NYU center for Data Science).
Matemática y
estadística
Ciencias de la
computación
Conocimiento de
dominio
Unicornio
Machine
Learning
Investigación
Ingeniería
Scripting, SQL
Python, R Scala
Data Pipelines
Big Data/ Apache
Spark, Hadoop
NoSQL
Conocimiento de dominio
Supply Chain
CRM
Finanzas
Costos
Recursos humanos
Matemáticas
computacionales
Algebra Líneal
Cálculo multivariado
… Pero la ciencia de datos tiene varias
definiciones
“El científico de Datos es aquel “que puede crear
puentes entre los datos crudos y el análisis –
haciéndolos accesibles . Es un rol democratizarte en la
medida que lleva los datos a la gente común, hacienda
el mundo un poco mejor paso a paso.”
“Hay un chiste en twitter que dice que la definición mas perfecta
de un científico de datos es la de un analista de datos que vive
en Silicon valley en California,”
“Los científicos de datos están involucrados con el agrupamiento de
datos desde distintas fuentes, su edición en formas mas tratables y
entendibles de forma que cuenten una historia que pueda ser
presentada por ellos para ser entendida por todos”
… Y una de ellas es como contar
historias con los datos
… Y una de ellas es como contar
historias con los datos
Machine Learning Vs Big data Vs
Inteligencia Artificial
Set de herramientas
Herramienta
Campo
Machine Learning Vs Big data Vs
Inteligencia Artificial
Qué es Inteligencia artificial
“La inteligencia artificial (IA) es el área de la ciencia de la computación que se enfoca
en la creación de máquinas inteligentes que actuan y reaccionan como los humanos.
Algunas de las actividades que las computadoras diseñadas con IA hacen son:
• Reconocimiento del habla
• Aprendizaje
• Planeación
• Resolución de problemas”
Techopedia, 2019.
Qué es Big data
“El concepto de big data se puede definir como las múltiples fuentes de información de alto
volúmen, alta velocidad y alta variedad que exigen de formas innovadoras y costo efectivas
para ser procesadas con el fin de generar descubrimientos, procesos de desición y
automatización de procesos”
Gartner, 2018
Qué es Big data
“El concepto de big data se puede definir como las múltiples fuentes de información de alto
volúmen, alta velocidad y alta variedad que exigen de formas innovadoras y costo efectivas
para ser procesadas con el fin de generar descubrimientos, procesos de desición y
automatización de procesos”
Gartner, 2018
11
11
Big Data = Volumen, Variedad, Velocidad y Veracidad
Escalable de terabytes a
zettabytes
Datos de tipo relacional y
no-relacional de
diferentes fuentes
Data en tiempo real y con
alto factor de movimiento
Contenidos dispares o
que con calidad variada
Volumen:
Variedad:
Velocidad:
Veracidad:
Sistemas que
aprenden
ser programados
explicitamente
Sin
Machine Learning – Cuál es el alboroto y
por qué debería importarnos?
Machine learning es el subcampo de la ciencias de la información que busca la posibilidad de que
las maquinas aprendan de su entorno sin necesidad de ser explícitamente programadas (Arthur
Samuel, 1959).
Producir nuevos modelos de manera rápida y automatizada que permitan analizar una mayor cantidad de
datos en un tiempo mas corto, entregando resultados mas exactos – aun a gran escala. Mediante la estos
modelos las organizaciones pueden tener un mejor entendimiento e identificación de oportunidades mas
rentables, reduciendo sus riesgos operativos.
Sistema
Datos
Programa
Resultado
Sistema
Datos
Resultado
Programa
Programación tradicional
Machine Learning
Esquema sistemático base del
machine learning
Origen de la ciencia de datos &
machine learning
1642
Maquina aritmética
Pascal
1649
Calculadora
Autónoma
Leibniz
1890
Maquina tabuladora
Hollerith
1945
Mark I
1952
Checkers program
1957
Mark I - Perceptron
1967
Recon. patrones
1990
Aplic. Mach
Learning
2000’s
Aplic. AI
IBM, Apple,
Amazon..
2010’s
Redes Neurales y
Deep Learning
FB – Google – IBM
¿Magia?
No, es más como jardinería.
 Semillas = Algoritmos
 Nutrientes = Datos
 Jardinero = Tú
 Plantas = Modelo/Programa
Tipos de aprendizaje automático
17
 Acción
rat maze
Recompensa
chee
se
brain
Observación
dog
cat
cat
dog
ID Positivo: Pug Desconocido
Desconocido ID Positivo: Pug
dog
dog
dog
dog
Aprendizaje
supervisado
Aprendizaje no
supervisado
Aprendizaje
por refuerzo
Aprendizaje
profundo
Algoritmos y lenguajes de programación
18
Bayesianos Clustering Arboles de desición Reducción de
dimensionalidad
Algoritmos basados
en instancias
Regresión lineal Regularización
Principales algoritmos de ML por tipo
de uso
Campos de desarrollo en Machine
learning y tendencias
Aprendizaje por Refuerzo Deep Learning (FNN, CNN,
RNN, Autoencoders, LSTMNN, GAN)
Deep Text
Campos de desarrollo en Machine
learning y tendencias
Generative adversarial networks (GAN)
Convolutional Neural Networks (CNN)
Tendencias de tecnología en la ciencia de datos…
SPSS SAS
Python R Scala
Trends in Google Searches (September 2nd 2016)
La ciencia de datos está encausando la evolución del
concepto de base de datos a big data….
Bases de datos
Big Data
Source: Google Trends
Hadoop
Spark
Aplicaciones mas conocidas del Machine
Learning y la ciencia de datos en el
mundo real
Visión de
computadores
Procesamiento de lenguaje natural
Reconocimiento de habla y audio Modelamiento predictivo
Aplicaciones del Machine Learning y la
ciencia de datos en el mundo corporativo
Salud Internet de
las cosas
Marketing y Ventas Transporte
Servicios Financieros
Metodología CRISP-DM (Cross Industry standard
Process for data mining)
Siete pasos de la metodología:
•Entendimiento de la necesidad de
negocio
•Entendimiento de los datos
•Preparación de los datos
•Validación de datos
•Modelamiento
•Evaluación
•Despliegue de los modelos
Herramientas e
Infraestructura
• Necesidad de un
ambiente que
permita “fallos
rápidos”
• Herramientas que no
permiten
colaboración
Gobierno
• Si la data no está
segura, el auto
servicio no es una
realidad
• Retos para entender
la historia de los datos
para tener una vista
única
Conocimiento
• Los conocimientos de
ciencia de datos
tienen poca oferta y
mucha demanda
• Alto riesgo de fuga de
conocimiento y capital
intelectual
Datos
• Los datos residen
en silos y son
difíciles de acceder
• Datos externos y no
estructurados no
son considerados
27
¿Por qué las organizaciones están sufriendo
para capturar el valor real de la Información?
Ecosistema de aplicaciones y productos en la
Ciencia de Datos
Ejemplos de aplicación de la Ciencia de datos – Uso de características
socio económicas de los usuarios de la línea 311 en la Ciudad de
Nueva York para predecir tipos de llamadas
Ejemplos de aplicación de la Ciencia de datos – Creación de un índice
de inequidad en el acceso al transporte en la ciudad de Nueva York
Ejemplos de aplicación de la Ciencia de datos – Análisis de
sentimientos sobre el proceso de paz en Colombia usando Twitter
http://juanmorads.blogspot.com.co/

Mais conteúdo relacionado

Mais procurados

AI Governance – The Responsible Use of AI
AI Governance – The Responsible Use of AIAI Governance – The Responsible Use of AI
AI Governance – The Responsible Use of AINUS-ISS
 
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Hritika Raj
 
Técnicas y herramientas de extracción de datos
Técnicas y herramientas de extracción de datos Técnicas y herramientas de extracción de datos
Técnicas y herramientas de extracción de datos Juan Sixto
 
The Future of Data Science
The Future of Data ScienceThe Future of Data Science
The Future of Data ScienceDataWorks Summit
 
Big Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyBig Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyRohit Dubey
 
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...Edureka!
 
Introduction to data science.pptx
Introduction to data science.pptxIntroduction to data science.pptx
Introduction to data science.pptxSadhanaParameswaran
 
introduction to data science
introduction to data scienceintroduction to data science
introduction to data sciencebhavesh lande
 
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...Edureka!
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data ScienceANOOP V S
 
Team 2 Big Data Presentation
Team 2 Big Data PresentationTeam 2 Big Data Presentation
Team 2 Big Data PresentationMatthew Urdan
 
Introduction to Business Intelligence
Introduction to Business IntelligenceIntroduction to Business Intelligence
Introduction to Business IntelligenceRonan Soares
 

Mais procurados (20)

Big Data Trends
Big Data TrendsBig Data Trends
Big Data Trends
 
AI Governance – The Responsible Use of AI
AI Governance – The Responsible Use of AIAI Governance – The Responsible Use of AI
AI Governance – The Responsible Use of AI
 
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
Big data PPT prepared by Hritika Raj (Shivalik college of engg.)
 
Técnicas y herramientas de extracción de datos
Técnicas y herramientas de extracción de datos Técnicas y herramientas de extracción de datos
Técnicas y herramientas de extracción de datos
 
The Future of Data Science
The Future of Data ScienceThe Future of Data Science
The Future of Data Science
 
Sstema de información gerencial
Sstema de información gerencialSstema de información gerencial
Sstema de información gerencial
 
Big Data PPT by Rohit Dubey
Big Data PPT by Rohit DubeyBig Data PPT by Rohit Dubey
Big Data PPT by Rohit Dubey
 
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
What Is Data Science? Data Science Course - Data Science Tutorial For Beginne...
 
Big Data
Big DataBig Data
Big Data
 
Introduction to data science.pptx
Introduction to data science.pptxIntroduction to data science.pptx
Introduction to data science.pptx
 
Data Science
Data ScienceData Science
Data Science
 
Big Data
Big DataBig Data
Big Data
 
Data Analytics
Data AnalyticsData Analytics
Data Analytics
 
Big data
Big dataBig data
Big data
 
introduction to data science
introduction to data scienceintroduction to data science
introduction to data science
 
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...
Who is a Data Scientist? | How to become a Data Scientist? | Data Science Cou...
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Team 2 Big Data Presentation
Team 2 Big Data PresentationTeam 2 Big Data Presentation
Team 2 Big Data Presentation
 
Introduction to Business Intelligence
Introduction to Business IntelligenceIntroduction to Business Intelligence
Introduction to Business Intelligence
 

Semelhante a Qué es la ciencia de datos.pdf

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03sbmalambo
 
Smart data el uso inteligente de los datos
Smart data el uso inteligente de los datosSmart data el uso inteligente de los datos
Smart data el uso inteligente de los datosDataCentric PDM
 
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALFUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALPamelaGranda5
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
Presentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptxPresentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptxWillianVinicio1
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfGerard Alba
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...Ronald vargas presente y futuro la adolescencia de los super sistemas computa...
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...Ronald Francisco Vargas Quesada
 
Inteligencia Artificial
Inteligencia Artificial Inteligencia Artificial
Inteligencia Artificial Danny2153
 
Inteligencia Artificial
Inteligencia Artificial Inteligencia Artificial
Inteligencia Artificial Danny2153
 

Semelhante a Qué es la ciencia de datos.pdf (20)

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
presentacion ia informatica.pptx
presentacion ia informatica.pptxpresentacion ia informatica.pptx
presentacion ia informatica.pptx
 
presentacion IA
presentacion IApresentacion IA
presentacion IA
 
Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03Hacia ti capacitación virtual pasos 01, 02, 03
Hacia ti capacitación virtual pasos 01, 02, 03
 
Smart data el uso inteligente de los datos
Smart data el uso inteligente de los datosSmart data el uso inteligente de los datos
Smart data el uso inteligente de los datos
 
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIALFUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Presentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptxPresentación Inteligencia Artificial.pptx
Presentación Inteligencia Artificial.pptx
 
Metric Video Analytics
Metric Video AnalyticsMetric Video Analytics
Metric Video Analytics
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Aprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdfAprendizaje automático I - Sesión 1 Intro.pdf
Aprendizaje automático I - Sesión 1 Intro.pdf
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...Ronald vargas presente y futuro la adolescencia de los super sistemas computa...
Ronald vargas presente y futuro la adolescencia de los super sistemas computa...
 
Inteligencia Artificial
Inteligencia Artificial Inteligencia Artificial
Inteligencia Artificial
 
Inteligencia Artificial
Inteligencia Artificial Inteligencia Artificial
Inteligencia Artificial
 
El big data
El big dataEl big data
El big data
 

Mais de apssoftwaredegestion

Mais de apssoftwaredegestion (7)

introducción a herencia programación orientada a objetos
introducción a herencia programación orientada a objetosintroducción a herencia programación orientada a objetos
introducción a herencia programación orientada a objetos
 
Listas dinámicas y programación de objetos en java
Listas dinámicas y programación de objetos  en javaListas dinámicas y programación de objetos  en java
Listas dinámicas y programación de objetos en java
 
clase 01BDF.pdf
clase 01BDF.pdfclase 01BDF.pdf
clase 01BDF.pdf
 
el-software-y-sus-clases.pdf
el-software-y-sus-clases.pdfel-software-y-sus-clases.pdf
el-software-y-sus-clases.pdf
 
Las-Variables.pdf
Las-Variables.pdfLas-Variables.pdf
Las-Variables.pdf
 
BD Federadas 01.pptx
BD Federadas 01.pptxBD Federadas 01.pptx
BD Federadas 01.pptx
 
El arte de la ciencia de datos
El arte de la ciencia de datosEl arte de la ciencia de datos
El arte de la ciencia de datos
 

Último

COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaItalo838444
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxlm8322074
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,LANZAPIANDAJOSEANDRE
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxJafetColli
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarCelesteRolon2
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfjosellaqtas
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacienteMedicinaInternaresid1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 

Último (20)

COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
EXPOSICION. PROCEOS SAW SEMIATUMATIZADO,
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 

Qué es la ciencia de datos.pdf

  • 1. Que es la Ciencia de Datos, el aprendizaje automático (ML), el Big Data y cuales son sus usos? Juan Pablo Mora Director – Programa MBA, Universidad Javeriana MS in Urban Data Science – NYU CUSP
  • 2. Qué es la Ciencia de Datos? La ciencia de los datos es un paso evolutivo en campos interdisciplinarios como el análisis de negocios que incorpora la informática, el modelado, las estadísticas, la analítica y las matemáticas en uno solo proceso (NYU center for Data Science). Matemática y estadística Ciencias de la computación Conocimiento de dominio Unicornio Machine Learning Investigación Ingeniería Scripting, SQL Python, R Scala Data Pipelines Big Data/ Apache Spark, Hadoop NoSQL Conocimiento de dominio Supply Chain CRM Finanzas Costos Recursos humanos Matemáticas computacionales Algebra Líneal Cálculo multivariado
  • 3. … Pero la ciencia de datos tiene varias definiciones “El científico de Datos es aquel “que puede crear puentes entre los datos crudos y el análisis – haciéndolos accesibles . Es un rol democratizarte en la medida que lleva los datos a la gente común, hacienda el mundo un poco mejor paso a paso.” “Hay un chiste en twitter que dice que la definición mas perfecta de un científico de datos es la de un analista de datos que vive en Silicon valley en California,” “Los científicos de datos están involucrados con el agrupamiento de datos desde distintas fuentes, su edición en formas mas tratables y entendibles de forma que cuenten una historia que pueda ser presentada por ellos para ser entendida por todos”
  • 4. … Y una de ellas es como contar historias con los datos
  • 5. … Y una de ellas es como contar historias con los datos
  • 6. Machine Learning Vs Big data Vs Inteligencia Artificial Set de herramientas Herramienta Campo
  • 7. Machine Learning Vs Big data Vs Inteligencia Artificial
  • 8. Qué es Inteligencia artificial “La inteligencia artificial (IA) es el área de la ciencia de la computación que se enfoca en la creación de máquinas inteligentes que actuan y reaccionan como los humanos. Algunas de las actividades que las computadoras diseñadas con IA hacen son: • Reconocimiento del habla • Aprendizaje • Planeación • Resolución de problemas” Techopedia, 2019.
  • 9. Qué es Big data “El concepto de big data se puede definir como las múltiples fuentes de información de alto volúmen, alta velocidad y alta variedad que exigen de formas innovadoras y costo efectivas para ser procesadas con el fin de generar descubrimientos, procesos de desición y automatización de procesos” Gartner, 2018
  • 10. Qué es Big data “El concepto de big data se puede definir como las múltiples fuentes de información de alto volúmen, alta velocidad y alta variedad que exigen de formas innovadoras y costo efectivas para ser procesadas con el fin de generar descubrimientos, procesos de desición y automatización de procesos” Gartner, 2018
  • 11. 11 11 Big Data = Volumen, Variedad, Velocidad y Veracidad Escalable de terabytes a zettabytes Datos de tipo relacional y no-relacional de diferentes fuentes Data en tiempo real y con alto factor de movimiento Contenidos dispares o que con calidad variada Volumen: Variedad: Velocidad: Veracidad:
  • 13. Machine Learning – Cuál es el alboroto y por qué debería importarnos? Machine learning es el subcampo de la ciencias de la información que busca la posibilidad de que las maquinas aprendan de su entorno sin necesidad de ser explícitamente programadas (Arthur Samuel, 1959). Producir nuevos modelos de manera rápida y automatizada que permitan analizar una mayor cantidad de datos en un tiempo mas corto, entregando resultados mas exactos – aun a gran escala. Mediante la estos modelos las organizaciones pueden tener un mejor entendimiento e identificación de oportunidades mas rentables, reduciendo sus riesgos operativos.
  • 15. Origen de la ciencia de datos & machine learning 1642 Maquina aritmética Pascal 1649 Calculadora Autónoma Leibniz 1890 Maquina tabuladora Hollerith 1945 Mark I 1952 Checkers program 1957 Mark I - Perceptron 1967 Recon. patrones 1990 Aplic. Mach Learning 2000’s Aplic. AI IBM, Apple, Amazon.. 2010’s Redes Neurales y Deep Learning FB – Google – IBM
  • 16. ¿Magia? No, es más como jardinería.  Semillas = Algoritmos  Nutrientes = Datos  Jardinero = Tú  Plantas = Modelo/Programa
  • 17. Tipos de aprendizaje automático 17  Acción rat maze Recompensa chee se brain Observación dog cat cat dog ID Positivo: Pug Desconocido Desconocido ID Positivo: Pug dog dog dog dog Aprendizaje supervisado Aprendizaje no supervisado Aprendizaje por refuerzo Aprendizaje profundo
  • 18. Algoritmos y lenguajes de programación 18 Bayesianos Clustering Arboles de desición Reducción de dimensionalidad Algoritmos basados en instancias Regresión lineal Regularización
  • 19. Principales algoritmos de ML por tipo de uso
  • 20. Campos de desarrollo en Machine learning y tendencias Aprendizaje por Refuerzo Deep Learning (FNN, CNN, RNN, Autoencoders, LSTMNN, GAN) Deep Text
  • 21. Campos de desarrollo en Machine learning y tendencias Generative adversarial networks (GAN) Convolutional Neural Networks (CNN)
  • 22. Tendencias de tecnología en la ciencia de datos… SPSS SAS Python R Scala Trends in Google Searches (September 2nd 2016)
  • 23. La ciencia de datos está encausando la evolución del concepto de base de datos a big data…. Bases de datos Big Data Source: Google Trends Hadoop Spark
  • 24. Aplicaciones mas conocidas del Machine Learning y la ciencia de datos en el mundo real Visión de computadores Procesamiento de lenguaje natural Reconocimiento de habla y audio Modelamiento predictivo
  • 25. Aplicaciones del Machine Learning y la ciencia de datos en el mundo corporativo Salud Internet de las cosas Marketing y Ventas Transporte Servicios Financieros
  • 26. Metodología CRISP-DM (Cross Industry standard Process for data mining) Siete pasos de la metodología: •Entendimiento de la necesidad de negocio •Entendimiento de los datos •Preparación de los datos •Validación de datos •Modelamiento •Evaluación •Despliegue de los modelos
  • 27. Herramientas e Infraestructura • Necesidad de un ambiente que permita “fallos rápidos” • Herramientas que no permiten colaboración Gobierno • Si la data no está segura, el auto servicio no es una realidad • Retos para entender la historia de los datos para tener una vista única Conocimiento • Los conocimientos de ciencia de datos tienen poca oferta y mucha demanda • Alto riesgo de fuga de conocimiento y capital intelectual Datos • Los datos residen en silos y son difíciles de acceder • Datos externos y no estructurados no son considerados 27 ¿Por qué las organizaciones están sufriendo para capturar el valor real de la Información?
  • 28. Ecosistema de aplicaciones y productos en la Ciencia de Datos
  • 29. Ejemplos de aplicación de la Ciencia de datos – Uso de características socio económicas de los usuarios de la línea 311 en la Ciudad de Nueva York para predecir tipos de llamadas
  • 30. Ejemplos de aplicación de la Ciencia de datos – Creación de un índice de inequidad en el acceso al transporte en la ciudad de Nueva York
  • 31. Ejemplos de aplicación de la Ciencia de datos – Análisis de sentimientos sobre el proceso de paz en Colombia usando Twitter http://juanmorads.blogspot.com.co/