SlideShare uma empresa Scribd logo
1 de 21
Big Data en el mundo del Machine
Learning
ESCUELA DE TECNOLOGÍA DE LA INFORMACIÓN
En breve comenzamos ...
Bienvenidos a las Tardes TIC
2
CONSEJOS PARA INGRESAR A BLACKBOARD
1
6
5
3
4
2
Silenciar nuestros micrófonos
para una mejor escucha entre
todos y apagar nuestras
cámaras
Escoger un lugar adecuado
para la videoconferencia
Si la conexión es por tu celular
será necesario descarga la app,
si lo haces desde la
computadora sólo deberás
ingresar con el enlace
Revisa que tu conexión a
internet sea estable
Sugerimos el uso de
audífonos para una mejor
escucha y transmisión de
nuestra voz
El link estará aperturado 30
minutos antes para probar la
conectividad y sus funciones
Para cualquier consulta estamos aquí para ayudarte.
Comunícate con Isabel Lindo / correo: isabel.lindo@cibertec.pe
4
Agenda
1. Bienvenida al ponente y participantes.
2. Presentación al Ponente
3. Desarrollo de la ponencia
4. Preguntas
5. Palabras de cierre.
5
Nicolás Nakasone
6
Big Data en el mundo del
Machine Learning
7
Definiciones de Big Data
Wikipedia hace referencia a una cantidad de datos tal que supera la capacidad del
software convencional para ser capturados, administrados y procesados en un
tiempo razonable.
IBM: toda aquella información que no puede ser procesada o
analizada utilizando procesos o herramientas tradicionales.
Gartner: son activos de información de gran volumen, alta velocidad y / o
gran variedad que demandan formas rentables e innovadoras de
procesamiento de la información que permiten un mejor conocimiento,
toma de decisiones y automatización de procesos.
Google: serían demasiado caros de almacenar, gestionar y analizar utilizando sistemas
de bases de datos tradicionales, son ineficientes debido a su inflexibilidad para
almacenar datos no estructurados (imágenes, texto y video), acomodar datos de "alta
velocidad" (en tiempo real) o escalar a soporte muy grande (petabytes).
8
Las V’s del Big Data
9
Volumen
• Aumento del Volumen de los datos disponibles para el análisis.
• Las empresas que han adoptado Big Data gestionan desde unos pocos
Terabytes (103 Gb) hasta Petabytes (106Gb)
• Muchas de ellas ya superan los 10 Terabytes
- En tres años lo habitual será >= 100 Terabytes
- No es lo mismo trabajar con 1 Terabyte de texto con 1 Gigabyte imágenes
médicas.
10
Velocidad
• Incremento de la velocidad a la que se genera y se
distribuye los datos en las fuentes.
 Es una de las razones del incremento del volumen de
datos
• Streaming: datos que se generan y distribuyen en
tiempo real.
 Generados por sensores, servidores web,
redes sociales, etc.
• También hace referencia a la necesidad para extraer
conocimiento de los datos en el momento oportuno.
 Ejemplo: Datos de tipo financiero.
11
Variedad
•La variedad se refiere al importante
aumento en la heterogeneidad de las
fuentes de datos debido a diversos
factores como:
• Incremento en el número de fuentes
disponibles.
• Fuentes con distintos nivel de
estructura.
• Diversidad de formatos de distribución.
12
Veracidad
• Aumento de la incertidumbre respecto a la veracidad o calidad de los
datos disponibles
• Incertidumbre datos => Incertidumbre conocimiento extraído.
• Es uno de los retos principales del nuevo contexto de datos.
 El uso de datos incorrectos supone grandes pérdidas.
13
Valor
• El valor es la medida de la utilidad de los datos seleccionados para
nuestros objetivos finales.
• Determinar dicha utilidad a priori puede ser realmente complicado.
•
14
El impacto del Big Data en los negocios
15
Ejemplo de Big Data - Netflix
Utiliza la información de sus suscriptores para
predecir que contenidos tienen más
probabilidades de triunfar.
• ¿Qué búsquedas realizan?
• ¿Qué dispositivos usan?
• ¿Cuál es su día preferido?
• ¿Cuánto tiempo emplean en el servicio y en
cada uno de los contenidos?
• Si ven los capítulos enteros o parcialmente,
incluso, ¿qué fragmentos vuelven a visionar?
• ¿En qué momento abandonan el visionado y si
lo recuperan o abandonan?
• Las valoraciones de los consumidores.
• ¿Qué preferencias tienen en común con sus
amigos o con la audiencia de su misma zona
geográfica?
• La información de sus perfiles en redes
sociales.
16
¿ Que es Machine Learning?
• Es una disciplina científica del ámbito de la Inteligencia Artificial que crea
sistemas que aprenden automáticamente
17
• Aprendizaje Supervisado y No Supervisado
• Supervisado: se entrena al algoritmo otorgándole las preguntas,
denominadas características, y las respuestas, denominadas
etiquetas.
• No Supervisado: solo se le otorgan las características, sin
proporcionarle al algoritmo ninguna etiqueta
18
¿Qué es la Inteligencia Artificial?
• Es la simulación de procesos de inteligencia humana por parte de máquinas,
especialmente sistemas informáticos..
19
Actualidad en la Inteligencia Artificial
• Automatización
• Aprendizaje Automático
• Visión por computadoras
• Procesamiento de Lenguaje Natural
• Reconocimiento de Patrones
• Robótica
20
Demo
www.cibertec.edu.pe
SEDE MIRAFLORES
Calle Diez Canseco Cdra 2 / Pasaje Tello
Miraflores – Lima
Teléfono: 633-5555
SEDE INDEPENDENCIA
Av. Carlos Izaguirre 233
Independencia – Lima
Teléfono: 633-5555
SEDE BREÑA
Av. Brasil 714 – 792
(CC La Rambla – Piso 3)
Breña – Lima
Teléfono: 633-5555
SEDE TRUJILLO
Calle Borgoño 361
Trujillo
Teléfono: (044) 60-2000
SEDE SAN JUAN DE LURIGANCHO
Av. Próceres de la Independencia 3023-3043
San Juan de Lurigancho – Lima
Teléfono: 633-5555
SEDE LIMA CENTRO
Av. Uruguay 514
Cercado – Lima
Teléfono: 419-2900
SEDE BELLAVISTA
Av. Mariscal Oscar R. Benavides 3866 – 4070
(CC Mall Aventura Plaza)
Bellavista – Callao
Teléfono: 633-5555
SEDE AREQUIPA
Av. Porongoche 500
(CC Mall Aventura Plaza)
Paucarpata - Arequipa
Teléfono: (054) 60-3535
GRACIAS

Mais conteúdo relacionado

Semelhante a Big Data en el mundo del Machine Learning

Aprovechamiento de recursos digitales (2010)
Aprovechamiento de recursos digitales (2010)Aprovechamiento de recursos digitales (2010)
Aprovechamiento de recursos digitales (2010)
Miriam Ruiz
 

Semelhante a Big Data en el mundo del Machine Learning (20)

Big Data Introducción
Big Data IntroducciónBig Data Introducción
Big Data Introducción
 
TIC en el Entorno Laboral
TIC en el Entorno LaboralTIC en el Entorno Laboral
TIC en el Entorno Laboral
 
Tecnoligias deinformación y comunicación
Tecnoligias deinformación y comunicaciónTecnoligias deinformación y comunicación
Tecnoligias deinformación y comunicación
 
IA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diariaIA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diaria
 
Actualización en recursos de información
Actualización en recursos de informaciónActualización en recursos de información
Actualización en recursos de información
 
Internet y comunidades intelectuales
Internet y comunidades intelectualesInternet y comunidades intelectuales
Internet y comunidades intelectuales
 
Internet y comunidades intelectuales óscar
Internet y comunidades intelectuales óscarInternet y comunidades intelectuales óscar
Internet y comunidades intelectuales óscar
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Herramientas de internet
Herramientas de internetHerramientas de internet
Herramientas de internet
 
La internet
La internetLa internet
La internet
 
Búsqueda de infromación en internet (gestion del conocimiento)
Búsqueda de infromación en internet (gestion del conocimiento)Búsqueda de infromación en internet (gestion del conocimiento)
Búsqueda de infromación en internet (gestion del conocimiento)
 
Búsqueda de infromación en internet (gestion del conocimiento)
Búsqueda de infromación en internet (gestion del conocimiento)Búsqueda de infromación en internet (gestion del conocimiento)
Búsqueda de infromación en internet (gestion del conocimiento)
 
Aprovechamiento de recursos digitales (2010)
Aprovechamiento de recursos digitales (2010)Aprovechamiento de recursos digitales (2010)
Aprovechamiento de recursos digitales (2010)
 
Internet, Búsqueda y Almacenamiento Remoto
Internet, Búsqueda y Almacenamiento Remoto Internet, Búsqueda y Almacenamiento Remoto
Internet, Búsqueda y Almacenamiento Remoto
 
Unidad 11
Unidad 11Unidad 11
Unidad 11
 
Big data
Big dataBig data
Big data
 
Big Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los DatosBig Data - El Futuro a través de los Datos
Big Data - El Futuro a través de los Datos
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 

Mais de nnakasone

Mais de nnakasone (20)

Azure Data Mesh
Azure Data MeshAzure Data Mesh
Azure Data Mesh
 
Como empezar tu Carrera como Azure Data Engineer
Como empezar tu Carrera como Azure Data EngineerComo empezar tu Carrera como Azure Data Engineer
Como empezar tu Carrera como Azure Data Engineer
 
Aprende a diseñar tableros de control (dashboard) de Alto impacto
Aprende a diseñar tableros de control (dashboard) de Alto impactoAprende a diseñar tableros de control (dashboard) de Alto impacto
Aprende a diseñar tableros de control (dashboard) de Alto impacto
 
Azure Synapse LInk
Azure Synapse LInkAzure Synapse LInk
Azure Synapse LInk
 
Ingeniería de datos para el mejoramiento continuo de los negocios
Ingeniería de datos para el mejoramiento continuo de los negociosIngeniería de datos para el mejoramiento continuo de los negocios
Ingeniería de datos para el mejoramiento continuo de los negocios
 
Como Empezar en el mundo de la Inteligencia Artificial
Como Empezar en el mundo de la Inteligencia ArtificialComo Empezar en el mundo de la Inteligencia Artificial
Como Empezar en el mundo de la Inteligencia Artificial
 
Introducing to sql server 2022
Introducing to sql server 2022Introducing to sql server 2022
Introducing to sql server 2022
 
Synthetic data
Synthetic dataSynthetic data
Synthetic data
 
PowerBI Admin
PowerBI AdminPowerBI Admin
PowerBI Admin
 
Analitica Aplicada a la Salud
Analitica Aplicada a la SaludAnalitica Aplicada a la Salud
Analitica Aplicada a la Salud
 
GAI_Microsoft_Speech_NN.pdf
GAI_Microsoft_Speech_NN.pdfGAI_Microsoft_Speech_NN.pdf
GAI_Microsoft_Speech_NN.pdf
 
Implementando redes educativas empresariales
Implementando redes educativas empresarialesImplementando redes educativas empresariales
Implementando redes educativas empresariales
 
Construyendo soluciones ONNX con Microsoft AI Platform
Construyendo soluciones ONNX con Microsoft AI PlatformConstruyendo soluciones ONNX con Microsoft AI Platform
Construyendo soluciones ONNX con Microsoft AI Platform
 
Detectando Mentiras con AI
Detectando Mentiras con AIDetectando Mentiras con AI
Detectando Mentiras con AI
 
Azure Hd insigth news
Azure Hd insigth newsAzure Hd insigth news
Azure Hd insigth news
 
Genomic sql pass
Genomic sql passGenomic sql pass
Genomic sql pass
 
Azure Quantum Computing
Azure Quantum ComputingAzure Quantum Computing
Azure Quantum Computing
 
Inteligencia Artificial Success Case
Inteligencia Artificial Success CaseInteligencia Artificial Success Case
Inteligencia Artificial Success Case
 
Vision Artificial Casos de Exito
Vision Artificial Casos de ExitoVision Artificial Casos de Exito
Vision Artificial Casos de Exito
 
Bigdata
BigdataBigdata
Bigdata
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (11)

Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 

Big Data en el mundo del Machine Learning

  • 1. Big Data en el mundo del Machine Learning ESCUELA DE TECNOLOGÍA DE LA INFORMACIÓN En breve comenzamos ... Bienvenidos a las Tardes TIC
  • 2. 2
  • 3. CONSEJOS PARA INGRESAR A BLACKBOARD 1 6 5 3 4 2 Silenciar nuestros micrófonos para una mejor escucha entre todos y apagar nuestras cámaras Escoger un lugar adecuado para la videoconferencia Si la conexión es por tu celular será necesario descarga la app, si lo haces desde la computadora sólo deberás ingresar con el enlace Revisa que tu conexión a internet sea estable Sugerimos el uso de audífonos para una mejor escucha y transmisión de nuestra voz El link estará aperturado 30 minutos antes para probar la conectividad y sus funciones Para cualquier consulta estamos aquí para ayudarte. Comunícate con Isabel Lindo / correo: isabel.lindo@cibertec.pe
  • 4. 4 Agenda 1. Bienvenida al ponente y participantes. 2. Presentación al Ponente 3. Desarrollo de la ponencia 4. Preguntas 5. Palabras de cierre.
  • 6. 6 Big Data en el mundo del Machine Learning
  • 7. 7 Definiciones de Big Data Wikipedia hace referencia a una cantidad de datos tal que supera la capacidad del software convencional para ser capturados, administrados y procesados en un tiempo razonable. IBM: toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Gartner: son activos de información de gran volumen, alta velocidad y / o gran variedad que demandan formas rentables e innovadoras de procesamiento de la información que permiten un mejor conocimiento, toma de decisiones y automatización de procesos. Google: serían demasiado caros de almacenar, gestionar y analizar utilizando sistemas de bases de datos tradicionales, son ineficientes debido a su inflexibilidad para almacenar datos no estructurados (imágenes, texto y video), acomodar datos de "alta velocidad" (en tiempo real) o escalar a soporte muy grande (petabytes).
  • 8. 8 Las V’s del Big Data
  • 9. 9 Volumen • Aumento del Volumen de los datos disponibles para el análisis. • Las empresas que han adoptado Big Data gestionan desde unos pocos Terabytes (103 Gb) hasta Petabytes (106Gb) • Muchas de ellas ya superan los 10 Terabytes - En tres años lo habitual será >= 100 Terabytes - No es lo mismo trabajar con 1 Terabyte de texto con 1 Gigabyte imágenes médicas.
  • 10. 10 Velocidad • Incremento de la velocidad a la que se genera y se distribuye los datos en las fuentes.  Es una de las razones del incremento del volumen de datos • Streaming: datos que se generan y distribuyen en tiempo real.  Generados por sensores, servidores web, redes sociales, etc. • También hace referencia a la necesidad para extraer conocimiento de los datos en el momento oportuno.  Ejemplo: Datos de tipo financiero.
  • 11. 11 Variedad •La variedad se refiere al importante aumento en la heterogeneidad de las fuentes de datos debido a diversos factores como: • Incremento en el número de fuentes disponibles. • Fuentes con distintos nivel de estructura. • Diversidad de formatos de distribución.
  • 12. 12 Veracidad • Aumento de la incertidumbre respecto a la veracidad o calidad de los datos disponibles • Incertidumbre datos => Incertidumbre conocimiento extraído. • Es uno de los retos principales del nuevo contexto de datos.  El uso de datos incorrectos supone grandes pérdidas.
  • 13. 13 Valor • El valor es la medida de la utilidad de los datos seleccionados para nuestros objetivos finales. • Determinar dicha utilidad a priori puede ser realmente complicado. •
  • 14. 14 El impacto del Big Data en los negocios
  • 15. 15 Ejemplo de Big Data - Netflix Utiliza la información de sus suscriptores para predecir que contenidos tienen más probabilidades de triunfar. • ¿Qué búsquedas realizan? • ¿Qué dispositivos usan? • ¿Cuál es su día preferido? • ¿Cuánto tiempo emplean en el servicio y en cada uno de los contenidos? • Si ven los capítulos enteros o parcialmente, incluso, ¿qué fragmentos vuelven a visionar? • ¿En qué momento abandonan el visionado y si lo recuperan o abandonan? • Las valoraciones de los consumidores. • ¿Qué preferencias tienen en común con sus amigos o con la audiencia de su misma zona geográfica? • La información de sus perfiles en redes sociales.
  • 16. 16 ¿ Que es Machine Learning? • Es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que aprenden automáticamente
  • 17. 17 • Aprendizaje Supervisado y No Supervisado • Supervisado: se entrena al algoritmo otorgándole las preguntas, denominadas características, y las respuestas, denominadas etiquetas. • No Supervisado: solo se le otorgan las características, sin proporcionarle al algoritmo ninguna etiqueta
  • 18. 18 ¿Qué es la Inteligencia Artificial? • Es la simulación de procesos de inteligencia humana por parte de máquinas, especialmente sistemas informáticos..
  • 19. 19 Actualidad en la Inteligencia Artificial • Automatización • Aprendizaje Automático • Visión por computadoras • Procesamiento de Lenguaje Natural • Reconocimiento de Patrones • Robótica
  • 21. www.cibertec.edu.pe SEDE MIRAFLORES Calle Diez Canseco Cdra 2 / Pasaje Tello Miraflores – Lima Teléfono: 633-5555 SEDE INDEPENDENCIA Av. Carlos Izaguirre 233 Independencia – Lima Teléfono: 633-5555 SEDE BREÑA Av. Brasil 714 – 792 (CC La Rambla – Piso 3) Breña – Lima Teléfono: 633-5555 SEDE TRUJILLO Calle Borgoño 361 Trujillo Teléfono: (044) 60-2000 SEDE SAN JUAN DE LURIGANCHO Av. Próceres de la Independencia 3023-3043 San Juan de Lurigancho – Lima Teléfono: 633-5555 SEDE LIMA CENTRO Av. Uruguay 514 Cercado – Lima Teléfono: 419-2900 SEDE BELLAVISTA Av. Mariscal Oscar R. Benavides 3866 – 4070 (CC Mall Aventura Plaza) Bellavista – Callao Teléfono: 633-5555 SEDE AREQUIPA Av. Porongoche 500 (CC Mall Aventura Plaza) Paucarpata - Arequipa Teléfono: (054) 60-3535 GRACIAS

Notas do Editor

  1. En términos en bytes: Megabyte = 106 = 1,000,000 Gigabyte = 109 = 1,000,000,000 Terabyte = 1012 = 1,000,000,000,000 Petabyte = 1015 = 1,000,000,000,000,000 Exabyte = 1018 = 1,000,000,000,000,000,000 Zettabyte = 1021 = 1,000,000,000,000,000,000,000 Yottabyte = 1021 = 1,000,000,000,000,000,000,000 Brontobyte = 1021 = 1,000,000,000,000,000,000,000
  2. Telescopio SKA, 10 Petabytes / hora Twitter, 100.000 tweets / minuto Bolsas de Valores, requiere el tratamiento de la información.