De acuerdo con algunos especialistas de la revista Science la capacidad de generar y almacenar datos ha venido duplicándose cada tres años desde los años 80´s, lo cual ha venido a sobrepasar las capacidades computacionales y funcionales de las tecnologías tradicionales, trayendo como consecuencia la generación de nuevos métodos para acceder y relacionar extremadamente grandes volúmenes de información, en los rangos de los zettabytes (1 GB de TB) e inclusive yottabytes (1 TB de TB). Esta tecnología es llamada Big Data que a su vez conjunta otras tecnologías como visualización de datos, análisis de datos, estructuras de datos estructurados, no estructurados y semiestructurados, inteligencia artificial, etc.
3. www.sgcampus.com.mx @sgcampus
¿Qué es Big Data?
•Algunos datos
– Más del 90% de los datos generados por la humanidad se han generado en los últimos 2
años.
– La información en el mundo se duplica cada dos años y medio.
•Ejemplo: Google guarda a dónde vas, chécalo en:
https://www.google.com/maps/timeline
– Según IDC en 2015 se generaron 10 zettabytes de datos.
– El mundo creará 180 zettabytes de datos en 2025.
•1 zettabyte = 1024 exabytes = 1024 * 1024 petabytes = 1024 * 1024 * 1024 terabytes
– El tamaño de mercado en 2016 fue de USD$130.1 mil millones y pasará a más de USD$200
mil millones en 2020.
– Según Forbes los CDO toman un rol preponderante en la empresa, principalmente en las
iniciativas empresariales de monetización de datos.
•https://www.sg.com.mx/revista/53/pasar-profesional-ti-cdo#.WOZmfdI1-Uk
– El reto principal sigue siendo el crear una cultura “data-driven” en las empresas.
4. www.sgcampus.com.mx @sgcampus
¿Qué es Big Data?
Big Data is a collection of data sets so large and
complex that it becomes difficult to process using
on-hand database management tools or traditional
data processing application.
- Wikipedia
Big data is data that exceeds the processing capacity
of conventional database systems. The data is too
big, moves too fast, or doesn’t fit the structures of
your database architectures. To gain value from this
data, you must choose an alternative way to process
it.
- O’Reilly Media
High-volume, high-velocity and/or high-variety
information assets that demand cost-effective,
innovative forms of information processing that
enable enhanced insight, decision making, and
process automation.
- Gartner
Big Data is the frontier of a firm’s ability to store,
process, and access (SPA) all the data it needs to
operate effectively, make decisions, reduce risks,
and serve customers.
- Forrester
Datasets whose size is beyond the ability of typical
database software tools to capture, store, manage,
and analyze.
- McKinsey’s
5. www.sgcampus.com.mx @sgcampus
¿Qué es Big Data?
• En resumen:
– Enormes volúmenes de datos (>1
petabyte).
•Aunque finalmente es un concepto
y el volumen puede ser lo de
menos.
– Los datos se generan muy rápido desde
muy variadas fuentes.
•Redes sociales, IoT, etc.
– Los datos son generados con diferentes
estructuras o totalmente sin estructura
y en combinación.
– Requiere nuevas formas de
almacenarse, procesarse, analizarse,
visualizarse e integrarse.
6. www.sgcampus.com.mx @sgcampus
• Es un acrónimo de “Enterprise Resource Planning”.
• Automatiza los procesos de negocio de la empresa.
• Integra las áreas de la organización con datos únicos y confiables.
• Es mucho más que un sistema administrativo.
¿Qué es un ERP?
7. www.sgcampus.com.mx @sgcampus
• Tanto Big Data como ERP están por separado.
–Algunas extraordinarias excepciones.
• Se siguen confundiendo varios conceptos (en todo el mundo):
–ERP con sistema administrativo.
–Big Data con inteligencia de negocios.
–Machine learning con Deep learning.
–Ingenieros de datos con Científicos de datos.
• El grado de penetración de la digitalización en México es todavía bajo.
–Mucho menos penetración de ERPs.
–Extraordinariamente poca penetración de Big Data.
• Algunas “modas tecnológicas” solamente confunden al mercado.
Situación en México
8. www.sgcampus.com.mx @sgcampus
• Escasez de especialistas en:
–Procesos de negocios.
–Programación.
–Ingenieros de datos.
–Científicos de datos.
• La calidad de los datos no siempre es la mejor.
–Recordemos la frase: “Garbage in, garbage out”.
• Mucho talento de TI.
–…aunque existan escuelas patito.
• La mayoría de las empresas mexicanas en etapas tempranas de digitalización
formal (ERPs) y con precario conocimiento de Big Data.
Situación en México
¡Extraordinaria oportunidad de negocio!
9. www.sgcampus.com.mx @sgcampus
• Se irán generando más tecnologías y más herramientas para manejar el Big Data.
–Ejemplo: Spark para ML
http://www.infoworld.com/article/3031690/analytics/why-you-should-use-spark-
for-machine-learning.html
• Se entenderá mejor Big Data.
–Procesos de Negocio – Matemática – Informática
• Los ERPs se convertirán en iERPs.
–Incorporarán por definición algoritmos como NBO, NBA, MBA, etc.
• Seguirán cambiando nuestras vidas.
–Como negocios. Más procesos de negocio automatizados.
–Como personas. Más fáciles nuestras labores.
Futuro
10. www.sgcampus.com.mx @sgcampus
Conclusiones
• La tecnología avanza más rápido de lo que se puede adoptar.
–Nueva tecnología.
–Tecnología mejorada.
• La “moda” de las nuevas tecnologías genera confusión.
• La oportunidad de negocio existente es ENORME.
• La calidad de los datos es un elemento de suma importancia a considerar.
• Debemos de generar tecnología para engranar Big Data y ERP.
–Mejores prácticas, infraestructura, privacidad de datos, calidad de datos, data
discovery, etc.
• Hay que leer, capacitarse, investigar y sacar conclusiones para decidir qué es lo que
más conviene en cada situación.
–Estamos lejos de ser totalmente sustituidos por una computadora.
–…pero cada vez hay más actividades automatizadas.