SlideShare uma empresa Scribd logo
1 de 28
Introducción a Data Science
19 de Agosto 2015 (12 pm GMT -5)
José L Rivera
Resumen:
En esta sesión estaremos viendo que es “Data Science”, que
necesitamos saber o aprender para poder convertirnos en un
científico de datos y estaremos viendo algunos ejemplos de usos
muy comunes usando lenguajes como Python, R y el cómo
podemos integrar estos en SQL Server y Azure . Al final de esta
charla tendrás un entendimiento más amplio de las técnicas de
manejos de datos, modelamiento, visualización y los lenguajes y
productos para poner tus proyectos en marcha
Está por comenzar:
Próximos Eventos
Conociendo los servicios
adicionales en BigData
26 de Agosto
Freddy Angarita
SQL Server Rápido y Furioso
2 de Setiembre
Alejandro Cordero
SQL como un servicio en la nube
9 de Setiembre
Warner Chaves
Moderador: Carlos Ulate
Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
Sigan Participando!
• Obtén tu membresía gratuita en sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Introducción a Data Science
19 de Agosto de 2015
Jose L Rivera, MBA
MVP | MCSE | MCSA | MCITP | MCSE
Chapter Leader – PASS Global Spanish VC
@SQLConqueror
Moderador: Carlos Ulate
Agenda
• Conceptos básicos de Data Science (DS)
• Herramientas Microsoft para DS
• Herramientas OpenSource para DS
• Demos
• Q&A
Conceptos Básicos
hechos y estadísticas almacenadas para referencia o análisis
BI es un termino sombrilla que reúne a una variedad de aplicaciones
usadas para analizar la data de una empresa. Esta disciplina esta compuesta
de actividades relacionadas a minería de datos, procesamiento analítico (OLAP),
queries y reportes.
Data
Business Intelligence
Conceptos Básicos
es la extracción de conocimiento de grandes volúmenes de
datos estructurados y no estructurados mediante el uso de
técnicas de minería de datos y análisis predictivo
Data Science
Que es Data Science?
• Análisis Estadístico
• estadística inferencial
• Algoritmos
• Experimentos
• Programación
• “Hacking”
• Python, R, etc..
• Conocimiento del Negocio
• Reglas y procesos
Copyright © 2014 by Steven Geringer Raleigh, NC.
Permision is granted to use, distribute or modify this image,
Provided that this copyright notice remains intact.
Recopilación de Datos
Eventos Comportamiento Acción/Pruebas Resultado Observación Conjuntos
de Datos
• Características
• Ambiente
• Actividades
significativas al
negocio
• Medidas • Estructurada
• No Estructurada
• Semi-Estructurada
Quieres ser un Data Scientist?
Quieres ser un Data Scientist?
Resultados 2014
R vs Python
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
Reloj de Data Science
http://www.exploringdatascience.com/the-data-science-clock/
• Destrezas básicas
• Fundamentos
• Análisis estadístico
• Machine Learning
• Text Mining/NLP
• Visualización
• Big Data
• Data Ingestion + Munging
• Herramientas
Ciclo de vida
Descubrimiento
de los datos
Preparación de
los datos
Desarrollo del
Modelo
Evaluación
Publicación
Monitoreo
SSAS Data Mining
• SQL Server 2005+
• Excel Add-in
Tipo de Algoritmo Uso Común
Clasificación
predice una o más variables discretas basadas en los otros atributos
del conjunto de datos
Regresión
predice una o más variables continuas basadas en los otros atributos
del conjunto de datos
Segmentación
divide los datos en grupos (clusters) de elementos que tiene
propiedades similares
Asociación
encuentra correlaciones entre los diferentes atributos en un conjunto
de datos
Análisis Secuencial
resume las secuencias frecuentes o episodios de los datos
SSAS Data Mining
DEMO
Excel Data Mining Add-in
R
• CRAN (versión oficial) - http://cran.r-project.org/
• 5,000+ paquetes (librerías)
• v 3.2.4
• RStudio (http://www.rstudio.com/)
• IDE para R
• Provee un experiencia integrada y simple
• Revolution Analytics (http://www.revolutionanalytics.com/)
• Otra versión de R
• Paralelismo y Rendimiento
• SQL Server 2016
Python
• Lenguaje de programación de uso general
• OOP
• Open Source - http://www.python.org/
• v 3.4.3 | 2.7.10
• Multiples IDEs
• IDLE
• Canopy
• IPython Notebook
DEMO
R en RStudio
Azure ML
• Servicio en la nube
• Algoritmos de ML
• Componentes para R y Python
• Publicación a Web-Service
DEMO
Azure Machine Learning (ML)
Recursos Adicionales
• www.r-bloggers.com/
• www.datasciencecentral.com
jose@sqlconqueror.com
Conociendo los servicios adicionales en BigData
26 de Agosto (12 pm GMT -5)
Freddy Angarita
Resúmen:
Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte
los lenguajes usados para su consumo, pero poco se hablado de los
servicios complementarios que pueden enriquecer la experiencia BigData,
conozca estos servicios y su aplicación
Próximo Evento

Mais conteúdo relacionado

Mais procurados

Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Simplilearn
 
Data Science Training | Data Science For Beginners | Data Science With Python...
Data Science Training | Data Science For Beginners | Data Science With Python...Data Science Training | Data Science For Beginners | Data Science With Python...
Data Science Training | Data Science For Beginners | Data Science With Python...
Simplilearn
 

Mais procurados (20)

Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
Big Data Tutorial | What Is Big Data | Big Data Hadoop Tutorial For Beginners...
 
Graph Thinking: Why it Matters
Graph Thinking: Why it MattersGraph Thinking: Why it Matters
Graph Thinking: Why it Matters
 
Looker Studio Data Contracts - Data.Monks.pptx
Looker Studio Data Contracts - Data.Monks.pptxLooker Studio Data Contracts - Data.Monks.pptx
Looker Studio Data Contracts - Data.Monks.pptx
 
Amazon QuickSight
Amazon QuickSightAmazon QuickSight
Amazon QuickSight
 
Databricks Fundamentals
Databricks FundamentalsDatabricks Fundamentals
Databricks Fundamentals
 
Data catalog
Data catalogData catalog
Data catalog
 
AWS October Webinar Series - Introducing Amazon QuickSight
AWS October Webinar Series - Introducing Amazon QuickSightAWS October Webinar Series - Introducing Amazon QuickSight
AWS October Webinar Series - Introducing Amazon QuickSight
 
Data collection, processing & organization with USPA framework
Data collection, processing & organization with USPA frameworkData collection, processing & organization with USPA framework
Data collection, processing & organization with USPA framework
 
Data Visualization Tools in Python
Data Visualization Tools in PythonData Visualization Tools in Python
Data Visualization Tools in Python
 
Cohort Analysis at Scale
Cohort Analysis at ScaleCohort Analysis at Scale
Cohort Analysis at Scale
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL Server
 
Data Science Training | Data Science For Beginners | Data Science With Python...
Data Science Training | Data Science For Beginners | Data Science With Python...Data Science Training | Data Science For Beginners | Data Science With Python...
Data Science Training | Data Science For Beginners | Data Science With Python...
 
Presto At Arm Treasure Data - 2019 Updates
Presto At Arm Treasure Data - 2019 UpdatesPresto At Arm Treasure Data - 2019 Updates
Presto At Arm Treasure Data - 2019 Updates
 
Building End-to-End Delta Pipelines on GCP
Building End-to-End Delta Pipelines on GCPBuilding End-to-End Delta Pipelines on GCP
Building End-to-End Delta Pipelines on GCP
 
Data Monetization
Data MonetizationData Monetization
Data Monetization
 
Big Data Architecture and Design Patterns
Big Data Architecture and Design PatternsBig Data Architecture and Design Patterns
Big Data Architecture and Design Patterns
 
Our journey with druid - from initial research to full production scale
Our journey with druid - from initial research to full production scaleOur journey with druid - from initial research to full production scale
Our journey with druid - from initial research to full production scale
 
Big Data & Analytics Architecture
Big Data & Analytics ArchitectureBig Data & Analytics Architecture
Big Data & Analytics Architecture
 
Neo4j in Production: A look at Neo4j in the Real World
Neo4j in Production: A look at Neo4j in the Real WorldNeo4j in Production: A look at Neo4j in the Real World
Neo4j in Production: A look at Neo4j in the Real World
 
DevOps + DataOps = Digital Transformation
DevOps + DataOps = Digital Transformation DevOps + DataOps = Digital Transformation
DevOps + DataOps = Digital Transformation
 

Destaque

Análisis de datos con Python
Análisis de datos con PythonAnálisis de datos con Python
Análisis de datos con Python
goyodiaz
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedadImpacto de las tics en la sociedad
Impacto de las tics en la sociedad
Angge_05
 
Power point Impacto Social de La Informatica
Power point Impacto Social de La InformaticaPower point Impacto Social de La Informatica
Power point Impacto Social de La Informatica
0973332505
 
Impacto tic en_la_sociedad
Impacto tic en_la_sociedadImpacto tic en_la_sociedad
Impacto tic en_la_sociedad
Paúl Machado
 
Importancia de las tic para la sociedad
Importancia de las tic para la sociedadImportancia de las tic para la sociedad
Importancia de las tic para la sociedad
LilianaChancusig
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedad Impacto de las tics en la sociedad
Impacto de las tics en la sociedad
rcoyagop
 
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY  IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
carlos27507
 

Destaque (20)

Análisis de datos con Python
Análisis de datos con PythonAnálisis de datos con Python
Análisis de datos con Python
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientist
 
Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009Python en ciencia Pycon Argentina 2009
Python en ciencia Pycon Argentina 2009
 
¿Conoces swift?
¿Conoces swift?¿Conoces swift?
¿Conoces swift?
 
Swift
SwiftSwift
Swift
 
Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual Aplicaciones e impacto de la informatica en la Sociedad Actual
Aplicaciones e impacto de la informatica en la Sociedad Actual
 
Análisis de datos: R vs Python
Análisis de datos: R vs PythonAnálisis de datos: R vs Python
Análisis de datos: R vs Python
 
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUALAPLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
APLICACIONES E IMPACTO D LA INFORMATICA EN LA SOCIEDAD ACTUAL
 
Developing iOS apps with Swift
Developing iOS apps with SwiftDeveloping iOS apps with Swift
Developing iOS apps with Swift
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedadImpacto de las tics en la sociedad
Impacto de las tics en la sociedad
 
What is r in spanish.
What is r in spanish.What is r in spanish.
What is r in spanish.
 
Summer school python in spanish
Summer school python in spanishSummer school python in spanish
Summer school python in spanish
 
De los datos a las predicciones
De los datos a las prediccionesDe los datos a las predicciones
De los datos a las predicciones
 
Python + Ciencia = ♥
Python + Ciencia = ♥Python + Ciencia = ♥
Python + Ciencia = ♥
 
Power point Impacto Social de La Informatica
Power point Impacto Social de La InformaticaPower point Impacto Social de La Informatica
Power point Impacto Social de La Informatica
 
Impacto tic en_la_sociedad
Impacto tic en_la_sociedadImpacto tic en_la_sociedad
Impacto tic en_la_sociedad
 
Importancia de las tic para la sociedad
Importancia de las tic para la sociedadImportancia de las tic para la sociedad
Importancia de las tic para la sociedad
 
Impacto de las tics en la sociedad
Impacto de las tics en la sociedad Impacto de las tics en la sociedad
Impacto de las tics en la sociedad
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY  IMPACTO DE LAS TIC EN EL MUNDO DE HOY
IMPACTO DE LAS TIC EN EL MUNDO DE HOY
 

Semelhante a Introduccion a Data Science

Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de Investigación
IAB México
 
BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1
Cristian Vergara
 

Semelhante a Introduccion a Data Science (20)

Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Herramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de DatosHerramientas de Microsoft para el Científicos de Datos
Herramientas de Microsoft para el Científicos de Datos
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
 
Azure Data Lake
Azure Data LakeAzure Data Lake
Azure Data Lake
 
Azure data lake
Azure data lakeAzure data lake
Azure data lake
 
Visualización de Big Data con Power View
Visualización de Big Data con Power ViewVisualización de Big Data con Power View
Visualización de Big Data con Power View
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000
 
Cursos Big Data Open Source
Cursos Big Data Open SourceCursos Big Data Open Source
Cursos Big Data Open Source
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Visualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de InvestigaciónVisualización de datos con Tableau Public - Comité de Investigación
Visualización de datos con Tableau Public - Comité de Investigación
 
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negociosAzure Data Lake: integracion dentro de soluciones de inteligencia de negocios
Azure Data Lake: integracion dentro de soluciones de inteligencia de negocios
 
Servicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureServicios de datos en Microsoft Azure
Servicios de datos en Microsoft Azure
 
BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1BIT - Evento HOL Microsoft Azure v1
BIT - Evento HOL Microsoft Azure v1
 
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server  Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
Webinar - Migración Oracle Business Intelligence a Oracle Analytics Server
 
Oracle Data Mining.pptx
Oracle Data Mining.pptxOracle Data Mining.pptx
Oracle Data Mining.pptx
 
Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint Server
 
GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)
 
Querona
QueronaQuerona
Querona
 
capacitación Data science.pptx
capacitación Data science.pptxcapacitación Data science.pptx
capacitación Data science.pptx
 

Mais de SpanishPASSVC

Mais de SpanishPASSVC (20)

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nube
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IO
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones Aprendidas
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación Transaccional
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecución
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreo
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizados
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
La receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datosLa receta de la abuela para mejores cargas de datos
La receta de la abuela para mejores cargas de datos
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine Learning
 
Cuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partesCuadros de mando el todo es más que la suma de las partes
Cuadros de mando el todo es más que la suma de las partes
 
Automatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatosAutomatizando la generación de Datawarehouses a través de metadatos
Automatizando la generación de Datawarehouses a través de metadatos
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
 
Administrando soluciones de Power BI
Administrando soluciones de Power BIAdministrando soluciones de Power BI
Administrando soluciones de Power BI
 
Vista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan AlvaradoVista 360 grados de DataZen - Juan Alvarado
Vista 360 grados de DataZen - Juan Alvarado
 

Último

Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Último (11)

pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 

Introduccion a Data Science

  • 1. Introducción a Data Science 19 de Agosto 2015 (12 pm GMT -5) José L Rivera Resumen: En esta sesión estaremos viendo que es “Data Science”, que necesitamos saber o aprender para poder convertirnos en un científico de datos y estaremos viendo algunos ejemplos de usos muy comunes usando lenguajes como Python, R y el cómo podemos integrar estos en SQL Server y Azure . Al final de esta charla tendrás un entendimiento más amplio de las técnicas de manejos de datos, modelamiento, visualización y los lenguajes y productos para poner tus proyectos en marcha Está por comenzar: Próximos Eventos Conociendo los servicios adicionales en BigData 26 de Agosto Freddy Angarita SQL Server Rápido y Furioso 2 de Setiembre Alejandro Cordero SQL como un servicio en la nube 9 de Setiembre Warner Chaves Moderador: Carlos Ulate
  • 2. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 3.
  • 4. Oportunidades de Voluntariado PASS no pudiera existir sin personas apasionadas y dedicadas de todas partes del mundo que dan de su tiempo como voluntarios. Se un voluntario ahora!! Para identificar oportunidades locales visita volunteer.sqlpass.org Recuerda actualizar tu perfil en las secciones de “MyVolunteering” y MyPASS para mas detalles.
  • 5. Sigan Participando! • Obtén tu membresía gratuita en sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 6. Introducción a Data Science 19 de Agosto de 2015 Jose L Rivera, MBA MVP | MCSE | MCSA | MCITP | MCSE Chapter Leader – PASS Global Spanish VC @SQLConqueror Moderador: Carlos Ulate
  • 7.
  • 8. Agenda • Conceptos básicos de Data Science (DS) • Herramientas Microsoft para DS • Herramientas OpenSource para DS • Demos • Q&A
  • 9. Conceptos Básicos hechos y estadísticas almacenadas para referencia o análisis BI es un termino sombrilla que reúne a una variedad de aplicaciones usadas para analizar la data de una empresa. Esta disciplina esta compuesta de actividades relacionadas a minería de datos, procesamiento analítico (OLAP), queries y reportes. Data Business Intelligence
  • 10. Conceptos Básicos es la extracción de conocimiento de grandes volúmenes de datos estructurados y no estructurados mediante el uso de técnicas de minería de datos y análisis predictivo Data Science
  • 11. Que es Data Science? • Análisis Estadístico • estadística inferencial • Algoritmos • Experimentos • Programación • “Hacking” • Python, R, etc.. • Conocimiento del Negocio • Reglas y procesos Copyright © 2014 by Steven Geringer Raleigh, NC. Permision is granted to use, distribute or modify this image, Provided that this copyright notice remains intact.
  • 12. Recopilación de Datos Eventos Comportamiento Acción/Pruebas Resultado Observación Conjuntos de Datos • Características • Ambiente • Actividades significativas al negocio • Medidas • Estructurada • No Estructurada • Semi-Estructurada
  • 13. Quieres ser un Data Scientist?
  • 14. Quieres ser un Data Scientist? Resultados 2014
  • 16. Reloj de Data Science http://www.exploringdatascience.com/the-data-science-clock/ • Destrezas básicas • Fundamentos • Análisis estadístico • Machine Learning • Text Mining/NLP • Visualización • Big Data • Data Ingestion + Munging • Herramientas
  • 17. Ciclo de vida Descubrimiento de los datos Preparación de los datos Desarrollo del Modelo Evaluación Publicación Monitoreo
  • 18. SSAS Data Mining • SQL Server 2005+ • Excel Add-in Tipo de Algoritmo Uso Común Clasificación predice una o más variables discretas basadas en los otros atributos del conjunto de datos Regresión predice una o más variables continuas basadas en los otros atributos del conjunto de datos Segmentación divide los datos en grupos (clusters) de elementos que tiene propiedades similares Asociación encuentra correlaciones entre los diferentes atributos en un conjunto de datos Análisis Secuencial resume las secuencias frecuentes o episodios de los datos
  • 21. R • CRAN (versión oficial) - http://cran.r-project.org/ • 5,000+ paquetes (librerías) • v 3.2.4 • RStudio (http://www.rstudio.com/) • IDE para R • Provee un experiencia integrada y simple • Revolution Analytics (http://www.revolutionanalytics.com/) • Otra versión de R • Paralelismo y Rendimiento • SQL Server 2016
  • 22. Python • Lenguaje de programación de uso general • OOP • Open Source - http://www.python.org/ • v 3.4.3 | 2.7.10 • Multiples IDEs • IDLE • Canopy • IPython Notebook
  • 24. Azure ML • Servicio en la nube • Algoritmos de ML • Componentes para R y Python • Publicación a Web-Service
  • 28. Conociendo los servicios adicionales en BigData 26 de Agosto (12 pm GMT -5) Freddy Angarita Resúmen: Todos han empezado a usar y a conocer Hadoop y HDInsight, en parte los lenguajes usados para su consumo, pero poco se hablado de los servicios complementarios que pueden enriquecer la experiencia BigData, conozca estos servicios y su aplicación Próximo Evento