SlideShare una empresa de Scribd logo
1 de 22
Descargar para leer sin conexión
1
Intro a Spatial Data Science con
R
Alí Santacruz
amsantac.co
JULIO 2016
2
Acerca de mí
• Geomático con background ambiental
• R geek
• Candidato a PhD en Geografía
• Interesado en Spatial Data Science
• Autor de paquetes de R (disponibles en CRAN)
3
Objetivo de esta charla
• Discutir qué es Spatial Data Science
• Presentar de manera introductoria cómo realizar Spatial Data Science
con R
4
Qué es Spatial Data Science?
Spatial Data Scientist (n.):
Estadístico Experto SIG/RSDesarrollador
SIG
Ingeniero de
software
Spatial Data
Scientist
Spatial Data Science
Data Science
Spatial
Persona que es mejor en análisis de datos espaciales que un desarrollador
SIG y mejor en ingeniería de software que un experto SIG/RS
5
Spatial Data Science
Se combinan para el análisis de
datos con el fin de …
Apoyar una mejor toma de
decisiones
"The key word in data science is not data; it is science"
Jeff Leek. Coursera.
6
Spatial
Data
Scientist
Adaptado de
gettingsmart.com
7
Habilidades computacionales
• Programación: Python y R (entre otros)
http://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
8
Por qué usar R?
• Libre, de código abierto y gratuito
• Un conjunto de paquetes (> 8600) comprehensivo
• Acceso a los datos
• Data cleaning
• Análisis
• Visualización y creación de reportes
• Excelentes ambientes de desarrollo – RStudio IDE
• Una comunidad activa y amigable de desarrolladores
• Una extensa comunidad de usuarios: > 2 millones
9
Por qué usar R para análisis espacial
• 160+ paquetes en CRAN Task View: Analysis of Spatial Data
• Clases para datos espaciales (y espacio-temporales)
• Importación y exportación de datos
• Análisis exploratorio de datos espaciales
• Soporte para operaciones en vector y raster
• Estadística espacial
• Visualización en gráficos estáticos o interactivos (web)
• Integración con software SIG
• Integración con técnicas de análisis de paquetes ‘no-espaciales’ usualmente
sencilla
10
Clases de R para datos espaciales
• Antes de 2003:
• Varios paquetes para datos espaciales con diferentes supuestos sobre cómo los
datos espaciales estaban organizados
• En 2003:
• Paquete ‘sp’: extiende R con clases y métodos para datos espaciales (vector y
raster)
• En 2010:
• Paquete ‘raster’: maneja datos raster almacenados en disco demasiado grandes
como para ser cargados en la memoria (RAM)
11
Clases de R para datos espaciales
SpatialPointsDataFrame SpatialLinesDataFrame SpatialPolygonsDataFrame
SpatialPixelsDataFrame
SpatialGridDataFrame
Paquete sp
RasterLayer
RasterStack
RasterBrick
Paquete raster (preferido)
12
The Data
Science
Process
Adaptado de science2knowledge
Reproducibility
13
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
• Es esto A o B o C? :: clasificación
• Es esto extraño? :: detección de anomalías
• Cuánto/qué tanto? :: regresión
• Cómo está organizado? :: clustering
• Cómo cambiará? :: predicción
"The key word in data science is not data; it is science"
Jeff Leek. Coursera.
OBTENER
los datos
OBTENER
los datos
Domain expertise
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
14
• Importar capas vector: paquetes rgdal, raster
• Importar capas raster: paquete raster
• Obtener datos georreferenciados mediante APIs: paquete twitteR, ver ejemplo
• Descargar imágenes satelitales/información geográfica: paquete raster, modis,
MODISTools
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para esta diapositiva y las siguientes ver el
código y ejemplos en esta página
15
• Data cleaning, subset, etc.
• Manipular datos con “verbos” del paquete dplyr y otros del Hadley-verse
• Subset espacial (paquetes sp, raster)
• Operaciones en vector:
• Operaciones en tabla de atributos (paquete sp)
• Superposición: unión, intersección, clip, extracción de valores de raster en
puntos (paquetes raster, rgeos)
• Dissolve (paquetes sp, rgeos), buffer (paquete rgeos)
• Rasterización (paquete raster)
• Operaciones en raster:
• Álgebra de mapas, filtros espaciales, remuestreo, … (paquete raster)
• Vectorización (paquetes rgdal, raster)
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
16
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Estadísticos descriptivos: medidas de tendencia central y de dispersión
• Gráficos exploratorios (2D y 3D): scatterplot, boxplot, histograma, …
• Autocorrelación espacial:
• Medidas globales de autocorrelación espacial: I de Moran, C de Geary, G(d) de
Getis y Ord (paquete spdep)
• Medidas locales de autocorrelación espacial: estadístico local Ii de Moran, Gi y
Gi*(d) de Getis y Ord (paquete spdep)
17
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
COMUNICAR
resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Regresión:
• Modelos espaciales autoregresivos (paquete spdep)
• Regresión ponderada geográficamente (paquete spgwr)
• Clasificación (Machine Learning):
• Supervisada: RandomForests, SVM, boosting, … (paquete caret)
• No supervisada: k-means clustering (paquete stats)
• Estadística espacial:
• Geoestadística (paquetes gstat, geoR, geospt, …)
• Patrones de puntos espaciales (paquete spatstat)
18
MODELAR
los datos
MODELAR
los datos
EXPLORAR
los datos
EXPLORAR
los datos
PREPARAR
los datos
PREPARAR
los datos
OBTENER
los datos
OBTENER
los datos
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
PLANTEAR la
pregunta correcta
COMUNICAR
los resultados
Para diapositivas 14 a 18 ver el código y
ejemplos en esta página
• Mapas temáticos estáticos o interactivos: paquetes tmap, leaflet, mapview
• Gráficos interactivos, aplicaciones web y dashboards:
• paquetes plotly (ejemplo), rcharts, googleVis (ejemplo)
• paquete shiny, ver ejemplo
• paquete flexdashboard, ver ejemplo
19
No olvides: Reproducibilidad!
• El código de R y los resultados de ejemplos presentados (diapositivas 17-
21) pueden ser reproducidos a partir de este documento .Rmd usando
RMarkdown
• Mira este ejemplo sobre análisis espaciales reproducibles usando
notebooks interactivos
• Conoce más sobre reproducibilidad en análisis geoespaciales
20
Integración de R con software SIG
• QGIS: ver ejemplo en este post
• ArcGIS: paquete arcgisbinding, ver ejemplo en este post
• GRASS GIS: versión 6, paquete spgrass6; versión 7, paquete rgrass7
• gvSIG: más info en este post
• SAGA: paquete RSAGA
• GME (Geospatial Modelling Environment): más info en esta página
21
Referencias / Dónde aprender más
• Bivand, R., Pebesma, E., Gómez-Rubio, V. 2013. Applied Spatial Data
Analysis with R. New York: Springer. 2nd ed.
• R-SIG-Geo mailing list
• CRAN Task View: Analysis of Spatial Data
• Grupos en Facebook: GIS with R, R project en Español
• Grupos en G+: Statistics and R, R Programming for Data Analysis
• Mi blog: amsantac.co/es/blog.html
Si tienes alguna pregunta puedes contactarme en:
amsantac.co/es/contact.html
Gracias!

Más contenido relacionado

Similar a Spatial Data Science con R

Tipos de archivos para datos geográficos
Tipos de archivos para datos geográficosTipos de archivos para datos geográficos
Tipos de archivos para datos geográficosLuis Alan Navarro
 
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Carlos Gabriel Asato
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL ServerdbLearner
 
Charla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaCharla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaPatricio Soriano Castro
 
Python gis mapping
Python gis mappingPython gis mapping
Python gis mappingkikocorreoso
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaSocialTIC
 
Thematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfThematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfLuiscondori80
 
Introducción al procesamiento del Big Data
Introducción al procesamiento del Big DataIntroducción al procesamiento del Big Data
Introducción al procesamiento del Big DataTomás Fernández Pena
 
Análisis científico en ArcGIS
Análisis científico en ArcGISAnálisis científico en ArcGIS
Análisis científico en ArcGISEsri España
 
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSDrupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSPablo López Escobés
 
Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Golgi Alvarez
 
Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Francisco Pesante
 
Tableau Public: Herramienta para la visualización de datos 3
 Tableau Public: Herramienta para la visualización de datos 3 Tableau Public: Herramienta para la visualización de datos 3
Tableau Public: Herramienta para la visualización de datos 3Francisco Pesante
 

Similar a Spatial Data Science con R (20)

Practica 4
Practica 4Practica 4
Practica 4
 
Tipos de archivos para datos geográficos
Tipos de archivos para datos geográficosTipos de archivos para datos geográficos
Tipos de archivos para datos geográficos
 
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
Introducción a la Creación de Mapas de Potencial Geotérmico Mediante el Métod...
 
Sistemas silvia florez
Sistemas silvia florezSistemas silvia florez
Sistemas silvia florez
 
BigData y MapReduce
BigData y MapReduceBigData y MapReduce
BigData y MapReduce
 
R Services con SQL Server
R Services con SQL ServerR Services con SQL Server
R Services con SQL Server
 
ArcGIS_Nivel1.pdf
ArcGIS_Nivel1.pdfArcGIS_Nivel1.pdf
ArcGIS_Nivel1.pdf
 
Exposición spring
Exposición springExposición spring
Exposición spring
 
Charla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python CórdobaCharla "GeoPython" Grupo Python Córdoba
Charla "GeoPython" Grupo Python Córdoba
 
Python gis mapping
Python gis mappingPython gis mapping
Python gis mapping
 
Mariana corzo
Mariana corzoMariana corzo
Mariana corzo
 
Análisis de datos con R - Techcivica
Análisis de datos con R - TechcivicaAnálisis de datos con R - Techcivica
Análisis de datos con R - Techcivica
 
Thematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdfThematic_Maps_ArcGIS_I.pdf
Thematic_Maps_ArcGIS_I.pdf
 
Introducción al procesamiento del Big Data
Introducción al procesamiento del Big DataIntroducción al procesamiento del Big Data
Introducción al procesamiento del Big Data
 
Análisis científico en ArcGIS
Análisis científico en ArcGISAnálisis científico en ArcGIS
Análisis científico en ArcGIS
 
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMSDrupal & GIS: Convirtiendo Drupal en un GeoCMS
Drupal & GIS: Convirtiendo Drupal en un GeoCMS
 
Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...Comparación e implementación de liberías webmapping como herramienta de visua...
Comparación e implementación de liberías webmapping como herramienta de visua...
 
Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)Taller: Tableau Public (Semana 3)
Taller: Tableau Public (Semana 3)
 
Tableau Public: Herramienta para la visualización de datos 3
 Tableau Public: Herramienta para la visualización de datos 3 Tableau Public: Herramienta para la visualización de datos 3
Tableau Public: Herramienta para la visualización de datos 3
 
Sig
SigSig
Sig
 

Último

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 

Último (20)

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdfFamilias más ricas de países de AL en inicio de su hegemonía (2024).pdf
Familias más ricas de países de AL en inicio de su hegemonía (2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 

Spatial Data Science con R

  • 1. 1 Intro a Spatial Data Science con R Alí Santacruz amsantac.co JULIO 2016
  • 2. 2 Acerca de mí • Geomático con background ambiental • R geek • Candidato a PhD en Geografía • Interesado en Spatial Data Science • Autor de paquetes de R (disponibles en CRAN)
  • 3. 3 Objetivo de esta charla • Discutir qué es Spatial Data Science • Presentar de manera introductoria cómo realizar Spatial Data Science con R
  • 4. 4 Qué es Spatial Data Science? Spatial Data Scientist (n.): Estadístico Experto SIG/RSDesarrollador SIG Ingeniero de software Spatial Data Scientist Spatial Data Science Data Science Spatial Persona que es mejor en análisis de datos espaciales que un desarrollador SIG y mejor en ingeniería de software que un experto SIG/RS
  • 5. 5 Spatial Data Science Se combinan para el análisis de datos con el fin de … Apoyar una mejor toma de decisiones "The key word in data science is not data; it is science" Jeff Leek. Coursera.
  • 7. 7 Habilidades computacionales • Programación: Python y R (entre otros) http://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
  • 8. 8 Por qué usar R? • Libre, de código abierto y gratuito • Un conjunto de paquetes (> 8600) comprehensivo • Acceso a los datos • Data cleaning • Análisis • Visualización y creación de reportes • Excelentes ambientes de desarrollo – RStudio IDE • Una comunidad activa y amigable de desarrolladores • Una extensa comunidad de usuarios: > 2 millones
  • 9. 9 Por qué usar R para análisis espacial • 160+ paquetes en CRAN Task View: Analysis of Spatial Data • Clases para datos espaciales (y espacio-temporales) • Importación y exportación de datos • Análisis exploratorio de datos espaciales • Soporte para operaciones en vector y raster • Estadística espacial • Visualización en gráficos estáticos o interactivos (web) • Integración con software SIG • Integración con técnicas de análisis de paquetes ‘no-espaciales’ usualmente sencilla
  • 10. 10 Clases de R para datos espaciales • Antes de 2003: • Varios paquetes para datos espaciales con diferentes supuestos sobre cómo los datos espaciales estaban organizados • En 2003: • Paquete ‘sp’: extiende R con clases y métodos para datos espaciales (vector y raster) • En 2010: • Paquete ‘raster’: maneja datos raster almacenados en disco demasiado grandes como para ser cargados en la memoria (RAM)
  • 11. 11 Clases de R para datos espaciales SpatialPointsDataFrame SpatialLinesDataFrame SpatialPolygonsDataFrame SpatialPixelsDataFrame SpatialGridDataFrame Paquete sp RasterLayer RasterStack RasterBrick Paquete raster (preferido)
  • 12. 12 The Data Science Process Adaptado de science2knowledge Reproducibility
  • 13. 13 MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos • Es esto A o B o C? :: clasificación • Es esto extraño? :: detección de anomalías • Cuánto/qué tanto? :: regresión • Cómo está organizado? :: clustering • Cómo cambiará? :: predicción "The key word in data science is not data; it is science" Jeff Leek. Coursera. OBTENER los datos OBTENER los datos Domain expertise PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados
  • 14. 14 • Importar capas vector: paquetes rgdal, raster • Importar capas raster: paquete raster • Obtener datos georreferenciados mediante APIs: paquete twitteR, ver ejemplo • Descargar imágenes satelitales/información geográfica: paquete raster, modis, MODISTools MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para esta diapositiva y las siguientes ver el código y ejemplos en esta página
  • 15. 15 • Data cleaning, subset, etc. • Manipular datos con “verbos” del paquete dplyr y otros del Hadley-verse • Subset espacial (paquetes sp, raster) • Operaciones en vector: • Operaciones en tabla de atributos (paquete sp) • Superposición: unión, intersección, clip, extracción de valores de raster en puntos (paquetes raster, rgeos) • Dissolve (paquetes sp, rgeos), buffer (paquete rgeos) • Rasterización (paquete raster) • Operaciones en raster: • Álgebra de mapas, filtros espaciales, remuestreo, … (paquete raster) • Vectorización (paquetes rgdal, raster) MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página
  • 16. 16 MODELAR los datos MODELAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Estadísticos descriptivos: medidas de tendencia central y de dispersión • Gráficos exploratorios (2D y 3D): scatterplot, boxplot, histograma, … • Autocorrelación espacial: • Medidas globales de autocorrelación espacial: I de Moran, C de Geary, G(d) de Getis y Ord (paquete spdep) • Medidas locales de autocorrelación espacial: estadístico local Ii de Moran, Gi y Gi*(d) de Getis y Ord (paquete spdep)
  • 17. 17 MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados COMUNICAR resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Regresión: • Modelos espaciales autoregresivos (paquete spdep) • Regresión ponderada geográficamente (paquete spgwr) • Clasificación (Machine Learning): • Supervisada: RandomForests, SVM, boosting, … (paquete caret) • No supervisada: k-means clustering (paquete stats) • Estadística espacial: • Geoestadística (paquetes gstat, geoR, geospt, …) • Patrones de puntos espaciales (paquete spatstat)
  • 18. 18 MODELAR los datos MODELAR los datos EXPLORAR los datos EXPLORAR los datos PREPARAR los datos PREPARAR los datos OBTENER los datos OBTENER los datos PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta PLANTEAR la pregunta correcta COMUNICAR los resultados Para diapositivas 14 a 18 ver el código y ejemplos en esta página • Mapas temáticos estáticos o interactivos: paquetes tmap, leaflet, mapview • Gráficos interactivos, aplicaciones web y dashboards: • paquetes plotly (ejemplo), rcharts, googleVis (ejemplo) • paquete shiny, ver ejemplo • paquete flexdashboard, ver ejemplo
  • 19. 19 No olvides: Reproducibilidad! • El código de R y los resultados de ejemplos presentados (diapositivas 17- 21) pueden ser reproducidos a partir de este documento .Rmd usando RMarkdown • Mira este ejemplo sobre análisis espaciales reproducibles usando notebooks interactivos • Conoce más sobre reproducibilidad en análisis geoespaciales
  • 20. 20 Integración de R con software SIG • QGIS: ver ejemplo en este post • ArcGIS: paquete arcgisbinding, ver ejemplo en este post • GRASS GIS: versión 6, paquete spgrass6; versión 7, paquete rgrass7 • gvSIG: más info en este post • SAGA: paquete RSAGA • GME (Geospatial Modelling Environment): más info en esta página
  • 21. 21 Referencias / Dónde aprender más • Bivand, R., Pebesma, E., Gómez-Rubio, V. 2013. Applied Spatial Data Analysis with R. New York: Springer. 2nd ed. • R-SIG-Geo mailing list • CRAN Task View: Analysis of Spatial Data • Grupos en Facebook: GIS with R, R project en Español • Grupos en G+: Statistics and R, R Programming for Data Analysis • Mi blog: amsantac.co/es/blog.html
  • 22. Si tienes alguna pregunta puedes contactarme en: amsantac.co/es/contact.html Gracias!