SlideShare uma empresa Scribd logo
1 de 35
Baixar para ler offline
Refinando un modelo predictivo gracias
al GIS con Python
MARINA VALENTÍN
Especialista GIS - BIM / CAD
30/10/2019 - Conferencia Esri España 2019
ROI MARTÍNEZ
Data Scientist Jr. / Ing. de
implantación
RAÚL JIMÉNEZ
Responsable de startups y
spin-offs @ Esri España
Problema
Predicción del precio de una vivienda
AGENDA:
● Primera aproximación desde Jupyter Notebooks
● Evaluación del modelo desde ArcGIS Pro
● Refinamiento del modelo con ArcGIS Pro
● Exploración en PowerBI
Disclaimer
Ninguno de nosotros es experto (aún al menos ;P) en Machine Learning
Hands-on ML with Scikit-Learn
& TensorFlow by O’Reilly
Machine Learning in ArcGIS,
Esri User Conference August
2018
Using Forest-based
Classification & Regression in
GIS to Model and Estimate
House Values
JUPYTER NOTEBOOKS
Qué papel juegan Jupyter, Scikit-learn, Pandas, Scypi y otras
bibliotecas en el proceso de selección, entrenamiento y refinamiento
de un modelo de ML antes de pasar a ArcGIS Pro.
Ver Notebook en: Github | Google Colab
Explorar y visualizar
Los datos para comprenderlos mejor
Exploramos los datos de entrenamiento
Con Pandas podemos ver rápidamente qué atributos tenemos, cuántos valores nulos, qué rango de valores, ...
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Exploramos los datos de entrenamiento
Pandas + matplotlib: qué valores tienen los atributos, cómo están distribuidos, existen truncamientos, …
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Exploramos los datos de entrenamiento
matplotlib: Visualizamos los datos geográficamente
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Buscamos correlaciones entre los datos de entrenamiento
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Pandas: Analizamos el coeficiente estándar de correlación (o el coeficiente de correlación de Pearson)
El coeficiente de correlación sólo mide correlaciones lineales pero no la pendiente de la relación ni otros aspectos, por ejemplo puede
perderse por completo las relaciones no lineales (por ejemplo, "si x está cerca de cero, entonces el genérico sube").
Buscamos correlaciones entre los datos de entrenamiento
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Pandas: Usando la función “pandas.plotting.scatter_matrix” para visualizar correlación entre pares de atributos
Experimentando con combinaciones de atributos
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Pandas y matplotlib: Exploramos si tiene sentido generamos atributos derivados a partir de otros
Preparar los datos
Para los algoritmos de Machine Learning
Limpiamos los datos
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Reemplazamos los valores nulos por la mediana de cada atributo
Limpiamos los datos
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Transformamos los atributos categóricos usando sklearn.preprocessing.OneHotEncoder
Escalamos los valores usando sklearn.preprocessing.StandardScaler
Seleccionar y entrenar
Entrenar y evaluar el modelo con los datos de entrenamiento
Entrenamos con un modelo de regresión lineal
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Usando sklearn.linear_model.LinearRegression
Entrenamos con un modelo de árboles de decisión
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Usando sklearn.tree.DecisionTreeRegressor
Entrenamos con un modelo de árboles aleatorios
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Usando sklearn.ensemble.RandomForestRegressor
Refinar el modelo
Mecanismo para mejorar el ajuste del modelo
Búsqueda por cuadrículas (Grid Search)
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Usando sklearn.model_selection.GridSearchCV
Búsqueda por cuadrículas (Grid Search)
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Usando sklearn.model_selection.GridSearchCV
Búsqueda aleatoria
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn + Scipy: Usando sklearn.model_selection.RandomizedSearchCV
Analizar la relevancia de cada dato
Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
Scikit-learn: Explorando las importancia gracias a sklearn.model_selection.GridSearchCV
EVALUACIÓN DEL MODELO
DESDE ARCGIS PRO
Cómo podemos entrenar un modelo de ML desde Arc GIS Pro
utilizando la herramienta Forest-Based Classification and Regression
Bosques Aleatorios
¿De dónde viene este algoritmo?
Bosques aleatorios
Bosques Aleatorios | Datos de partida | Caso 1
Breve introducción al algoritmo.
Árbol de Decisión
Datos de partida
Dataset que vamos a utilizar
Datos de Partida
Bosques Aleatorios | Datos de partida | Caso 1
Dataset procedente de Jupyter
Datos de Partida
Bosques Aleatorios | Datos de partida | Caso 1
Representación gráfica de los datos.
Caso 1
Modelo sin variables espaciales
Caso 1
Bosques Aleatorios | Datos de partida | Caso 1
Herramienta Forest-based Classification and Regression.
Caso 1
Bosques Aleatorios | Datos de partida | Caso 1
Resultados del modelo sin variables espaciales
Caso 2
Modelo con variables espaciales
Caso 2 - Variables espaciales
Bosques Aleatorios | Datos de partida | Caso 2
Herramienta Forest-based Classification and Regression.
Caso 2
Bosques Aleatorios | Datos de partida | Caso 2
Resultados del modelo con variables espaciales

Mais conteúdo relacionado

Mais procurados

Tema 1-1 datos y tipos de datos
Tema 1-1 datos y tipos de datosTema 1-1 datos y tipos de datos
Tema 1-1 datos y tipos de datosRufi Flores
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data ScienceSrishti44
 
Introduction to data science
Introduction to data scienceIntroduction to data science
Introduction to data scienceSampath Kumar
 
Presentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA MéxicoPresentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA MéxicoRamón Hernández
 
Introduction to data science.pptx
Introduction to data science.pptxIntroduction to data science.pptx
Introduction to data science.pptxSadhanaParameswaran
 
Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Datos.gob.es
 
Data science & data scientist
Data science & data scientistData science & data scientist
Data science & data scientistVijayMohan Vasu
 
Data Science Introduction
Data Science IntroductionData Science Introduction
Data Science IntroductionGang Tao
 
Data Science Training | Data Science Tutorial | Data Science Certification | ...
Data Science Training | Data Science Tutorial | Data Science Certification | ...Data Science Training | Data Science Tutorial | Data Science Certification | ...
Data Science Training | Data Science Tutorial | Data Science Certification | ...Edureka!
 
analisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xanalisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xHerbert Cosio Dueñas
 
Tema 1 Datos y tipos de datos
Tema 1    Datos y tipos de datosTema 1    Datos y tipos de datos
Tema 1 Datos y tipos de datosrufiflores0469
 
Become a Data Analyst
Become a Data Analyst Become a Data Analyst
Become a Data Analyst Aaron Lamphere
 

Mais procurados (17)

matrices con-pse int
matrices con-pse intmatrices con-pse int
matrices con-pse int
 
Tema 1-1 datos y tipos de datos
Tema 1-1 datos y tipos de datosTema 1-1 datos y tipos de datos
Tema 1-1 datos y tipos de datos
 
Micro proyectop libardo 80
Micro proyectop libardo 80Micro proyectop libardo 80
Micro proyectop libardo 80
 
Introduction to data science
Introduction to data scienceIntroduction to data science
Introduction to data science
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Introduction to data science
Introduction to data scienceIntroduction to data science
Introduction to data science
 
Teoria de limites 2
Teoria de limites 2 Teoria de limites 2
Teoria de limites 2
 
Presentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA MéxicoPresentación de Gobierno de Datos en DAMA México
Presentación de Gobierno de Datos en DAMA México
 
Introduction to data science.pptx
Introduction to data science.pptxIntroduction to data science.pptx
Introduction to data science.pptx
 
Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos Guía Práctica de Introducción al Análisis Exploratorio de Datos
Guía Práctica de Introducción al Análisis Exploratorio de Datos
 
Data science & data scientist
Data science & data scientistData science & data scientist
Data science & data scientist
 
Data Science Introduction
Data Science IntroductionData Science Introduction
Data Science Introduction
 
What is Data Science
What is Data ScienceWhat is Data Science
What is Data Science
 
Data Science Training | Data Science Tutorial | Data Science Certification | ...
Data Science Training | Data Science Tutorial | Data Science Certification | ...Data Science Training | Data Science Tutorial | Data Science Certification | ...
Data Science Training | Data Science Tutorial | Data Science Certification | ...
 
analisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1xanalisis de datos cuantitativos segunda parte (spss).ppt1x
analisis de datos cuantitativos segunda parte (spss).ppt1x
 
Tema 1 Datos y tipos de datos
Tema 1    Datos y tipos de datosTema 1    Datos y tipos de datos
Tema 1 Datos y tipos de datos
 
Become a Data Analyst
Become a Data Analyst Become a Data Analyst
Become a Data Analyst
 

Semelhante a Refinando un modelo predictivo gracias al GIS con Python

Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Eduardo Castro
 
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerenciales
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerencialesPLANEAMIENTO ESTRATEGICO: Siete herramientas gerenciales
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerencialesSandra Mariela Ballón Aguedo
 
Machine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuidoMachine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuidoSoftware Guru
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Gina Mejía
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerEduardo Castro
 
Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)Jose Manuel Ortega Candel
 
Aprendiendo Machine learning - Aplicado a xAPI, elearning
Aprendiendo Machine learning - Aplicado a xAPI, elearningAprendiendo Machine learning - Aplicado a xAPI, elearning
Aprendiendo Machine learning - Aplicado a xAPI, elearningRaúl Bordallo
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Gerard Alba
 
Tablas dinámicas
 Tablas dinámicas Tablas dinámicas
Tablas dinámicaslmedinapa
 
Excel avanzado y tablas dinámicas
Excel avanzado y tablas dinámicasExcel avanzado y tablas dinámicas
Excel avanzado y tablas dinámicaslmedinapa
 
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Neo4j
 
Pass - Algoritmos de clasificacion
Pass - Algoritmos de clasificacionPass - Algoritmos de clasificacion
Pass - Algoritmos de clasificacionFabricio Quintanilla
 
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...elianatorales
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxLuis Beltran
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxAnonymousEoGAaTF
 
Introducción al Machine Learning con BigML
Introducción al Machine Learning con BigMLIntroducción al Machine Learning con BigML
Introducción al Machine Learning con BigMLMSc Aldo Valdez Alvarado
 

Semelhante a Refinando un modelo predictivo gracias al GIS con Python (20)

Feature Selection
Feature SelectionFeature Selection
Feature Selection
 
Prediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdfPrediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdf
 
Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015Que es Azure Machine Learning 2015
Que es Azure Machine Learning 2015
 
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerenciales
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerencialesPLANEAMIENTO ESTRATEGICO: Siete herramientas gerenciales
PLANEAMIENTO ESTRATEGICO: Siete herramientas gerenciales
 
7 nuevas herramientas
7 nuevas herramientas7 nuevas herramientas
7 nuevas herramientas
 
Machine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuidoMachine learning usando Weka, en un entorno de cómputo distribuido
Machine learning usando Weka, en un entorno de cómputo distribuido
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)Machine Learning para proyectos de seguridad(Pycon)
Machine Learning para proyectos de seguridad(Pycon)
 
Aprendiendo Machine learning - Aplicado a xAPI, elearning
Aprendiendo Machine learning - Aplicado a xAPI, elearningAprendiendo Machine learning - Aplicado a xAPI, elearning
Aprendiendo Machine learning - Aplicado a xAPI, elearning
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
 
Tablas dinámicas
 Tablas dinámicas Tablas dinámicas
Tablas dinámicas
 
Excel avanzado y tablas dinámicas
Excel avanzado y tablas dinámicasExcel avanzado y tablas dinámicas
Excel avanzado y tablas dinámicas
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
Graph Everywhere - Josep Taruella - Por qué Graph Data Science en tus modelos...
 
Pass - Algoritmos de clasificacion
Pass - Algoritmos de clasificacionPass - Algoritmos de clasificacion
Pass - Algoritmos de clasificacion
 
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
slides-espanol-curso-introduccion-machine-learning-por-mindsdb_8c5ff985-0581-...
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptx
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Introducción al Machine Learning con BigML
Introducción al Machine Learning con BigMLIntroducción al Machine Learning con BigML
Introducción al Machine Learning con BigML
 

Mais de Esri España

Mesa expertos esri 2019 aljarafesa
Mesa expertos esri 2019 aljarafesaMesa expertos esri 2019 aljarafesa
Mesa expertos esri 2019 aljarafesaEsri España
 
Implantación de una Plataforma de Información Geográfica en una Compañía del ...
Implantación de una Plataforma de Información Geográfica en una Compañía del ...Implantación de una Plataforma de Información Geográfica en una Compañía del ...
Implantación de una Plataforma de Información Geográfica en una Compañía del ...Esri España
 
Ejemplos de integración del GIS con otros sistemas
Ejemplos de integración del GIS con otros sistemasEjemplos de integración del GIS con otros sistemas
Ejemplos de integración del GIS con otros sistemasEsri España
 
Un nuevo paradigma en el sector del agua Utility Network
Un nuevo paradigma en el sector del agua  Utility NetworkUn nuevo paradigma en el sector del agua  Utility Network
Un nuevo paradigma en el sector del agua Utility NetworkEsri España
 
Gestión de Activos en Tiempo Real
Gestión de Activos en Tiempo RealGestión de Activos en Tiempo Real
Gestión de Activos en Tiempo RealEsri España
 
Utility Network en la Nube
Utility Network en la NubeUtility Network en la Nube
Utility Network en la NubeEsri España
 
Dashboard Operacional de órdenes de trabajo en campo
Dashboard Operacional de órdenes de trabajo en campoDashboard Operacional de órdenes de trabajo en campo
Dashboard Operacional de órdenes de trabajo en campoEsri España
 
Subiendo el rendimiento y la productividad Herramientas estratégicas automa...
Subiendo el rendimiento y la productividad  Herramientas estratégicas  automa...Subiendo el rendimiento y la productividad  Herramientas estratégicas  automa...
Subiendo el rendimiento y la productividad Herramientas estratégicas automa...Esri España
 
La implantación de la plataforma ArcGIS en Aljarafesa
La implantación de la plataforma ArcGIS en AljarafesaLa implantación de la plataforma ArcGIS en Aljarafesa
La implantación de la plataforma ArcGIS en AljarafesaEsri España
 
La importancia del dato geográfico en la toma de decisiones de negocio
La importancia del dato geográfico en la toma de decisiones de negocioLa importancia del dato geográfico en la toma de decisiones de negocio
La importancia del dato geográfico en la toma de decisiones de negocioEsri España
 
La importancia del dato geográfico en los Servicios Financieros
La importancia del dato geográfico en los Servicios FinancierosLa importancia del dato geográfico en los Servicios Financieros
La importancia del dato geográfico en los Servicios FinancierosEsri España
 
Análisis del Territorio a través del Dato
Análisis del Territorio a través del DatoAnálisis del Territorio a través del Dato
Análisis del Territorio a través del DatoEsri España
 
Gestión hospitalaria con ArcGIS Indoor
Gestión hospitalaria con ArcGIS IndoorGestión hospitalaria con ArcGIS Indoor
Gestión hospitalaria con ArcGIS IndoorEsri España
 
BIM + GIS: La alianza Autodesk-Esri
BIM + GIS: La alianza Autodesk-EsriBIM + GIS: La alianza Autodesk-Esri
BIM + GIS: La alianza Autodesk-EsriEsri España
 
CEsri19-esri_bim_gis
CEsri19-esri_bim_gisCEsri19-esri_bim_gis
CEsri19-esri_bim_gisEsri España
 
Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISHaciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISEsri España
 
Impulsa tus políticas de Gobierno Abierto con ArcGIS Hub
Impulsa tus políticas de Gobierno Abierto con ArcGIS HubImpulsa tus políticas de Gobierno Abierto con ArcGIS Hub
Impulsa tus políticas de Gobierno Abierto con ArcGIS HubEsri España
 
Últimas tendencias en el uso del GIS en salud y servicios sanitarios
Últimas tendencias en el uso del GIS en salud y servicios sanitariosÚltimas tendencias en el uso del GIS en salud y servicios sanitarios
Últimas tendencias en el uso del GIS en salud y servicios sanitariosEsri España
 
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”Esri España
 
ArcGIS Pro: la innovación del GIS
ArcGIS Pro: la innovación del GISArcGIS Pro: la innovación del GIS
ArcGIS Pro: la innovación del GISEsri España
 

Mais de Esri España (20)

Mesa expertos esri 2019 aljarafesa
Mesa expertos esri 2019 aljarafesaMesa expertos esri 2019 aljarafesa
Mesa expertos esri 2019 aljarafesa
 
Implantación de una Plataforma de Información Geográfica en una Compañía del ...
Implantación de una Plataforma de Información Geográfica en una Compañía del ...Implantación de una Plataforma de Información Geográfica en una Compañía del ...
Implantación de una Plataforma de Información Geográfica en una Compañía del ...
 
Ejemplos de integración del GIS con otros sistemas
Ejemplos de integración del GIS con otros sistemasEjemplos de integración del GIS con otros sistemas
Ejemplos de integración del GIS con otros sistemas
 
Un nuevo paradigma en el sector del agua Utility Network
Un nuevo paradigma en el sector del agua  Utility NetworkUn nuevo paradigma en el sector del agua  Utility Network
Un nuevo paradigma en el sector del agua Utility Network
 
Gestión de Activos en Tiempo Real
Gestión de Activos en Tiempo RealGestión de Activos en Tiempo Real
Gestión de Activos en Tiempo Real
 
Utility Network en la Nube
Utility Network en la NubeUtility Network en la Nube
Utility Network en la Nube
 
Dashboard Operacional de órdenes de trabajo en campo
Dashboard Operacional de órdenes de trabajo en campoDashboard Operacional de órdenes de trabajo en campo
Dashboard Operacional de órdenes de trabajo en campo
 
Subiendo el rendimiento y la productividad Herramientas estratégicas automa...
Subiendo el rendimiento y la productividad  Herramientas estratégicas  automa...Subiendo el rendimiento y la productividad  Herramientas estratégicas  automa...
Subiendo el rendimiento y la productividad Herramientas estratégicas automa...
 
La implantación de la plataforma ArcGIS en Aljarafesa
La implantación de la plataforma ArcGIS en AljarafesaLa implantación de la plataforma ArcGIS en Aljarafesa
La implantación de la plataforma ArcGIS en Aljarafesa
 
La importancia del dato geográfico en la toma de decisiones de negocio
La importancia del dato geográfico en la toma de decisiones de negocioLa importancia del dato geográfico en la toma de decisiones de negocio
La importancia del dato geográfico en la toma de decisiones de negocio
 
La importancia del dato geográfico en los Servicios Financieros
La importancia del dato geográfico en los Servicios FinancierosLa importancia del dato geográfico en los Servicios Financieros
La importancia del dato geográfico en los Servicios Financieros
 
Análisis del Territorio a través del Dato
Análisis del Territorio a través del DatoAnálisis del Territorio a través del Dato
Análisis del Territorio a través del Dato
 
Gestión hospitalaria con ArcGIS Indoor
Gestión hospitalaria con ArcGIS IndoorGestión hospitalaria con ArcGIS Indoor
Gestión hospitalaria con ArcGIS Indoor
 
BIM + GIS: La alianza Autodesk-Esri
BIM + GIS: La alianza Autodesk-EsriBIM + GIS: La alianza Autodesk-Esri
BIM + GIS: La alianza Autodesk-Esri
 
CEsri19-esri_bim_gis
CEsri19-esri_bim_gisCEsri19-esri_bim_gis
CEsri19-esri_bim_gis
 
Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGISHaciendo visible lo invisible: imágenes en la plataforma ArcGIS
Haciendo visible lo invisible: imágenes en la plataforma ArcGIS
 
Impulsa tus políticas de Gobierno Abierto con ArcGIS Hub
Impulsa tus políticas de Gobierno Abierto con ArcGIS HubImpulsa tus políticas de Gobierno Abierto con ArcGIS Hub
Impulsa tus políticas de Gobierno Abierto con ArcGIS Hub
 
Últimas tendencias en el uso del GIS en salud y servicios sanitarios
Últimas tendencias en el uso del GIS en salud y servicios sanitariosÚltimas tendencias en el uso del GIS en salud y servicios sanitarios
Últimas tendencias en el uso del GIS en salud y servicios sanitarios
 
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”
Creando mundos 3D en la plataforma ArcGIS, desde catastro a “Zootopia”
 
ArcGIS Pro: la innovación del GIS
ArcGIS Pro: la innovación del GISArcGIS Pro: la innovación del GIS
ArcGIS Pro: la innovación del GIS
 

Refinando un modelo predictivo gracias al GIS con Python

  • 1. Refinando un modelo predictivo gracias al GIS con Python MARINA VALENTÍN Especialista GIS - BIM / CAD 30/10/2019 - Conferencia Esri España 2019 ROI MARTÍNEZ Data Scientist Jr. / Ing. de implantación RAÚL JIMÉNEZ Responsable de startups y spin-offs @ Esri España
  • 2. Problema Predicción del precio de una vivienda AGENDA: ● Primera aproximación desde Jupyter Notebooks ● Evaluación del modelo desde ArcGIS Pro ● Refinamiento del modelo con ArcGIS Pro ● Exploración en PowerBI
  • 3. Disclaimer Ninguno de nosotros es experto (aún al menos ;P) en Machine Learning Hands-on ML with Scikit-Learn & TensorFlow by O’Reilly Machine Learning in ArcGIS, Esri User Conference August 2018 Using Forest-based Classification & Regression in GIS to Model and Estimate House Values
  • 4. JUPYTER NOTEBOOKS Qué papel juegan Jupyter, Scikit-learn, Pandas, Scypi y otras bibliotecas en el proceso de selección, entrenamiento y refinamiento de un modelo de ML antes de pasar a ArcGIS Pro. Ver Notebook en: Github | Google Colab
  • 5. Explorar y visualizar Los datos para comprenderlos mejor
  • 6. Exploramos los datos de entrenamiento Con Pandas podemos ver rápidamente qué atributos tenemos, cuántos valores nulos, qué rango de valores, ... Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
  • 7. Exploramos los datos de entrenamiento Pandas + matplotlib: qué valores tienen los atributos, cómo están distribuidos, existen truncamientos, … Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
  • 8. Exploramos los datos de entrenamiento matplotlib: Visualizamos los datos geográficamente Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo
  • 9. Buscamos correlaciones entre los datos de entrenamiento Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Pandas: Analizamos el coeficiente estándar de correlación (o el coeficiente de correlación de Pearson) El coeficiente de correlación sólo mide correlaciones lineales pero no la pendiente de la relación ni otros aspectos, por ejemplo puede perderse por completo las relaciones no lineales (por ejemplo, "si x está cerca de cero, entonces el genérico sube").
  • 10. Buscamos correlaciones entre los datos de entrenamiento Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Pandas: Usando la función “pandas.plotting.scatter_matrix” para visualizar correlación entre pares de atributos
  • 11. Experimentando con combinaciones de atributos Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Pandas y matplotlib: Exploramos si tiene sentido generamos atributos derivados a partir de otros
  • 12. Preparar los datos Para los algoritmos de Machine Learning
  • 13. Limpiamos los datos Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Reemplazamos los valores nulos por la mediana de cada atributo
  • 14. Limpiamos los datos Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Transformamos los atributos categóricos usando sklearn.preprocessing.OneHotEncoder Escalamos los valores usando sklearn.preprocessing.StandardScaler
  • 15. Seleccionar y entrenar Entrenar y evaluar el modelo con los datos de entrenamiento
  • 16. Entrenamos con un modelo de regresión lineal Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Usando sklearn.linear_model.LinearRegression
  • 17. Entrenamos con un modelo de árboles de decisión Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Usando sklearn.tree.DecisionTreeRegressor
  • 18. Entrenamos con un modelo de árboles aleatorios Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Usando sklearn.ensemble.RandomForestRegressor
  • 19. Refinar el modelo Mecanismo para mejorar el ajuste del modelo
  • 20. Búsqueda por cuadrículas (Grid Search) Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Usando sklearn.model_selection.GridSearchCV
  • 21. Búsqueda por cuadrículas (Grid Search) Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Usando sklearn.model_selection.GridSearchCV
  • 22. Búsqueda aleatoria Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn + Scipy: Usando sklearn.model_selection.RandomizedSearchCV
  • 23. Analizar la relevancia de cada dato Explorar y visualizar los datos | Preparar los datos | Seleccionar y entrenar el modelo | Refinar el modelo Scikit-learn: Explorando las importancia gracias a sklearn.model_selection.GridSearchCV
  • 24. EVALUACIÓN DEL MODELO DESDE ARCGIS PRO Cómo podemos entrenar un modelo de ML desde Arc GIS Pro utilizando la herramienta Forest-Based Classification and Regression
  • 25. Bosques Aleatorios ¿De dónde viene este algoritmo?
  • 26. Bosques aleatorios Bosques Aleatorios | Datos de partida | Caso 1 Breve introducción al algoritmo. Árbol de Decisión
  • 27. Datos de partida Dataset que vamos a utilizar
  • 28. Datos de Partida Bosques Aleatorios | Datos de partida | Caso 1 Dataset procedente de Jupyter
  • 29. Datos de Partida Bosques Aleatorios | Datos de partida | Caso 1 Representación gráfica de los datos.
  • 30. Caso 1 Modelo sin variables espaciales
  • 31. Caso 1 Bosques Aleatorios | Datos de partida | Caso 1 Herramienta Forest-based Classification and Regression.
  • 32. Caso 1 Bosques Aleatorios | Datos de partida | Caso 1 Resultados del modelo sin variables espaciales
  • 33. Caso 2 Modelo con variables espaciales
  • 34. Caso 2 - Variables espaciales Bosques Aleatorios | Datos de partida | Caso 2 Herramienta Forest-based Classification and Regression.
  • 35. Caso 2 Bosques Aleatorios | Datos de partida | Caso 2 Resultados del modelo con variables espaciales