SlideShare uma empresa Scribd logo
1 de 23
DataMining Bernardo A. Robelo Jirón bernardorobelo.blogspot.com
Quées el Data Mining TEORÍAGrandesempresastienenvaliosainformaciónoculta y almacenada en sus bases de datosproveniente de la acumulación de info a lo largo de suhistoria. CERTEZAS Esosdatos no pueden ser extraídospormétodosinformáticosconvencionalesniportécnicasestadísticastradicionales.   Se requiere de algoritmos y técnicasmáscomplejasprovenientes del área de la Inteligencia Artificial y la MatemáticaCompleja, como ser RedesNeuronales, Árboles de Decisión, RegresiónLogística, AlgoritmosGenéticos y Análisis Fractal. VALOR	 Su valor radica, en que el descubrimiento de dichospatronespuedeconvertirse en el activomásimportanteparaunaempresa a la hora de toma de decisiones en susnegocios. Conociendo de estamanera con másdetalle a susclientes, la dinámica de susproductos en el mercado, realizandomodeloseficientes de predicción y determinando la influencia de las variables involucradas.  SEGÚN EL MITPara el Massachusetts Institute Technology, el Data Mining es una de las diez tecnologías emergentes que cambiará al Mundo.
Quées el Data Mining  DEFINICIÓN La Minería de Datos, es un conjunto de técnicasprovenientes de la Inteligencia Artificial y la MatemáticaCompleja,cuyafinalidad, en el ambienteempresarial,es la de encontrar en grandes bases de datospatronesocultos, no triviales e imposibles de detectarmedianteotrosmecanismosestadísticos; paraluegoextraerdichainformación, la cualpuedeconvertirse en el activomásimportante de unaempresa a la hora de toma de decisiones y encararfuturasestrategias de negocios.
Tecnicas A. RedesNeuronales Características: - Sistema Artificial queemula el funcionamiento del cerebrohumano.- Son capaces de aprendermediantediferentesalgoritmos de entrenamiento. - Existendiferentestipos de RedesNeuronalesArtificiales. Su utilización y entrenamientodepende del problemaqueesténencomendadas a resolver. - Son flexibles y resistentes a errores. - Puedenprocesarse en tiempo real.- Susprincipalesusos se dan en el reconocimiento de patrones y en los modelos de predicción.- Son aplicablesporejemplo en el Mercado Bursátil, en los sistemas OCR, en la Segmentación de Clientes, en predicciones de Demanda y especialmente en Detección de Fraudes y Riesgos. Neurona Humana Neurona Artificial Red Neuronal Artificial
Tecnicas B. Árboles de Decisión Características: ,[object Object],EJEMPLO: Unaempresalíder en electrodomésticos decide hacerunacampañaparaofrecer un nuevoproducto, un reproductor de músicaportátil de grancapacidad y con un precioaccesible. Dichaempresaposeeunagran base de datos con todaslasventasrealizadas a lo largo de 15 años de historia.  Se deseaexploraresta base paraencontrarpatrones y asísegmentar a susclientes y realizarunacampaña de marketing dirigida. A continuación la solución al problema
Tecnicas B. Árboles de Decisión Notas:El árbol puede ramificarse mucho más aún y poseer un mayor número de variables.En este caso, el responsable de la campaña de Marketing, tiene buenas herramientas para optar por dirigir su campaña a personas entre 18 y 27 años de clase media, y a empleados de entre 28 y 38 años. Solución al problema anterior:Se plantea un árbol de decisión, el cual determina de manera inteligente (es parte del algoritmo) que la variable fundamental a considerar es la edad. A partir de allí se comienza a ramificar el árbol. La edad se divide en tres rangos. La segunda variable de mayor peso es el Nivel Socio Económico de la persona y su profesión. El árbol, mostrará en cada una de sus ramas un número entre 0 y 1 que indica la probabilidad de que una persona en dicho segmento compre el producto que se está ofreciendo. De esta manera, se convierte en una herramienta fundamental en la toma de decisiones para encarar una campaña de marketing eficiente. La potencia de un algoritmo de AD radica en su capacidad de ordenar y segmentar las variables de mayor a menor. Aquí los resultados en este análisis.  EDAD > 38 28-38 18-27 P=0,65 P=0,61 NSE ALTO NSE MED NSE BAJO Profesional Tecnico/Analista NSE ALTO NSE MED NSE BAJO Emplado Estudiante P=0,81 P=0,51 P=0,42 P=0,29 P=0,37 P=0,12 P=0,76 P=0,67
Tecnicas C. RegresiónLogística Características: ,[object Object],En estas dos industrias, el análisis de Data Mining para los modelos de puntaje o scoring, se ha convertido en una herramienta de uso crítico.
Tecnicas D. Análisis Fractal Características: ,[object Object],[object Object]
Data Mining comoInteligencia de Negocios La Inteligencia de Negocios, disciplinamásconocidaporsunombre en ingléscomo Business Intelligence, tienelassiguientescaracterísticasfundamentales:Acceso a la InformaciónObtenerReportes de calidadApoyo en la toma de decisionesLas herramientasmásdestacadasparaconseguirdichospuntos son:Data Mining y Data WarehouseSistemas de Predicción y Modelado (Análisis Fractal es un ejemplo de ello)Cubos OLAP El proceso de Data Mining, consta de variospasos, los mismosabarcan:Etapa de consultoría: Comprender el problema y determinar de lastécnicas a aplicar.Limpieza de las Bases de Datos.Correr los análisisdeterminados en la primeraetapa (redesneuronales, árboles de decisión, etc.)Comprensión de los resultados.Validación de los mismos.Portodo lo expresado en el presentedocumento, Data Mining es la herramientamáspotentequeacompaña a los responsables de unaempresa o cualquiertipo de proyecto, en el momento de la toma de decisiones de negocios y en el análisis de resultadospresentes, pasados y aúnfuturos.
DataMining SQL Server Analysis Services DataMining
Como trabaja? Tipos de Algoritmos ProblemasNegocios Clustering =  grouping  Asociacion de segmentos y atributos. Ej: E-Commerce WebSite Clustering Algorithm Classification =  predecir un valor especifico Gran volumen de datos,  Hight-Quality Historical Data Decision Trees Naïve Bayes Neural Network Association = correlacion Ej: Vendedores de detalles ( Cervezas y Panales) Association Algorithm Regression =  Prevision a un numero continuo Time Series Logistic Regression Sequences = Proceso y Rutas ( websites)  Sequence Clustering Deviation =  ValoresExtremos (fraudes, credit card) Decision Tree Clustering
Como trabaja? Case Tables   FuenteDatos Lista de Valoresqueutilizara el algoritmo Nested Tables Informacionadicional Ejemplo: Customer Table 9 Algoritmos Mining Structures contienen Mining Models
Algoritmos 1. Association Rules 2. Clustering 3. Sequence Clustering 4. Decision Trees 5. Linear Regression 6. Time Series 7. Naive Bayes 8. Neural Network 9. Logistic Regression
Association Rules Algoritmo genera reglasindicandocomo los items debenaparecerjuntos. Ejemplo: Permitepredecircuando un clienteseleccionara un item,  el clienteseleccionaratambienotrotipo de item.
Clustering El algoritmocorremuchasiteracionesbuscandogrupos de items quetenganpropiedadessimilares.   Ejemplo:	 BuscarClientes con un ciertonivel de educacionquetenganingresossimilares.  Estonosdefinira un Cluster.
Sequence Clustering El algoritmocombinaanalisis de secuencias con cluster paraanalizar la transicion o cambios entre estados. Ejemplo: La prediccion del cluster indicaracualtransiciones la queocurrira en base a patronespasados
Decision Trees Organiza los datos en un Arbol de Red en el cualcadanodorepresentauna decision acerca de unacaracteristica de la informacion. El algoritmosoporta la prediccion de los atributos o caracteristicas.
Linear Regression Es unaaplicacion particular del Decision Tree paracrear un arbol de decisiones con unaraizsencilla.
Time Series Analiza el tiemporelacionado con datosusandounaregresion lineal.  Ejemplo: Predecirlasventasfuturas en base a lasventas en el pasado.
Naive Bayes Examina un atributo en el tiempoparaanalizarcomo el atributo se relaciona a otroatributopara ser predecido. Para ejecutarloesmuyfacilperoignora la influencia de la combinaciones de otrosatributos.
Neural Network Similar al sistemanerviosotrabajandoparaanalizarlasentradas(input) al sistema, cadanodo en la red tiene un peso paradeterminarlassalidas (output) del sistema de cadanodo
Logistic Regression Es unaaplicacion del algoritmo Neural Network, soporta la prediccion de atributos de manera discrete y continous
Data Mining

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Minería de datos
Minería de datosMinería de datos
Minería de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesen
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 

Semelhante a Data Mining

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datosdataminingperu
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datosdataminingperu
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos dataminingperu
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2jarmendipg
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Toma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercialToma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercialMsC. Alec Vinent
 
Derly Diapositivas[1]
Derly Diapositivas[1]Derly Diapositivas[1]
Derly Diapositivas[1]Derly ♥
 
Inteligencia de negocios 1
Inteligencia de negocios 1Inteligencia de negocios 1
Inteligencia de negocios 1reyna mac mas
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
Entregable4 carmenmillansanchez
Entregable4 carmenmillansanchezEntregable4 carmenmillansanchez
Entregable4 carmenmillansanchezCarMillanS
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocioskminxp
 
El sistema de información de marketing
El sistema de información de marketingEl sistema de información de marketing
El sistema de información de marketingJonathanCovena1
 

Semelhante a Data Mining (20)

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2
 
Businnes intelligence
Businnes intelligenceBusinnes intelligence
Businnes intelligence
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
4.data mining
4.data mining4.data mining
4.data mining
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Toma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercialToma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercial
 
Derly Diapositivas[1]
Derly Diapositivas[1]Derly Diapositivas[1]
Derly Diapositivas[1]
 
Business intelligence diapositivas
Business intelligence diapositivasBusiness intelligence diapositivas
Business intelligence diapositivas
 
Inteligencia de negocios 1
Inteligencia de negocios 1Inteligencia de negocios 1
Inteligencia de negocios 1
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Entregable4 carmenmillansanchez
Entregable4 carmenmillansanchezEntregable4 carmenmillansanchez
Entregable4 carmenmillansanchez
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 
El sistema de información de marketing
El sistema de información de marketingEl sistema de información de marketing
El sistema de información de marketing
 

Mais de brobelo

Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejerciciosbrobelo
 
Excel 2007
Excel 2007Excel 2007
Excel 2007brobelo
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQLbrobelo
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007brobelo
 
XML en .NET
XML en .NETXML en .NET
XML en .NETbrobelo
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008brobelo
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NETbrobelo
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoftbrobelo
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Miningbrobelo
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Servicesbrobelo
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Servicesbrobelo
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligencebrobelo
 
Reporting Services
Reporting ServicesReporting Services
Reporting Servicesbrobelo
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Brokerbrobelo
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Serverbrobelo
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datosbrobelo
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005brobelo
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSISbrobelo
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Servicesbrobelo
 

Mais de brobelo (20)

Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejercicios
 
Excel 2007
Excel 2007Excel 2007
Excel 2007
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQL
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007
 
XML en .NET
XML en .NETXML en .NET
XML en .NET
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
 
ADO.NET
ADO.NETADO.NET
ADO.NET
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NET
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoft
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
 
Reporting Services
Reporting ServicesReporting Services
Reporting Services
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Broker
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Server
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datos
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSIS
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Services
 

Data Mining

  • 1. DataMining Bernardo A. Robelo Jirón bernardorobelo.blogspot.com
  • 2. Quées el Data Mining TEORÍAGrandesempresastienenvaliosainformaciónoculta y almacenada en sus bases de datosproveniente de la acumulación de info a lo largo de suhistoria. CERTEZAS Esosdatos no pueden ser extraídospormétodosinformáticosconvencionalesniportécnicasestadísticastradicionales. Se requiere de algoritmos y técnicasmáscomplejasprovenientes del área de la Inteligencia Artificial y la MatemáticaCompleja, como ser RedesNeuronales, Árboles de Decisión, RegresiónLogística, AlgoritmosGenéticos y Análisis Fractal. VALOR Su valor radica, en que el descubrimiento de dichospatronespuedeconvertirse en el activomásimportanteparaunaempresa a la hora de toma de decisiones en susnegocios. Conociendo de estamanera con másdetalle a susclientes, la dinámica de susproductos en el mercado, realizandomodeloseficientes de predicción y determinando la influencia de las variables involucradas. SEGÚN EL MITPara el Massachusetts Institute Technology, el Data Mining es una de las diez tecnologías emergentes que cambiará al Mundo.
  • 3. Quées el Data Mining DEFINICIÓN La Minería de Datos, es un conjunto de técnicasprovenientes de la Inteligencia Artificial y la MatemáticaCompleja,cuyafinalidad, en el ambienteempresarial,es la de encontrar en grandes bases de datospatronesocultos, no triviales e imposibles de detectarmedianteotrosmecanismosestadísticos; paraluegoextraerdichainformación, la cualpuedeconvertirse en el activomásimportante de unaempresa a la hora de toma de decisiones y encararfuturasestrategias de negocios.
  • 4. Tecnicas A. RedesNeuronales Características: - Sistema Artificial queemula el funcionamiento del cerebrohumano.- Son capaces de aprendermediantediferentesalgoritmos de entrenamiento. - Existendiferentestipos de RedesNeuronalesArtificiales. Su utilización y entrenamientodepende del problemaqueesténencomendadas a resolver. - Son flexibles y resistentes a errores. - Puedenprocesarse en tiempo real.- Susprincipalesusos se dan en el reconocimiento de patrones y en los modelos de predicción.- Son aplicablesporejemplo en el Mercado Bursátil, en los sistemas OCR, en la Segmentación de Clientes, en predicciones de Demanda y especialmente en Detección de Fraudes y Riesgos. Neurona Humana Neurona Artificial Red Neuronal Artificial
  • 5.
  • 6. Tecnicas B. Árboles de Decisión Notas:El árbol puede ramificarse mucho más aún y poseer un mayor número de variables.En este caso, el responsable de la campaña de Marketing, tiene buenas herramientas para optar por dirigir su campaña a personas entre 18 y 27 años de clase media, y a empleados de entre 28 y 38 años. Solución al problema anterior:Se plantea un árbol de decisión, el cual determina de manera inteligente (es parte del algoritmo) que la variable fundamental a considerar es la edad. A partir de allí se comienza a ramificar el árbol. La edad se divide en tres rangos. La segunda variable de mayor peso es el Nivel Socio Económico de la persona y su profesión. El árbol, mostrará en cada una de sus ramas un número entre 0 y 1 que indica la probabilidad de que una persona en dicho segmento compre el producto que se está ofreciendo. De esta manera, se convierte en una herramienta fundamental en la toma de decisiones para encarar una campaña de marketing eficiente. La potencia de un algoritmo de AD radica en su capacidad de ordenar y segmentar las variables de mayor a menor. Aquí los resultados en este análisis. EDAD > 38 28-38 18-27 P=0,65 P=0,61 NSE ALTO NSE MED NSE BAJO Profesional Tecnico/Analista NSE ALTO NSE MED NSE BAJO Emplado Estudiante P=0,81 P=0,51 P=0,42 P=0,29 P=0,37 P=0,12 P=0,76 P=0,67
  • 7.
  • 8.
  • 9. Data Mining comoInteligencia de Negocios La Inteligencia de Negocios, disciplinamásconocidaporsunombre en ingléscomo Business Intelligence, tienelassiguientescaracterísticasfundamentales:Acceso a la InformaciónObtenerReportes de calidadApoyo en la toma de decisionesLas herramientasmásdestacadasparaconseguirdichospuntos son:Data Mining y Data WarehouseSistemas de Predicción y Modelado (Análisis Fractal es un ejemplo de ello)Cubos OLAP El proceso de Data Mining, consta de variospasos, los mismosabarcan:Etapa de consultoría: Comprender el problema y determinar de lastécnicas a aplicar.Limpieza de las Bases de Datos.Correr los análisisdeterminados en la primeraetapa (redesneuronales, árboles de decisión, etc.)Comprensión de los resultados.Validación de los mismos.Portodo lo expresado en el presentedocumento, Data Mining es la herramientamáspotentequeacompaña a los responsables de unaempresa o cualquiertipo de proyecto, en el momento de la toma de decisiones de negocios y en el análisis de resultadospresentes, pasados y aúnfuturos.
  • 10. DataMining SQL Server Analysis Services DataMining
  • 11. Como trabaja? Tipos de Algoritmos ProblemasNegocios Clustering = grouping Asociacion de segmentos y atributos. Ej: E-Commerce WebSite Clustering Algorithm Classification = predecir un valor especifico Gran volumen de datos, Hight-Quality Historical Data Decision Trees Naïve Bayes Neural Network Association = correlacion Ej: Vendedores de detalles ( Cervezas y Panales) Association Algorithm Regression = Prevision a un numero continuo Time Series Logistic Regression Sequences = Proceso y Rutas ( websites) Sequence Clustering Deviation = ValoresExtremos (fraudes, credit card) Decision Tree Clustering
  • 12. Como trabaja? Case Tables  FuenteDatos Lista de Valoresqueutilizara el algoritmo Nested Tables Informacionadicional Ejemplo: Customer Table 9 Algoritmos Mining Structures contienen Mining Models
  • 13. Algoritmos 1. Association Rules 2. Clustering 3. Sequence Clustering 4. Decision Trees 5. Linear Regression 6. Time Series 7. Naive Bayes 8. Neural Network 9. Logistic Regression
  • 14. Association Rules Algoritmo genera reglasindicandocomo los items debenaparecerjuntos. Ejemplo: Permitepredecircuando un clienteseleccionara un item, el clienteseleccionaratambienotrotipo de item.
  • 15. Clustering El algoritmocorremuchasiteracionesbuscandogrupos de items quetenganpropiedadessimilares. Ejemplo: BuscarClientes con un ciertonivel de educacionquetenganingresossimilares. Estonosdefinira un Cluster.
  • 16. Sequence Clustering El algoritmocombinaanalisis de secuencias con cluster paraanalizar la transicion o cambios entre estados. Ejemplo: La prediccion del cluster indicaracualtransiciones la queocurrira en base a patronespasados
  • 17. Decision Trees Organiza los datos en un Arbol de Red en el cualcadanodorepresentauna decision acerca de unacaracteristica de la informacion. El algoritmosoporta la prediccion de los atributos o caracteristicas.
  • 18. Linear Regression Es unaaplicacion particular del Decision Tree paracrear un arbol de decisiones con unaraizsencilla.
  • 19. Time Series Analiza el tiemporelacionado con datosusandounaregresion lineal. Ejemplo: Predecirlasventasfuturas en base a lasventas en el pasado.
  • 20. Naive Bayes Examina un atributo en el tiempoparaanalizarcomo el atributo se relaciona a otroatributopara ser predecido. Para ejecutarloesmuyfacilperoignora la influencia de la combinaciones de otrosatributos.
  • 21. Neural Network Similar al sistemanerviosotrabajandoparaanalizarlasentradas(input) al sistema, cadanodo en la red tiene un peso paradeterminarlassalidas (output) del sistema de cadanodo
  • 22. Logistic Regression Es unaaplicacion del algoritmo Neural Network, soporta la prediccion de atributos de manera discrete y continous