SlideShare uma empresa Scribd logo
1 de 19
Minería de Datos – Data Mining


           Víctor Algarín
        Cristian Maldonado
         Andrés Calderón
            Miguel Caro
Aplicación

La minería de datos es utilizada actualmente para
deducir y encontrar perfiles del comportamiento de
clientes, proveedores o ambientes de acuerdo a los
parámetros emitidos en los modelos matemáticos
que se extraen en el análisis, hecho previamente a la
implementación de esta tecnología.
Comportamiento en Internet

Análisis del comportamiento de los visitantes
Iinformación histórica disponible acerca de los clientes
Terrorismo
Able Danger
Servicio de Inteligencia y Seguridad Canadiense
Juegos
Juegos combinacionales
Reconocimiento de patrones
Máquina oráculo

teoría de la complejidad
protocolos de criptografía
Aplicación en Negocios

Detección de fraudes en las tarjetas de crédito.
Software: Falcon Fraud Manager
Aplicación en Negocios

Descubriendo el porqué de la deserción de clientes de
una compañía operadora de telefonía móvil.
Aplicación en Negocios

Hábitos de compra en supermercados.
Aplicación en Clubes Deportivos

 Los equipos de la NBA utilizan aplicaciones
 inteligentes para apoyar a su cuerpo de entrenadores.
Aplicación en Investigaciones
          Espaciales

Proyecto SKYCAT
(Sky Image Cataloguing and Analysis Tool)
Aplicar MD en Excel

http://www.youtube.com/watch?v=43mS9M1ZjU8&fe
ature=related
Minería de Datos y Otras Disciplinas
            Análogas
                         En la practica la
                         totalidad de los
                         modelos y algoritmos
                         de uso en minería de
                         datos gozan de una
                         tradición
                         relativamente larga en
                         otros campos
En la estadística
    Ciertamente, la minería de datos bebe de la estadística, de la que toma las
    siguientes técnicas:




                     Análisis de varianza
•     Mediante le cual se evalúa la existencia de diferencias significativas entre las
      medias de una o más variables
Regresión
    Define la relación entre una o mas variables y un conjunto de variables
    pronosticadores de las primeras


                     Prueba chi-cuadrado
•       Por medio de la cual se realiza el contraste la hipótesis de dependencia de
        variables

                 Análisis de agrupamiento o
                          clustering
    •    Por medio de la cual se realiza el contraste de la hipótesis inicial en la que se
         analiza la dependencia de variables
Análisis Discriminante
    permite la clasificación de individuos en grupos que previamente se han
    establecido, permite encontrar la regla de clasificación de los elementos de
    estos grupos, y por tanto una mejor identificación de cuáles son las variables que
    definan la pertenencia al grupo.



                        Series de tiempo
•     permite el estudio de la evolución de una variable a través del tiempo para
      poder realizar predicciones, a partir de ese conocimiento y bajo el supuesto de
      que no van a producirse cambios estructurales.
En la informática
De la informática toma las siguientes técnicas:


                  Algoritmos Genéticos
•   Son métodos numéricos de optimización, en
    los que aquella variable o variables que se
    pretenden optimizar junto con las variables
    de estudio constituyen un segmento de
    información. Aquellas configuraciones de las
    variables de análisis que obtengan mejores
    valores para la variable de respuesta,
    corresponderán a segmentos con mayor
    capacidad reproductiva. A través de la
    reproducción, los mejores segmentos
    perduran y su proporción crece de generación
    en generación. Se puede además introducir
    elementos aleatorios para la modificación de
    las variables (mutaciones). Al cabo de cierto
    número de iteraciones, la población estará
    constituida por buenas soluciones al
    problema de optimización, pues las malas
    soluciones han ido descartándose, iteración
    tras iteración.
Inteligencia Artificial
    Mediante un sistema informático que simula un sistema inteligente, se procede
    al análisis de los datos disponibles. Entre los sistemas de Inteligencia Artificial se
    encuadrarían los Sistemas Expertos y las Redes Neuronales.


                      Sistemas Expertos
•   Son sistemas que han sido creados a partir de reglas prácticas extraídas del
    conocimiento de expertos. Principalmente a base de inferencias o de causa-
    efecto

                        Redes neuronales
•   Son métodos de proceso numérico en el que las variables interactúan mediante
    transformaciones lineales o no lineales, hasta obtener unas salidas. Estas salidas
    se contrastan con los que tenían que haber salido, basándose en unos datos de
    prueba, dando lugar a un proceso de RETROALIMENTACION mediante el cual la
    red se reconfigura, hasta obtener un modelo adecuado.

Mais conteúdo relacionado

Mais procurados

Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid MinerLPI ONG
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datosDavidAcurio2
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOsystemprisoners
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datosiloylan
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Análisis de contenidos de los medios de comunicación
Análisis de contenidos de los medios de comunicaciónAnálisis de contenidos de los medios de comunicación
Análisis de contenidos de los medios de comunicaciónMarcos Nuñez
 
Como Se Hace Una Simulación (Grupo 04)
Como Se Hace Una Simulación (Grupo 04)Como Se Hace Una Simulación (Grupo 04)
Como Se Hace Una Simulación (Grupo 04)simulando
 
Minería de datos
Minería de datosMinería de datos
Minería de datosanag catal
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos SecuencialesMarilyn Jaramillo
 

Mais procurados (17)

Datamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias BiológicasDatamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias Biológicas
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid Miner
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Christian Ramirez 1
Christian Ramirez 1Christian Ramirez 1
Christian Ramirez 1
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
RetoLab Ecopetrol - Odin
RetoLab Ecopetrol - OdinRetoLab Ecopetrol - Odin
RetoLab Ecopetrol - Odin
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Análisis de contenidos de los medios de comunicación
Análisis de contenidos de los medios de comunicaciónAnálisis de contenidos de los medios de comunicación
Análisis de contenidos de los medios de comunicación
 
Como Se Hace Una Simulación (Grupo 04)
Como Se Hace Una Simulación (Grupo 04)Como Se Hace Una Simulación (Grupo 04)
Como Se Hace Una Simulación (Grupo 04)
 
Unidad iii
Unidad iiiUnidad iii
Unidad iii
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 

Destaque

The Future of Library Cataloguing
The Future of Library CataloguingThe Future of Library Cataloguing
The Future of Library CataloguingKathryne Dunlap
 
Library of Congress New Bibliographic Framework - What is it?
Library of Congress New Bibliographic Framework - What is it?Library of Congress New Bibliographic Framework - What is it?
Library of Congress New Bibliographic Framework - What is it?Lukas Koster
 
Censorship by Omission: Closing off fiction in cataloguing
Censorship by Omission: Closing off fiction in cataloguingCensorship by Omission: Closing off fiction in cataloguing
Censorship by Omission: Closing off fiction in cataloguingNational Library of Australia
 
Datech2014 - Cataloguing for a Billion Word Library of Greek and Latin
Datech2014 - Cataloguing for a Billion Word Library of Greek and LatinDatech2014 - Cataloguing for a Billion Word Library of Greek and Latin
Datech2014 - Cataloguing for a Billion Word Library of Greek and LatinIMPACT Centre of Competence
 
Day in the life of a data librarian [presentation for ANU 23Things group]
Day in the life of a data librarian [presentation for ANU 23Things group]Day in the life of a data librarian [presentation for ANU 23Things group]
Day in the life of a data librarian [presentation for ANU 23Things group]Jane Frazier
 
Cataloguing in the Real World
Cataloguing in the Real WorldCataloguing in the Real World
Cataloguing in the Real WorldEmily Porta
 
Library Carpentry: software skills training for library professionals, Chart...
 Library Carpentry: software skills training for library professionals, Chart... Library Carpentry: software skills training for library professionals, Chart...
Library Carpentry: software skills training for library professionals, Chart...James Baker
 
Microdata cataloging tool (nada)
Microdata cataloging tool (nada)Microdata cataloging tool (nada)
Microdata cataloging tool (nada)Divya Vyas
 
Computer Science Library Training
Computer Science Library TrainingComputer Science Library Training
Computer Science Library Trainingpvhead123
 
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...DIGIBIS
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Library of Congress Subject Headings
Library of Congress Subject HeadingsLibrary of Congress Subject Headings
Library of Congress Subject Headingsroycekitts
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Data Mining
Data MiningData Mining
Data Miningbrobelo
 

Destaque (20)

The Future of Library Cataloguing
The Future of Library CataloguingThe Future of Library Cataloguing
The Future of Library Cataloguing
 
Library of Congress New Bibliographic Framework - What is it?
Library of Congress New Bibliographic Framework - What is it?Library of Congress New Bibliographic Framework - What is it?
Library of Congress New Bibliographic Framework - What is it?
 
Censorship by Omission: Closing off fiction in cataloguing
Censorship by Omission: Closing off fiction in cataloguingCensorship by Omission: Closing off fiction in cataloguing
Censorship by Omission: Closing off fiction in cataloguing
 
Datech2014 - Cataloguing for a Billion Word Library of Greek and Latin
Datech2014 - Cataloguing for a Billion Word Library of Greek and LatinDatech2014 - Cataloguing for a Billion Word Library of Greek and Latin
Datech2014 - Cataloguing for a Billion Word Library of Greek and Latin
 
Day in the life of a data librarian [presentation for ANU 23Things group]
Day in the life of a data librarian [presentation for ANU 23Things group]Day in the life of a data librarian [presentation for ANU 23Things group]
Day in the life of a data librarian [presentation for ANU 23Things group]
 
Cataloguing in the Real World
Cataloguing in the Real WorldCataloguing in the Real World
Cataloguing in the Real World
 
Library Carpentry: software skills training for library professionals, Chart...
 Library Carpentry: software skills training for library professionals, Chart... Library Carpentry: software skills training for library professionals, Chart...
Library Carpentry: software skills training for library professionals, Chart...
 
Building a Search Engine Using Lucene
Building a Search Engine Using LuceneBuilding a Search Engine Using Lucene
Building a Search Engine Using Lucene
 
Microdata cataloging tool (nada)
Microdata cataloging tool (nada)Microdata cataloging tool (nada)
Microdata cataloging tool (nada)
 
Computer Science Library Training
Computer Science Library TrainingComputer Science Library Training
Computer Science Library Training
 
Laravel and SOLR
Laravel and SOLRLaravel and SOLR
Laravel and SOLR
 
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...
Taller de catalogación Linked Open Data y RDA: posibilidades y desafíos. Prim...
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
RDA y el proceso de catalogación
RDA y el proceso de catalogaciónRDA y el proceso de catalogación
RDA y el proceso de catalogación
 
Library of Congress Subject Headings
Library of Congress Subject HeadingsLibrary of Congress Subject Headings
Library of Congress Subject Headings
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
POPSI
POPSIPOPSI
POPSI
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Data Mining
Data MiningData Mining
Data Mining
 

Semelhante a Presentacion mineria

Semelhante a Presentacion mineria (20)

Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Trabajo colaborativo 3
Trabajo colaborativo 3Trabajo colaborativo 3
Trabajo colaborativo 3
 
Trabajo colaborativo 3
Trabajo colaborativo 3Trabajo colaborativo 3
Trabajo colaborativo 3
 
2 como simular
2 como simular2 como simular
2 como simular
 
Técnicas de minería de datos.
Técnicas de minería de datos. Técnicas de minería de datos.
Técnicas de minería de datos.
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Ca732ov
Ca732ovCa732ov
Ca732ov
 
Mineria de datos ensayo
Mineria de datos ensayoMineria de datos ensayo
Mineria de datos ensayo
 
ETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACIONETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACION
 
Clase 2
Clase 2Clase 2
Clase 2
 
Fases de simulacion
Fases de simulacion Fases de simulacion
Fases de simulacion
 
Prediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdfPrediccion de Rocas con Machine Learning.pdf
Prediccion de Rocas con Machine Learning.pdf
 
Tecnicas de minería de datos
Tecnicas de minería de datosTecnicas de minería de datos
Tecnicas de minería de datos
 
REDES NEURONALES.pptx
REDES NEURONALES.pptxREDES NEURONALES.pptx
REDES NEURONALES.pptx
 

Presentacion mineria

  • 1. Minería de Datos – Data Mining Víctor Algarín Cristian Maldonado Andrés Calderón Miguel Caro
  • 2. Aplicación La minería de datos es utilizada actualmente para deducir y encontrar perfiles del comportamiento de clientes, proveedores o ambientes de acuerdo a los parámetros emitidos en los modelos matemáticos que se extraen en el análisis, hecho previamente a la implementación de esta tecnología.
  • 3. Comportamiento en Internet Análisis del comportamiento de los visitantes Iinformación histórica disponible acerca de los clientes
  • 4. Terrorismo Able Danger Servicio de Inteligencia y Seguridad Canadiense
  • 6. Máquina oráculo teoría de la complejidad protocolos de criptografía
  • 7. Aplicación en Negocios Detección de fraudes en las tarjetas de crédito. Software: Falcon Fraud Manager
  • 8. Aplicación en Negocios Descubriendo el porqué de la deserción de clientes de una compañía operadora de telefonía móvil.
  • 9. Aplicación en Negocios Hábitos de compra en supermercados.
  • 10. Aplicación en Clubes Deportivos Los equipos de la NBA utilizan aplicaciones inteligentes para apoyar a su cuerpo de entrenadores.
  • 11. Aplicación en Investigaciones Espaciales Proyecto SKYCAT (Sky Image Cataloguing and Analysis Tool)
  • 12. Aplicar MD en Excel http://www.youtube.com/watch?v=43mS9M1ZjU8&fe ature=related
  • 13. Minería de Datos y Otras Disciplinas Análogas En la practica la totalidad de los modelos y algoritmos de uso en minería de datos gozan de una tradición relativamente larga en otros campos
  • 14. En la estadística Ciertamente, la minería de datos bebe de la estadística, de la que toma las siguientes técnicas: Análisis de varianza • Mediante le cual se evalúa la existencia de diferencias significativas entre las medias de una o más variables
  • 15. Regresión Define la relación entre una o mas variables y un conjunto de variables pronosticadores de las primeras Prueba chi-cuadrado • Por medio de la cual se realiza el contraste la hipótesis de dependencia de variables Análisis de agrupamiento o clustering • Por medio de la cual se realiza el contraste de la hipótesis inicial en la que se analiza la dependencia de variables
  • 16. Análisis Discriminante permite la clasificación de individuos en grupos que previamente se han establecido, permite encontrar la regla de clasificación de los elementos de estos grupos, y por tanto una mejor identificación de cuáles son las variables que definan la pertenencia al grupo. Series de tiempo • permite el estudio de la evolución de una variable a través del tiempo para poder realizar predicciones, a partir de ese conocimiento y bajo el supuesto de que no van a producirse cambios estructurales.
  • 18. De la informática toma las siguientes técnicas: Algoritmos Genéticos • Son métodos numéricos de optimización, en los que aquella variable o variables que se pretenden optimizar junto con las variables de estudio constituyen un segmento de información. Aquellas configuraciones de las variables de análisis que obtengan mejores valores para la variable de respuesta, corresponderán a segmentos con mayor capacidad reproductiva. A través de la reproducción, los mejores segmentos perduran y su proporción crece de generación en generación. Se puede además introducir elementos aleatorios para la modificación de las variables (mutaciones). Al cabo de cierto número de iteraciones, la población estará constituida por buenas soluciones al problema de optimización, pues las malas soluciones han ido descartándose, iteración tras iteración.
  • 19. Inteligencia Artificial Mediante un sistema informático que simula un sistema inteligente, se procede al análisis de los datos disponibles. Entre los sistemas de Inteligencia Artificial se encuadrarían los Sistemas Expertos y las Redes Neuronales. Sistemas Expertos • Son sistemas que han sido creados a partir de reglas prácticas extraídas del conocimiento de expertos. Principalmente a base de inferencias o de causa- efecto Redes neuronales • Son métodos de proceso numérico en el que las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener unas salidas. Estas salidas se contrastan con los que tenían que haber salido, basándose en unos datos de prueba, dando lugar a un proceso de RETROALIMENTACION mediante el cual la red se reconfigura, hasta obtener un modelo adecuado.