SlideShare uma empresa Scribd logo
1 de 42
Baixar para ler offline
Minería de Datos Integrantes del Equipo: Cerón Reyes María de los Ángeles Gómez Díaz Haydeé Bases de Datos Junio 2010
Introducción Día a día generamos información y esto nos lleva a tener una gran cantidad de esta, lo cual implica que el  generar información, nos puede ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nos desarrollemos.
¿Qué es Minería de Datos? ,[object Object],[object Object]
Proceso de Minería de Datos Los pasos a seguir para la realización de un proyecto de minería de datos son: 1. La Determinación de los Objetivos. Trata sobre la delimitación de los objetivos que el cliente desea  2. Pre procesamiento de los Datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y transformación de las bases de datos.
[object Object],[object Object],Proceso de Minería de Datos
Principales Características de MD ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Aplicaciones de Minería de Datos
¿Qué es el proceso de KDD? ,[object Object],[object Object],[object Object]
Fases del KDD
Fases del KDD ,[object Object],[object Object],[object Object],[object Object],[object Object]
Fases del KDD ,[object Object],[object Object]
TÉCNICAS DE DATA MINING IMPLANTAR MODELO DE DATA MINING DATOS PROBLEMAS Estadística  o Inteligencia Artificial ALGORITMOS No estático
Con el modelado se construye un modelo en una situación donde se conoce la respuesta y luego se aplica en otra situación de la cual se desconoce la respuesta.
CLASIFICACION DE ALGORITMOS DE MINERIA DE DATOS
Descripción Normalmente esta técnica es usada para análisis preliminar de los datos (resumen, características de los datos,  etc.).  Describir un comportamiento en una base de datos compleja para aumentar el conocimiento y entendimiento sobre gente, productos, procesos etc.  (–Visualización – Diferenciación) ,[object Object],[object Object],[object Object],[object Object]
Ejemplo ‏ Gestión de personal de una empresa: ¿Qué clases de empleados hay contratados? Datos: Modelo generado: Minería de datos Grupo 1 : Sin niños y en una casa alquilada. Bajo número de uniones. Muchos días enfermos Grupo 2 : Sin niños y con coche. Alto número de uniones. Pocos días enfermos. Más mujeres y en una casa alquilada Grupo 3 : Con niños, casados y con coche. Más hombres y normalmente propietarios de casa. Bajo número de uniones
Predicción ALGORITMOS DE MINERIA DE DATOS
Árboles de decisión SE SELECCIONA EL NODO RAIZ Y ESTE SE DIVIDE DE ACUERDO A LOS VALORES DEL ATRIBUTO RAIZ
> $5000   <=$5000 M  F   >35  <= 35 0  Casado  Soltera  F  M  >=4  >4 0  1  0  1  0  1 If (Ingreso=>5000  AND Genero=F AND Estado = Soltera  Then  P(Coche)=1  ,[object Object],[object Object],[object Object],[object Object],[object Object],Modelo predictivo generado Árboles de decisión Ingreso Ingreso Genero Edad Genero Antigüedad
Árboles de decisión
Árboles de decisión Agente comercial: ¿Debo conceder una hipoteca a un cliente? Datos: Modelo generado: Minería de datos If  Defaulter-accounts > 0  then  Returns-credit = no If  Defaulter-accounts = 0  and  [(Salary > 2500)  or  (Credit-p > 10)]  then  Returns-credit = yes
Ejemplo ‏ Tienda de TV: ¿Cuántas televisiones planas se venderán el próximo mes? Datos:  Modelo generado: Minería de datos Modelo lineal : número de televisiones para el próximo mes V(month) flatTV  = 0.62 V(Month-1) flat-TV  + 0.33 V(Month-2) flat-TV  + 0.12 V(Month-1) DVD-Recorder  – 0.05
Exploración ALGORITMOS DE MINERIA DE DATOS
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],ALGORITMOS DE MINERIA DE DATOS
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],ALGORITMOS DE MINERIA DE DATOS
Análisis de Canasta  (Market Basket Analysis) Reglas de Asociación
Análisis de Canasta  Ejemplo  Un ejemplo tradicional de minería de datos es el relacionado con una búsqueda en una bodega de datos, de un negocio de cadena, de hechos comunes y relevantes: Luego del proceso se dio como resultado la siguiente: Si edad < 35;  y sexo = masculino;  y dia = jueves  entonces compras incluyen  pañales;  y cerveza  Esto sirvió para que empresa tomara medidas relacionada con la ubicación de ciertos productos en sitios comunes.
Análisis de Canasta (Market Basket Analysis) Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o correlaciones entre los diferentes productos que compran en sus “canastas”. Cliente 1: Arroz, puré, bebida Cliente 2: Arroz, helado, pan Cliente 1: Arroz, bebida, cerveza
Análisis de Canasta: Indicadores
Análisis de Canasta: Indicadores Confiabilidad (confidence ) :  Indica el porcentaje de transacciones que llevan el antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente. Ejemplo:  {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Confianza (cerveza   puré)= 1/2=50% Esta relación señala el vínculo entre ambos productos (probabilidad condicional). Pero, qué pasa en el siguiente caso: Confianza(helado   arroz)=1/1= 100% ¿Quiere decir que hay una fuerte relación entre estos productos?
Análisis de Canasta: Indicadores Ganancia (gain or Improvement ) :  puntaje que representa el aumento en la probabilidad de selección del consecuente, al ser comprado en conjunto con el antecedente. Ganancia (A  B)=Confianza(A  B)/Importancia Relativa(B) Ejemplo:  {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Ganancia(helado   arroz)=1/1= 1 Ganancia(bebida   puré)=0,5/0,3= 1,5 Con estos indicadores podemos entender las relaciones entre clientes
Ejemplo Supermercado: ¿Cuándo los clientes compran huevos, también compran aceite? Datos: Modelo generado: Minería de datos Eggs -> Oil: Confianza = 75%, Soporte = 37%
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Beneficios para el Supermercado :
Herramientas de software Existen muchas herramientas de software para el desarrollo de modelos de minería de datos tanto libres como comerciales como, por ejemplo: ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Herramienta Weka La Weka ( Gallirallus australis) es un ave originaria de Nueva Zelanda. Esta Gallinácea en peligro  de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina, las wekas se alimentan fundamentalmente de insectos y frutos. Weka es un software programado en Java que est á  orientado a la extracci ó n de conocimientos desde bases de datos con grandes cantidades de informaci ó n.
Herramienta Weka ,[object Object],[object Object],[object Object],[object Object],[object Object]
Herramienta Weka
Herramienta Weka
Referencias ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Preguntas
Gracias!!!!

Mais conteúdo relacionado

Mais procurados

La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD travon1
 
Decisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosDecisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosheymitzi
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
Pronóstico de ventas geraldine rojas
Pronóstico de ventas geraldine rojasPronóstico de ventas geraldine rojas
Pronóstico de ventas geraldine rojasGeraldine Dolinar
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business IntelligenceCarlos Escobar
 
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación (Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación mdelriomejia
 
Modelo de negocios internacionales 15 nestle
Modelo de negocios internacionales 15  nestleModelo de negocios internacionales 15  nestle
Modelo de negocios internacionales 15 nestleJairo Rodriguez
 
TRABAJO BUSINESS INTELLIGENCE
TRABAJO BUSINESS INTELLIGENCETRABAJO BUSINESS INTELLIGENCE
TRABAJO BUSINESS INTELLIGENCERosmelys Ponce
 
3 métodos para pronosticar las ventas
3 métodos para pronosticar las ventas3 métodos para pronosticar las ventas
3 métodos para pronosticar las ventasCELOGIS
 
Proyecto de investigación de mercados
Proyecto de investigación de mercadosProyecto de investigación de mercados
Proyecto de investigación de mercadosKas Pryzko
 
Investigacion de mercados
Investigacion de mercadosInvestigacion de mercados
Investigacion de mercadosMarco Chavez
 
U3 investigacion de-mercados
U3 investigacion de-mercadosU3 investigacion de-mercados
U3 investigacion de-mercadosBrenda Pasillas
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BIfabian fernandez
 
Ejemplos de las estrategias de porter
Ejemplos de las estrategias de porterEjemplos de las estrategias de porter
Ejemplos de las estrategias de porterAndres Valverde
 
Caso+de+estudio starbucks
Caso+de+estudio starbucksCaso+de+estudio starbucks
Caso+de+estudio starbuckstrinivitteri
 

Mais procurados (20)

La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Decisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosDecisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datos
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 
Inteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business IntelligenceInteligencia de negocios - Business Intelligence
Inteligencia de negocios - Business Intelligence
 
Pronóstico de ventas geraldine rojas
Pronóstico de ventas geraldine rojasPronóstico de ventas geraldine rojas
Pronóstico de ventas geraldine rojas
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación (Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
 
Modelo de negocios internacionales 15 nestle
Modelo de negocios internacionales 15  nestleModelo de negocios internacionales 15  nestle
Modelo de negocios internacionales 15 nestle
 
Cadena de valor de un restaurante
Cadena de valor de un restauranteCadena de valor de un restaurante
Cadena de valor de un restaurante
 
TRABAJO BUSINESS INTELLIGENCE
TRABAJO BUSINESS INTELLIGENCETRABAJO BUSINESS INTELLIGENCE
TRABAJO BUSINESS INTELLIGENCE
 
Ciencia de datos en 20'
Ciencia de datos en 20'Ciencia de datos en 20'
Ciencia de datos en 20'
 
3 métodos para pronosticar las ventas
3 métodos para pronosticar las ventas3 métodos para pronosticar las ventas
3 métodos para pronosticar las ventas
 
Proyecto de investigación de mercados
Proyecto de investigación de mercadosProyecto de investigación de mercados
Proyecto de investigación de mercados
 
Investigacion de mercados
Investigacion de mercadosInvestigacion de mercados
Investigacion de mercados
 
U3 investigacion de-mercados
U3 investigacion de-mercadosU3 investigacion de-mercados
U3 investigacion de-mercados
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Ejemplos de las estrategias de porter
Ejemplos de las estrategias de porterEjemplos de las estrategias de porter
Ejemplos de las estrategias de porter
 
Caso+de+estudio starbucks
Caso+de+estudio starbucksCaso+de+estudio starbucks
Caso+de+estudio starbucks
 

Semelhante a Mineria de Datos (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
MD: Clase9
MD: Clase9MD: Clase9
MD: Clase9
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 

Último

Trabajo de La Electricidad y La Electrónica
Trabajo de La Electricidad y La ElectrónicaTrabajo de La Electricidad y La Electrónica
Trabajo de La Electricidad y La ElectrónicaCamilaCordoba30
 
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOS
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOSDESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOS
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOSreinamanuela20
 
La Electricidad y La Electrónica por el grado 10-5
La Electricidad y La Electrónica por el grado 10-5La Electricidad y La Electrónica por el grado 10-5
La Electricidad y La Electrónica por el grado 10-5CamilaCordoba30
 
Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxPaolaCarolinaCarvaja
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosLCristinaForchue
 
Calculadora cientifica corregida para enviar.docx
Calculadora cientifica  corregida para enviar.docxCalculadora cientifica  corregida para enviar.docx
Calculadora cientifica corregida para enviar.docxzoecaicedosalazar
 
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfalejandrogomezescoto
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfymiranda2
 
Taller de tecnología conclucion tonotoss
Taller de tecnología conclucion tonotossTaller de tecnología conclucion tonotoss
Taller de tecnología conclucion tonotossgijhonpa
 
Análisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfAnálisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfcastrodanna185
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfOBr.global
 
TRABAJO EN GRUPO.pdf tecnología décimo :)
TRABAJO EN GRUPO.pdf tecnología décimo :)TRABAJO EN GRUPO.pdf tecnología décimo :)
TRABAJO EN GRUPO.pdf tecnología décimo :)edepjuanorozco
 
Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.marianarodriguezc797
 
Carta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfCarta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfangelinebocanegra1
 
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOS
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOSDESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOS
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOSreinamanuela20
 
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSPRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSLincangoKevin
 
La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2montoyagabriela340
 
Trabajo de Electricidad y Electrónica grado 10-3
Trabajo de Electricidad y Electrónica grado 10-3Trabajo de Electricidad y Electrónica grado 10-3
Trabajo de Electricidad y Electrónica grado 10-3wwwcuentanuevacom
 
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu softwareFrancisco Javier Barrena
 

Último (20)

Trabajo de La Electricidad y La Electrónica
Trabajo de La Electricidad y La ElectrónicaTrabajo de La Electricidad y La Electrónica
Trabajo de La Electricidad y La Electrónica
 
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOS
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOSDESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOS
DESARROLLO DE BLOG DE ANÁLISIS Y ARTEFACTOS TECNOLOGICOS
 
La Electricidad y La Electrónica por el grado 10-5
La Electricidad y La Electrónica por el grado 10-5La Electricidad y La Electrónica por el grado 10-5
La Electricidad y La Electrónica por el grado 10-5
 
Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docx
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
 
Calculadora cientifica corregida para enviar.docx
Calculadora cientifica  corregida para enviar.docxCalculadora cientifica  corregida para enviar.docx
Calculadora cientifica corregida para enviar.docx
 
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
 
Taller de tecnología conclucion tonotoss
Taller de tecnología conclucion tonotossTaller de tecnología conclucion tonotoss
Taller de tecnología conclucion tonotoss
 
Análisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfAnálisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdf
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
 
TRABAJO EN GRUPO.pdf tecnología décimo :)
TRABAJO EN GRUPO.pdf tecnología décimo :)TRABAJO EN GRUPO.pdf tecnología décimo :)
TRABAJO EN GRUPO.pdf tecnología décimo :)
 
Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.
 
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura SilvaBEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
 
Carta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfCarta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdf
 
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOS
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOSDESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOS
DESARROLLO BLOG Y ANÁLISIS DE ARTEFACTOS
 
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSPRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
 
La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2
 
Trabajo de Electricidad y Electrónica grado 10-3
Trabajo de Electricidad y Electrónica grado 10-3Trabajo de Electricidad y Electrónica grado 10-3
Trabajo de Electricidad y Electrónica grado 10-3
 
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software
¡Cookiegeddon! Bye a las cookies de terceros y cómo afectará a tu software
 

Mineria de Datos

  • 1. Minería de Datos Integrantes del Equipo: Cerón Reyes María de los Ángeles Gómez Díaz Haydeé Bases de Datos Junio 2010
  • 2. Introducción Día a día generamos información y esto nos lleva a tener una gran cantidad de esta, lo cual implica que el generar información, nos puede ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nos desarrollemos.
  • 3.
  • 4. Proceso de Minería de Datos Los pasos a seguir para la realización de un proyecto de minería de datos son: 1. La Determinación de los Objetivos. Trata sobre la delimitación de los objetivos que el cliente desea 2. Pre procesamiento de los Datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y transformación de las bases de datos.
  • 5.
  • 6.
  • 8.
  • 10.
  • 11.
  • 12. TÉCNICAS DE DATA MINING IMPLANTAR MODELO DE DATA MINING DATOS PROBLEMAS Estadística o Inteligencia Artificial ALGORITMOS No estático
  • 13. Con el modelado se construye un modelo en una situación donde se conoce la respuesta y luego se aplica en otra situación de la cual se desconoce la respuesta.
  • 14. CLASIFICACION DE ALGORITMOS DE MINERIA DE DATOS
  • 15.
  • 16. Ejemplo ‏ Gestión de personal de una empresa: ¿Qué clases de empleados hay contratados? Datos: Modelo generado: Minería de datos Grupo 1 : Sin niños y en una casa alquilada. Bajo número de uniones. Muchos días enfermos Grupo 2 : Sin niños y con coche. Alto número de uniones. Pocos días enfermos. Más mujeres y en una casa alquilada Grupo 3 : Con niños, casados y con coche. Más hombres y normalmente propietarios de casa. Bajo número de uniones
  • 17. Predicción ALGORITMOS DE MINERIA DE DATOS
  • 18. Árboles de decisión SE SELECCIONA EL NODO RAIZ Y ESTE SE DIVIDE DE ACUERDO A LOS VALORES DEL ATRIBUTO RAIZ
  • 19.
  • 21. Árboles de decisión Agente comercial: ¿Debo conceder una hipoteca a un cliente? Datos: Modelo generado: Minería de datos If Defaulter-accounts > 0 then Returns-credit = no If Defaulter-accounts = 0 and [(Salary > 2500) or (Credit-p > 10)] then Returns-credit = yes
  • 22. Ejemplo ‏ Tienda de TV: ¿Cuántas televisiones planas se venderán el próximo mes? Datos: Modelo generado: Minería de datos Modelo lineal : número de televisiones para el próximo mes V(month) flatTV = 0.62 V(Month-1) flat-TV + 0.33 V(Month-2) flat-TV + 0.12 V(Month-1) DVD-Recorder – 0.05
  • 23. Exploración ALGORITMOS DE MINERIA DE DATOS
  • 24.
  • 25.
  • 26.
  • 27. Análisis de Canasta (Market Basket Analysis) Reglas de Asociación
  • 28. Análisis de Canasta Ejemplo Un ejemplo tradicional de minería de datos es el relacionado con una búsqueda en una bodega de datos, de un negocio de cadena, de hechos comunes y relevantes: Luego del proceso se dio como resultado la siguiente: Si edad < 35; y sexo = masculino; y dia = jueves entonces compras incluyen pañales; y cerveza Esto sirvió para que empresa tomara medidas relacionada con la ubicación de ciertos productos en sitios comunes.
  • 29. Análisis de Canasta (Market Basket Analysis) Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o correlaciones entre los diferentes productos que compran en sus “canastas”. Cliente 1: Arroz, puré, bebida Cliente 2: Arroz, helado, pan Cliente 1: Arroz, bebida, cerveza
  • 30. Análisis de Canasta: Indicadores
  • 31. Análisis de Canasta: Indicadores Confiabilidad (confidence ) : Indica el porcentaje de transacciones que llevan el antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente. Ejemplo: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Confianza (cerveza  puré)= 1/2=50% Esta relación señala el vínculo entre ambos productos (probabilidad condicional). Pero, qué pasa en el siguiente caso: Confianza(helado  arroz)=1/1= 100% ¿Quiere decir que hay una fuerte relación entre estos productos?
  • 32. Análisis de Canasta: Indicadores Ganancia (gain or Improvement ) : puntaje que representa el aumento en la probabilidad de selección del consecuente, al ser comprado en conjunto con el antecedente. Ganancia (A  B)=Confianza(A  B)/Importancia Relativa(B) Ejemplo: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Ganancia(helado  arroz)=1/1= 1 Ganancia(bebida  puré)=0,5/0,3= 1,5 Con estos indicadores podemos entender las relaciones entre clientes
  • 33. Ejemplo Supermercado: ¿Cuándo los clientes compran huevos, también compran aceite? Datos: Modelo generado: Minería de datos Eggs -> Oil: Confianza = 75%, Soporte = 37%
  • 34.
  • 35.
  • 36. Herramienta Weka La Weka ( Gallirallus australis) es un ave originaria de Nueva Zelanda. Esta Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina, las wekas se alimentan fundamentalmente de insectos y frutos. Weka es un software programado en Java que est á orientado a la extracci ó n de conocimientos desde bases de datos con grandes cantidades de informaci ó n.
  • 37.
  • 40.