SlideShare uma empresa Scribd logo
1 de 24
Baixar para ler offline
Técnicas de
Agrupamiento
Medidas de semejanza.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
! Los elementos de grupos diferentes sean lo más
diferente posible.
Agrupamiento
! Las técnicas de agrupamiento buscan crear
colecciones de datos con base en una medida de
semejanza.
! A través de una medida de semejanza son
comparados los elementos de todo el conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
! euclidiana,
! Manhatan,
! Minkowski,
! Coseno,
! etc.
Medidas de Semejanza
! Los grupos formados con base en estas medidas,
son de tal forma que dos datos en el mismo grupo
tiene un valor de distancia mínima, mientras que
dos datos de grupos diferentes presentan un valor
de distancia máximo, esta distancia se denomina
distancia del grupo.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Distancia muy grande
entre puntos del
conjunto
Distancia
pequeña entre
puntos del
conjunto.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
! La distancia euclidiana no es más que la raíz
cuadrada de la diferencia entre las coordenadas de
un par de objetos.
DXY = Xik − Xjk
( )
2
k=1
m
∑
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
! Esta medida va de [0, π], así que:
! Un valor de π significa que son opuestos.
! Un valor de π/2 significa independientes.
! Un valor de 0 significa iguales.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
*Imagen tomada de internet
Figura 1*
Medidas de Semejanza
Distancia Jaccard
! La distancia Jaccard mide la semejanza de dos
conjuntos de datos y se calcula de la siguiente
forma:
J(A, B) =
A∩B
A∪B
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
= ?
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
A∪B =
A∩B =
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
=
2
7
= 0.286
A∪B =
A∩B =
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
DXY = Xik − Xjk
1
p
k=1
d
∑
⎛
⎝
⎜
⎞
⎠
⎟
p
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
! Si p=1 tenemos la distancia Manhatan.
! Si p=2 tenemos la distancia Euclidiana.
DXY = Xik − Xjk
p
k=1
d
∑
( )
1
p

Mais conteúdo relacionado

Mais de Carlos Paredes

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxCarlos Paredes
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfCarlos Paredes
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfCarlos Paredes
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencionCarlos Paredes
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloCarlos Paredes
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosCarlos Paredes
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdfCarlos Paredes
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxCarlos Paredes
 

Mais de Carlos Paredes (13)

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptx
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdf
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencion
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencillo
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismos
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdf
 
Squim .pdf
Squim .pdfSquim .pdf
Squim .pdf
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptx
 
MAS1.pdf
MAS1.pdfMAS1.pdf
MAS1.pdf
 
Modulo IV CV.pptx
Modulo IV CV.pptxModulo IV CV.pptx
Modulo IV CV.pptx
 
Examen.docx
Examen.docxExamen.docx
Examen.docx
 
Servidores.pptx
Servidores.pptxServidores.pptx
Servidores.pptx
 

Último

Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Dr. Edwin Hernandez
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfXimenaFallaLecca1
 
clases de porcinos generales de porcinos
clases de porcinos generales de porcinosclases de porcinos generales de porcinos
clases de porcinos generales de porcinosDayanaCarolinaAP
 
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOCAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOLUISDAVIDVIZARRETARA
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxJuanPablo452634
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfmatepura
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMarceloQuisbert6
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAJOSLUISCALLATAENRIQU
 
Base de Datos en Microsoft SQL Server 2024
Base de Datos en Microsoft SQL Server 2024Base de Datos en Microsoft SQL Server 2024
Base de Datos en Microsoft SQL Server 2024CESARHERNANPATRICIOP2
 
Principales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingPrincipales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingKevinCabrera96
 
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptxBRAYANJOSEPTSANJINEZ
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptCRISTOFERSERGIOCANAL
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacajeremiasnifla
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALKATHIAMILAGRITOSSANC
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaAlexanderimanolLencr
 
PPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfPPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfalexquispenieto2
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptx
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptxCONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptx
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptxBrayanJavierCalle2
 

Último (20)

Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...
 
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdfTEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
TEXTO UNICO DE LA LEY-DE-CONTRATACIONES-ESTADO.pdf
 
clases de porcinos generales de porcinos
clases de porcinos generales de porcinosclases de porcinos generales de porcinos
clases de porcinos generales de porcinos
 
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESOCAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
CAPITULO 4 ANODIZADO DE ALUMINIO ,OBTENCION Y PROCESO
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdf
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
Magnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principiosMagnetismo y electromagnetismo principios
Magnetismo y electromagnetismo principios
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
 
Base de Datos en Microsoft SQL Server 2024
Base de Datos en Microsoft SQL Server 2024Base de Datos en Microsoft SQL Server 2024
Base de Datos en Microsoft SQL Server 2024
 
Principales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards DemingPrincipales aportes de la carrera de William Edwards Deming
Principales aportes de la carrera de William Edwards Deming
 
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptxNTP- Determinación de Cloruros  en suelos y agregados (1) (1).pptx
NTP- Determinación de Cloruros en suelos y agregados (1) (1).pptx
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpaca
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
 
Tinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiologíaTinciones simples en el laboratorio de microbiología
Tinciones simples en el laboratorio de microbiología
 
PPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdfPPT ELABORARACION DE ADOBES 2023 (1).pdf
PPT ELABORARACION DE ADOBES 2023 (1).pdf
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptx
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptxCONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptx
CONCEPTOS EN HIDROGEOLOGIA-diapositivas varias.pptx
 

tecnicas_agrupamiento de datos para analisis

  • 2. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que
  • 3. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible.
  • 4. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible. ! Los elementos de grupos diferentes sean lo más diferente posible.
  • 5. Agrupamiento ! Las técnicas de agrupamiento buscan crear colecciones de datos con base en una medida de semejanza. ! A través de una medida de semejanza son comparados los elementos de todo el conjunto.
  • 6. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto.
  • 7. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia,
  • 8. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia, ! euclidiana, ! Manhatan, ! Minkowski, ! Coseno, ! etc.
  • 9. Medidas de Semejanza ! Los grupos formados con base en estas medidas, son de tal forma que dos datos en el mismo grupo tiene un valor de distancia mínima, mientras que dos datos de grupos diferentes presentan un valor de distancia máximo, esta distancia se denomina distancia del grupo.
  • 10. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos.
  • 11. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2
  • 12. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2 Distancia muy grande entre puntos del conjunto Distancia pequeña entre puntos del conjunto.
  • 13. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos.
  • 14. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos. ! La distancia euclidiana no es más que la raíz cuadrada de la diferencia entre las coordenadas de un par de objetos. DXY = Xik − Xjk ( ) 2 k=1 m ∑
  • 15. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. cosθ = A⋅ B A B
  • 16. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. ! Esta medida va de [0, π], así que: ! Un valor de π significa que son opuestos. ! Un valor de π/2 significa independientes. ! Un valor de 0 significa iguales. cosθ = A⋅ B A B
  • 17. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk
  • 18. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk *Imagen tomada de internet Figura 1*
  • 19. Medidas de Semejanza Distancia Jaccard ! La distancia Jaccard mide la semejanza de dos conjuntos de datos y se calcula de la siguiente forma: J(A, B) = A∩B A∪B
  • 20. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = ?
  • 21. Medidas de Semejanza Distancia Jaccard ! Ejemplo: A∪B = A∩B =
  • 22. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = 2 7 = 0.286 A∪B = A∩B =
  • 23. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. DXY = Xik − Xjk 1 p k=1 d ∑ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ p
  • 24. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. ! Si p=1 tenemos la distancia Manhatan. ! Si p=2 tenemos la distancia Euclidiana. DXY = Xik − Xjk p k=1 d ∑ ( ) 1 p