El documento presenta una introducción al reconocimiento de patrones. Explica que es el reconocimiento de patrones, su relación con la inteligencia artificial y como proporciona capacidades perceptuales a los agentes inteligentes. También resume algunas aplicaciones clave del reconocimiento de patrones como la inspección industrial, la teledetección, la clasificación de documentos y la computación afectiva.
Modelo de convenio de pago con morosos del condominio (GENÉRICO).docx
Recpat1v1y
1. Reconocimiento de Patrones 1. Introducción
¿Qué es el Reconocimiento de Patrones?
• Definición
– quot;El Reconocimiento de Patrones (RP) es la disciplina científica
cuya meta es la clasificación de objetos en un número de
categorías o clases“
S. Theodoridis y K.Koutrumbas, Pattern Recognition (1998)
• ¿Como se relaciona con la Informática?
– El RP está encuadrado dentro de la Inteligencia Artificial (IA)
› Uno de los objetivos de la IA es la construcción de agentes
inteligentes.
Agente: Todo sistema que percibe su ambiente mediante sensores y
que actúa en tal ambiente mediante efectores.
• El Reconocimiento de Patrones se encarga de la parte relacionada
con la percepción en el agente.
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
2. Reconocimiento de Patrones 1. Introducción
Percepción
• La investigación en percepción intenta comprender y explicar la
conexion entre la entrada (sensación) y la salida (percepción) de
los sistemas sensoriales (vista, oido, tacto, etc).
• Una forma de explicar determinados aspectos de la conexión
entre sensación y percepción en los agentes naturales es
mediante la detección y aprendizaje de categorías:
“...puesto que ningun organismo puede manejar una diversidad
infinita, una de las funciones básicas de todos los organismos
consiste en dividir el entorno en clasificaciones mediante las que
estímulos no idénticos puedan ser tratados como equivalentes...”
E. Rosch, Principles of Categorization (1978)
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
3. Reconocimiento de Patrones 1. Introducción
La importancia de las categorías
“La categorización no es algo que tomar a la ligera. No existe nada más
básico que la categorización en nuestro pensamiento, percepción,
acción y habla.
Cada vez que vemos algo como una clase de objeto estamos
categorizando. Siempre que razonamos sobre clases de objetos -sillas,
naciones, enfermedades, emociones o cualquier cosa similar- estamos
empleando categorías. Siempre que llevamos a cabo alguna acción de
forma intencional, por ejemplo algo tan mundano como escribir con un
lapiz, martillando con un martillo, o planchando la ropa, estamos
utilizando categorías...
Sin la capacidad de categorizar, no podríamos actuar, bien en el mundo
físico o en nuestras vidas sociales e intelectuales. La comprensión de
cómo categorizamos es fundamental para comprender como pensamos
y como actuamos, y es por tanto fundamental para comprender que nos
hace humanos”
G. Lakoff, quot;Women, fire and dangerous things ..., What the categories reveal about
the mind.quot; (1987)
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
4. Reconocimiento de Patrones 1. Introducción
¿Qué capacidad perceptual proporciona
actualmente el RP a los agentes
inteligentes?
• A la edad de cinco años la mayoría de los niños pueden reconocer
dígitos y letras:
– Grandes, pequeños, escritos a mano, rotados, incompletos...
Variaciones de la letra d
• Reproducir esta capacidad por medio de los ordenadores es
sorprendentemente difícil
• De hecho, tras 50 años de investigación no existe actualmente
ningún sistema de R.P. de propósito general que sea capaz de
aproximarse a la capacidad humana.
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
5. Reconocimiento de Patrones 1. Introducción
Los Seres Vivos como Sistemas de RP
• ¿Por qué los Seres Vivos son tan buenos reconociendo patrones?
– Porque un buen sistema de RP proporciona una ventaja
competitiva a la hora de la supervivencia y reproducción.
• ¿Por qué no copiarlos?
– No se sabe actualmente como los Seres Vivos reconocen los
patrones
• ¿Cuál es la ventaja de reemplazarlos?
– Construir sistemas que:
› Realicen tareas monótonas y repetitivas
› Trabajen en zonas peligrosas
› Funcionen donde los agentes biológicos no pueden vivir (el espacio).
› Tengan menos errores
› Sean más económicos
› Sean autónomos
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
6. Reconocimiento de Patrones 1. Introducción
Algunas aplicaciones del RP
Dominio Aplicación Patrón de entrada Clases
Bioinformática Análisis de secuencias Secuencia de ADN / Tipos conocidos de
Proteínas genes
Minado de Datos Búsqueda de patrones Puntos en espacios Agrupaciones
de interés multidimensionales
Clasificación de Búsqueda en Internet Documento de texto Categorías
documentos semánticas
Automatización Inspección de tarjetas de Imagen de la tarjeta Defectuosa o no
industrial ordenador defectuosa
Gestión de bases de Búsqueda por Internet Vídeo clip Tipo de video
datos multimedia (acción, diálogo)
Reconocimiento Identificación de Cara, iris, huellas Usuario autorizado
Biométrico personas dactilares o no autorizado
Teledetección Estudio de cultivos Imagen de Satélite Categorías de uso
de la tierra
Reconocimiento del Gestiones telefónicas sin Onda sonora con el Palabras habladas
habla asistencia de operador habla
Computación Reconocimiento de Imagen de la persona, Estados de ánimo
Afectiva emociones Sonido de la voz
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
8. Reconocimiento de Patrones 1. Introducción
Aplicaciones:Teledetección
• Objetivo
– Predicción del tiempo atmosférico
• Realizado por
– Instituto meteorológico del Reino Unido
• Características
– Realizado con una red neuronal
– Precisión del 94%. En servicio desde 1999
Tipo de masa de aire esperada:
Violeta:libre de nubes, Verde:nubes dinámicas
Amarillo:nubes superficiales, Rojo: nubes profundas
Imagen infraroja del Meteosat
Imagen visible del Meteosat
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
9. Reconocimiento de Patrones 1. Introducción
Aplicaciones:
Clasificación de Documentos en Internet
• Objetivo:
– Clasificar de forma automática documentos en Internet
• Realizado por:
– Universidad de Arizona (Estados Unidos)
• Características:
– Realizado con un Mapa Auto-Organizado (MAO) bidimensional
multicapa
– El MAO agrupa categorías similares cerca de cada otra en el
mapa
– Seleccionando una región del mapa se pasa a la siguiente capa
del mapa multicapa o se muestran los documentos de la
categoría si el número es inferior a 200
– Los textos y colores se utilizan para visualizar las distintas
categorías
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
10. Reconocimiento de Patrones 1. Introducción
Clasificación de Documentos en Internet:
Ejemplo
• Mapa bidimensional multicapa generado a partir de las páginas de
entretenimiento de Yahoo.
ET-Map: Clasificación de documentos en Internet
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
11. Reconocimiento de Patrones 1. Introducción
Aplicaciones: Computación Afectiva
• Objetivo:
– Creación de robots “sociales” capaces de reconocer y expresar
emociones.
• Realizado por:
– MIT (Estados Unidos)
• Características
– Se creó el robot Kismet que es una criatura expresiva robótica con
capacidades perceptuales y motoras diseñadas para los canales
de comunicación natural con el hombre.
Cámaras Dirección de la mirada
Micrófonos
Sintetizador de voz Orientación de la cabeza
Kismet: Cabeza robótica
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
12. Reconocimiento de Patrones 1. Introducción
Computación Afectiva: Ejemplo
Calmado
Interesado Enfadado
Feliz
Triste Sorprendido
Disgustado
Computación Afectiva: Robot Kismet
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
13. Reconocimiento de Patrones 1. Introducción
Aplicaciones:
Minado de Bases de Datos Multimedia
• Objetivo:
– Realizar el indexado, clasificación, navegación y visualización de
videos de forma automática
• Realizado por:
– CMU (Estados Unidos)
• Características
– Utiliza tecnología de comprensión
automática del habla, lenguaje e
imágenes para transcribir,
segmentar e indexar el video.
Las mismas herramientas se
utilizan para realizar búsquedas
inteligentes y proporcionar
respuestas selectivas. Sistema Informedia (CMU)
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
14. Reconocimiento de Patrones 1. Introducción
Aplicaciones:Biometría
• Objetivo
– Identificación mediante el iris del ojo
• Realizado por
– Iriscan (Estados Unidos)
• Características
– Probabilidad de dos iris iguales 1/1078
– Tiempo medio de identificación 1 seg (NT) con 100.000 usuarios
Identificación mediante iris (Irisscan)
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
15. Reconocimiento de Patrones 1. Introducción
Aplicaciones:
Reconocimiento de Caracteres
• Objetivo:
– Reconocimiento de caracteres para clasificación postal
• Realizado por
– CEDAR (Universidad de Nueva York) para el Servicio Postal de
Estados Unidos
• Características
– Cada ordenador procesa 90.000 cartas a la hora
– Clasifica totalmente el 15% de las cartas
– El error cometido es inferior al 2%
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
16. Reconocimiento de Patrones 1. Introducción
Reconocimiento de Caracteres: Ejemplo
1 Digitalización 2 Localización de la dirección 3 Extracción de la dirección
4 Binarización 5 Separación de líneas 6 Análisis de la dirección 7a Nombre del estado
7b Reconocimiento del C. Postal 7c Reconocimiento del número de calle 7d Reconocimiento de nombre de calle
8 Códigos de entrega 9 Impresión de códigos de entrega
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
17. Reconocimiento de Patrones 1. Introducción
Aplicaciones: Robótica
Robot Cog (MIT) Robot Asimo (Honda)
Robot AIBO (Sony)
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
18. Reconocimiento de Patrones 1. Introducción
Aplicaciones de R.P. en Canarias
Registro Oleícola Español (1992-1998)
• Objetivo:
– Realizar un censo de los olivos en España a partir de fotografías
aéreas.
• Realizado por
– Galileo Ingeniería y Servicios (Tenerife).
• Características
– Duración del proyecto 6 años
– Puestos de trabajo creados 40.
Conteo de parcela con olivos
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
19. Reconocimiento de Patrones 1. Introducción
Aplicaciones de R.P. en Canarias
Detecam (2001)
• Objetivo:
– Detectar cambios en imágenes aéreas (edificaciones, carreteras,
etc.)
• Realizado por
– Universidad de La Laguna (DEIOC) para Grafcan
Sistema Detecam
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
20. Reconocimiento de Patrones 1. Introducción
Detecam: Algunos resultados
S/C Tfe. 1998 Cambios
S/C Tfe. 1995
Madrid 1999 Madrid 2000 Cambios
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
21. Reconocimiento de Patrones 1. Introducción
Aplicaciones de R.P. en Canarias
Proyecto Eldi
• Objetivo
– Diseño y construcción de un Sistema Autónomo Inteligente Móvil
capaz de interactuar con el medio en ambientes en los cuales
coexiste con personas.
• Realizado por:
– Grupo de investigación en Inteligencia Artificial y Sistemas (GIAS)
de la ULPGC para el Museo de La Ciencia de Las Palmas de Gran
Canaria
ELDI bailando en el Museo de La Ciencia
Vídeo cortesía del GIAS
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
22. Reconocimiento de Patrones 1. Introducción
Aplicaciones de R.P. en Canarias
Espacio Acústico Virtual (1995-2004)
• Objetivo:
– Codificar la información visual mediante sonidos para aumentar la
autonomía de las personas ciegas.
• Realizado por
– Instituto Astrofísico de Canarias (Área de Instrumentación)
– Universidad de La Laguna (Departamento de Fisiología)
– En colaboración con ONCE, ITC, IMETISA
– Financiación: 1.4 Meuros (230 Mptas)
Espacio Acústico Virtual: Presentación
Vídeo cortesía del IAC
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
23. Reconocimiento de Patrones 1. Introducción
Conceptos básicos de RP
En el R.P. no se clasifican directamente las entidades u objetos
•
sino su descripción.
Esta descripción se crea a partir de un modelo de la entidad
•
construida a partir de unas características y algún tipo de
representación.
La representación también es dependiente del problema y puede
•
ser un vector, una cadena, un grafo, etc...
Esta representación es utilizada por un clasificador para asignar
•
la entidad a una clase
Además el clasificador se ajusta al problema mediante un proceso
•
de entrenamiento o aprendizaje
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
24. Reconocimiento de Patrones 1. Introducción
El Proceso de Clasificación
• El proceso de clasificación sigue las etapas:
– Adquisición de datos
– Preprocesado
– Extracción de características
– Clasificación
Asignación
Patrón Medida de
Ambiente Sensor Preprocesado Clasificación a una clase
de testeo Características
Selección de
Patrón
Ambiente Sensor Preprocesado Aprendizaje
Características
de testeo
Modelo del proceso de clasificación
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
25. Reconocimiento de Patrones 1. Introducción
Las Características: Propiedades (1)
• Las características:
– Pueden ser simbólicas o numéricas
– Cuestiones básicas son:
› ¿Qué características? ¿Cuántas?.
› ¿Cuál es su importancia relativa?
• Características numéricas
– Toman valores reales
– La combinación de d características se representa mediante un
vector de características. El espacio al que pertenecen los vectores
de características se llama espacio de características
– Los objetos y entidades se representan entonces como puntos en
el espacio de características.
Característica 2
Clase 3 Clase 1
Clase 2
Característica 1
Vector de Espacio de Representación en el
características características espacio de características
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
26. Reconocimiento de Patrones 1. Introducción
Las Características: Propiedades (2)
• Caracteristicas simbólicas
– Suelen ser discretas
› Ejemplo: Forma = {cuadrado, circunferencia , triángulo}
– No suelen tener una noción natural de similitud
– Puede que tampoco tengan una noción natural de orden
– La combinación de d características suele hacerse mediante
alguna estructura de datos como listas, árboles o grafos.
Característica Simbólicas
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
27. Reconocimiento de Patrones 1. Introducción
Clasificadores
• La tarea de un clasificador es dividir
el espacio de características en regiones
de decisión asociadas a las clases
• Las fronteras entre las regiones de decisión
Regiones de decisión
se llaman fronteras de decisión
• La clasificación de un patrón consiste en determinar a qué región
pertenece.
• La elección de un clasificador depende del problema. Cuestiones
a resolver son:
- ¿Como hacer mínimo el error de clasificación?
- ¿Cual debe ser su complejidad?
• Es posible combinar distintos clasificadores
para resolver un determinado problema de RP
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
28. Reconocimiento de Patrones 1. Introducción
Aprendizaje
• Una vez elegido el clasificador, éste debe de ajustarse a los datos
del problema mediante un proceso de aprendizaje que en R.P. se
realiza mediante un conjunto de entrenamiento a cuyos elementos
de llaman muestras. Cuestiones básicas son:
– ¿Cuantas muestras?
– ¿Cual es el costo de obtenerlas?
– ¿cómo hacer que sean representativas del problema?
• Hay tres tipos fundamentales de aprendizaje:
– Supervisado: Se dispone de un conjunto de muestras junto con las
clases a las que pertenecen
– No Supervisado: Se dispone de un conjunto de muestras pero se
desconocen las clases a las que pertenecen
– Por Refuerzo: Se puede saber si el proceso de clasificación es
correcto o no para un conjunto de muestras
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
29. Reconocimiento de Patrones 1. Introducción
Areas Relacionadas
• Procesamiento de Señal
• Aprendizaje Computacional
• Robótica y Visión
• Ciencias Cognitivas
• Estadística Matemática
• Optimización no Lineal
• Análisis de Datos
• Sistemas Difusos y Genéticos
• Lenguajes Formales
• Modelado Estructural
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
30. Reconocimiento de Patrones 1. Introducción
Un Sistema sencillo de Reconocimiento de
Patrones
• Consideremos el problema de reconocer las letras L,P,O,E,Q
– Necesitamos determinar:
› Un conjunto suficiente de características
› Un clasificador
• Resultado
Características Inicio
Letra Líneas Rectas Líneas Rectas Líneas Rectas Líneas
Verticales Horizontales Oblícuas Curvas SI NO
L 1 1 0 0
SI NO
SI NO
P 1 0 0 1
O 0 0 0 1 SI NO
1 1
E 1 3 0 0
Q 0 0 1 1
Ejemplo de características y clasificador
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
31. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (1)
• Consideremos el siguiente problema:
– Una planta procesadora de pescado quiere automatizar el proceso
de clasificación de pescado con respecto a la especie (salmón o
ródalo).
– El sistema automatizado consiste en:
› Una cinta transportadora para los productos recibidos
› Dos cintas transportadoras para los productos clasificados
› Un brazo robótico para coger y colocar objetos
› Un sistema de visión con una cámara
› Un ordenador para clasificar las imágenes y controlar el robot.
Cinta Transportadora (Salmones)
Cámara de
Vídeo
Ordenador
Cinta
Transportadora
Brazo
Robótico
Cinta Transportadora (Ródalos)
Sistema de Clasificación de Pescado
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
32. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (2)
• Sensor
– El sistema de visión captura una imagen en cuanto un nuevo
pescado entra en el área de ordenación
• Preprocesado
– Algoritmos de Procesamiento de Imágenes
› Ajuste de niveles de intensidad
› Segmentación para separar el pescado del fondo de la imagen
• Extracción de características
– Supongamos que sabemos que en
media, el ródalo es más largo que el
salmón
› A partir de la imagen segmentada
estimamos la longitud del pescado
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
33. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (3)
• Clasificación
– Seleccionar un conjunto de muestras de ambas especies
– Calcular la distribución de longitudes para ambas clases
– Determinar la frontera de decisión (umbral) que minimiza el error
de clasificación
Nº veces
Frontera
de decisión
Salmón Ródalo
Longitud
Histograma de longitudes
– Estimamos la probabilidad de error y se obtiene un mal resultado
del orden del 40%
– ¿Qué hacemos ahora?
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
34. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (4)
• Mejoremos el rendimiento del sistema de R.P.
– Para obtener un error inferior al 5%, probamos con nuevas
características
› Anchura, área, posición de los ojos respecto a la cara,...
– Finalmente encontramos una “buena” Frontera de decisión
Ródalo
característica: intensidad media de las Nº
Salmón
escamas
– Combinamos “longitud” e “intensidad Intensidad media
media de las escamas” para mejorar
Longitud
la separabilidad de las clases Frontera
– Buscamos un clasificador que proporcione
una frontera de decisión lineal (clasificador
lineal) y obtenemos un 4.3% de error de Ródalo
Salmón
clasificación Intensidad media
Clasificador con 2 características
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
35. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (5)
• Costo y Error de Clasificación
– El clasificador que se diseñó hace mínimo el error de clasificación
– ¿Es éste el mejor criterio para procesar pescado ?
› El costo de clasificar erróneamente salmón como ródalo es que el
consumidor encontrará una pieza sabrosa de salmón cuando compra
ródalo.
› El costo de clasificar erróneamente ródalo como salmón es que el
consumidor encontrará una pieza ródalo comprada al precio de salmón
– Deberíamos ajustar la frontera de decisión para minimizar esta
función de coste
Longitud
Longitud
Nueva Frontera
Frontera
Ródalo
Ródalo
Salmón Salmón
Intensidad media Intensidad media
Fronteras de decisión: Error y Costo
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
36. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (6)
• ¿Cómo seguir mejorando el rendimiento del sistema?
– El rendimiento de un clasificador depende de la interrelación entre
el número de muestras del conjunto de entrenamiento, el número
de características y la complejidad del clasificador.
– Supongamos un número de muestras fijo entonces podemos:
› Aumentar el número de características
En principio parece que al aumentar la información (más
características) debe de aumentarse el rendimiento del clasificador. Sin
embargo se observa en la práctica que llega un momento en que el
rendimiento disminuye cuando el número de características aumenta.
A este comportamiento paradójico se le llama “la maldición de la
dimensionalidad”
› Se acepta que generalmente que se debe utilizar al menos diez veces
más muestras por clase que el número de características
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
37. Reconocimiento de Patrones 1. Introducción
Un Sistema realista de Reconocimiento de
Patrones (7)
• Para mejorar el rendimiento del sistema la otra alternativa es
aumentar la complejidad del clasificador
– Parece que un clasificador más complejo debería aumentar el
rendimiento del sistema. Sin embargo se observa en la práctica
que llega un momento en que el rendimiento disminuye cuando
aumenta la complejidad del clasificador.
– A este hecho se le llama “el problema de la generalización”, su
explicación es que el clasificador se ajusta tanto a las muestras de
entrenamiento que no “captura” bien el comportamiento de las
muestras nuevas.
Longitud
Frontera
– Hay una teoría filosófica para la elección de
clasificadores sencillos. Ya William de Occam
(1284-1347?) afirmaba (“navaja de Occam”)
que si dos explicaciones son igual de buenas Ródalo
Salmón
Intensidad media
se debe elegir la simple sobre la complicada. El problema de la generalización
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
38. Reconocimiento de Patrones 1. Introducción
Metodología general para diseñar un
Sistema de Reconocimiento de Patrones
Estudiar las clases del problema y desarrollar sus
1.
caracterizaciones.
Determinar que características pueden extraerse
2.
Estudiar el clasificador más adecuado
3.
Determinar la presencia de datos de entrenamiento para entrenar
4.
el clasificador
Considerar las restricciones computacionales
5.
Realizar una Simulación
6.
Iterar los pasos anteriores hasta obtener el rendimiento deseado.
7.
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
39. Reconocimiento de Patrones 1. Introducción
La elección de las características
• Hay al menos dos razones para mantener el número de
características tan pequeño como sea posible:
– Costo de obtención
– Precisión en la clasificación
• Para determinar las características del clasificador se distingue
entre:
– Extracción de características
› Métodos que crean nuevas características con mejor poder de
discriminación a partir del conjunto original de características
– Selección de características
› Métodos que seleccionan el mejor subconjunto de características a
partir de un conjunto original
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
40. Reconocimiento de Patrones 1. Introducción
La elección del clasificador
• En la práctica, la elección de un clasificador es un problema difícil
y generalmente está basado en cuales están disponibles o son
conocidos para el usuario
• ¿Hay algún clasificador absolutamente superior al resto?
– Teorema “No Free Lunch” (NFL)
› En ausencia de información a priori no hay ningún clasificador superior
a otro (incluyendo la elección al azar de las clases) sobre todos los
problemas de reconocimiento de patrones.
• Algo similar pasa con la representación:
– Teorema “Ugly Duckling”
› En ausencia de información a priori no hay ninguna representación
superior a otra sobre todos los problemas de reconocimiento de
patrones.
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna
41. Reconocimiento de Patrones 1. Introducción
La esencia del Reconocimiento de
Patrones
• La ciencia del Reconocimiento de Patrones está relacionada con
la elección del algoritmo más apropiado para el problema a
resolver
• Esto requiere conocimiento a priori (distribución de los datos,
probabilidades a priori, complejidad del problema, física del
fenómeno que generó los datos, etc)
• El teorema NFL nos dice que en ausencia de conocimiento a
priori no hay ningún clasificador mejor que otro. Sin embargo
con información a priori, algunos clasificadores funcionan mejor
con determinados tipos de problemas
• El reto del profesional del Reconocimiento de Patrones es
entonces identificar el clasificador adecuado para el problema a
resolver
Escuela Técnica Superior de Ingeniería Informática. Universidad de La Laguna