SlideShare uma empresa Scribd logo
1 de 20
Silvia Ramis
Francisco J. Perales,
Antoni Bibiloni
(DMI-UIB)
Introducción


Proyecto desarrollado dentro del proyecto
ITVnet.
◦ Trata de un recomendador de vídeos vía PC,
android o hbbtv.
◦ Extrae las características del vídeo a partir de la
detección y te recomienda los vídeos relacionados.



Han colaborado el grupo UGIVIA junto con el
grupo LTIM de DMI de la UIB.
Objetivos


Reconocer e identificar mediante VPO
◦ Sujetos  Algoritmo PCA
◦ Textos explicativos  Técnica OCR
Detección de Caras


Clasificadores cascada Haar de OpenCV.
◦ Devuelve 1 si es cara
◦ Devuelve 0 en caso
contrario



Eliminar falsos
positivos.
◦ Rango de color de la
piel.



Cara detectada.
◦ Limitar la zona de la
persona.
Detección de Caras


Rango de Color de la piel
Representación HSI.
• H (Hue): tono del color
• S (Saturación): apagado o vivo
• I (Intensitat): claro u oscuro (prescindible)

◦ Aprendizaje de los colores
con el algoritmo AdaBoost
con 1000 cares y 1284 no
cares.
Algoritmo PCA


Detección de caras:
◦ Conjunto de imágenes de
entrenamiento Im.

m: nº de imagen



Cada imagen detectada
Im, representada como
un vector Ƭm.
Algoritmo PCA


La cara promedio (vector ψ)

1
K

◦ K es el nº total de imágenes.


m
m 1

Normaliza: Resta cada imagen del entrenamiento
con la cara promedio.
m



K

m

Matriz de Covarianza

C

T

A

A· A

(matriz NxN)
¡No práctico!

1

2



m

m Columnas = m imágenes

N Filas:
w*h
Algoritmo PCA


Matriz de Covarianza
◦ Si m<N considera



(matriz mxm)

Extraer los vectores propios (eigenfaces) y valores
propios de mayor peso de la matriz de covarianza.

m Eigenfaces 


AT · A

C

Se obtiene el patrón:

(u1...um )

T

w1

donde wm

w2  wm
T
um

m
Identificación







Extraer un patrón para cada individuo y crear una
base de datos.
Realizar el mismo proceso para la nueva imagen.
Calcular la distancia entre la imagen a detectar y las
imágenes de la base de datos.
Seleccionar la imagen de la base de datos que más se
aproxima a la nueva imagen.

min


2
m

Si la distancia ϵ es inferior a un umbral asignado se
reconoce al individuo.
Resultados
<?xml version="1.0"?>
<Faces>
<Segment>
<Person id = "programacion">
<MediaTime>
<MediaTimePoint>T00:00:13</MediaTimePoint>
<MediaDuration>PT14S</MediaDuration>
</MediaTime>
<Segment/>
<Segment>
<Person id = "programacion">
<MediaTime>
<MediaTimePoint>T00:01:07</MediaTimePoint>
<MediaDuration>PT54S</MediaDuration>
</MediaTime>
<Segment/>
<Segment>
<Person id = "programacion">
<MediaTime>
<MediaTimePoint>T00:02:28</MediaTimePoint>
<MediaDuration>PT27S</MediaDuration>
</MediaTime>
<Segment/>
<Faces/>

Pruebas con 13 videos:

Aciertos

10

Fallos

3

77% de aciertos.
Causa de errores:
• El individuo tiene la
cara de perfil.
Si el conjunto de caras
esta bien alineado, con
caras frontales  90.1%
de aciertos
Detección de texto


Librería OCR tesseract.
◦ Mejor detección si extraemos una subimagen ajustada del
texto.



Dificultad: no existe un modelo estándar de
transparencias.
Detección de texto


Solución
◦
◦
◦
◦



Estandarizar el tamaño del video.
Convertir a una imagen binaria.
Contar número de píxeles blancos.
Hallar el umbral. Cada umbral representa un estilo
de transparencia.

Detección de títulos
◦ proyección horizontal para determinar la zona.
 El título se localiza entre las primeras sumas.
Detección de texto
Detección de texto


Observaciones
Tipo de letra
Letra negra sobre fondo claro

≥ 16 (detección óptima)
< 16 (confunde letras)

Letra blanca sobre fondo
oscuro

≥ 18 en mayúsculas
(detección óptima)

Letra muy grande



Tamaño de letra

≥ 18 en mayúsculas
(detección óptima)

Mejores detecciones:
◦ Letra negra sobre fondo claro.
Detección de texto


Normalización del tamaño de texto
◦ Calcular el tamaño de letra.
 Si es menor a 16  agrandarla mediante una
interpolación bicúbica.

◦ Normalizar todos los textos a letra negra sobre
fondo blanco.





Convertir imagen a binaria.
Sea Pb número total de píxeles blancos.
Sea Pn número total de píxeles negros.
Si Pn > Pb se invierte los colores de la imagen
binaria.
Resultados de texto
<?xml version="1.0"?>

<Slides>
<Segment>
<Title>Punteros en lenguaje C </Title>
<MediaTime>
<MediaTimePoint>T00:00:00</MediaTimePoint>
<MediaDuration>PT14S</MediaDuration>
</MediaTime>
</Segment>
<Segment>
<Title>Objetivos </Title>
<MediaTime>
<MediaTimePoint>T00:00:14</MediaTimePoint>
<MediaDuration>PT36S</MediaDuration>
</MediaTime>
</Segment>

<Segment>
<Title>Punteros </Title>
<MediaTime>
<MediaTimePoint>T00:00:50</MediaTimePoint>
<MediaDuration>PT199S</MediaDuration>
</MediaTime>
</Segment>
</Slides>
Resultados de texto
Video

Detección OCR

Programación 1
Programación 2
Programación_sistemas_1
Programación_sistemas_2
Programación_sistemas_3
Internet_aula_1
Internet_aula_3
Internet_aula_5
Mercado emisiones UE
Mecanismo_mercado
Cocina1
Conceptos_clave
Consumo_Espana_crisis
Mercado_deuda_publica
Curso cocina gazpacho
Curso cocina pescado con mayonesa
Curso cocina puré de calabacín
Competencia monopolística

100%
100%
95%
95%
100%
99%
93%
89%
93%
93%
90%
70%
100%
100%
95%
100%
99%
59%

Media Detección

92.77%
Conclusiones y Trabajos Futuros


Se ha presentado un sistema óptimo.




Reconoce el 90.1% de individuos en caso de que todas las
imágenes sean frontales y el 92.77% de texto.

Se propone mejorar:
◦ El reconocimiento facial con nuevos sistema basados en
RNA, LDA.
◦ Aplicar un analizador sintáctico en el OCR
◦ Comparar con otro OCR comercial
◦ Realizar nuevas pruebas
Agradecimientos




Financiación proyecto ConnectedTV
(IPT-2012-0871-430000)
Parcialmente financiado por el Govern Balear,
Grupos Competitivos, 2011, Num. 28/2011/44
Gracias por su Atención. Preguntas?

Mais conteúdo relacionado

Semelhante a Reconocimiento facial e identificación de textos en videos interactivos - Ramis - Perales - Bibiloni

Imagen En Pantalla
Imagen En PantallaImagen En Pantalla
Imagen En Pantallanatachasb
 
Exposición Scanline
Exposición ScanlineExposición Scanline
Exposición Scanlinejdtorrespal
 
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)Alberto Palomares
 
Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1dave
 
Instrumento de medicion para prueva de color
Instrumento de medicion para prueva de colorInstrumento de medicion para prueva de color
Instrumento de medicion para prueva de colorMarli Moña
 
Clase 7 la_programacion
Clase 7 la_programacionClase 7 la_programacion
Clase 7 la_programacionDr.Ing. Uriel
 
Clase 1 Itinerario
Clase 1 ItinerarioClase 1 Itinerario
Clase 1 Itinerariovbalda
 
CCD2015 - Creación contenidos digitales
CCD2015 - Creación contenidos digitalesCCD2015 - Creación contenidos digitales
CCD2015 - Creación contenidos digitalesAndoni Eguíluz Morán
 
5 Producción multimedia
5 Producción multimedia5 Producción multimedia
5 Producción multimediaa-stellez
 
Presentacion_Lenguaje_C.pptx
Presentacion_Lenguaje_C.pptxPresentacion_Lenguaje_C.pptx
Presentacion_Lenguaje_C.pptxIng. Ríos
 
El_pensamiento_computacional_y_programacion_.pptx
El_pensamiento_computacional_y_programacion_.pptxEl_pensamiento_computacional_y_programacion_.pptx
El_pensamiento_computacional_y_programacion_.pptxKarinaLeticiaKovvali
 
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstream
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstreamDecodificador de vídeo mpeg 2 en matlab y análisis del bitstream
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstreamJosé Ramón Cerquides Bueno
 

Semelhante a Reconocimiento facial e identificación de textos en videos interactivos - Ramis - Perales - Bibiloni (20)

Imagen En Pantalla
Imagen En PantallaImagen En Pantalla
Imagen En Pantalla
 
Exposición Scanline
Exposición ScanlineExposición Scanline
Exposición Scanline
 
Final
FinalFinal
Final
 
Asignacion
AsignacionAsignacion
Asignacion
 
4 video y-cinedigital
4 video y-cinedigital4 video y-cinedigital
4 video y-cinedigital
 
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)
Gestion del Riesgo 7 - Analisis cuantitativo de riesgos (oa)
 
Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1Reporte proyecto primer parcial 1
Reporte proyecto primer parcial 1
 
Instrumento de medicion para prueva de color
Instrumento de medicion para prueva de colorInstrumento de medicion para prueva de color
Instrumento de medicion para prueva de color
 
Clase 7 la_programacion
Clase 7 la_programacionClase 7 la_programacion
Clase 7 la_programacion
 
Visual basic-net
Visual basic-netVisual basic-net
Visual basic-net
 
Clase 1 Itinerario
Clase 1 ItinerarioClase 1 Itinerario
Clase 1 Itinerario
 
Matematica computacional
Matematica computacionalMatematica computacional
Matematica computacional
 
CCD2015 - Creación contenidos digitales
CCD2015 - Creación contenidos digitalesCCD2015 - Creación contenidos digitales
CCD2015 - Creación contenidos digitales
 
El Monitor
El MonitorEl Monitor
El Monitor
 
5 Producción multimedia
5 Producción multimedia5 Producción multimedia
5 Producción multimedia
 
Guia de-programacion-i-visual-b-net
Guia de-programacion-i-visual-b-netGuia de-programacion-i-visual-b-net
Guia de-programacion-i-visual-b-net
 
Presentacion_Lenguaje_C.pptx
Presentacion_Lenguaje_C.pptxPresentacion_Lenguaje_C.pptx
Presentacion_Lenguaje_C.pptx
 
Ivan gomez cisti2010
Ivan gomez cisti2010Ivan gomez cisti2010
Ivan gomez cisti2010
 
El_pensamiento_computacional_y_programacion_.pptx
El_pensamiento_computacional_y_programacion_.pptxEl_pensamiento_computacional_y_programacion_.pptx
El_pensamiento_computacional_y_programacion_.pptx
 
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstream
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstreamDecodificador de vídeo mpeg 2 en matlab y análisis del bitstream
Decodificador de vídeo mpeg 2 en matlab y análisis del bitstream
 

Mais de Red Auti

jAUTI 2014- Processo metodológico para alicerçar a seleção de métodos de ide...
jAUTI 2014- Processo metodológico para alicerçar a  seleção de métodos de ide...jAUTI 2014- Processo metodológico para alicerçar a  seleção de métodos de ide...
jAUTI 2014- Processo metodológico para alicerçar a seleção de métodos de ide...Red Auti
 
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...Red Auti
 
jAUTI 2014- Template Generator - Pillajo
jAUTI 2014- Template Generator - PillajojAUTI 2014- Template Generator - Pillajo
jAUTI 2014- Template Generator - PillajoRed Auti
 
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez Red Auti
 
jAUTI 2014-Analisis de penetracion de tvdi- fuentealba
jAUTI 2014-Analisis de penetracion de tvdi- fuentealbajAUTI 2014-Analisis de penetracion de tvdi- fuentealba
jAUTI 2014-Analisis de penetracion de tvdi- fuentealbaRed Auti
 
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irere
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irerejAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irere
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irereRed Auti
 
jAUTI 2014-Marcacion de contenidos iptv- vargas
jAUTI 2014-Marcacion de contenidos iptv- vargasjAUTI 2014-Marcacion de contenidos iptv- vargas
jAUTI 2014-Marcacion de contenidos iptv- vargasRed Auti
 
jAUTI 2014- Keynote wetakecarewebmedia Lozano
jAUTI 2014- Keynote wetakecarewebmedia  LozanojAUTI 2014- Keynote wetakecarewebmedia  Lozano
jAUTI 2014- Keynote wetakecarewebmedia LozanoRed Auti
 
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...Red Auti
 
Metodología de evaluación y gestión del conocimiento... - Jon Arambarri Basañez
Metodología de evaluación y gestión del conocimiento... -  Jon Arambarri BasañezMetodología de evaluación y gestión del conocimiento... -  Jon Arambarri Basañez
Metodología de evaluación y gestión del conocimiento... - Jon Arambarri BasañezRed Auti
 
Matriz de eficiencia siesta care - CPMTI
Matriz de eficiencia siesta care - CPMTIMatriz de eficiencia siesta care - CPMTI
Matriz de eficiencia siesta care - CPMTIRed Auti
 
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...Marco de referencia para la evaluación del desempeño de los servicios t-Learn...
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...Red Auti
 
La interactividad en la televisión digital en Argentina - Néstor Daniel González
La interactividad en la televisión digital en Argentina - Néstor Daniel GonzálezLa interactividad en la televisión digital en Argentina - Néstor Daniel González
La interactividad en la televisión digital en Argentina - Néstor Daniel GonzálezRed Auti
 
La información digital, un nuevo modelo de contenido educativo... - Miguel An...
La información digital, un nuevo modelo de contenido educativo... - Miguel An...La información digital, un nuevo modelo de contenido educativo... - Miguel An...
La información digital, un nuevo modelo de contenido educativo... - Miguel An...Red Auti
 
Hollybyte - dnovae
Hollybyte - dnovaeHollybyte - dnovae
Hollybyte - dnovaeRed Auti
 
Ginga ncl televisión digital terrestre - Gonzalo Olmedo
Ginga ncl televisión digital terrestre - Gonzalo OlmedoGinga ncl televisión digital terrestre - Gonzalo Olmedo
Ginga ncl televisión digital terrestre - Gonzalo OlmedoRed Auti
 
EWBS - Gonzalo Olmedo
EWBS - Gonzalo OlmedoEWBS - Gonzalo Olmedo
EWBS - Gonzalo OlmedoRed Auti
 
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...Red Auti
 
El Futuro de la televisión - Guido Lemos
El Futuro de la televisión - Guido LemosEl Futuro de la televisión - Guido Lemos
El Futuro de la televisión - Guido LemosRed Auti
 
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...Red Auti
 

Mais de Red Auti (20)

jAUTI 2014- Processo metodológico para alicerçar a seleção de métodos de ide...
jAUTI 2014- Processo metodológico para alicerçar a  seleção de métodos de ide...jAUTI 2014- Processo metodológico para alicerçar a  seleção de métodos de ide...
jAUTI 2014- Processo metodológico para alicerçar a seleção de métodos de ide...
 
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...
jAUTI 2014- Generación Aut. de Contenido para Aplic. Interac. de TD Ginga-NCL...
 
jAUTI 2014- Template Generator - Pillajo
jAUTI 2014- Template Generator - PillajojAUTI 2014- Template Generator - Pillajo
jAUTI 2014- Template Generator - Pillajo
 
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez
jAUTI 2014-Licencias de Televisión Digital- N.Gonzalez
 
jAUTI 2014-Analisis de penetracion de tvdi- fuentealba
jAUTI 2014-Analisis de penetracion de tvdi- fuentealbajAUTI 2014-Analisis de penetracion de tvdi- fuentealba
jAUTI 2014-Analisis de penetracion de tvdi- fuentealba
 
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irere
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irerejAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irere
jAUTi2014- Tv digital y one-seg como desarrollo estratégico de la cultura- irere
 
jAUTI 2014-Marcacion de contenidos iptv- vargas
jAUTI 2014-Marcacion de contenidos iptv- vargasjAUTI 2014-Marcacion de contenidos iptv- vargas
jAUTI 2014-Marcacion de contenidos iptv- vargas
 
jAUTI 2014- Keynote wetakecarewebmedia Lozano
jAUTI 2014- Keynote wetakecarewebmedia  LozanojAUTI 2014- Keynote wetakecarewebmedia  Lozano
jAUTI 2014- Keynote wetakecarewebmedia Lozano
 
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...
Sistemas de comunicación alternativa y aumentativa - Baldassarri - Peña - Cer...
 
Metodología de evaluación y gestión del conocimiento... - Jon Arambarri Basañez
Metodología de evaluación y gestión del conocimiento... -  Jon Arambarri BasañezMetodología de evaluación y gestión del conocimiento... -  Jon Arambarri Basañez
Metodología de evaluación y gestión del conocimiento... - Jon Arambarri Basañez
 
Matriz de eficiencia siesta care - CPMTI
Matriz de eficiencia siesta care - CPMTIMatriz de eficiencia siesta care - CPMTI
Matriz de eficiencia siesta care - CPMTI
 
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...Marco de referencia para la evaluación del desempeño de los servicios t-Learn...
Marco de referencia para la evaluación del desempeño de los servicios t-Learn...
 
La interactividad en la televisión digital en Argentina - Néstor Daniel González
La interactividad en la televisión digital en Argentina - Néstor Daniel GonzálezLa interactividad en la televisión digital en Argentina - Néstor Daniel González
La interactividad en la televisión digital en Argentina - Néstor Daniel González
 
La información digital, un nuevo modelo de contenido educativo... - Miguel An...
La información digital, un nuevo modelo de contenido educativo... - Miguel An...La información digital, un nuevo modelo de contenido educativo... - Miguel An...
La información digital, un nuevo modelo de contenido educativo... - Miguel An...
 
Hollybyte - dnovae
Hollybyte - dnovaeHollybyte - dnovae
Hollybyte - dnovae
 
Ginga ncl televisión digital terrestre - Gonzalo Olmedo
Ginga ncl televisión digital terrestre - Gonzalo OlmedoGinga ncl televisión digital terrestre - Gonzalo Olmedo
Ginga ncl televisión digital terrestre - Gonzalo Olmedo
 
EWBS - Gonzalo Olmedo
EWBS - Gonzalo OlmedoEWBS - Gonzalo Olmedo
EWBS - Gonzalo Olmedo
 
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...
Evaluación de la usabilidad de aplicaciones para la TVDI - Montero - López - ...
 
El Futuro de la televisión - Guido Lemos
El Futuro de la televisión - Guido LemosEl Futuro de la televisión - Guido Lemos
El Futuro de la televisión - Guido Lemos
 
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...
El diseño instruccional de los Moocs y el de los nuevos cursos online abierto...
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (10)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

Reconocimiento facial e identificación de textos en videos interactivos - Ramis - Perales - Bibiloni

  • 1. Silvia Ramis Francisco J. Perales, Antoni Bibiloni (DMI-UIB)
  • 2. Introducción  Proyecto desarrollado dentro del proyecto ITVnet. ◦ Trata de un recomendador de vídeos vía PC, android o hbbtv. ◦ Extrae las características del vídeo a partir de la detección y te recomienda los vídeos relacionados.  Han colaborado el grupo UGIVIA junto con el grupo LTIM de DMI de la UIB.
  • 3. Objetivos  Reconocer e identificar mediante VPO ◦ Sujetos  Algoritmo PCA ◦ Textos explicativos  Técnica OCR
  • 4. Detección de Caras  Clasificadores cascada Haar de OpenCV. ◦ Devuelve 1 si es cara ◦ Devuelve 0 en caso contrario  Eliminar falsos positivos. ◦ Rango de color de la piel.  Cara detectada. ◦ Limitar la zona de la persona.
  • 5. Detección de Caras  Rango de Color de la piel Representación HSI. • H (Hue): tono del color • S (Saturación): apagado o vivo • I (Intensitat): claro u oscuro (prescindible) ◦ Aprendizaje de los colores con el algoritmo AdaBoost con 1000 cares y 1284 no cares.
  • 6. Algoritmo PCA  Detección de caras: ◦ Conjunto de imágenes de entrenamiento Im. m: nº de imagen  Cada imagen detectada Im, representada como un vector Ƭm.
  • 7. Algoritmo PCA  La cara promedio (vector ψ) 1 K ◦ K es el nº total de imágenes.  m m 1 Normaliza: Resta cada imagen del entrenamiento con la cara promedio. m  K m Matriz de Covarianza C T A A· A (matriz NxN) ¡No práctico! 1 2  m m Columnas = m imágenes N Filas: w*h
  • 8. Algoritmo PCA  Matriz de Covarianza ◦ Si m<N considera  (matriz mxm) Extraer los vectores propios (eigenfaces) y valores propios de mayor peso de la matriz de covarianza. m Eigenfaces   AT · A C Se obtiene el patrón: (u1...um ) T w1 donde wm w2  wm T um m
  • 9. Identificación     Extraer un patrón para cada individuo y crear una base de datos. Realizar el mismo proceso para la nueva imagen. Calcular la distancia entre la imagen a detectar y las imágenes de la base de datos. Seleccionar la imagen de la base de datos que más se aproxima a la nueva imagen. min  2 m Si la distancia ϵ es inferior a un umbral asignado se reconoce al individuo.
  • 10. Resultados <?xml version="1.0"?> <Faces> <Segment> <Person id = "programacion"> <MediaTime> <MediaTimePoint>T00:00:13</MediaTimePoint> <MediaDuration>PT14S</MediaDuration> </MediaTime> <Segment/> <Segment> <Person id = "programacion"> <MediaTime> <MediaTimePoint>T00:01:07</MediaTimePoint> <MediaDuration>PT54S</MediaDuration> </MediaTime> <Segment/> <Segment> <Person id = "programacion"> <MediaTime> <MediaTimePoint>T00:02:28</MediaTimePoint> <MediaDuration>PT27S</MediaDuration> </MediaTime> <Segment/> <Faces/> Pruebas con 13 videos: Aciertos 10 Fallos 3 77% de aciertos. Causa de errores: • El individuo tiene la cara de perfil. Si el conjunto de caras esta bien alineado, con caras frontales  90.1% de aciertos
  • 11. Detección de texto  Librería OCR tesseract. ◦ Mejor detección si extraemos una subimagen ajustada del texto.  Dificultad: no existe un modelo estándar de transparencias.
  • 12. Detección de texto  Solución ◦ ◦ ◦ ◦  Estandarizar el tamaño del video. Convertir a una imagen binaria. Contar número de píxeles blancos. Hallar el umbral. Cada umbral representa un estilo de transparencia. Detección de títulos ◦ proyección horizontal para determinar la zona.  El título se localiza entre las primeras sumas.
  • 14. Detección de texto  Observaciones Tipo de letra Letra negra sobre fondo claro ≥ 16 (detección óptima) < 16 (confunde letras) Letra blanca sobre fondo oscuro ≥ 18 en mayúsculas (detección óptima) Letra muy grande  Tamaño de letra ≥ 18 en mayúsculas (detección óptima) Mejores detecciones: ◦ Letra negra sobre fondo claro.
  • 15. Detección de texto  Normalización del tamaño de texto ◦ Calcular el tamaño de letra.  Si es menor a 16  agrandarla mediante una interpolación bicúbica. ◦ Normalizar todos los textos a letra negra sobre fondo blanco.     Convertir imagen a binaria. Sea Pb número total de píxeles blancos. Sea Pn número total de píxeles negros. Si Pn > Pb se invierte los colores de la imagen binaria.
  • 16. Resultados de texto <?xml version="1.0"?> <Slides> <Segment> <Title>Punteros en lenguaje C </Title> <MediaTime> <MediaTimePoint>T00:00:00</MediaTimePoint> <MediaDuration>PT14S</MediaDuration> </MediaTime> </Segment> <Segment> <Title>Objetivos </Title> <MediaTime> <MediaTimePoint>T00:00:14</MediaTimePoint> <MediaDuration>PT36S</MediaDuration> </MediaTime> </Segment> <Segment> <Title>Punteros </Title> <MediaTime> <MediaTimePoint>T00:00:50</MediaTimePoint> <MediaDuration>PT199S</MediaDuration> </MediaTime> </Segment> </Slides>
  • 17. Resultados de texto Video Detección OCR Programación 1 Programación 2 Programación_sistemas_1 Programación_sistemas_2 Programación_sistemas_3 Internet_aula_1 Internet_aula_3 Internet_aula_5 Mercado emisiones UE Mecanismo_mercado Cocina1 Conceptos_clave Consumo_Espana_crisis Mercado_deuda_publica Curso cocina gazpacho Curso cocina pescado con mayonesa Curso cocina puré de calabacín Competencia monopolística 100% 100% 95% 95% 100% 99% 93% 89% 93% 93% 90% 70% 100% 100% 95% 100% 99% 59% Media Detección 92.77%
  • 18. Conclusiones y Trabajos Futuros  Se ha presentado un sistema óptimo.   Reconoce el 90.1% de individuos en caso de que todas las imágenes sean frontales y el 92.77% de texto. Se propone mejorar: ◦ El reconocimiento facial con nuevos sistema basados en RNA, LDA. ◦ Aplicar un analizador sintáctico en el OCR ◦ Comparar con otro OCR comercial ◦ Realizar nuevas pruebas
  • 19. Agradecimientos   Financiación proyecto ConnectedTV (IPT-2012-0871-430000) Parcialmente financiado por el Govern Balear, Grupos Competitivos, 2011, Num. 28/2011/44
  • 20. Gracias por su Atención. Preguntas?