SlideShare uma empresa Scribd logo
1 de 25
Baixar para ler offline
IInterfícienterfície GGràficaràfica d’d’ UUsuari per a lasuari per a la CCercaerca
d’d’ IImatges basada enmatges basada en IImatgesmatges
Projecte Final de CarreraProjecte Final de Carrera
Enginyeria Tècnica de Telecomunicacions, Imatge i SoEnginyeria Tècnica de Telecomunicacions, Imatge i So
EUETITEUETIT--UPCUPC
d’d’ IImatges basada enmatges basada en IImatgesmatges
GOSGOS -- GGraphicraphic OObjectbject SSearcherearcher
Alumna: Silvia Cortés YusteAlumna: Silvia Cortés Yuste
Tutor: Xavier Giró i NietoTutor: Xavier Giró i Nieto
Juny 2009Juny 2009
1.1. Presentació del projectePresentació del projecte
2.2. Estat de l’artEstat de l’art
3.3. RequerimentsRequeriments
ÍÍndexndex
22
4.4. Entorn de desenvolupamentEntorn de desenvolupament
5.5. Disseny de la interfície gràficaDisseny de la interfície gràfica
6.6. Futur del GOSFutur del GOS
7.7. ConclusionsConclusions
PPresentació del projecteresentació del projecte
Recuperació d’informació:Recuperació d’informació: gestió dels continguts.gestió dels continguts.
Iniciativa I3media :Iniciativa I3media : implementació de tècniques d’anotació,implementació de tècniques d’anotació,
indexació i recuperació de contingut audiovisual.indexació i recuperació de contingut audiovisual.
Sistemes CBIRSistemes CBIR ((ContentContent--Based Image RetrievalBased Image Retrieval):):
33
Sistemes CBIRSistemes CBIR ((ContentContent--Based Image RetrievalBased Image Retrieval):):
Consulta amb exemple:Consulta amb exemple: recuperar imatges/vídeos a partir d’unarecuperar imatges/vídeos a partir d’una
imatge de consulta.imatge de consulta.
Solventar deficiències cerca textual.Solventar deficiències cerca textual.
PPresentació del projecteresentació del projecte
Interfície gràfica d’usuari:Interfície gràfica d’usuari:
Àrea de comunicació entreÀrea de comunicació entre
usuariusuari –– màquinamàquina “Traductor”“Traductor”
44
Servei de cercaServei de cerca
GUIGUIUsuariUsuari
EEstat de l’ artstat de l’ art
Importància de la HCIImportància de la HCI –– Human ComputerHuman Computer
InteractionInteraction :: millorar la comunicació entre usuaris imillorar la comunicació entre usuaris i
sistemes de documentació (informatitzats).sistemes de documentació (informatitzats).
Àmbit per desenvolupar en els sistemes CBIR.Àmbit per desenvolupar en els sistemes CBIR.
55
Àmbit per desenvolupar en els sistemes CBIR.Àmbit per desenvolupar en els sistemes CBIR.
1.1. Què es buscaQuè es busca
2.2. On es buscaOn es busca
3.3. Com es buscaCom es busca
PerspectivaPerspectiva
usuariusuari
PerspectivaPerspectiva
sistema de cercasistema de cerca
Punts claus d’una cercaPunts claus d’una cerca
EEstat de l’ artstat de l’ art
A.A. Interfícies ComercialsInterfícies Comercials
Senzilles : Usuari no expertSenzilles : Usuari no expert
AtractivesAtractives
UsablesUsables
B.B. Interfícies AcadèmiquesInterfícies Acadèmiques
Complexes : Usuari expertComplexes : Usuari expert
Poc atractivesPoc atractives
FuncionalsFuncionals
66
GazoPa (QBIC)GazoPa (QBIC)
HitachiHitachi www.gazopa.comwww.gazopa.com
PhotobookPhotobook
Vision and Modeling Group, MITVision and Modeling Group, MIT
Media Laboratory, Cambridge, MA.Media Laboratory, Cambridge, MA.
RRequerimentsequeriments
Motor de cerca:Motor de cerca:
Ruta de la imatge de consultaRuta de la imatge de consulta
Arxiu de configuració (dades d’entrada)Arxiu de configuració (dades d’entrada)
Directori dels resultatsDirectori dels resultats
77
Directori dels resultatsDirectori dels resultats
UsuariUsuari Motor deMotor de
cercacerca
GOSGOS
InteractivitatInteractivitat
Crida ambCrida amb
paràmetresparàmetres
Dades entrada iDades entrada i
sortidasortida
(MPEG(MPEG--7/XML)7/XML)
RRequerimentsequeriments
Arxiu de Configuració (dades d’entrada) :Arxiu de Configuració (dades d’entrada) :
Tipus de criteri de fusió (MinTipus de criteri de fusió (Min (AND)(AND), Max, Max (OR)(OR), Mitja, Pesos), Mitja, Pesos)
Descriptors visuals (disseny de color, estructura de color,Descriptors visuals (disseny de color, estructura de color,
textura homogènia, histograma de marges de textura)textura homogènia, histograma de marges de textura)
88
textura homogènia, histograma de marges de textura)textura homogènia, histograma de marges de textura)
Pesos (si el criteri de fusió és “Pesos”)Pesos (si el criteri de fusió és “Pesos”)
Espai de cerca (dominis)Espai de cerca (dominis)
Número de resultatsNúmero de resultats
Resultats (dades de sortida) :Resultats (dades de sortida) : llista de resultatsllista de resultats
ordenats per grau de similitud amb la imatge exempleordenats per grau de similitud amb la imatge exemple
(URI de la imatge, posició i puntuació).(URI de la imatge, posició i puntuació).
EEntorn de desenvolupamentntorn de desenvolupament
Entorn d’execució :Entorn d’execució :
GNU/Linux: Local i remot.GNU/Linux: Local i remot.
Estructura de fitxers i directoris rígida.Estructura de fitxers i directoris rígida.
REMOTREMOT
Xarxa IPXarxa IP
99
Entorn de treball :Entorn de treball :
Aplicació en Java (requereix JRE 1.6 o superior).Aplicació en Java (requereix JRE 1.6 o superior).
Independent de la plataforma.Independent de la plataforma.
Llibreries per a crear interfícies gràfiques (AWT, SWING).Llibreries per a crear interfícies gràfiques (AWT, SWING).
Filosofia de treball colaboratiu.Filosofia de treball colaboratiu.
WebservicesWebservices: arquitectures modulars i integrables en xarxa.: arquitectures modulars i integrables en xarxa.
LOCALLOCAL
DDisseny de la GUIisseny de la GUI
Àrees implicades en el disseny:Àrees implicades en el disseny:
DissenyadorDissenyador
Disseny Gràfic
UsuariUsuari
1010
Ús industrial :Ús industrial : convergència entre interfície comercial iconvergència entre interfície comercial i
acadèmica, dóna servei a empreses i investigadors.acadèmica, dóna servei a empreses i investigadors.
DissenyadorDissenyador
GUIGUI
TecnologiaUsabilitat
UsuariUsuari
DesenvolupadorDesenvolupador
DDisseny de la GUIisseny de la GUI
Disseny gràfic:Disseny gràfic: imatge corporativa en tots els elementsimatge corporativa en tots els elements
visuals.visuals.
Estil com el GAT (Estil com el GAT (Graphic Annotation Tool)Graphic Annotation Tool)
Logo (Logo (pointing dogpointing dog))
Look&Feel i iconesLook&Feel i icones
1111
Look&Feel i iconesLook&Feel i icones
GATGAT GOSGOS
DDisseny de la GUIisseny de la GUI
Usabilitat:Usabilitat: organització dels elements iorganització dels elements i patrons de lecturapatrons de lectura
en pantalla.en pantalla.
1212
eyetrackingeyetracking
Patró FPatró F
DDisseny de la GUIisseny de la GUI
Tecnologia:Tecnologia: arquitectura jeràrquica d’elements Java.arquitectura jeràrquica d’elements Java.
CRITERIS DE FUSIÓCRITERIS DE FUSIÓ
Botons de criteris de fusióBotons de criteris de fusió
PANELLS CONTENIDORSPANELLS CONTENIDORS
1313
Arbre desplegableArbre desplegable Espais de cercaEspais de cerca Ítems seleccionablesÍtems seleccionablesESPAI DE CERCAESPAI DE CERCA
Descriptors visualsDescriptors visuals Casella selecció + Barra lliscantCasella selecció + Barra lliscant
CRITERIS DE FUSIÓCRITERIS DE FUSIÓ
GRAELLAGRAELLA DiapositivesDiapositives
RESULTATSRESULTATS
IMATGE DESTACADAIMATGE DESTACADA
Casella selecció + Miniatura +Casella selecció + Miniatura +
InformacióInformació
Imatge + Botons navegació + Àrea de textImatge + Botons navegació + Àrea de text
informativainformativa
DDisseny de la GUIisseny de la GUI
Criteris de disseny per a un sistema CBIRCriteris de disseny per a un sistema CBIR
1.1. Diferenciar àrea de consulta i àrea de resultatsDiferenciar àrea de consulta i àrea de resultats
2.2. Tipus de formulació de la consultaTipus de formulació de la consulta
1414
2.2. Tipus de formulació de la consultaTipus de formulació de la consulta
3.3. Configurar la consulta pel motor de cercaConfigurar la consulta pel motor de cerca
4.4. Visualització dels resultatsVisualització dels resultats
5.5. Disposar de mètodes de refinament de la consultaDisposar de mètodes de refinament de la consulta
6.6. Incloure documentació/ajuda a l’usuariIncloure documentació/ajuda a l’usuari
DDisseny de la GUIisseny de la GUI
1.1. Diferenciar àrea de consulta i àrea de resultatsDiferenciar àrea de consulta i àrea de resultats
1515
Àrea de consultaÀrea de consulta
Àrea de resultatsÀrea de resultats
DDisseny de la GUIisseny de la GUI
2.2. Tipus de formulació de la consultaTipus de formulació de la consulta
Consulta basada en imatge exempleConsulta basada en imatge exemple
1616
DDisseny de la GUIisseny de la GUI
3.3. Configurar la consulta pel motor de cercaConfigurar la consulta pel motor de cerca
Formulació de la consultaFormulació de la consulta
1717
DDisseny de la GUIisseny de la GUI
4.4. Visualització dels resultatsVisualització dels resultats
Imatge destacadaImatge destacada
1818
Imatge destacadaImatge destacada
Graella de resultatsGraella de resultats
DDisseny de la GUIisseny de la GUI
5.5. Disposar de mètodes de refinament de la consultaDisposar de mètodes de refinament de la consulta
Resultat com a nova imatge de consultaResultat com a nova imatge de consulta
1919
DDisseny de la GUIisseny de la GUI
6.6. Incloure documentació/ajuda a l’usuari (multilingüe)Incloure documentació/ajuda a l’usuari (multilingüe)
Manual d’ajudaManual d’ajuda
2020
DDisseny de la GUIisseny de la GUI
Com busca el GOS?Com busca el GOS?
DEMO :DEMO : Veure elements i funcionalitatsVeure elements i funcionalitats
directament en l’aplicació.directament en l’aplicació.
2121
directament en l’aplicació.directament en l’aplicació.
Vídeo demostratiu disponible a la web:Vídeo demostratiu disponible a la web:
http://gpshttp://gps--tsc.upc.es/imatge/i3media/tsc.upc.es/imatge/i3media/
* Més informació al Manual d’usuari.* Més informació al Manual d’usuari.
FFutur del GOSutur del GOS
Seguir l’evolució de les tècniques de recuperació deSeguir l’evolució de les tècniques de recuperació de
contingut :contingut :
Cerca d’imatges basada en regionsCerca d’imatges basada en regions
Utilitzar i combinar més d’un tipus de consultaUtilitzar i combinar més d’un tipus de consulta
2222
Eliminar limitacions:Eliminar limitacions: configuració noconfiguració no hardhard--codedcoded, execució, execució
multiplataforma, càlcul automàtic de descriptors visuals permultiplataforma, càlcul automàtic de descriptors visuals per
imatges noves.imatges noves.
Ampliar funcionalitats:Ampliar funcionalitats: gestió dels resultats (paginació, novesgestió dels resultats (paginació, noves
eines de selecció, etc.)eines de selecció, etc.)
Test d’usabilitat:Test d’usabilitat: acordat test d’usuari amb TV3.acordat test d’usuari amb TV3.
CConclusionsonclusions
Importància de la GUI :Importància de la GUI : unió de funcionalitat i estètica.unió de funcionalitat i estètica.
Aplicació a la indústria audiovisual:Aplicació a la indústria audiovisual: creació de novescreació de noves
eines d’accés a continguteines d’accés a contingut gran interés de les empresesgran interés de les empreses..
Servei remot:Servei remot: tendència d’aplicacions modulars itendència d’aplicacions modulars i
2323
Servei remot:Servei remot: tendència d’aplicacions modulars itendència d’aplicacions modulars i
integrables.integrables.
Treball interdisciplinar:Treball interdisciplinar: noves tecnologies (TIC),noves tecnologies (TIC),
comunicació, mitjans audiovisuals.comunicació, mitjans audiovisuals.
Gràcies per la vostra atenció.Gràcies per la vostra atenció.
Podeu seguir l’evolució del projecte a:Podeu seguir l’evolució del projecte a:
http://bitsearch.blogspot.com/http://bitsearch.blogspot.com/
"Les imatges televisives utilitzades en aquesta presentació són propietat de TVC,"Les imatges televisives utilitzades en aquesta presentació són propietat de TVC,
Televisió de Catalunya, SA, i contenen copyright. Aquestes imatges han estatTelevisió de Catalunya, SA, i contenen copyright. Aquestes imatges han estat
proporcionades amb la finalitat exclusiva d’investigació pel projecte i3media”proporcionades amb la finalitat exclusiva d’investigació pel projecte i3media”
Interfaz gráfica de usuario para la búsqueda de imágenes basada en imágenes

Mais conteúdo relacionado

Semelhante a Interfaz gráfica de usuario para la búsqueda de imágenes basada en imágenes

Render i renderitzar
Render i renderitzarRender i renderitzar
Render i renderitzarsergidpm
 
Pr3 ex2 oral_latino_navarrocarolina
Pr3 ex2 oral_latino_navarrocarolinaPr3 ex2 oral_latino_navarrocarolina
Pr3 ex2 oral_latino_navarrocarolinaCarolina Latino
 
T1 ex1 gil
T1 ex1 gilT1 ex1 gil
T1 ex1 giljgilmars
 
somUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCsomUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCinLabFIB
 
Qüestionaris interactius i signatura
Qüestionaris interactius i signaturaQüestionaris interactius i signatura
Qüestionaris interactius i signaturaLocalret
 
Tobii baix cost
Tobii baix costTobii baix cost
Tobii baix costbaixcost
 
PRÀCTICA - Disseny d'Interfícies Multimèdia
PRÀCTICA - Disseny d'Interfícies MultimèdiaPRÀCTICA - Disseny d'Interfícies Multimèdia
PRÀCTICA - Disseny d'Interfícies MultimèdiaRosa Suñé Barniol
 
Arquitectura de la Información - Pràctica - Lidia Bria
Arquitectura de la Información - Pràctica -  Lidia BriaArquitectura de la Información - Pràctica -  Lidia Bria
Arquitectura de la Información - Pràctica - Lidia BriaLidia Bria
 
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...uzielero
 
Comparativa ERPs de programari lliure
Comparativa ERPs de programari lliureComparativa ERPs de programari lliure
Comparativa ERPs de programari lliureejordi
 
1 introducción a windows xp
1 introducción a windows xp1 introducción a windows xp
1 introducción a windows xplinmei
 
Introducció al desenvolupament d’aplicacions per a i os ctug
Introducció al desenvolupament d’aplicacions per a i os   ctugIntroducció al desenvolupament d’aplicacions per a i os   ctug
Introducció al desenvolupament d’aplicacions per a i os ctugDigital Granollers
 
Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©David Delgado Vendrell
 
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdf
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdfTreball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdf
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdfaNDREUETgARCIA
 
Fll tecnologia
Fll tecnologiaFll tecnologia
Fll tecnologia22verd
 

Semelhante a Interfaz gráfica de usuario para la búsqueda de imágenes basada en imágenes (20)

Ifcd0210 cat
Ifcd0210 catIfcd0210 cat
Ifcd0210 cat
 
Render i renderitzar
Render i renderitzarRender i renderitzar
Render i renderitzar
 
Pr3 ex2 oral_latino_navarrocarolina
Pr3 ex2 oral_latino_navarrocarolinaPr3 ex2 oral_latino_navarrocarolina
Pr3 ex2 oral_latino_navarrocarolina
 
Bloc3
Bloc3Bloc3
Bloc3
 
T1 ex1 gil
T1 ex1 gilT1 ex1 gil
T1 ex1 gil
 
somUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPCsomUPC: Integració de les intranets de la UPC
somUPC: Integració de les intranets de la UPC
 
Presentacio Eprojectes Web
Presentacio Eprojectes WebPresentacio Eprojectes Web
Presentacio Eprojectes Web
 
Programari Lliure UOC
Programari Lliure UOCProgramari Lliure UOC
Programari Lliure UOC
 
Qüestionaris interactius i signatura
Qüestionaris interactius i signaturaQüestionaris interactius i signatura
Qüestionaris interactius i signatura
 
Tobii baix cost
Tobii baix costTobii baix cost
Tobii baix cost
 
PRÀCTICA - Disseny d'Interfícies Multimèdia
PRÀCTICA - Disseny d'Interfícies MultimèdiaPRÀCTICA - Disseny d'Interfícies Multimèdia
PRÀCTICA - Disseny d'Interfícies Multimèdia
 
Arquitectura de la Información - Pràctica - Lidia Bria
Arquitectura de la Información - Pràctica -  Lidia BriaArquitectura de la Información - Pràctica -  Lidia Bria
Arquitectura de la Información - Pràctica - Lidia Bria
 
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...
Anàlisis, disseny i construcció d\’un robot educatiu basat en microcontrolado...
 
Comparativa ERPs de programari lliure
Comparativa ERPs de programari lliureComparativa ERPs de programari lliure
Comparativa ERPs de programari lliure
 
1 introducción a windows xp
1 introducción a windows xp1 introducción a windows xp
1 introducción a windows xp
 
Introducció al desenvolupament d’aplicacions per a i os ctug
Introducció al desenvolupament d’aplicacions per a i os   ctugIntroducció al desenvolupament d’aplicacions per a i os   ctug
Introducció al desenvolupament d’aplicacions per a i os ctug
 
Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©Introducció a la metodologia BIM, by DDV Arquitectura ©
Introducció a la metodologia BIM, by DDV Arquitectura ©
 
Linkat
LinkatLinkat
Linkat
 
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdf
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdfTreball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdf
Treball_Final_de_Grau_a_l_EPS_de_la_UIB - 14.09.22.pdf
 
Fll tecnologia
Fll tecnologiaFll tecnologia
Fll tecnologia
 

Mais de Universitat Politècnica de Catalunya

The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...Universitat Politècnica de Catalunya
 
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoTowards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoUniversitat Politècnica de Catalunya
 
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Universitat Politècnica de Catalunya
 
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosGeneration of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosUniversitat Politècnica de Catalunya
 
Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Universitat Politècnica de Catalunya
 
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya
 
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Universitat Politècnica de Catalunya
 
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Universitat Politècnica de Catalunya
 
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Universitat Politècnica de Catalunya
 
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Universitat Politècnica de Catalunya
 
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Universitat Politècnica de Catalunya
 
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Universitat Politècnica de Catalunya
 

Mais de Universitat Politècnica de Catalunya (20)

Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
Deep Generative Learning for All - The Gen AI Hype (Spring 2024)Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
Deep Generative Learning for All - The Gen AI Hype (Spring 2024)
 
Deep Generative Learning for All
Deep Generative Learning for AllDeep Generative Learning for All
Deep Generative Learning for All
 
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
The Transformer in Vision | Xavier Giro | Master in Computer Vision Barcelona...
 
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-NietoTowards Sign Language Translation & Production | Xavier Giro-i-Nieto
Towards Sign Language Translation & Production | Xavier Giro-i-Nieto
 
The Transformer - Xavier Giró - UPC Barcelona 2021
The Transformer - Xavier Giró - UPC Barcelona 2021The Transformer - Xavier Giró - UPC Barcelona 2021
The Transformer - Xavier Giró - UPC Barcelona 2021
 
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
Learning Representations for Sign Language Videos - Xavier Giro - NIST TRECVI...
 
Open challenges in sign language translation and production
Open challenges in sign language translation and productionOpen challenges in sign language translation and production
Open challenges in sign language translation and production
 
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in VideosGeneration of Synthetic Referring Expressions for Object Segmentation in Videos
Generation of Synthetic Referring Expressions for Object Segmentation in Videos
 
Discovery and Learning of Navigation Goals from Pixels in Minecraft
Discovery and Learning of Navigation Goals from Pixels in MinecraftDiscovery and Learning of Navigation Goals from Pixels in Minecraft
Discovery and Learning of Navigation Goals from Pixels in Minecraft
 
Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...Learn2Sign : Sign language recognition and translation using human keypoint e...
Learn2Sign : Sign language recognition and translation using human keypoint e...
 
Intepretability / Explainable AI for Deep Neural Networks
Intepretability / Explainable AI for Deep Neural NetworksIntepretability / Explainable AI for Deep Neural Networks
Intepretability / Explainable AI for Deep Neural Networks
 
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
Convolutional Neural Networks - Xavier Giro - UPC TelecomBCN Barcelona 2020
 
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
Self-Supervised Audio-Visual Learning - Xavier Giro - UPC TelecomBCN Barcelon...
 
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
Attention for Deep Learning - Xavier Giro - UPC TelecomBCN Barcelona 2020
 
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
Generative Adversarial Networks GAN - Xavier Giro - UPC TelecomBCN Barcelona ...
 
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
Q-Learning with a Neural Network - Xavier Giró - UPC Barcelona 2020
 
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
Language and Vision with Deep Learning - Xavier Giró - ACM ICMR 2020 (Tutorial)
 
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
Image Segmentation with Deep Learning - Xavier Giro & Carles Ventura - ISSonD...
 
Curriculum Learning for Recurrent Video Object Segmentation
Curriculum Learning for Recurrent Video Object SegmentationCurriculum Learning for Recurrent Video Object Segmentation
Curriculum Learning for Recurrent Video Object Segmentation
 
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
Deep Self-supervised Learning for All - Xavier Giro - X-Europe 2020
 

Interfaz gráfica de usuario para la búsqueda de imágenes basada en imágenes

  • 1. IInterfícienterfície GGràficaràfica d’d’ UUsuari per a lasuari per a la CCercaerca d’d’ IImatges basada enmatges basada en IImatgesmatges Projecte Final de CarreraProjecte Final de Carrera Enginyeria Tècnica de Telecomunicacions, Imatge i SoEnginyeria Tècnica de Telecomunicacions, Imatge i So EUETITEUETIT--UPCUPC d’d’ IImatges basada enmatges basada en IImatgesmatges GOSGOS -- GGraphicraphic OObjectbject SSearcherearcher Alumna: Silvia Cortés YusteAlumna: Silvia Cortés Yuste Tutor: Xavier Giró i NietoTutor: Xavier Giró i Nieto Juny 2009Juny 2009
  • 2. 1.1. Presentació del projectePresentació del projecte 2.2. Estat de l’artEstat de l’art 3.3. RequerimentsRequeriments ÍÍndexndex 22 4.4. Entorn de desenvolupamentEntorn de desenvolupament 5.5. Disseny de la interfície gràficaDisseny de la interfície gràfica 6.6. Futur del GOSFutur del GOS 7.7. ConclusionsConclusions
  • 3. PPresentació del projecteresentació del projecte Recuperació d’informació:Recuperació d’informació: gestió dels continguts.gestió dels continguts. Iniciativa I3media :Iniciativa I3media : implementació de tècniques d’anotació,implementació de tècniques d’anotació, indexació i recuperació de contingut audiovisual.indexació i recuperació de contingut audiovisual. Sistemes CBIRSistemes CBIR ((ContentContent--Based Image RetrievalBased Image Retrieval):): 33 Sistemes CBIRSistemes CBIR ((ContentContent--Based Image RetrievalBased Image Retrieval):): Consulta amb exemple:Consulta amb exemple: recuperar imatges/vídeos a partir d’unarecuperar imatges/vídeos a partir d’una imatge de consulta.imatge de consulta. Solventar deficiències cerca textual.Solventar deficiències cerca textual.
  • 4. PPresentació del projecteresentació del projecte Interfície gràfica d’usuari:Interfície gràfica d’usuari: Àrea de comunicació entreÀrea de comunicació entre usuariusuari –– màquinamàquina “Traductor”“Traductor” 44 Servei de cercaServei de cerca GUIGUIUsuariUsuari
  • 5. EEstat de l’ artstat de l’ art Importància de la HCIImportància de la HCI –– Human ComputerHuman Computer InteractionInteraction :: millorar la comunicació entre usuaris imillorar la comunicació entre usuaris i sistemes de documentació (informatitzats).sistemes de documentació (informatitzats). Àmbit per desenvolupar en els sistemes CBIR.Àmbit per desenvolupar en els sistemes CBIR. 55 Àmbit per desenvolupar en els sistemes CBIR.Àmbit per desenvolupar en els sistemes CBIR. 1.1. Què es buscaQuè es busca 2.2. On es buscaOn es busca 3.3. Com es buscaCom es busca PerspectivaPerspectiva usuariusuari PerspectivaPerspectiva sistema de cercasistema de cerca Punts claus d’una cercaPunts claus d’una cerca
  • 6. EEstat de l’ artstat de l’ art A.A. Interfícies ComercialsInterfícies Comercials Senzilles : Usuari no expertSenzilles : Usuari no expert AtractivesAtractives UsablesUsables B.B. Interfícies AcadèmiquesInterfícies Acadèmiques Complexes : Usuari expertComplexes : Usuari expert Poc atractivesPoc atractives FuncionalsFuncionals 66 GazoPa (QBIC)GazoPa (QBIC) HitachiHitachi www.gazopa.comwww.gazopa.com PhotobookPhotobook Vision and Modeling Group, MITVision and Modeling Group, MIT Media Laboratory, Cambridge, MA.Media Laboratory, Cambridge, MA.
  • 7. RRequerimentsequeriments Motor de cerca:Motor de cerca: Ruta de la imatge de consultaRuta de la imatge de consulta Arxiu de configuració (dades d’entrada)Arxiu de configuració (dades d’entrada) Directori dels resultatsDirectori dels resultats 77 Directori dels resultatsDirectori dels resultats UsuariUsuari Motor deMotor de cercacerca GOSGOS InteractivitatInteractivitat Crida ambCrida amb paràmetresparàmetres Dades entrada iDades entrada i sortidasortida (MPEG(MPEG--7/XML)7/XML)
  • 8. RRequerimentsequeriments Arxiu de Configuració (dades d’entrada) :Arxiu de Configuració (dades d’entrada) : Tipus de criteri de fusió (MinTipus de criteri de fusió (Min (AND)(AND), Max, Max (OR)(OR), Mitja, Pesos), Mitja, Pesos) Descriptors visuals (disseny de color, estructura de color,Descriptors visuals (disseny de color, estructura de color, textura homogènia, histograma de marges de textura)textura homogènia, histograma de marges de textura) 88 textura homogènia, histograma de marges de textura)textura homogènia, histograma de marges de textura) Pesos (si el criteri de fusió és “Pesos”)Pesos (si el criteri de fusió és “Pesos”) Espai de cerca (dominis)Espai de cerca (dominis) Número de resultatsNúmero de resultats Resultats (dades de sortida) :Resultats (dades de sortida) : llista de resultatsllista de resultats ordenats per grau de similitud amb la imatge exempleordenats per grau de similitud amb la imatge exemple (URI de la imatge, posició i puntuació).(URI de la imatge, posició i puntuació).
  • 9. EEntorn de desenvolupamentntorn de desenvolupament Entorn d’execució :Entorn d’execució : GNU/Linux: Local i remot.GNU/Linux: Local i remot. Estructura de fitxers i directoris rígida.Estructura de fitxers i directoris rígida. REMOTREMOT Xarxa IPXarxa IP 99 Entorn de treball :Entorn de treball : Aplicació en Java (requereix JRE 1.6 o superior).Aplicació en Java (requereix JRE 1.6 o superior). Independent de la plataforma.Independent de la plataforma. Llibreries per a crear interfícies gràfiques (AWT, SWING).Llibreries per a crear interfícies gràfiques (AWT, SWING). Filosofia de treball colaboratiu.Filosofia de treball colaboratiu. WebservicesWebservices: arquitectures modulars i integrables en xarxa.: arquitectures modulars i integrables en xarxa. LOCALLOCAL
  • 10. DDisseny de la GUIisseny de la GUI Àrees implicades en el disseny:Àrees implicades en el disseny: DissenyadorDissenyador Disseny Gràfic UsuariUsuari 1010 Ús industrial :Ús industrial : convergència entre interfície comercial iconvergència entre interfície comercial i acadèmica, dóna servei a empreses i investigadors.acadèmica, dóna servei a empreses i investigadors. DissenyadorDissenyador GUIGUI TecnologiaUsabilitat UsuariUsuari DesenvolupadorDesenvolupador
  • 11. DDisseny de la GUIisseny de la GUI Disseny gràfic:Disseny gràfic: imatge corporativa en tots els elementsimatge corporativa en tots els elements visuals.visuals. Estil com el GAT (Estil com el GAT (Graphic Annotation Tool)Graphic Annotation Tool) Logo (Logo (pointing dogpointing dog)) Look&Feel i iconesLook&Feel i icones 1111 Look&Feel i iconesLook&Feel i icones GATGAT GOSGOS
  • 12. DDisseny de la GUIisseny de la GUI Usabilitat:Usabilitat: organització dels elements iorganització dels elements i patrons de lecturapatrons de lectura en pantalla.en pantalla. 1212 eyetrackingeyetracking Patró FPatró F
  • 13. DDisseny de la GUIisseny de la GUI Tecnologia:Tecnologia: arquitectura jeràrquica d’elements Java.arquitectura jeràrquica d’elements Java. CRITERIS DE FUSIÓCRITERIS DE FUSIÓ Botons de criteris de fusióBotons de criteris de fusió PANELLS CONTENIDORSPANELLS CONTENIDORS 1313 Arbre desplegableArbre desplegable Espais de cercaEspais de cerca Ítems seleccionablesÍtems seleccionablesESPAI DE CERCAESPAI DE CERCA Descriptors visualsDescriptors visuals Casella selecció + Barra lliscantCasella selecció + Barra lliscant CRITERIS DE FUSIÓCRITERIS DE FUSIÓ GRAELLAGRAELLA DiapositivesDiapositives RESULTATSRESULTATS IMATGE DESTACADAIMATGE DESTACADA Casella selecció + Miniatura +Casella selecció + Miniatura + InformacióInformació Imatge + Botons navegació + Àrea de textImatge + Botons navegació + Àrea de text informativainformativa
  • 14. DDisseny de la GUIisseny de la GUI Criteris de disseny per a un sistema CBIRCriteris de disseny per a un sistema CBIR 1.1. Diferenciar àrea de consulta i àrea de resultatsDiferenciar àrea de consulta i àrea de resultats 2.2. Tipus de formulació de la consultaTipus de formulació de la consulta 1414 2.2. Tipus de formulació de la consultaTipus de formulació de la consulta 3.3. Configurar la consulta pel motor de cercaConfigurar la consulta pel motor de cerca 4.4. Visualització dels resultatsVisualització dels resultats 5.5. Disposar de mètodes de refinament de la consultaDisposar de mètodes de refinament de la consulta 6.6. Incloure documentació/ajuda a l’usuariIncloure documentació/ajuda a l’usuari
  • 15. DDisseny de la GUIisseny de la GUI 1.1. Diferenciar àrea de consulta i àrea de resultatsDiferenciar àrea de consulta i àrea de resultats 1515 Àrea de consultaÀrea de consulta Àrea de resultatsÀrea de resultats
  • 16. DDisseny de la GUIisseny de la GUI 2.2. Tipus de formulació de la consultaTipus de formulació de la consulta Consulta basada en imatge exempleConsulta basada en imatge exemple 1616
  • 17. DDisseny de la GUIisseny de la GUI 3.3. Configurar la consulta pel motor de cercaConfigurar la consulta pel motor de cerca Formulació de la consultaFormulació de la consulta 1717
  • 18. DDisseny de la GUIisseny de la GUI 4.4. Visualització dels resultatsVisualització dels resultats Imatge destacadaImatge destacada 1818 Imatge destacadaImatge destacada Graella de resultatsGraella de resultats
  • 19. DDisseny de la GUIisseny de la GUI 5.5. Disposar de mètodes de refinament de la consultaDisposar de mètodes de refinament de la consulta Resultat com a nova imatge de consultaResultat com a nova imatge de consulta 1919
  • 20. DDisseny de la GUIisseny de la GUI 6.6. Incloure documentació/ajuda a l’usuari (multilingüe)Incloure documentació/ajuda a l’usuari (multilingüe) Manual d’ajudaManual d’ajuda 2020
  • 21. DDisseny de la GUIisseny de la GUI Com busca el GOS?Com busca el GOS? DEMO :DEMO : Veure elements i funcionalitatsVeure elements i funcionalitats directament en l’aplicació.directament en l’aplicació. 2121 directament en l’aplicació.directament en l’aplicació. Vídeo demostratiu disponible a la web:Vídeo demostratiu disponible a la web: http://gpshttp://gps--tsc.upc.es/imatge/i3media/tsc.upc.es/imatge/i3media/ * Més informació al Manual d’usuari.* Més informació al Manual d’usuari.
  • 22. FFutur del GOSutur del GOS Seguir l’evolució de les tècniques de recuperació deSeguir l’evolució de les tècniques de recuperació de contingut :contingut : Cerca d’imatges basada en regionsCerca d’imatges basada en regions Utilitzar i combinar més d’un tipus de consultaUtilitzar i combinar més d’un tipus de consulta 2222 Eliminar limitacions:Eliminar limitacions: configuració noconfiguració no hardhard--codedcoded, execució, execució multiplataforma, càlcul automàtic de descriptors visuals permultiplataforma, càlcul automàtic de descriptors visuals per imatges noves.imatges noves. Ampliar funcionalitats:Ampliar funcionalitats: gestió dels resultats (paginació, novesgestió dels resultats (paginació, noves eines de selecció, etc.)eines de selecció, etc.) Test d’usabilitat:Test d’usabilitat: acordat test d’usuari amb TV3.acordat test d’usuari amb TV3.
  • 23. CConclusionsonclusions Importància de la GUI :Importància de la GUI : unió de funcionalitat i estètica.unió de funcionalitat i estètica. Aplicació a la indústria audiovisual:Aplicació a la indústria audiovisual: creació de novescreació de noves eines d’accés a continguteines d’accés a contingut gran interés de les empresesgran interés de les empreses.. Servei remot:Servei remot: tendència d’aplicacions modulars itendència d’aplicacions modulars i 2323 Servei remot:Servei remot: tendència d’aplicacions modulars itendència d’aplicacions modulars i integrables.integrables. Treball interdisciplinar:Treball interdisciplinar: noves tecnologies (TIC),noves tecnologies (TIC), comunicació, mitjans audiovisuals.comunicació, mitjans audiovisuals.
  • 24. Gràcies per la vostra atenció.Gràcies per la vostra atenció. Podeu seguir l’evolució del projecte a:Podeu seguir l’evolució del projecte a: http://bitsearch.blogspot.com/http://bitsearch.blogspot.com/ "Les imatges televisives utilitzades en aquesta presentació són propietat de TVC,"Les imatges televisives utilitzades en aquesta presentació són propietat de TVC, Televisió de Catalunya, SA, i contenen copyright. Aquestes imatges han estatTelevisió de Catalunya, SA, i contenen copyright. Aquestes imatges han estat proporcionades amb la finalitat exclusiva d’investigació pel projecte i3media”proporcionades amb la finalitat exclusiva d’investigació pel projecte i3media”