Análise e Comparação de
Métricas de Similaridade
Sumário
•   Introdução
•   Motivação
•   Objetivos
•   CBIR
•   Consultas por Similaridade
•   Extração de Características
•   Funções de Distância
•   Medidas de Avaliação
•   Metodologia Experimental
•   Resultados
•   Trabalhos Futuros
•   Conclusão                     2
• Problema de busca textual pode ser muito
  imprecisa.
• Utiliza sistemas CBIR (Content-based Image
  Retrieval).
• Extrair as características e aplicar as funções
  de distância retornando a similaridade.

                                                    3
• O avanço tecnológico promoveu um aumento nas
  bases de dados em diversas áreas do conhecimento.
• Incentivando o desenvolvimento de ferramentas para a
  recuperação de imagens.
• Utiliza características ajustadas visando diminuir o
  gap semântico.


                                                     4
• Analisar o relacionamento entre uma dada
  função de distância e as características
  extraídas das imagens.
• Resaltando que o objetivo não é substituir o
  médico no diagnóstico dado ao paciente.

                                             5
6
• Representar de forma numérica sucinta de uma
  imagem ou parte dela (região de interesse)
• COR
  Histograma de Níveis de Cinza
• FORMA
  Momentos de Zernike
• TEXTURA
  Matrizes de Co-ocorrência
                                             7
• Leva em conta o quanto duas imagens são
  parecidas entre si feitas por uma função que
  retorna o valor de distância entre elas.
• A representação de uma imagem através de
  suas características não é suficiente para
  determinar a similaridade.

                                                 8
• Na literatura são encontrados vários tipos de funções
  de distância como por exemplo: Família Minkowsky,
  Mahalanobis, Canberra, Quadrática, Correlação e
  Chi-quadrado.
• Euclidiana
   o Intuitiva
   o Mais utilizada
                                                          9
Função de Distância




10         15              20
                                10
11
• Uma abordagem bastante simples e difundida
  para avaliar e analisar os resultados são os
  conceitos de Precisão e Revocação.
                    Conj. Recuperado Relevantes


                                        Conj. Recuperado
Conj. Relevantes




                                                           12
• Base ALOI




              13
• Base Imagens Médicas




                         14
• Foram extraídos as 3 características das imagens.
• Aplica-se as 4 funções de distâncias
  implementadas.
• Gera-se várias consultas por similaridade.
• Com os resultados das consultas aplica-se a
  formula de precisão.

                                                 15
80.00%



70.00%                                                                          67.18%



60.00%
                    55.90%
                                         52.28%
         49.80%                                              50.12%        49.90%
50.00%                       47.79%               46.75%
              44.44%              43.61%                              43.13%
                                                                                         Histograma de níveis de Cinza
40.00%                                                 38.37%
                                                                                         Matriz de Co-ocorrência
                                                                                         Momentos de Zernike
30.00%



20.00%



10.00%



 0.00%
                                                                                                           16
             Manhattan           Euclidiana          Cherbyschev          Camberra
80.00%




70.00%                                                                                                    67.18%



60.00%
                                                                               55.90%
                                                                                        52.28%
         49.80%                                                       49.90%                     50.12%
50.00%            47.79%
                           46.75%
                                             44.44% 43.61%
                                    43.13%
                                                                                                                   Manhattan
40.00%                                                       38.37%                                                Eucli
                                                                                                                   Cherbyschev
                                                                                                                   Camberra
30.00%




20.00%




10.00%




 0.00%
                                                                                                                    17
          Histograma de níveis de Cinza         Matriz de Co-ocorrência            Momentos de Zernike
60.00%
         57.05%                                                       56.73%


                             50.33%
50.00%                                                                     48.70%



              41.02%
                                         39.55%   40.13%
40.00%
                                  36.29%
                    35.31%

                                                             31.92%             32.44%
                                                                                         Histograma de níveis de Cinza
30.00%                                                 28.50%
                                                                                         Matriz de Co-ocorrência
                                                                                         Momentos de Zernike


20.00%




10.00%




 0.00%
                                                                                                           18
             Manhattan           Euclidiana          Cherbyschev          Camberra
60.00%
         57.05%                     56.73%


                  50.33%
50.00%                                                                  48.70%



                                             41.02%
                           40.13%                                                         39.55%
40.00%
                                                      36.29%
                                                                                 35.31%

                                                                                                   31.92% 32.44%
                                                                                                                   Manhattan
30.00%                                                         28.50%                                              Euclidiana
                                                                                                                   Cherbyschev
                                                                                                                   Camberra

20.00%




10.00%




 0.00%
                                                                                                                    19
          Histograma de níveis de Cinza         Matriz de Co-ocorrência              Momentos de Zernike
• Implementar novas funções de distâncias e
  extratores.
• Técnicas que interagem com a percepção
  humana (Relevance Feedback).
• Técnicas de refinamento das pesquisas.


                                              20
21
BUENO, J. M. Suporte à Recuperação de Imagens Medica baseada
em Conteúdo através de Histogramas Métricos. Dissertação (Tese de
doutorado) — Universidade de São Paulo, 2002.
BUGATTI, P. H. Content-based retrieval of medical images by
continuous feature selection, 2008.
FELIPE, J. C. Desenvolvimento de métodos para
extração, comparação e analise de características intrínsecas de
imagens medicas, visando à recuperação perceptual por conteúdo.
Dissertação (Doutorado) — Universidade de S ao Paulo, S ao Carlos -
SP, 2005.
HARALICK, R. M. Statistical and structural approaches to texture.
Proceedings of The IEEE, v. 67, p. 786–804, 1979.
HARALICK, R. M.; SHANMUGAN, K.; DINSTEIN, I. Textural features
for image classification. IEEE Transactions on Systems, Man, and
Cybernetics, v. 3, p. 610–621, 1973.

                                                              22
SMEULDERS, A. W. M. et al. Content-based image retrieval at the
end of the early years. IEEE Trans. Pattern Anal. Mach. Intell., IEEE
Computer Society, Washington, DC, USA, v. 22, p. 1349–
1380, December 2000. ISSN 0162-8828. Disponível em:
<http://portal.acm.org/citation.cfm?id=357871.357873>.
SONKA M., H. V. e. B. R. Image Processing: Analysis and Machine
Vision. 1998. 786–804 p.
WILSON, D. R.; MARTINEZ, T. R. Improved heterogeneous
distance functions. J. Artif. Int. Res., AI Access Foundation, USA, v.
6, p. 1–34, January 1997. ISSN 1076-9757.
Disponível em:
<http://portal.acm.org/citation.cfm?id=1622767.1622768>.
ZHANG, C. et al. Webssql - a query language for multimedia web
documents. Advances in Digital Libraries Conference, IEEE, IEEE
Computer Society, Los Alamitos, CA, USA, v. 0, p. 58, 2000.
                                                                  23

Analise e comparação de métricas de similaridade

  • 1.
    Análise e Comparaçãode Métricas de Similaridade
  • 2.
    Sumário • Introdução • Motivação • Objetivos • CBIR • Consultas por Similaridade • Extração de Características • Funções de Distância • Medidas de Avaliação • Metodologia Experimental • Resultados • Trabalhos Futuros • Conclusão 2
  • 3.
    • Problema debusca textual pode ser muito imprecisa. • Utiliza sistemas CBIR (Content-based Image Retrieval). • Extrair as características e aplicar as funções de distância retornando a similaridade. 3
  • 4.
    • O avançotecnológico promoveu um aumento nas bases de dados em diversas áreas do conhecimento. • Incentivando o desenvolvimento de ferramentas para a recuperação de imagens. • Utiliza características ajustadas visando diminuir o gap semântico. 4
  • 5.
    • Analisar orelacionamento entre uma dada função de distância e as características extraídas das imagens. • Resaltando que o objetivo não é substituir o médico no diagnóstico dado ao paciente. 5
  • 6.
  • 7.
    • Representar deforma numérica sucinta de uma imagem ou parte dela (região de interesse) • COR Histograma de Níveis de Cinza • FORMA Momentos de Zernike • TEXTURA Matrizes de Co-ocorrência 7
  • 8.
    • Leva emconta o quanto duas imagens são parecidas entre si feitas por uma função que retorna o valor de distância entre elas. • A representação de uma imagem através de suas características não é suficiente para determinar a similaridade. 8
  • 9.
    • Na literaturasão encontrados vários tipos de funções de distância como por exemplo: Família Minkowsky, Mahalanobis, Canberra, Quadrática, Correlação e Chi-quadrado. • Euclidiana o Intuitiva o Mais utilizada 9
  • 10.
  • 11.
  • 12.
    • Uma abordagembastante simples e difundida para avaliar e analisar os resultados são os conceitos de Precisão e Revocação. Conj. Recuperado Relevantes Conj. Recuperado Conj. Relevantes 12
  • 13.
  • 14.
    • Base ImagensMédicas 14
  • 15.
    • Foram extraídosas 3 características das imagens. • Aplica-se as 4 funções de distâncias implementadas. • Gera-se várias consultas por similaridade. • Com os resultados das consultas aplica-se a formula de precisão. 15
  • 16.
    80.00% 70.00% 67.18% 60.00% 55.90% 52.28% 49.80% 50.12% 49.90% 50.00% 47.79% 46.75% 44.44% 43.61% 43.13% Histograma de níveis de Cinza 40.00% 38.37% Matriz de Co-ocorrência Momentos de Zernike 30.00% 20.00% 10.00% 0.00% 16 Manhattan Euclidiana Cherbyschev Camberra
  • 17.
    80.00% 70.00% 67.18% 60.00% 55.90% 52.28% 49.80% 49.90% 50.12% 50.00% 47.79% 46.75% 44.44% 43.61% 43.13% Manhattan 40.00% 38.37% Eucli Cherbyschev Camberra 30.00% 20.00% 10.00% 0.00% 17 Histograma de níveis de Cinza Matriz de Co-ocorrência Momentos de Zernike
  • 18.
    60.00% 57.05% 56.73% 50.33% 50.00% 48.70% 41.02% 39.55% 40.13% 40.00% 36.29% 35.31% 31.92% 32.44% Histograma de níveis de Cinza 30.00% 28.50% Matriz de Co-ocorrência Momentos de Zernike 20.00% 10.00% 0.00% 18 Manhattan Euclidiana Cherbyschev Camberra
  • 19.
    60.00% 57.05% 56.73% 50.33% 50.00% 48.70% 41.02% 40.13% 39.55% 40.00% 36.29% 35.31% 31.92% 32.44% Manhattan 30.00% 28.50% Euclidiana Cherbyschev Camberra 20.00% 10.00% 0.00% 19 Histograma de níveis de Cinza Matriz de Co-ocorrência Momentos de Zernike
  • 20.
    • Implementar novasfunções de distâncias e extratores. • Técnicas que interagem com a percepção humana (Relevance Feedback). • Técnicas de refinamento das pesquisas. 20
  • 21.
  • 22.
    BUENO, J. M.Suporte à Recuperação de Imagens Medica baseada em Conteúdo através de Histogramas Métricos. Dissertação (Tese de doutorado) — Universidade de São Paulo, 2002. BUGATTI, P. H. Content-based retrieval of medical images by continuous feature selection, 2008. FELIPE, J. C. Desenvolvimento de métodos para extração, comparação e analise de características intrínsecas de imagens medicas, visando à recuperação perceptual por conteúdo. Dissertação (Doutorado) — Universidade de S ao Paulo, S ao Carlos - SP, 2005. HARALICK, R. M. Statistical and structural approaches to texture. Proceedings of The IEEE, v. 67, p. 786–804, 1979. HARALICK, R. M.; SHANMUGAN, K.; DINSTEIN, I. Textural features for image classification. IEEE Transactions on Systems, Man, and Cybernetics, v. 3, p. 610–621, 1973. 22
  • 23.
    SMEULDERS, A. W.M. et al. Content-based image retrieval at the end of the early years. IEEE Trans. Pattern Anal. Mach. Intell., IEEE Computer Society, Washington, DC, USA, v. 22, p. 1349– 1380, December 2000. ISSN 0162-8828. Disponível em: <http://portal.acm.org/citation.cfm?id=357871.357873>. SONKA M., H. V. e. B. R. Image Processing: Analysis and Machine Vision. 1998. 786–804 p. WILSON, D. R.; MARTINEZ, T. R. Improved heterogeneous distance functions. J. Artif. Int. Res., AI Access Foundation, USA, v. 6, p. 1–34, January 1997. ISSN 1076-9757. Disponível em: <http://portal.acm.org/citation.cfm?id=1622767.1622768>. ZHANG, C. et al. Webssql - a query language for multimedia web documents. Advances in Digital Libraries Conference, IEEE, IEEE Computer Society, Los Alamitos, CA, USA, v. 0, p. 58, 2000. 23