Aula 4Disciplina: Recuperação da Informação Letícia Strehl9 abr. 2009
Conteúdos da Aula 4Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de buscaComponente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de buscaComponente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)
Componente do processo de RI (4/6)A verbalização da necessidade de informação em uma seqüência de expressões de busca
Aspectos principais dos pedidos dos usuáriosAspecto semântico:  é o tópico de um pedido, apresenta o assunto que é a preocupação do usuário.Exemplo: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”.Aspecto pragmático:  diz respeito ao propósito do pedido do usuário, a finalidade para a qual a informação recuperada será utilizada.Exemplo: imagina-se que o usuário poderá precisar de uma busca exaustiva por todos os documentos relevantes; ou somente de uns poucos trabalhos altamente relevantes; ou ainda deseja recuperar apenas os documentos publicados recentemente.A entrevista de referência precisará esclarecer os dois aspectos.FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
Quando o pedido torna-se objeto de estratégia e tática de busca: definiçõesEstratégia de busca (como o ato da busca): um plano para a busca como um todoEstratégia de busca (como um área de estudo): o estudo da teoria, dos princípios e da prática de formular e usar táticas de buscaTática da busca: o movimento feito para melhorar uma busca
Tipos de busca em um SRIBusca por um item conhecidoBusca por uma informação específicaBusca por uma informação geralBusca exploratória pela base de dadosMEADOW, Charles T., Boyce, Bert , Kraft, Donald . Text Information Retrieval Systems. 2nd ed. San Diego: Academic Press, 2000.
Informações Essenciais para definição dos Elementos da BuscaInformações sobre:a base de dadosos procedimentos de buscao conhecimento anterior do pesquisador
A etapas de elaboração de expressões de buscaAnálise dos conceitosEleição dos termos de buscaSeleção dos recursos de busca
Análise dos conceitosDefinir os conceitos mais relevantes para o tema a ser pesquisado.Pergunta para auxiliar o usuário:Qual seria o título do artigo perfeito?SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
Exemplo de busca para a análise dos conceitosBusca por informações sobre: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
Uma solução caseira para identificar os conceitosFísica da matéria condensada experimental. Quais são: os materiais estudados?as propriedades e os fenômenos observados?as técnicas de análise empregadas?LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004. O Apêndice 2 apresenta algo semelhante.
Exemplo de um registro do INSPECMateriaisPropriedades e fenômenosTécnicas de análise
Eleição dos termos de buscaObjetivo: ampliar os conceitos com um maior número de termos possíveis, visando a recuperação de tudo que há sobre o tema.Fontes:o próprio usuário, através de seu conhecimento ou de artigos e livros que ele tenha como referênciaos tesauros e vocabulários controlados das bases de dadosos dicionários técnicos, de sinônimos, manuais, etc.SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
Exemplo de busca para a eleição dos termosTermos:SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
A rotina de seleção dos termosFIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
Seleção dos recursos de busca: DefiniçãoRecursos desenvolvidos com a finalidade de atender a um ambiente baseado em texto, onde o usuário não sabe de antemão quais são os documentos cobertos pela base de dados ou desconhece os termos a partir dos quais os registros podem ser recuperados.ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
Recursos de busca usuais (1)ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
Recursos de busca usuais (2)ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
Componente do processo de RI (5/6)A seqüência dos itens apresentados como um resultado da estratégia de busca
A seqüência dos itens apresentados como um resultado da estratégia de busca!104 mil
Componente do processo de RI (6/6)A medida em que os registros recuperados satisfazem a necessidade de informação do usuário
Uso da informaçãoO indivíduo seleciona mensagens entre um grupo de mensagens que recebe ou acompanha. Ele faz a escolha quando percebe uma relação significativa entre o conteúdo da mensagem e o problema que tem em mãos.Determinada pelo conhecimento e rede de referências do indivíduo, assim como conteúdo e forma da mensagemCHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
Relevância da informaçãoA principal tentativa de medir o produto da RI é o conceito de relevância.A relevância pode ser definida tendo como parâmetros duas perspectivas distintas:Do sistema: relacionamento entre os registros recuperados e o pedidoDo usuário: valor ou utilidade do registro para o usuárioMEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
Relacionamento X ValorExemplo:Como resultado de uma busca é recuperado um documento já conhecido pelo usuário e que está altamente relacionado com o assunto que motivou a pesquisa. Em termos de relacionamento, o documento satisfaz completamente o critério de relevância. Em termos de utilidade para o usuário, o valor é nulo, considerando que o documento não é capaz de fornecer nova informação.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
A relevância sob duas perspectivas:o sistema (1)A informação pode ser representada objetivamente, possibilitando a comparação entre a representação e a questão propostaComputa-se o número de correspondências entre os termos da pesquisa do usuário e os termos do documento, de modo a medir o grau de proximidade com o tema de pesquisa.CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
A relevância sob duas perspectivas:o sistema (2)LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática.   Brasília: Briquet de Lemos, 1993.
A relevância sob duas perspectivas:o usuárioA relevância é produto de uma relação construída pelo usuário entre a informação e a pesquisa. Deste modo, é:Subjetiva, dependente do julgamento humano;Cognitiva, dependente do conhecimento e da percepção do indivíduo;Situacional, relacionada com os problemas particulares de informação do usuário;Multidimensional, influenciada por variados fatores;Dinâmica, sujeita a constantes mudanças ao longo do tempo;Mensurável, pode ser observada num dado momento.CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
A medida da relevância (1)A relevância, seja qual for sua definição, é considerada a o principal parâmetro para avaliação da RI.Basicamente, três medidas compostas são utilizadas para analisá-la:PrecisãoRevocaçãoEficácia (menos utilizada)MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
A medida da relevância (2)MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
PrecisãoCapacidade de evitar documentos irrelevantesOnde:P= precisãoa=documentos relevante recuperadosb=documentos não relevantes recuperadosLANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática.   Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
RevocaçãoCapacidade de recuperar documentos relevantesOnde:R= revocaçãoa=documentos relevante recuperadosc=documentos relevantes não recuperadosLANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática.   Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
EficáciaCapacidade de recuperar itens relevantes e ignorar os irrelevantesOnde:E= eficáciaP=PrecisãoR=RevocaçãoUma das possíveis fórmulas para o cálculoMEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
Classes de uso da informação (Taylor)CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
O cuidado com a “supersimplificação”Risco, ver SEMPRE o usuário como alguém que quer:extrair informações específicas num curto espaço de tempo, OU, ao contrárioinvestir esforço para buscar e explorar informaçãoA verdade é que as pessoas oscilam continuamente entre extrair e explorar- O uso da informação é um processo confuso, desordenado, sujeitos aos caprichos humanos, como qualquer outra atividade - CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
Fim

Aula 4

  • 1.
    Aula 4Disciplina: Recuperaçãoda Informação Letícia Strehl9 abr. 2009
  • 2.
    Conteúdos da Aula4Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de buscaComponente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de buscaComponente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)
  • 3.
    Componente do processode RI (4/6)A verbalização da necessidade de informação em uma seqüência de expressões de busca
  • 4.
    Aspectos principais dospedidos dos usuáriosAspecto semântico: é o tópico de um pedido, apresenta o assunto que é a preocupação do usuário.Exemplo: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”.Aspecto pragmático: diz respeito ao propósito do pedido do usuário, a finalidade para a qual a informação recuperada será utilizada.Exemplo: imagina-se que o usuário poderá precisar de uma busca exaustiva por todos os documentos relevantes; ou somente de uns poucos trabalhos altamente relevantes; ou ainda deseja recuperar apenas os documentos publicados recentemente.A entrevista de referência precisará esclarecer os dois aspectos.FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
  • 5.
    Quando o pedidotorna-se objeto de estratégia e tática de busca: definiçõesEstratégia de busca (como o ato da busca): um plano para a busca como um todoEstratégia de busca (como um área de estudo): o estudo da teoria, dos princípios e da prática de formular e usar táticas de buscaTática da busca: o movimento feito para melhorar uma busca
  • 6.
    Tipos de buscaem um SRIBusca por um item conhecidoBusca por uma informação específicaBusca por uma informação geralBusca exploratória pela base de dadosMEADOW, Charles T., Boyce, Bert , Kraft, Donald . Text Information Retrieval Systems. 2nd ed. San Diego: Academic Press, 2000.
  • 7.
    Informações Essenciais paradefinição dos Elementos da BuscaInformações sobre:a base de dadosos procedimentos de buscao conhecimento anterior do pesquisador
  • 8.
    A etapas deelaboração de expressões de buscaAnálise dos conceitosEleição dos termos de buscaSeleção dos recursos de busca
  • 9.
    Análise dos conceitosDefiniros conceitos mais relevantes para o tema a ser pesquisado.Pergunta para auxiliar o usuário:Qual seria o título do artigo perfeito?SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 10.
    Exemplo de buscapara a análise dos conceitosBusca por informações sobre: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 11.
    Uma solução caseirapara identificar os conceitosFísica da matéria condensada experimental. Quais são: os materiais estudados?as propriedades e os fenômenos observados?as técnicas de análise empregadas?LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004. O Apêndice 2 apresenta algo semelhante.
  • 12.
    Exemplo de umregistro do INSPECMateriaisPropriedades e fenômenosTécnicas de análise
  • 13.
    Eleição dos termosde buscaObjetivo: ampliar os conceitos com um maior número de termos possíveis, visando a recuperação de tudo que há sobre o tema.Fontes:o próprio usuário, através de seu conhecimento ou de artigos e livros que ele tenha como referênciaos tesauros e vocabulários controlados das bases de dadosos dicionários técnicos, de sinônimos, manuais, etc.SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 14.
    Exemplo de buscapara a eleição dos termosTermos:SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).
  • 15.
    A rotina deseleção dos termosFIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link
  • 16.
    Seleção dos recursosde busca: DefiniçãoRecursos desenvolvidos com a finalidade de atender a um ambiente baseado em texto, onde o usuário não sabe de antemão quais são os documentos cobertos pela base de dados ou desconhece os termos a partir dos quais os registros podem ser recuperados.ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 17.
    Recursos de buscausuais (1)ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 18.
    Recursos de buscausuais (2)ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.
  • 19.
    Componente do processode RI (5/6)A seqüência dos itens apresentados como um resultado da estratégia de busca
  • 20.
    A seqüência dositens apresentados como um resultado da estratégia de busca!104 mil
  • 21.
    Componente do processode RI (6/6)A medida em que os registros recuperados satisfazem a necessidade de informação do usuário
  • 22.
    Uso da informaçãoOindivíduo seleciona mensagens entre um grupo de mensagens que recebe ou acompanha. Ele faz a escolha quando percebe uma relação significativa entre o conteúdo da mensagem e o problema que tem em mãos.Determinada pelo conhecimento e rede de referências do indivíduo, assim como conteúdo e forma da mensagemCHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 23.
    Relevância da informaçãoAprincipal tentativa de medir o produto da RI é o conceito de relevância.A relevância pode ser definida tendo como parâmetros duas perspectivas distintas:Do sistema: relacionamento entre os registros recuperados e o pedidoDo usuário: valor ou utilidade do registro para o usuárioMEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 24.
    Relacionamento X ValorExemplo:Comoresultado de uma busca é recuperado um documento já conhecido pelo usuário e que está altamente relacionado com o assunto que motivou a pesquisa. Em termos de relacionamento, o documento satisfaz completamente o critério de relevância. Em termos de utilidade para o usuário, o valor é nulo, considerando que o documento não é capaz de fornecer nova informação.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 25.
    A relevância sobduas perspectivas:o sistema (1)A informação pode ser representada objetivamente, possibilitando a comparação entre a representação e a questão propostaComputa-se o número de correspondências entre os termos da pesquisa do usuário e os termos do documento, de modo a medir o grau de proximidade com o tema de pesquisa.CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 26.
    A relevância sobduas perspectivas:o sistema (2)LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.
  • 27.
    A relevância sobduas perspectivas:o usuárioA relevância é produto de uma relação construída pelo usuário entre a informação e a pesquisa. Deste modo, é:Subjetiva, dependente do julgamento humano;Cognitiva, dependente do conhecimento e da percepção do indivíduo;Situacional, relacionada com os problemas particulares de informação do usuário;Multidimensional, influenciada por variados fatores;Dinâmica, sujeita a constantes mudanças ao longo do tempo;Mensurável, pode ser observada num dado momento.CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 28.
    A medida darelevância (1)A relevância, seja qual for sua definição, é considerada a o principal parâmetro para avaliação da RI.Basicamente, três medidas compostas são utilizadas para analisá-la:PrecisãoRevocaçãoEficácia (menos utilizada)MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 29.
    A medida darelevância (2)MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 30.
    PrecisãoCapacidade de evitardocumentos irrelevantesOnde:P= precisãoa=documentos relevante recuperadosb=documentos não relevantes recuperadosLANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 31.
    RevocaçãoCapacidade de recuperardocumentos relevantesOnde:R= revocaçãoa=documentos relevante recuperadosc=documentos relevantes não recuperadosLANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 32.
    EficáciaCapacidade de recuperaritens relevantes e ignorar os irrelevantesOnde:E= eficáciaP=PrecisãoR=RevocaçãoUma das possíveis fórmulas para o cálculoMEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).
  • 33.
    Classes de usoda informação (Taylor)CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 34.
    O cuidado coma “supersimplificação”Risco, ver SEMPRE o usuário como alguém que quer:extrair informações específicas num curto espaço de tempo, OU, ao contrárioinvestir esforço para buscar e explorar informaçãoA verdade é que as pessoas oscilam continuamente entre extrair e explorar- O uso da informação é um processo confuso, desordenado, sujeitos aos caprichos humanos, como qualquer outra atividade - CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2
  • 35.