O documento analisa os modelos de recuperação de informação, discutindo o problema da grande quantidade de informação disponível, as soluções oferecidas por sistemas de recuperação de informação e definindo o que é recuperação de informação e o que constitui um documento neste contexto.
O documento fornece dicas para organizar um espaço de trabalho em casa de forma funcional e acolhedora. Ele destaca a importância de planejar adequadamente o layout, considerando todos os equipamentos necessários, e de investir em iluminação e mobiliário ergonômico que previnam problemas de saúde. A arquiteta também enfatiza a vantagem de ter um local reservado e isolado para o home office.
Montando seu DataCenter Pessoal - Fernando MassenTchelinux
O documento discute a montagem de um datacenter pessoal, citando motivações como armazenar arquivos digitais de forma organizada e disponível. Ele lista serviços úteis como FTP, HTTP, banco de dados e impressão. Também discute opções de sistemas operacionais como Linux, FreeBSD e formas de compartilhar arquivos entre sistemas.
O documento discute:
1) O que é um sistema de informação e como ele é composto por elementos interrelacionados;
2) As funções de um sistema de recuperação de informação, incluindo indexação, armazenamento e recuperação de dados;
3) Como os computadores influenciaram esses processos de indexação e recuperação ao automatizá-los.
O documento discute a introdução à recuperação de informação, definindo o tema e descrevendo os principais elementos de um sistema de recuperação, como a indexação e recuperação de documentos para atender consultas de usuários.
Aula 02 - Recuperação da Informação / Modelos de Sistemas de RecuperaçãoNilton Heck
O documento descreve os principais modelos de recuperação de informação, incluindo: (1) O modelo booleano, que representa documentos e consultas como vetores binários e fornece respostas binárias; (2) O modelo de espaço vetorial, que atribui pesos não-binários aos termos, permitindo casamento parcial e ordenação de resultados; (3) Medidas de similaridade como o co-seno são usadas para ordenar documentos de acordo com sua relevância à consulta.
Soft information retrieval / Modelos de recuperação alternativosVanessa Biff
O documento discute a aplicação da teoria dos conjuntos difusos e redes neurais na recuperação da informação de forma a representar a incerteza e imprecisão no processo. A teoria dos conjuntos difusos permite representações flexíveis dos documentos e consultas atribuindo pesos parciais aos termos. As redes neurais simulam o processamento neural para inferir documentos relacionados durante a pesquisa.
O documento descreve diferentes métodos para recuperar dados de discos rígidos em várias situações, incluindo formatação, vírus, defeitos físicos e lógicos. Softwares e hardwares especializados podem recuperar dados apagados ou de discos formatados, enquanto o tipo de vírus determina a abordagem. Defeitos físicos tornam a recuperação difícil, mas defeitos lógicos permitem muitas vezes consertar o disco.
Introdução Programação de Aplicações WebDiogo Benicá
O documento discute programação web, abordando comunicação entre cliente e servidor através do HTTP, métodos HTTP como GET, POST, PUT e DELETE, e uso de bancos de dados e formulários no lado do servidor.
O documento fornece dicas para organizar um espaço de trabalho em casa de forma funcional e acolhedora. Ele destaca a importância de planejar adequadamente o layout, considerando todos os equipamentos necessários, e de investir em iluminação e mobiliário ergonômico que previnam problemas de saúde. A arquiteta também enfatiza a vantagem de ter um local reservado e isolado para o home office.
Montando seu DataCenter Pessoal - Fernando MassenTchelinux
O documento discute a montagem de um datacenter pessoal, citando motivações como armazenar arquivos digitais de forma organizada e disponível. Ele lista serviços úteis como FTP, HTTP, banco de dados e impressão. Também discute opções de sistemas operacionais como Linux, FreeBSD e formas de compartilhar arquivos entre sistemas.
O documento discute:
1) O que é um sistema de informação e como ele é composto por elementos interrelacionados;
2) As funções de um sistema de recuperação de informação, incluindo indexação, armazenamento e recuperação de dados;
3) Como os computadores influenciaram esses processos de indexação e recuperação ao automatizá-los.
O documento discute a introdução à recuperação de informação, definindo o tema e descrevendo os principais elementos de um sistema de recuperação, como a indexação e recuperação de documentos para atender consultas de usuários.
Aula 02 - Recuperação da Informação / Modelos de Sistemas de RecuperaçãoNilton Heck
O documento descreve os principais modelos de recuperação de informação, incluindo: (1) O modelo booleano, que representa documentos e consultas como vetores binários e fornece respostas binárias; (2) O modelo de espaço vetorial, que atribui pesos não-binários aos termos, permitindo casamento parcial e ordenação de resultados; (3) Medidas de similaridade como o co-seno são usadas para ordenar documentos de acordo com sua relevância à consulta.
Soft information retrieval / Modelos de recuperação alternativosVanessa Biff
O documento discute a aplicação da teoria dos conjuntos difusos e redes neurais na recuperação da informação de forma a representar a incerteza e imprecisão no processo. A teoria dos conjuntos difusos permite representações flexíveis dos documentos e consultas atribuindo pesos parciais aos termos. As redes neurais simulam o processamento neural para inferir documentos relacionados durante a pesquisa.
O documento descreve diferentes métodos para recuperar dados de discos rígidos em várias situações, incluindo formatação, vírus, defeitos físicos e lógicos. Softwares e hardwares especializados podem recuperar dados apagados ou de discos formatados, enquanto o tipo de vírus determina a abordagem. Defeitos físicos tornam a recuperação difícil, mas defeitos lógicos permitem muitas vezes consertar o disco.
Introdução Programação de Aplicações WebDiogo Benicá
O documento discute programação web, abordando comunicação entre cliente e servidor através do HTTP, métodos HTTP como GET, POST, PUT e DELETE, e uso de bancos de dados e formulários no lado do servidor.
Este documento apresenta a biblioteca jQuery, que permite escrever menos código JavaScript para realizar tarefas comuns no DOM, como encontrar e alterar elementos HTML, ouvir eventos do usuário e animar conteúdo. Explica brevemente como o DOM representa a estrutura HTML e fornece exemplos de como selecionar e manipular elementos, adicionar eventos de clique e animações usando jQuery.
Tese de doutorado em CIência da Informação Análise de dominio Organizacional ...Célia Dias
1. O documento apresenta uma tese de doutorado sobre a análise do domínio organizacional na perspectiva arquivística utilizando a metodologia DIRKS.
2. O objetivo é mapear as entidades presentes nos instrumentos de coleta de dados da Metodologia DIRKS para a elaboração dos instrumentos de gestão de documentos.
3. A metodologia envolve a análise de 8 instrumentos DIRKS e a construção de um sistema categorial com categorias, subcategorias e entidades para representar o domínio organizacional.
O documento apresenta um seminário sobre Recuperação Social da Informação ministrado em uma disciplina de mestrado em Ciência da Informação. O seminário abordou os seguintes tópicos:
1) Definição e exemplos de técnicas de Recuperação Social da Informação;
2) Mudanças proporcionadas pelas redes sociais na internet, como a expressão e sociabilização online;
3) Exemplos de agregadores de redes sociais como sistemas que permitem acesso a várias redes sociais simultaneamente.
O documento apresenta uma introdução ao padrão MPEG-7, descrevendo sua estrutura e ferramentas para descrição de objetos multimídia, como vídeos. O MPEG-7 permite a indexação e recuperação desses conteúdos por meio de descritores que codificam características estruturais e semânticas. Sua estrutura em XML torna as descrições interoperáveis entre sistemas.
A coordenação de eventos como aspecto complementar à formação do profissional...Semana Biblioteconomia
O documento discute como a coordenação de eventos acadêmicos pode complementar a formação de profissionais da informação, desenvolvendo habilidades práticas como organização, comunicação e gerenciamento. A autora descreve sua experiência coordenando três Semanas de Biblioteconomia na ECA-USP entre 2008-2011.
Este artigo discute a identificação de conceitos como uma das etapas mais importantes do processo de análise de assunto para indexação. A autora explica que a identificação de conceitos envolve compreender o texto e selecionar os conceitos-chave que representam a essência do documento. Além disso, a autora observou dificuldades enfrentadas por indexadores na identificação de conceitos durante a leitura e revisou a literatura sobre o tema para investigar melhor como os conceitos podem ser identificados a partir da leitura, da tem
A documentação Jurídica no contexto do Centro de Documentação - Roseli MirandaSemana Biblioteconomia
Apresentação de Roseli Miranda sobre "A documentação Jurídica no contexto do Centro de Documentação" na mesa-redonda “Bibliotecários que atuam em Centros de Documentação” da V Semana de Biblioteconomia da ECA/USP. Data: 30 de setembro de 2010.
Este documento discute a interdisciplinaridade da análise de assunto, enfatizando como linguística, ciências cognitivas e lógica contribuem para o processo de indexação. Vários alunos apresentam como cada área apoia a análise, desde o estudo de morfologia e semântica na linguística até os processos cognitivos e estratégias de leitura. Os aspectos lógicos também são explicados, incluindo lógica formal, clássica e a semiótica geral de Pierce.
Seminário apresentado na matéria Informação e Cultura Pós-Graduação em Ciência da Informação da ECA/USP.
Temática: Ciência da Informação: histórico e delimitação do campo.
Textos abordados:
BUCKLAND, M.K. Information as thing. Journal of the American Society for Information Science (JASIS), v.45, n.5, p.351-360, 1991.
_______. What is a document? (JASIS 1997) - What is a digital document? (Document Numerique 1998)
FROHMANN, B. Revisiting ‘what is a document’ . Journal of Documentation, v.66, n.2, p.291-303. Disponível em: http://www.fims.uwo.ca/people/faculty/frohmann/Documents/Revisiting_JDOC.pdf
FROHMANN, B. O caráter social, material e público da informação. In FUJITA, M.S.L.; MARTELETO, R.M.; LARA, M.L.G., orgs. A dimensão epistemológia da Ciência da Informação e suas itnerfaces técnicas, políticas e institucionais nos processos de produção, acesso e disseminação da informação. São Paulo: Cultura Acadêmica Ed.; Marília: FUNDEPE, 2008. p.13-34.
Apresentação do artigo elaborado para a disciplina Recuperação Inteligente da Informação no Mestrado em Ciência da Informação da Universidade Federal de Santa Catarina.
Trabalho apresentado na disciplina Recuperação Inteligente da Informação no Mestrado em Ciência da Informação da Universidade Federal de Santa Catarina.
El documento describe los diferentes niveles de RAID (Redundant Array of Independent Disks), incluyendo los niveles estándar, anidados y propietarios. Explica brevemente cada uno de los niveles RAID más comunes como RAID 0, 1, 2, 3, 4 y 5, así como algunos niveles anidados y propietarios.
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticosFilipe Reis
Este documento discute os operadores booleanos e aspectos linguísticos que afetam a recuperação de informação. Apresenta os operadores AND, OR e NOT para refinar pesquisas e explica como polissemia, homonímia, sinonímia e ambiguidade influenciam os resultados de busca.
O documento descreve a origem e evolução da Ciência da Informação. Apresenta seus antecedentes históricos, como a Revolução Industrial e o trabalho de Paul Otlet e Henri La Fontaine, que criaram a primeira biblioteca universal. Também discute o surgimento dos sistemas automatizados de recuperação da informação e a gênese da Ciência da Informação como disciplina, relacionando-a à Teoria Matemática da Informação e ao uso de computadores. Por fim, aborda a natureza interdisciplinar da área e sua relação com a Biblioteconomia
Este documento discute critérios para preservação digital de informação científica no Brasil. Apresenta uma revisão da literatura sobre o assunto e identifica critérios usados internacionalmente. Também caracteriza as práticas atuais de preservação digital em instituições de pesquisa brasileiras e propõe um conjunto de critérios para adoção.
O documento discute regras e técnicas importantes para backups e restauração de dados, incluindo a importância de testar backups periodicamente, manter mídias e hardware em boas condições, fazer cópias de dados críticos, e garantir espaço suficiente em disco para restauração completa.
O documento discute as diferentes tipos de consultas de referência, incluindo:
1) Consultas administrativas e de orientação, sobre autor/título, de localização de fatos e material.
2) Consultas mutáveis, de pesquisa, residuais e irrespondíveis.
3) A análise de perguntas para categorização, avaliação do acervo e serviços.
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendaçãosaspi2
Este documento discute a aplicação de técnicas de mineração de dados em sistemas de recomendação. Apresenta os conceitos de sistemas de recomendação, mineração de dados, regras de associação e classificação baseada em associação. Propõe uma metodologia que utiliza algoritmos de classificação baseada em associação fuzzy para validação em um sistema de recomendação.
O documento discute sistemas de informação em saúde (SIS) e o Sistema Único de Saúde (SUS). Apresenta diagramas e gráficos sobre SIS e contextualiza os SIS, discutindo suas funções como planejamento, avaliação e tomada de decisão. Explora também como os SIS funcionam no nível da Estratégia Saúde da Família.
As classes de modelagem podem ser comparadas a moldes ou
formas que definem as características e os comportamentos dos
objetos criados a partir delas. Vale traçar um paralelo com o projeto de
um automóvel. Os engenheiros definem as medidas, a quantidade de
portas, a potência do motor, a localização do estepe, dentre outras
descrições necessárias para a fabricação de um veículo
Este documento apresenta a biblioteca jQuery, que permite escrever menos código JavaScript para realizar tarefas comuns no DOM, como encontrar e alterar elementos HTML, ouvir eventos do usuário e animar conteúdo. Explica brevemente como o DOM representa a estrutura HTML e fornece exemplos de como selecionar e manipular elementos, adicionar eventos de clique e animações usando jQuery.
Tese de doutorado em CIência da Informação Análise de dominio Organizacional ...Célia Dias
1. O documento apresenta uma tese de doutorado sobre a análise do domínio organizacional na perspectiva arquivística utilizando a metodologia DIRKS.
2. O objetivo é mapear as entidades presentes nos instrumentos de coleta de dados da Metodologia DIRKS para a elaboração dos instrumentos de gestão de documentos.
3. A metodologia envolve a análise de 8 instrumentos DIRKS e a construção de um sistema categorial com categorias, subcategorias e entidades para representar o domínio organizacional.
O documento apresenta um seminário sobre Recuperação Social da Informação ministrado em uma disciplina de mestrado em Ciência da Informação. O seminário abordou os seguintes tópicos:
1) Definição e exemplos de técnicas de Recuperação Social da Informação;
2) Mudanças proporcionadas pelas redes sociais na internet, como a expressão e sociabilização online;
3) Exemplos de agregadores de redes sociais como sistemas que permitem acesso a várias redes sociais simultaneamente.
O documento apresenta uma introdução ao padrão MPEG-7, descrevendo sua estrutura e ferramentas para descrição de objetos multimídia, como vídeos. O MPEG-7 permite a indexação e recuperação desses conteúdos por meio de descritores que codificam características estruturais e semânticas. Sua estrutura em XML torna as descrições interoperáveis entre sistemas.
A coordenação de eventos como aspecto complementar à formação do profissional...Semana Biblioteconomia
O documento discute como a coordenação de eventos acadêmicos pode complementar a formação de profissionais da informação, desenvolvendo habilidades práticas como organização, comunicação e gerenciamento. A autora descreve sua experiência coordenando três Semanas de Biblioteconomia na ECA-USP entre 2008-2011.
Este artigo discute a identificação de conceitos como uma das etapas mais importantes do processo de análise de assunto para indexação. A autora explica que a identificação de conceitos envolve compreender o texto e selecionar os conceitos-chave que representam a essência do documento. Além disso, a autora observou dificuldades enfrentadas por indexadores na identificação de conceitos durante a leitura e revisou a literatura sobre o tema para investigar melhor como os conceitos podem ser identificados a partir da leitura, da tem
A documentação Jurídica no contexto do Centro de Documentação - Roseli MirandaSemana Biblioteconomia
Apresentação de Roseli Miranda sobre "A documentação Jurídica no contexto do Centro de Documentação" na mesa-redonda “Bibliotecários que atuam em Centros de Documentação” da V Semana de Biblioteconomia da ECA/USP. Data: 30 de setembro de 2010.
Este documento discute a interdisciplinaridade da análise de assunto, enfatizando como linguística, ciências cognitivas e lógica contribuem para o processo de indexação. Vários alunos apresentam como cada área apoia a análise, desde o estudo de morfologia e semântica na linguística até os processos cognitivos e estratégias de leitura. Os aspectos lógicos também são explicados, incluindo lógica formal, clássica e a semiótica geral de Pierce.
Seminário apresentado na matéria Informação e Cultura Pós-Graduação em Ciência da Informação da ECA/USP.
Temática: Ciência da Informação: histórico e delimitação do campo.
Textos abordados:
BUCKLAND, M.K. Information as thing. Journal of the American Society for Information Science (JASIS), v.45, n.5, p.351-360, 1991.
_______. What is a document? (JASIS 1997) - What is a digital document? (Document Numerique 1998)
FROHMANN, B. Revisiting ‘what is a document’ . Journal of Documentation, v.66, n.2, p.291-303. Disponível em: http://www.fims.uwo.ca/people/faculty/frohmann/Documents/Revisiting_JDOC.pdf
FROHMANN, B. O caráter social, material e público da informação. In FUJITA, M.S.L.; MARTELETO, R.M.; LARA, M.L.G., orgs. A dimensão epistemológia da Ciência da Informação e suas itnerfaces técnicas, políticas e institucionais nos processos de produção, acesso e disseminação da informação. São Paulo: Cultura Acadêmica Ed.; Marília: FUNDEPE, 2008. p.13-34.
Apresentação do artigo elaborado para a disciplina Recuperação Inteligente da Informação no Mestrado em Ciência da Informação da Universidade Federal de Santa Catarina.
Trabalho apresentado na disciplina Recuperação Inteligente da Informação no Mestrado em Ciência da Informação da Universidade Federal de Santa Catarina.
El documento describe los diferentes niveles de RAID (Redundant Array of Independent Disks), incluyendo los niveles estándar, anidados y propietarios. Explica brevemente cada uno de los niveles RAID más comunes como RAID 0, 1, 2, 3, 4 y 5, así como algunos niveles anidados y propietarios.
Aula 2 Recuperação de Informação: operadores booleanos e aspectos linguísticosFilipe Reis
Este documento discute os operadores booleanos e aspectos linguísticos que afetam a recuperação de informação. Apresenta os operadores AND, OR e NOT para refinar pesquisas e explica como polissemia, homonímia, sinonímia e ambiguidade influenciam os resultados de busca.
O documento descreve a origem e evolução da Ciência da Informação. Apresenta seus antecedentes históricos, como a Revolução Industrial e o trabalho de Paul Otlet e Henri La Fontaine, que criaram a primeira biblioteca universal. Também discute o surgimento dos sistemas automatizados de recuperação da informação e a gênese da Ciência da Informação como disciplina, relacionando-a à Teoria Matemática da Informação e ao uso de computadores. Por fim, aborda a natureza interdisciplinar da área e sua relação com a Biblioteconomia
Este documento discute critérios para preservação digital de informação científica no Brasil. Apresenta uma revisão da literatura sobre o assunto e identifica critérios usados internacionalmente. Também caracteriza as práticas atuais de preservação digital em instituições de pesquisa brasileiras e propõe um conjunto de critérios para adoção.
O documento discute regras e técnicas importantes para backups e restauração de dados, incluindo a importância de testar backups periodicamente, manter mídias e hardware em boas condições, fazer cópias de dados críticos, e garantir espaço suficiente em disco para restauração completa.
O documento discute as diferentes tipos de consultas de referência, incluindo:
1) Consultas administrativas e de orientação, sobre autor/título, de localização de fatos e material.
2) Consultas mutáveis, de pesquisa, residuais e irrespondíveis.
3) A análise de perguntas para categorização, avaliação do acervo e serviços.
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendaçãosaspi2
Este documento discute a aplicação de técnicas de mineração de dados em sistemas de recomendação. Apresenta os conceitos de sistemas de recomendação, mineração de dados, regras de associação e classificação baseada em associação. Propõe uma metodologia que utiliza algoritmos de classificação baseada em associação fuzzy para validação em um sistema de recomendação.
O documento discute sistemas de informação em saúde (SIS) e o Sistema Único de Saúde (SUS). Apresenta diagramas e gráficos sobre SIS e contextualiza os SIS, discutindo suas funções como planejamento, avaliação e tomada de decisão. Explora também como os SIS funcionam no nível da Estratégia Saúde da Família.
As classes de modelagem podem ser comparadas a moldes ou
formas que definem as características e os comportamentos dos
objetos criados a partir delas. Vale traçar um paralelo com o projeto de
um automóvel. Os engenheiros definem as medidas, a quantidade de
portas, a potência do motor, a localização do estepe, dentre outras
descrições necessárias para a fabricação de um veículo
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...Faga1939
Este artigo tem por objetivo apresentar como ocorreu a evolução do consumo e da produção de energia desde a pré-história até os tempos atuais, bem como propor o futuro da energia requerido para o mundo. Da pré-história até o século XVIII predominou o uso de fontes renováveis de energia como a madeira, o vento e a energia hidráulica. Do século XVIII até a era contemporânea, os combustíveis fósseis predominaram com o carvão e o petróleo, mas seu uso chegará ao fim provavelmente a partir do século XXI para evitar a mudança climática catastrófica global resultante de sua utilização ao emitir gases do efeito estufa responsáveis pelo aquecimento global. Com o fim da era dos combustíveis fósseis virá a era das fontes renováveis de energia quando prevalecerá a utilização da energia hidrelétrica, energia solar, energia eólica, energia das marés, energia das ondas, energia geotérmica, energia da biomassa e energia do hidrogênio. Não existem dúvidas de que as atividades humanas sobre a Terra provocam alterações no meio ambiente em que vivemos. Muitos destes impactos ambientais são provenientes da geração, manuseio e uso da energia com o uso de combustíveis fósseis. A principal razão para a existência desses impactos ambientais reside no fato de que o consumo mundial de energia primária proveniente de fontes não renováveis (petróleo, carvão, gás natural e nuclear) corresponde a aproximadamente 88% do total, cabendo apenas 12% às fontes renováveis. Independentemente das várias soluções que venham a ser adotadas para eliminar ou mitigar as causas do efeito estufa, a mais importante ação é, sem dúvidas, a adoção de medidas que contribuam para a eliminação ou redução do consumo de combustíveis fósseis na produção de energia, bem como para seu uso mais eficiente nos transportes, na indústria, na agropecuária e nas cidades (residências e comércio), haja vista que o uso e a produção de energia são responsáveis por 57% dos gases de estufa emitidos pela atividade humana. Neste sentido, é imprescindível a implantação de um sistema de energia sustentável no mundo. Em um sistema de energia sustentável, a matriz energética mundial só deveria contar com fontes de energia limpa e renováveis (hidroelétrica, solar, eólica, hidrogênio, geotérmica, das marés, das ondas e biomassa), não devendo contar, portanto, com o uso dos combustíveis fósseis (petróleo, carvão e gás natural).
Este certificado confirma que Gabriel de Mattos Faustino concluiu com sucesso um curso de 42 horas de Gestão Estratégica de TI - ITIL na Escola Virtual entre 19 de fevereiro de 2014 a 20 de fevereiro de 2014.
Em um mundo cada vez mais digital, a segurança da informação tornou-se essencial para proteger dados pessoais e empresariais contra ameaças cibernéticas. Nesta apresentação, abordaremos os principais conceitos e práticas de segurança digital, incluindo o reconhecimento de ameaças comuns, como malware e phishing, e a implementação de medidas de proteção e mitigação para vazamento de senhas.
1. Análise dos Modelos de
Recuperação de Informação
Diogo
Benicá
Pereira
Trabalho
para
Conclusão
de
Curso
|
Orientador:
André
Marcos
da
Silva
Faculdade
Campo
Limpo
Paulista
Faculdade
Campo
Limpo
Paulista Dez/2012 01
2. qual o problema?
Muita
informação!
Não
é
fácil
encontrar
um
dado
relevante
no
meio
de
tanta
informação.
Faculdade
Campo
Limpo
Paulista Dez/2012 02
3. qual a solução?
Documentos Necessidade
Sistemas
de
Recuperação
de
Informação Perda de
Informação
Especificação
Indexação
da Consulta
Para
a
tarefa
de
buscar
informação
relevante
dentro
de
Representação
Índices dos Documentos Consultas
um
conjunto
de
documentos
documentos.
Recuperação
Lista de Documentos
Faculdade
Campo
Limpo
Paulista Dez/2012 03
4. o que é IR?
“
Informa;on
Retrieval
“
Encontrar
material
de
natureza
não-‐estruturada
que
saQsfaz
uma
informação
requerida
a
parQr
de
grandes
coleções.
- Mainning
Faculdade
Campo
Limpo
Paulista Dez/2012 04
5. o que é um documento?
Um
documento
pode
ser
qualquer
unidade
Um
texto
inteiro,
um
capítulo,
um
parágrago,
etc.
Lorem
164. cupidatat
A
escolha
depende
do
resultado
desejado
Faculdade
Campo
Limpo
Paulista Dez/2012 05
165. como funciona?
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 06
166. modelo booleano
Álgebra
booleana
Sistema
para
manipular
regras
e
símbolos.
Lógica
aristotélica
AQngir
conhecimento
sem
contradição.
Verdadeiro
ou
Falso
Faculdade
Campo
Limpo
Paulista Dez/2012 07
167. modelo booleano
Expressões
booleanas
termo1
AND
(termo2
OR
termo3)
ex.
“Recuperação”
AND
(“Informação”
OR
“Texto”)
termo1
n
unidades
termo2
ex.
“Recuperação”
5
unidades
“Informação”
Faculdade
Campo
Limpo
Paulista Dez/2012 08
168. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 09
169. modelo vetorial
Resultados
parciais
Uso
de
pesos
nos
termos
para
determinar
quanto
cada
documento
é
semelhante
à
expressão
de
busca.
Tudo
são
vetores
Documentos
e
expressões
de
busca
são
representados
como
vetores.
Documento Peso
termo1 Peso
termo2 Peso
termo3 Peso
termo4
Faculdade
Campo
Limpo
Paulista Dez/2012 10
170. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 11
171. modelo probabilistíco
Teoria
da
probabilidade
Experimentos
aleatórios
em
condições
iguais
com
resultados
diferentes.
Probabilidade
de
um
evento
Evento 1
Resultados
possíveis 6
Faculdade
Campo
Limpo
Paulista Dez/2012 12
172. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 13
173. modelo booleano estendido
União
do
modelo
booleano
e
do
vetorial
Junta
a
potencialidade
do
booleano
com
a
precisão
do
vetorial.
Operadores
com
pesos
Os
operadores
(AND
e
OR)
também
possuem
pesos.
Faculdade
Campo
Limpo
Paulista Dez/2012 14
174. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 15
175. modelo fuzzy
Baseado
na
lógica
fuzzy
Opera
com
incerteza
e
verdade
parcial
Um
elemento
tem
um
grau
de
perQnência
em
um
conjunto.
cidade
1 75% 25% cidade
2
Cidade
1 Cidade
2
Elemento
Faculdade
Campo
Limpo
Paulista Dev/2012 16
176. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 17
177. sistemas especialistas
Emula
a
especialização
humana
em
um
domínio
Entrada
de
conhecimento
a
parQr
de
especialistas.
Regras,
inferência
e
feedback
Através
de
regras
SE
-‐
ENTÃO
faz
inferência
e
adquire
mais
conhecimento
através
do
feedback
do
usuário.
Faculdade
Campo
Limpo
Paulista Dez/2012 18
178. como funciona
Modelos
de
Recuperação
Modelos
quan;ta;vos Modelos
dinâmicos
Booleano Sistemas
especialistas
Vetorial Redes
neurais
ProbabilísQco Algoritmos
genéQcos
Booleano
estendido
Fuzzy
Faculdade
Campo
Limpo
Paulista Dez/2012 19
179. redes neurais
Sistema
modelando
os
circuitos
cerebrais
Procura
obter
um
comportamento
inteligente.
Vários
neurônios
formam
uma
rede
neural
Cada
neurônio
tem
várias
entradas
e
uma
função
que
transforma
em
uma
saída.
Capacidade
de
aprender
com
exemplos
Melhora
gradual
de
desempenho
através
de
inferências.
Faculdade
Campo
Limpo
Paulista Dez/2012 20
180. algoritmos genéticos
Baseado
na
teoria
evolucionista
de
Darwin
Seleção
natural
Os
algoritmos
se
“reproduzem”
e
se
adaptam
para
que
cada
geração
seja
melhor
em
resolver
o
problema.
Faculdade
Campo
Limpo
Paulista Dez/2012 21
181. na prática
Análise
dos
modelos
Criação
de
protóQpos
dos
modelos
booleano,
vetorial
e
booleano
estendido.
Comparação
Análise
do
tempo
de
execução,
uso
de
memória
e
qualidade
de
resultado.
Ambiente
PHP
5.3
(executado
no
terminal).
Faculdade
Campo
Limpo
Paulista Dez/2012 22
182. na prática (documento)
Documentos
Cada
modelo
será
testado
com
9
diferentes
documentos
de
texto.
Os
documentos
têm
aproximadamente
150,
900
e
1800
palavras.
Expressão
de
busca
Para
cada
grupo
de
documentos
será
aplicada
uma
expressão
de
busca
com
3
e
depois
6
termos.
Ex:
termo1
AND
termo2
OR
termo3
termo1
AND
(termo2
OR
termo3)
AND
termo4
OR
(termo5
AND
termo6)
Faculdade
Campo
Limpo
Paulista Dez/2012 23
183. resultados (Modelo
booleano)
Uso
de
Memória Tempo
de
Execução
150 palavras 900 palavras 1800 palavras 150 palavras 900 palavras 1800 palavras
0,00019
1000 kb 947
kb 947
kb 0,00019 s
0,00016
0,00015
0,00014
750 kb 681
kb 681
kb 0,00014 s
0,00012
500 kb 458
kb 458
kb 0,00010 s 0,00009
250 kb 0,00005 s
0 kb 0s
3 termos 6 termos 3 termos 6 termos
Faculdade
Campo
Limpo
Paulista Dez/2012 24
184. resultados (Modelo
vetorial)
Uso
de
Memória Tempo
de
Execução
150 palavras 900 palavras 1800 palavras 150 palavras 900 palavras 1800 palavras
1000 kb 967
kb 967
kb 0,02000 s
0,01753 0,01775
750 kb 697
kb 697
kb 0,01500 s
500 kb 465
kb 465
kb 0,01000 s 0,00890 0,00903
250 kb 0,00500 s
0,00221 0,00222
0 kb 0s
3 termos 6 termos 3 termos 6 termos
Faculdade
Campo
Limpo
Paulista Dez/2012 25
185. resultados (Modelo
booleano
estendido)
Uso
de
Memória Tempo
de
Execução
150 palavras 900 palavras 1800 palavras 150 palavras 900 palavras 1800 palavras
1000 kb 967
kb 967
kb 0,03000 s 0,02676 0,02681
750 kb 697
kb 697
kb 0,02250 s
0,01511 0,01513
500 kb 465
kb 465
kb 0,01500 s
250 kb 0,00750 s
0,00328 0,00332
0 kb 0s
3 termos 6 termos 3 termos 6 termos
Faculdade
Campo
Limpo
Paulista Dez/2012 26
186. conclusões (experimento)
Modelo
booleano
é
muito
rápido!
Seguido
do
modelo
vetorial
e
depois
o
modelo
booleano
estendido.
Modelo
booleano
estendido
tem
melhores
resultados
Crescimento
linear
de
memória
e
tempo
Todos
os
modelos
apresentaram
um
crescimento
linear
em
relação
ao
tamanho
dos
documento.
Faculdade
Campo
Limpo
Paulista Dez/2012 27
187. conclusões (geral)
Modelos
quan;ta;vos
estão
consolidados
Presentes
na
web
e
na
maioria
dos
sistemas
de
recuperação.
Modelos
dinâmicos
ainda
são
complexos
Dircil
implementação
e
de
domínio
específico.
Modelos
quan;ta;vos
não
são
tolerantes
à
falhas
Erros
de
gramáQca,
semânQca
e
cultura
não
são
levados
em
conta.
Faculdade
Campo
Limpo
Paulista Dez/2012 28