Pesquisa Avançada
    na Internet
     Luís Vidigal
        2009
Porquê o nome Internet?


Interconnected Networks
              ou
 Internetwork System
    Começou a ser falada em 1973

...
Computadores a falar a mesma língua




1,6 biliões de utilizadores – 24% da população
Utilização da Internet e População Mundial
                                      31 de Março de 2009

                    ...
Utilizadores da Internet no Mundo
           Março 2009
% de Penetração dos Utilizadores da Internet no Mundo
                     Março 2009
Tempo de penetração tecnológica
100                                                 Televisão
                            ...
As TIC estão a invadir o mundo real
        “Pervasive computing”
Definições
• Pesquisar:
  – Efectuar um exame completo de
  – Olhar com cuidado para encontrar algo
• Resultados de Pesqui...
O que pesquisamos
• Para apoiar o negócio (Compras
  electrónicas, etc.)
• Para fins científicos (livros, jornais e
  arti...
Porque pesquisamos
•   Para ter resultados
•   Para poupar tempo
•   Para explorar recursos relacionados
•   Para facilita...
História da Pesquisa na Web
• 1990, Alan Emtage criou o Archie, uma das
  primeiras tentativas de organizar a informação n...
História da Pesquisa na Web
• Abr. 1994, Aparecimento do Yahoo.
• Out. 1994, Aparecimento do WebCrawler
  logo seguido do ...
Domínios Gerais
       ou de mais alto nível
Tipo de Organização
    com - Organização Comercial
    edu - Instituição de ...
Registo de domínios
http://www.whois.net/


http://www.idotz.net/


http://www.register.com/
Tuvalu
Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália
A Web oculta




http://www.completeplanet.com
Os recursos da Web profunda podem ser
     classificados nas seguintes categorias

•   Conteúdo dinâmico.
•   Conteúdos nã...
Fontes de Informação na Web
•   Académicos
•   Periódicos on-line
•   Sítios governamentais
•   Sítios de instituições esp...
Qualidade dos sítios Web
Autoridade          Informação especializada on-line deve ser oferecida por profissionais
       ...
Qualidade dos sítios Web
Credibilidade     Qual a reputação da fonte? A informação está actualizada? A
                  i...
Qualidade dos sítios Web
Conteúdo        O conteúdo é preciso e completo? O sítio web informa a
                autoria e ...
Dado, Informação e Conhecimento
                            Davenport (1998)
                 Dado                 Informa...
Pesquisadores
Directórios                     Pessoas
Índice de links organizados por temas
(Yahoo, AOL, Netscape's open d...
Como                                        Entrar

pesquisamos?
                                  Sim           Quer     ...
Estratégias de Pesquisa
Directórios por categorias

Pesquisa básica
   • Any words (Quaisquer palavras)
   • All words (To...
Operadores booleanos
          a           b
                c

a AND b
a AND b AND c
a OR b


a AND b NOT c
Operadores booleanos (Exercícios)
Vinho                               Tinto
        1          2            3
            ...
Tipos de Motores de Pesquisa

• Generalistas híbridos
     –Google, FAST, Altavista, Hotbot
• Especializados
• Metamotores...
Estratégias de Pesquisa
Directórios por categorias

Pesquisa básica
   • Any words (Quaisquer palavras)
   • All words (To...
Operadores booleanos nos principais
  Motores de Pesquisa (avançada)

AND                 AND

OR                  OR
NOT ...
Pesquisa por defeito (simples)

• AND: HotBot, Google, MSN
  Search, Teoma, WiseNut
• OR: GigaBlast
• Frase: AltaVista (só...
Sensível às maiúsculas
• Sim: AltaVista Avançado, AltaVista Simples
  (entre aspas)
• Só maiúsculas juntas: HotBot, MSN Se...
Indexação de campos
•   title: AltaVista, Gigablast, HotBot, Lycos, MSN Search
•   intitle: Google, Teoma
•   allintitle: ...
Tipos de Documentos
• PDFs: AltaVista, Gigablast, Google, MSN Search,
  HotBot
• MS Word (.doc): Gigablast, Google, MSN Se...
Conceitos associados à pesquisa na Web
•   Adequação (Match)
•   Pesquisa booleana (Boolean Search)
•   Parêntesis (Parent...
Velocidade     Precisão
                       Resultado   Encontrar sempre
                       imediato      documento...
Componentes de um Motor de Pesquisa
 • Batedores: descobrem e recolhem automáticamente
   conteúdos da web;
 • Repositório...
Indexação e ordenação
• Frequência de termos: as páginas mais importantes para uma palavra
  são as que a repetem mais vez...
Motor de Pesquisa
•   Indexação do Texto - extraindo o conteúdo relevante de
    cada página, descartando:
        Lista d...
Motor de Pesquisa
     Pertinência da Página
• Densidade das palavras
• Frequência das palavras
• Proximidade das palavras...
Exemplo de um Problema
Impressionismo francês
Impressionismo francês

                         Claude Monet
              ...
A solução

O destinatário    A semântica
Personalização
Personalização     Taxinomia
                   Taxinomia

 Locali...
Comparação entre Motores de Pesquisa




                 http://www.searchengineshowdown.com/features/
Estatísticas dos Motores de Pesquisa
Fidelidade aos Motores de Pesquisa
Forças e fraquezas do Google (Junho 2004)
• Strengths:
   * Size and scope: It is now the largest, and includes PDF, DOC, ...
Operadores booleanos no Google
 Para esta operação,     no Google é assim

        x AND y                 xy
         x O...
Sites sobre recursos de pesquisa

         http://www.searchengineshowdown.com/

            http://searchenginewatch.com/...
Notícias
http://news.google.com/


http://www.altavista.com/news/

 http://www.alltheweb.com/?cat=news

 http://www.totaln...
Multi-Search Engines
• Copernic http://www.copernic.com/
   AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fas...
Grandes Arquivos Históricos da WEB

 • http://web.archive.org

 • http://www.gigablast.com
Comparação entre Directórios




              http://www.searchengineshowdown.com/dir/
Directórios
• http://www.yahoo.com
• http://www.looksmart.com
• http://www.dmoz.com
Pesquisa de Imagens, Audio e Vídeo
• AllTheWeb
  http://www.alltheweb.com/
• AltaVista
  http://www.altavista.com/
• Ditto...
Listas Telefónicas
•   Switchboard - http://www.switchboard.com/
•   InfoSpace - http://www.infospace.com/
•   AnyWho - ht...
Enciclopédias
                http://www.wikipedia.org/

                   http://www.britannica.com/

• Living Encyclope...
Gestão do Conhecimento
•   KTweb - http://www.ktweb.org
•   The Knowledge Management Connection - http://www.KMconnection....
Bibliotecas
•   LibDex - http://www.libdex.com/
•   School Libraries on the Web - http://www.sldirectory.com/
•   Lib Web ...
Mapas
• Maps on Other Web Sites -
  http://www.lib.utexas.edu/maps/map_sites/map_sites.html
• All the World's Maps -
  htt...
Directórios




http://www.google.com/dirhp



                              http://dir.yahoo.com/
Directórios
•   The Invisible Web Directory - http://www.invisible-   •   Re-Quest dot Net - http://www.re-quest.net/
    ...
A família Yahoo
• Yahoo! - http://www.yahoo.com/
  Directório principal

• AllTheWeb - http://www.alltheweb.com/
  Motor d...
Forças e fraquezas do Yahoo (Abril 2005)
• Strengths:
    * A large, new (as of Feb. 2004) search engine database
    * In...
Pesquisar publicações científicas


                           http://scholar.google.pt/




                     Directór...
Sítios para Crianças


Yahoo! Kids           http://www.yahooligans.com
Kids Click!           http://www.kidsclick.org
Thi...
Pesquisadores
para encaminhamento em Portugal

           http://www.iupi.pt/
          http://www.busca.pt/

           h...
Portais e Jornais portugueses

          http://www.lusomundo.net

            http://www.iol.pt/


              http://d...
Televisões portuguesas

     http://www.rtp.pt

     http://www.sic.pt

     http://www.tvi.iol.pt

      http://www.sport...
Rádios portuguesas
http://www.radiocomercial.pt

      http://www.tsf.pt

   http://www.rdp.pt/antena1
   http://www.rdp.p...
Legislação

  http://www.dr.incm.pt



    http://www.digesto.gov.pt/
Governo, Parlamento e Administração Pública
                 http://www.portaldocidadao.pt


                     http://w...
http://www.zdnet.com
http://www.hotfiles.com
http://www.shareware.com


http://www.tucows.com

http://www.jumbo.com
Notícias para os profissionais
        de Informação
• ResourceShelf
  http://www.resourceshelf.com/
• LLRX (Legislação)
 ...
http://lii.org
   Sítios
confiáveis
Tipos de som na Internet
MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um
standard para a codificação e compres...
Vídeo na Internet
AVI Audio Video Interleaved.AVI. um formato multimédia da
Microsoft , utilizado pelo Video for Windows. ...
Requisitos de Segurança
• Integridade
      – Complecta e não alterada
• Confidencialidade
      – Acesso condicionado
• A...
Assinaturas digitais

                      Entidade
                       Entidade
                 a                   ...
CAPTCHA
 "Completely Automated Public Turing test to
     tell Computers and Humans Apart“
                   Carnegie Mel...
Fishing
Próximos SlideShares
Carregando em…5
×

Pesquisa AvançAda Na Internet 2009

2.427 visualizações

Publicada em

Slides de apoio ao curso de Pesquisa Avançada da Internet no INA

Publicada em: Educação, Tecnologia, Negócios
  • Seja o primeiro a comentar

Pesquisa AvançAda Na Internet 2009

  1. 1. Pesquisa Avançada na Internet Luís Vidigal 2009
  2. 2. Porquê o nome Internet? Interconnected Networks ou Internetwork System Começou a ser falada em 1973 A rede das redes
  3. 3. Computadores a falar a mesma língua 1,6 biliões de utilizadores – 24% da população
  4. 4. Utilização da Internet e População Mundial 31 de Março de 2009 Internet Cresci- População População % População Utilização Regiões do Mundo Utilização mento ( 2008 Est.) % do Mundo (Penetração) % do Mundo 2000-2008 Últimos dados África 975,330,899 4,514,400 54,171,500 5.6 % 1,100.0 % 3.4 % Ásia 3,780,819,792 114,304,000 657,170,816 17.4 % 474.9 % 41.2 % Europa 803,903,540 105,096,093 393,373,398 48.9 % 274.3 % 24.6 % Médio Oriente 196,767,614 3,284,800 45,861,346 23.3 % 1,296.2 % 2.9 % América do Norte 337,572,949 108,096,800 251,290,489 74.4 % 132.5 % 15.7 % América Latina e Caraíbas 581,249,892 18,068,919 173,619,140 29.9 % 860.9 % 10.9 % Oceania / Austrália 34,384,384 7,620,480 20,783,419 60.4 % 172.7 % 1.3 % TOTAL 6,710,029,070 360,985,492 1,596,270,108 23.8 % 342.2 % 100.0 %
  5. 5. Utilizadores da Internet no Mundo Março 2009
  6. 6. % de Penetração dos Utilizadores da Internet no Mundo Março 2009
  7. 7. Tempo de penetração tecnológica 100 Televisão Electricidade Telefone Rádio Automóvel % Penetração Vídeo 50 PC el m óv Tele et ern Int 0 25 50 75 100 125 150 Anos
  8. 8. As TIC estão a invadir o mundo real “Pervasive computing”
  9. 9. Definições • Pesquisar: – Efectuar um exame completo de – Olhar com cuidado para encontrar algo • Resultados de Pesquisa: – Apresentação do conteúdo que corresponde aos critérios de pesquisa
  10. 10. O que pesquisamos • Para apoiar o negócio (Compras electrónicas, etc.) • Para fins científicos (livros, jornais e artigos, etc.) • Para a nossa vida quotidiana (mapas, guias, etc.) • Para entretenimento (assunto específico do nosso interesse)
  11. 11. Porque pesquisamos • Para ter resultados • Para poupar tempo • Para explorar recursos relacionados • Para facilitar a navegação na Internet
  12. 12. História da Pesquisa na Web • 1990, Alan Emtage criou o Archie, uma das primeiras tentativas de organizar a informação na Internet. • 1991-92, Matthew Gray criou o primeiro robot na web. Chamou-se World Wide Web wanderer. • 1993, Início de três motores de pesquisa baseados em robots: JumpStation, World Wide Worm e Repository Based Software Engineering Spider. O Excite apreceu com o nome original de Architext. • 1994, Galaxy, dirctório pesquisável na web através de um ídice
  13. 13. História da Pesquisa na Web • Abr. 1994, Aparecimento do Yahoo. • Out. 1994, Aparecimento do WebCrawler logo seguido do Lycos. • 1995, Aparecimento do Infoseek e do AltaVista • 1996, HotBot, MetaCrawler e SaavySearch. • Desde 1996, Outros motores de pesquisa
  14. 14. Domínios Gerais ou de mais alto nível Tipo de Organização com - Organização Comercial edu - Instituição de Ensino gov - Entidade Governamental mil - Instituição Militar net - Hosts Administrativos org - Organização não lucrativa int - Organização internacional A Área Geográfica ISO 3166-1 pt - Portugal
  15. 15. Registo de domínios http://www.whois.net/ http://www.idotz.net/ http://www.register.com/
  16. 16. Tuvalu Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália
  17. 17. A Web oculta http://www.completeplanet.com
  18. 18. Os recursos da Web profunda podem ser classificados nas seguintes categorias • Conteúdo dinâmico. • Conteúdos não linkados • Web privada • Web contextualizada • Conteúdo de acesso limitado. • Conteúdo acedido por scripts • Conteúdo de texto não HTML
  19. 19. Fontes de Informação na Web • Académicos • Periódicos on-line • Sítios governamentais • Sítios de instituições especializadas • Sítios de contribuição individual • Sítios relacionados à indústria • Sítios comerciais
  20. 20. Qualidade dos sítios Web Autoridade Informação especializada on-line deve ser oferecida por profissionais qualificados ou existe o esclarecimento que a informação foi fornecida por uma pessoa ou grupo não qualificado na área Complementaridade A informação on-line deve ser complementar, e não substituir o aconselhamento especializado Sigilo O sítio web assegura o sigilo de dados sobre pessoas e utilizadores, inclusive a sua identidade. Crédito O sítio web apresenta as referências das fontes que suportam as informações disponíveis (com respectivos links), e também as datas das últimas actualizações. Justificativa Apresenta os benefícios e o desempenho dos produtos e serviços baseados em evidências Autoria Oferece endereços de contanto para utilizadores que queiram mais informações; oferece e-mail do webmaster Patrocínio Apoios de organizações comerciais e não-comerciais são claramente identificadas Publicidade Anúncios publicitários são claramente identificados. Health on the Net – HON
  21. 21. Qualidade dos sítios Web Credibilidade Qual a reputação da fonte? A informação está actualizada? A informação é útil? É usado algum processo de revisão editorial? Conteúdo O conteúdo é preciso e completo? Existem termos de responsabilidade no sítio? Transparência O propósito do sítio web é apresentado? Links O sítio web oferece links para informações relevantes, actualizadas, precisas e de confiança? Os links são de fácil navegação? Design O design é acessível? A navegação e buscas no site são fáceis de serem feitas? Interactividade Estão incluídos mecanismos de feedback ao utilizador? Limitações Está claro se o propósito é a divulgação e venda de produtos e serviços ou a divulgação de informação? Health Information Technology Institute
  22. 22. Qualidade dos sítios Web Conteúdo O conteúdo é preciso e completo? O sítio web informa a autoria e as datas de publicação inicial e de actualização? Publicidade e Anúncios não devem influenciar na decisão sobre o conteúdo. Patrocínio Anúncios comerciais são proibidos? Privacidade e O sítio web deve solicitar a permissão do utilizador para Sigilo colectar dados pessoais. O sigilo deve ser respeitado. E-commerce Utilizadores e compradores de informações, produtos e serviços devem ter translações seguras e eficientes. Deve haver um link para o serviço de atendimento ao consumidor. American Medical Association
  23. 23. Dado, Informação e Conhecimento Davenport (1998) Dado Informação Conhecimento Definição Simples Dado dotado de Informação valiosa da observação sobre o relevância e propósito mente humana, estado do mundo incluindo reflexão, síntese e contexto Caracte- •Facilmente •Requer unidade de •Difícil estruturação rísticas estruturado análise •Difícil captura em •Facilmente obtido •Exige consenso em máquinas por máquinas relação ao significado •Frequentemente tácito •Frequente- •Exige necessa- •Difícil transferência mente quantificado riamente a mediação •Facilmente humana transferível
  24. 24. Pesquisadores Directórios Pessoas Índice de links organizados por temas (Yahoo, AOL, Netscape's open directory, DMOZ open directory project, MSN , etc.) Motores de Pesquisa Máquinas Indexação automática através de robots (spiders ou searchbots) (Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite, Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos, etc.)
  25. 25. Como Entrar pesquisamos? Sim Quer Não paginar? Toque numa Caixa de secção pesquisa Toque numa Interrogação subsecção Não Sim Procure Resultados Não Está algo credíveis? na secção Sim Melhorar certa? interrogação Encontrou? Listar Não relevâncias Não Sim Ainda Frustrado? Quase Não Verificar Sim Não Será Sim Sim Encontrou? suficiente? Luís Vidigal
  26. 26. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  27. 27. Operadores booleanos a b c a AND b a AND b AND c a OR b a AND b NOT c
  28. 28. Operadores booleanos (Exercícios) Vinho Tinto 1 2 3 5 4 6 7 Alentejo
  29. 29. Tipos de Motores de Pesquisa • Generalistas híbridos –Google, FAST, Altavista, Hotbot • Especializados • Metamotores • Metamotores inteligentes
  30. 30. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  31. 31. Operadores booleanos nos principais Motores de Pesquisa (avançada) AND AND OR OR NOT NOT AND AND NOT NOT OR OR AND NOT
  32. 32. Pesquisa por defeito (simples) • AND: HotBot, Google, MSN Search, Teoma, WiseNut • OR: GigaBlast • Frase: AltaVista (só para frases comuns)
  33. 33. Sensível às maiúsculas • Sim: AltaVista Avançado, AltaVista Simples (entre aspas) • Só maiúsculas juntas: HotBot, MSN Search • Não: AltaVista Simples, Gigablast, Google, Lycos, Teoma, WiseNut
  34. 34. Indexação de campos • title: AltaVista, Gigablast, HotBot, Lycos, MSN Search • intitle: Google, Teoma • allintitle: Google • url: AltaVista, Gigablast, Lycos Advanced • inurl: Google, Teoma • allinurl: Google • link: AltaVista, Google, Gigablast, Lycos Advanced, MSN Search • host: AltaVista (same as site: at others) • ip: Gigablast • domain: HotBot, MSN Search • site: Gigablast, Google, Teoma, (use host: at AltaVista) • anchor: AltaVista • image: AltaVista • related: Google • others: AltaVista, Gigablast, Google, HotBot, MSN Search
  35. 35. Tipos de Documentos • PDFs: AltaVista, Gigablast, Google, MSN Search, HotBot • MS Word (.doc): Gigablast, Google, MSN Search, HotBot • PowerPoint (.ppt): Gigablast, Google, MSN Search, HotBot • Excel (.xls): Gigablast, Google, MSN Search, HotBot • PostScript (.ps): Gigablast, Google • WordPerfect (.wpd): Google
  36. 36. Conceitos associados à pesquisa na Web • Adequação (Match) • Pesquisa booleana (Boolean Search) • Parêntesis (Parentheses) • Pesquisa combinada (Faceted Search) • Pesquisa vectorial (Vector Search) • Pergunta (Query) • Linguagem Natural (Natural Language Processing - NLP) • Adequação difusa (Fuzzy Matching) • Lista de resultados (Results List) • Peso (Weighting) • Precisão (Recall and Precision)
  37. 37. Velocidade Precisão Resultado Encontrar sempre imediato documentos Âmbito relevantes Procurar todos os documentos da Web Um Motor de Localização Conhecer o local Pesquisa perfeito do utilizador Actualidade Toda a informação é actualizada Personalização Prioridade Os documentos Conhecer as mais relevantes necessidades do em primeiro utilizador lugar
  38. 38. Componentes de um Motor de Pesquisa • Batedores: descobrem e recolhem automáticamente conteúdos da web; • Repositório: armazena as páginas recolhidas; • Indexador: extrai as palavras das páginas armazenadas e cria índices para acelerar as pesquisas; • Ordenador: ordena as páginas que contenham os termos pesquisados por um utilizador de modo a que as mais relevantes sejam apresentadas nos primeiros lugares; • Apresentador: gere a interface de utilização do motor de busca.
  39. 39. Indexação e ordenação • Frequência de termos: as páginas mais importantes para uma palavra são as que a repetem mais vezes no texto; • PageRank: é um algoritmo matemático em que as páginas mais importantes são as que recebem o maior número de links ou links das páginas mais importantes; • Número de links: as páginas mais importantes são as que recebem o maior número de links; • tf-idf: calcula a importância da página combinando a frequência de um termo com a importância desse termo no conjunto de todas as páginas armazenadas; • Estrutura da página: a importância de uma página é dada pela localização de um termo na sua estrutura. Por exemplo, as páginas mais importantes são as que contêm o termo no titulo; • Análise de URLs: as páginas mais importantes são as que contêm os termos no URL que as refere.
  40. 40. Motor de Pesquisa • Indexação do Texto - extraindo o conteúdo relevante de cada página, descartando: Lista de palavras vazias (SWL – Stop Word List) – Artigos, preposições, conjunções e pronomes – Verbos comuns (saber, ver, fazer, ser, etc.) – Adjectivos comuns (grande, alto, atrasado, etc.) – Qualquer palavra que apareça em todos os documentos – Qualquer palavra que apareça apenas em um documento • Indexação META – Indexando preferencialmente as palavras chave colocadas pelo autor na meta-informação de cada página
  41. 41. Motor de Pesquisa Pertinência da Página • Densidade das palavras • Frequência das palavras • Proximidade das palavras • Links externos para a página • META tags
  42. 42. Exemplo de um Problema Impressionismo francês Impressionismo francês Claude Monet Claude Monet Exposições Exposições Renoir Renoir Museu de Giverny Museu de Giverny Livros Livros
  43. 43. A solução O destinatário A semântica Personalização Personalização Taxinomia Taxinomia Localização Localização Sinónimos Sinónimos Traduções Traduções
  44. 44. Comparação entre Motores de Pesquisa http://www.searchengineshowdown.com/features/
  45. 45. Estatísticas dos Motores de Pesquisa
  46. 46. Fidelidade aos Motores de Pesquisa
  47. 47. Forças e fraquezas do Google (Junho 2004) • Strengths: * Size and scope: It is now the largest, and includes PDF, DOC, PS, and many other file types * Relevance based on sites' linkages and authority * Cached archive of Web pages as the looked were indexed * Additional databases: Google Groups, News, Directory, etc. • Weaknesses: See also the Google Inconsistencies Page * Limited search features: no nesting, no truncation, does not support full Boolean * Link searches must be exact and are incomplete * Only indexes first 101 KB of a Web page and about 120 KB of PDFs * May search for plural/singular, synonyms, and grammatical variants without telling you http://www.searchengineshowdown.com/features/google/review.html
  48. 48. Operadores booleanos no Google Para esta operação, no Google é assim x AND y xy x OR y x OR y x AND (y OR z) x y OR z (x AND y) OR (z AND q) Ainda não possível (x OR y) AND (z OR q) x OR y z OR q x AND (y OR z OR q) x y OR z OR q x AND (y OR z) AND q x y OR z q
  49. 49. Sites sobre recursos de pesquisa http://www.searchengineshowdown.com/ http://searchenginewatch.com/ http://www.webmasterworld.com/
  50. 50. Notícias http://news.google.com/ http://www.altavista.com/news/ http://www.alltheweb.com/?cat=news http://www.totalnews.com/ http://www.newsindex.com/ http://news.yahoo.com/
  51. 51. Multi-Search Engines • Copernic http://www.copernic.com/ AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fast Search), FindWhat, HotBot, LookSmart, Lycos, Mamma.com, MSN Web Search, Netscape Netcenter, Open Directory, Teoma, WiseNut, Yahoo. • Search http://www.search.com/ AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler, Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy e NationalDirectory. • MetaCrawler http://www.metacrawler.com/ Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo e Yahoo. • C4 http://www.c4.com/ AltaVista, Yahoo!, InfoSeek. Excite, Lycos, NBCi.com, Magellan, WebCrawler e HotBot. • DogPile http://www.dogpile.com/ LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos e AltaVista. • InfoSpace http://www.infospace.com/ Excite, AltaVista, Infoseek e WebCrawler.
  52. 52. Grandes Arquivos Históricos da WEB • http://web.archive.org • http://www.gigablast.com
  53. 53. Comparação entre Directórios http://www.searchengineshowdown.com/dir/
  54. 54. Directórios • http://www.yahoo.com • http://www.looksmart.com • http://www.dmoz.com
  55. 55. Pesquisa de Imagens, Audio e Vídeo • AllTheWeb http://www.alltheweb.com/ • AltaVista http://www.altavista.com/ • Ditto (só imagens) http://www.ditto.com/ • Google Images (só imagens) http://images.google.com • Kazaa Media Desktop (só MP3) http://www.kazaa.com/ • Lycos Pictures and Sounds http://multimedia.lycos.com/ • MIDI Explorer (Só MIDI) http://www.musicrobot.com/ • Picsearch (só imagens) http://www.picsearch.com/ • Singingfish (Só som e video) http://www.singingfish.com/
  56. 56. Listas Telefónicas • Switchboard - http://www.switchboard.com/ • InfoSpace - http://www.infospace.com/ • AnyWho - http://www.anywho.com/ • SuperPages.com - http://www.superpages.com/ • SmartPages.com - http://www.smartpages.com/ • WhoWhere - http://www.whowhere.lycos.com/ • Infobel - http://www.infobel.com/ • InfoUSA - http://www.infousa.com/ • All Nations Telephone Search Engine - http://www.escapeartist.com/global/telephone.htm • Phonenumber.com - http://www.phonenumber.com/ • International Numbering Plans - http://www.numberingplans.com/ • 411 Information - http://www.411.info • GeoPortals.com, Inc. - http://finder.geoportals.com/ • 140Online - http://www.140online.com/ • Search Detective Reverse Phone Lookup - http://www.searchdetective.net/ • McPayphone - http://www.geocities.com/bootzilla00/ • Apni Directory - http://www.apnidirectory.com/ • Jay Computer Services - http://nt.jcsm.com/ • Zip and Area Code Directory - http://www.horizon-realty.us/whrzipar.htm • Email Address Finder - http://www.allemailaddresses.com/
  57. 57. Enciclopédias http://www.wikipedia.org/ http://www.britannica.com/ • Living Encyclopedia in Cyberspace - http://www.encyberpedia.com/ency.htm • The Virtual Encyclopedia - http://www.abp1.com/knowledgeispower/index.ht ml • Search-22 - Reference Search Engines - http://www.search-22.com/reference.html • Access Place Library - http://www.accessplace.com/library.htm
  58. 58. Gestão do Conhecimento • KTweb - http://www.ktweb.org • The Knowledge Management Connection - http://www.KMconnection.com • Knowledge Management Resource Center - http://www.kmresource.com • Knowledge Management Resource Center - http://www.bio- itworld.com/resources/km/ • Netacademy on Knowledge Media - http://www.knowledgemedia.org • ICASIT's Knowledge Management Central - http://www.icasit.org/km/ • Knowledge Management Server - http://www.mccombs.utexas.edu/kman/ • Meta Knowledge Management - http://www.metakm.com • Knowledge Management Center Info - http://www.kmcenter.info/ • KMTool - http://www.kmtool.net • Gotcha - http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index.html • Knowledge-Portal.com - http://www.knowledge-portal.com/ • Knowledge Management Links - http://www.lepak.com/kmlinks.html • Knowledge Portal on Document and Data Organization - http://members.lycos.co.uk/UFitsME/knowledge.html
  59. 59. Bibliotecas • LibDex - http://www.libdex.com/ • School Libraries on the Web - http://www.sldirectory.com/ • Lib Web Cats - http://www.librarytechnology.org/libwebcats/ • Libweb - http://lists.webjunction.org/libweb/ • Lii.org: Librarianship - http://lii.org/search/file/libraries • National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/ • Library and Information Science - http://www.ifla.org/II/natlibs.htm • ALiNUS - http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Home.html • The WWW Library Directory - http://www.webpan.com/msauers/libdir/ • NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/ • Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html • Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/ • Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html • UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/ • LibraryBug - http://www.librarybug.org • Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html • ISBNDB - http://isbndb.com/ • Internet Quick Reference Shelf: Library Resources - http://www.indiana.edu/~librcsd/internet/Library_Resources/ • Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm • Libraries and Archives - http://www.uky.edu/Subject/libraries.html • List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm • Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm • Global Reach - https://cs.ala.org/global/ • Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html • Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html • US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html • Bishop Library Index - http://members.lycos.co.uk/kbishoplib/
  60. 60. Mapas • Maps on Other Web Sites - http://www.lib.utexas.edu/maps/map_sites/map_sites.html • All the World's Maps - http://www.embassyworld.com/maps/maps.html • Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php • About.com: Maps - http://geography.about.com/cs/maps/ • Bodleian Library Map Room - http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm • StreetLookup.Com - http://www.streetlookup.com/ • Alexandria Digital Library - http://www.alexandria.ucsb.edu/other-sites/subj_page.html • Maps from start4all - http://maps.start4all.com/ • Links 4 Maps - http://www.links4maps.com/
  61. 61. Directórios http://www.google.com/dirhp http://dir.yahoo.com/
  62. 62. Directórios • The Invisible Web Directory - http://www.invisible- • Re-Quest dot Net - http://www.re-quest.net/ web.net/ • Blakkat Station - http://blakkat.com/ • ThisIsOurYear - http://www.thisisouryear.com/ • 1st Spot - http://1st-spot.net/ • Common Content - http://www.commoncontent.org/ • Hoppa - http://hoppa.com/ • Nations Online - • Fetch Dog - http://www.fetchdog.com/ http://www.nationsonline.org/oneworld/ • Forum Zilla - http://www.forumzilla.com/ • Chiff - http://www.chiff.com/ • The Library Channel - • VisioBrand - http://www.visiobrand.com/ http://www.thelibrarychannel.com/ • GoGuides Directory - http://www.goguides.org • Wealth24.com - http://www.wealth24.com/ • Gimpsy - http://www.gimpsy.com/ • intelSeek! - http://www.intelseek.com/ • Starting Page - http://www.startingpage.com/ • Got That Online - http://www.gotthatonline.com/ • DateDex - http://www.datedex.com/ • E-lynks - http://www.e-lynks.com/ • Surfpoint - http://www.surfpoint.com/ • GirlHoo - http://www.girlhoo.com/ • 123World - http://www.123world.com/ • Leon's Web Brain - • Web World Directory - http://www.leonatkinson.com/brain/ http://www.webworldindex.com/ • iMarvel - http://www.imarvel.com/ • Sight Quest - http://www.sightquest.com/ • Smart Links - http://www.smartlinks.org/ • SearchMonster - http://www.searchmonster.org/ • Smart Internet Guide - • La Toile des Toiles - http://www.la-toile.com/ http://www.smartinternetguide.com/ • Somuch - http://www.somuch.com/ • A Perfect Search - http://aperfectsearch.com/ • Andilinks - http://www.andilinks.com/ • Consumer2.com - http://www.consumer2.com/ • Linkopedia - http://www.linkopedia.com/ • MVRU.com - http://www.mvru.com • Josh's Sanctum - http://josh.nu/ • Ranks - http://ranks.com/ • Yakeo - http://www.yakeo.com/ • Aeiwi - http://www.aeiwi.com/ • All.info - http://all.info/ • Rex - http://rex.skyline.net/ • Earth Station Nine - http://www.earthstation9.com/
  63. 63. A família Yahoo • Yahoo! - http://www.yahoo.com/ Directório principal • AllTheWeb - http://www.alltheweb.com/ Motor de pesquisa do Yahoo • Yahooligans! - http://yahooligans.yahoo.com/ Para crianças • Ujiko - http://www.ujiko.com/ Pesquisa personalizada do Yahoo
  64. 64. Forças e fraquezas do Yahoo (Abril 2005) • Strengths: * A large, new (as of Feb. 2004) search engine database * Includes cached copies of pages * Also includes links to the Yahoo! directory * Supports full Boolean searching • Weaknesses: * Lack of some advanced search features such as truncation * Only indexes first 500 KB of a Web page (still more than Google's 101KB) * Link searches require the inclusion of the http:// * Includes some pay for inclusion sites http://www.searchengineshowdown.com/features/yahoo/review.html
  65. 65. Pesquisar publicações científicas http://scholar.google.pt/ Directórios http://infomine.ucr.edu/ http://lii.org/
  66. 66. Sítios para Crianças Yahoo! Kids http://www.yahooligans.com Kids Click! http://www.kidsclick.org ThinkQuest Entries http://www.thinkquest.org/library Kids Search Tool http://www.rcls.org/ksearch.htm Ask Jeeves for Kids http://www.askforkids.com/
  67. 67. Pesquisadores para encaminhamento em Portugal http://www.iupi.pt/ http://www.busca.pt/ http://www.aeiou.pt/ http://www.sapo.pt/ http://www.cusco.pt
  68. 68. Portais e Jornais portugueses http://www.lusomundo.net http://www.iol.pt/ http://dn.sapo.pt/ http://jn.sapo.pt/ http://www.publico.pt/
  69. 69. Televisões portuguesas http://www.rtp.pt http://www.sic.pt http://www.tvi.iol.pt http://www.sporttv.pt http://www.telecine.pt
  70. 70. Rádios portuguesas http://www.radiocomercial.pt http://www.tsf.pt http://www.rdp.pt/antena1 http://www.rdp.pt/antena2 http://www.rdp.pt/antena3 http://www.radiocidade.iol.pt http://www.rr.pt/
  71. 71. Legislação http://www.dr.incm.pt http://www.digesto.gov.pt/
  72. 72. Governo, Parlamento e Administração Pública http://www.portaldocidadao.pt http://www.lojadocidadao.pt http://www.portugal.gov.pt http://www.parlamento.pt http://www.dgo.pt http://www.dgap.gov.pt
  73. 73. http://www.zdnet.com http://www.hotfiles.com http://www.shareware.com http://www.tucows.com http://www.jumbo.com
  74. 74. Notícias para os profissionais de Informação • ResourceShelf http://www.resourceshelf.com/ • LLRX (Legislação) http://www.llrx.com/ • Librarians' Index to the Internet http://lii.org/ • INFOMINE http://infomine.ucr.edu/ • The Internet Scout Project http://scout.wisc.edu/
  75. 75. http://lii.org Sítios confiáveis
  76. 76. Tipos de som na Internet MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um standard para a codificação e compressão de sinais áudio. Faz diminuir o tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação perceptual de áudio" e "compressão psico-acústica" removem partes do sinal que pouca diferença fazem à forma como de facto ouvimos os sons. WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por exemplo para os pequenos ruídos que um computador emite para indicar que o Windows foi iniciado ou a reciclagem foi limpa. Streaming Streaming audio ou streaming media é uma técnica que permite ouvir parte do ficheiro antes do download estar concluído. Funciona através do download e armazenamento de uma secção suficiente do ficheiro para actuar como buffer, permitindo a reprodução da música mesmo que a transmissão seja brevemente interrompida. Pode tirar uma amostra do áudio e decidir se pretende continuar a download ou simplesmente cancelar. Se por qualquer motivo a transmissão ficar demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos bem.
  77. 77. Vídeo na Internet AVI Audio Video Interleaved.AVI. um formato multimédia da Microsoft , utilizado pelo Video for Windows. Os elementos áudio e vídeo são armazenados em segmentos alternados no ficheiro (.avi). MPEG Moving Pictures Experts Group standard para compressão e armazenamento de vídeos (.mpg) Windows Media e Microsoft's Windows Media Player (.asf) Real RealNetwork's RealVideo (.ram) Quicktime extensão do ficheiro Windows: .mov
  78. 78. Requisitos de Segurança • Integridade – Complecta e não alterada • Confidencialidade – Acesso condicionado • Autenticidade – Identidade da pessoa • Não repúdio – Transacção garantida
  79. 79. Assinaturas digitais Entidade Entidade a a lic lic Certificadora Certificadora úb P A úb P B AE a da a da riv P A riv P B A B
  80. 80. CAPTCHA "Completely Automated Public Turing test to tell Computers and Humans Apart“ Carnegie Mellon University Garantir que a resposta não é gerada por computadores, mas por humanos Turing Test (1950)
  81. 81. Fishing

×