SlideShare uma empresa Scribd logo
1 de 81
Baixar para ler offline
Pesquisa Avançada
    na Internet
     Luís Vidigal
        2009
Porquê o nome Internet?


Interconnected Networks
              ou
 Internetwork System
    Começou a ser falada em 1973

    A rede das redes
Computadores a falar a mesma língua




1,6 biliões de utilizadores – 24% da população
Utilização da Internet e População Mundial
                                      31 de Março de 2009

                                                        Internet                                   Cresci-
                       População        População                     % População    Utilização
Regiões do Mundo                                       Utilização                                     mento
                       ( 2008 Est.)     % do Mundo                    (Penetração)   % do Mundo
                                                                                                  2000-2008
                                                      Últimos dados


África                 975,330,899        4,514,400     54,171,500           5.6 %   1,100.0 %       3.4 %

Ásia                  3,780,819,792     114,304,000    657,170,816          17.4 %    474.9 %       41.2 %

Europa                 803,903,540      105,096,093    393,373,398          48.9 %    274.3 %       24.6 %

Médio Oriente          196,767,614        3,284,800     45,861,346          23.3 %   1,296.2 %       2.9 %

América do Norte       337,572,949      108,096,800    251,290,489          74.4 %    132.5 %       15.7 %

América Latina e
   Caraíbas
                       581,249,892       18,068,919    173,619,140          29.9 %    860.9 %       10.9 %

Oceania / Austrália     34,384,384        7,620,480     20,783,419          60.4 %    172.7 %        1.3 %

TOTAL                 6,710,029,070     360,985,492   1,596,270,108         23.8 %    342.2 %      100.0 %
Utilizadores da Internet no Mundo
           Março 2009
% de Penetração dos Utilizadores da Internet no Mundo
                     Março 2009
Tempo de penetração tecnológica
100                                                 Televisão
                                                                 Electricidade
                                                                                       Telefone
                                                        Rádio
                                                                                 Automóvel
% Penetração




                                            Vídeo

               50               PC

                               el
                           m óv
                    Tele
                                  et
                               ern
                           Int




                0                      25     50           75          100       125         150
                                                          Anos
As TIC estão a invadir o mundo real
        “Pervasive computing”
Definições
• Pesquisar:
  – Efectuar um exame completo de
  – Olhar com cuidado para encontrar algo
• Resultados de Pesquisa:
  – Apresentação do conteúdo que corresponde aos
    critérios de pesquisa
O que pesquisamos
• Para apoiar o negócio (Compras
  electrónicas, etc.)
• Para fins científicos (livros, jornais e
  artigos, etc.)
• Para a nossa vida quotidiana (mapas,
  guias, etc.)
• Para entretenimento (assunto específico
  do nosso interesse)
Porque pesquisamos
•   Para ter resultados
•   Para poupar tempo
•   Para explorar recursos relacionados
•   Para facilitar a navegação na Internet
História da Pesquisa na Web
• 1990, Alan Emtage criou o Archie, uma das
  primeiras tentativas de organizar a informação na
  Internet.
• 1991-92, Matthew Gray criou o primeiro robot na
  web. Chamou-se World Wide Web wanderer.
• 1993, Início de três motores de pesquisa baseados
  em robots: JumpStation, World Wide Worm e
  Repository Based Software Engineering Spider. O
  Excite apreceu com o nome original de Architext.
• 1994, Galaxy, dirctório pesquisável na web
  através de um ídice
História da Pesquisa na Web
• Abr. 1994, Aparecimento do Yahoo.
• Out. 1994, Aparecimento do WebCrawler
  logo seguido do Lycos.
• 1995, Aparecimento do Infoseek e do
  AltaVista
• 1996, HotBot, MetaCrawler e SaavySearch.
• Desde 1996, Outros motores de pesquisa
Domínios Gerais
       ou de mais alto nível
Tipo de Organização
    com - Organização Comercial
    edu - Instituição de Ensino
    gov - Entidade Governamental
    mil - Instituição Militar
    net - Hosts Administrativos
    org - Organização não lucrativa
    int - Organização internacional
A Área Geográfica
                               ISO 3166-1
    pt - Portugal
Registo de domínios
http://www.whois.net/


http://www.idotz.net/


http://www.register.com/
Tuvalu
Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália
A Web oculta




http://www.completeplanet.com
Os recursos da Web profunda podem ser
     classificados nas seguintes categorias

•   Conteúdo dinâmico.
•   Conteúdos não linkados
•   Web privada
•   Web contextualizada
•   Conteúdo de acesso limitado.
•   Conteúdo acedido por scripts
•   Conteúdo de texto não HTML
Fontes de Informação na Web
•   Académicos
•   Periódicos on-line
•   Sítios governamentais
•   Sítios de instituições especializadas
•   Sítios de contribuição individual
•   Sítios relacionados à indústria
•   Sítios comerciais
Qualidade dos sítios Web
Autoridade          Informação especializada on-line deve ser oferecida por profissionais
                    qualificados ou existe o esclarecimento que a informação foi fornecida
                    por uma pessoa ou grupo não qualificado na área

Complementaridade   A informação on-line deve ser complementar, e não substituir o
                    aconselhamento especializado
Sigilo              O sítio web assegura o sigilo de dados sobre pessoas e utilizadores,
                    inclusive a sua identidade.
Crédito             O sítio web apresenta as referências das fontes que suportam as
                    informações disponíveis (com respectivos links), e também as datas das
                    últimas actualizações.

Justificativa       Apresenta os benefícios e o desempenho dos produtos e serviços baseados
                    em evidências
Autoria             Oferece endereços de contanto para utilizadores que queiram mais
                    informações; oferece e-mail do webmaster
Patrocínio          Apoios de organizações comerciais e não-comerciais são claramente
                    identificadas
Publicidade         Anúncios publicitários são claramente identificados.
                                                                           Health on the Net – HON
Qualidade dos sítios Web
Credibilidade     Qual a reputação da fonte? A informação está actualizada? A
                  informação é útil? É usado algum processo de revisão
                  editorial?
Conteúdo          O conteúdo é preciso e completo? Existem termos de
                  responsabilidade no sítio?
Transparência     O propósito do sítio web é apresentado?
Links             O sítio web oferece links para informações relevantes,
                  actualizadas, precisas e de confiança? Os links são de fácil
                  navegação?
Design            O design é acessível? A navegação e buscas no site são fáceis
                  de serem feitas?
Interactividade   Estão incluídos mecanismos de feedback ao utilizador?

Limitações        Está claro se o propósito é a divulgação e venda de produtos e
                  serviços ou a divulgação de informação?
                                                     Health Information Technology Institute
Qualidade dos sítios Web
Conteúdo        O conteúdo é preciso e completo? O sítio web informa a
                autoria e as datas de publicação inicial e de actualização?

Publicidade e   Anúncios não devem influenciar na decisão sobre o conteúdo.
Patrocínio      Anúncios comerciais são proibidos?

Privacidade e   O sítio web deve solicitar a permissão do utilizador para
Sigilo          colectar dados pessoais. O sigilo deve ser respeitado.

E-commerce      Utilizadores e compradores de informações, produtos e
                serviços devem ter translações seguras e eficientes. Deve
                haver um link para o serviço de atendimento ao consumidor.



                                                     American Medical Association
Dado, Informação e Conhecimento
                            Davenport (1998)
                 Dado                 Informação             Conhecimento
Definição   Simples            Dado dotado de             Informação valiosa da
            observação sobre o relevância e propósito     mente humana,
            estado do mundo                               incluindo reflexão,
                                                          síntese e contexto
Caracte-    •Facilmente          •Requer unidade de       •Difícil estruturação
rísticas    estruturado          análise                  •Difícil captura em
            •Facilmente obtido   •Exige consenso em       máquinas
            por máquinas         relação ao significado   •Frequentemente tácito
            •Frequente-          •Exige necessa-          •Difícil transferência
            mente quantificado   riamente a mediação
            •Facilmente          humana
            transferível
Pesquisadores
Directórios                     Pessoas
Índice de links organizados por temas
(Yahoo, AOL, Netscape's open directory, DMOZ open directory
project, MSN , etc.)

Motores de Pesquisa                               Máquinas

Indexação automática através de robots
(spiders ou searchbots)
(Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite,
Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos,
etc.)
Como                                        Entrar

pesquisamos?
                                  Sim           Quer     Não
                                              paginar?
                         Toque numa                       Caixa de
                           secção                         pesquisa

                         Toque numa
                                                         Interrogação
                          subsecção
   Não
             Sim          Procure                        Resultados
                                                                         Não
   Está                    algo                          credíveis?
na secção                                                      Sim
                                                                                 Melhorar
  certa?                                                                       interrogação
                         Encontrou?
                                                            Listar
               Não                                       relevâncias
   Não
                            Sim                                                   Ainda
            Frustrado?                Quase                                        Não
                                                          Verificar


                                                Sim                     Não       Será        Sim
               Sim                                       Encontrou?
                                                                               suficiente?


                                                                                                    Luís Vidigal
Estratégias de Pesquisa
Directórios por categorias

Pesquisa básica
   • Any words (Quaisquer palavras)
   • All words (Todas as palavras)
   • Exact phrase (Frase exacta) ou “....”

Pesquisa avançada
   • Pesquisa booleana (AND, OR, NOT)
   • Palavras excluídas -xxx
   • Palavras incluídas +xxx

Perguntas em linguagem natural

Personalização
Operadores booleanos
          a           b
                c

a AND b
a AND b AND c
a OR b


a AND b NOT c
Operadores booleanos (Exercícios)
Vinho                               Tinto
        1          2            3
                   5
            4              6

                   7
                Alentejo
Tipos de Motores de Pesquisa

• Generalistas híbridos
     –Google, FAST, Altavista, Hotbot
• Especializados
• Metamotores
• Metamotores inteligentes
Estratégias de Pesquisa
Directórios por categorias

Pesquisa básica
   • Any words (Quaisquer palavras)
   • All words (Todas as palavras)
   • Exact phrase (Frase exacta) ou “....”

Pesquisa avançada
   • Pesquisa booleana (AND, OR, NOT)
   • Palavras excluídas -xxx
   • Palavras incluídas +xxx

Perguntas em linguagem natural

Personalização
Operadores booleanos nos principais
  Motores de Pesquisa (avançada)

AND                 AND

OR                  OR
NOT                 NOT


 AND                      AND
 NOT                      NOT
 OR                       OR



           AND
           NOT
Pesquisa por defeito (simples)

• AND: HotBot, Google, MSN
  Search, Teoma, WiseNut
• OR: GigaBlast
• Frase: AltaVista (só para frases
  comuns)
Sensível às maiúsculas
• Sim: AltaVista Avançado, AltaVista Simples
  (entre aspas)
• Só maiúsculas juntas: HotBot, MSN Search
• Não: AltaVista Simples, Gigablast, Google,
  Lycos, Teoma, WiseNut
Indexação de campos
•   title: AltaVista, Gigablast, HotBot, Lycos, MSN Search
•   intitle: Google, Teoma
•   allintitle: Google
•   url: AltaVista, Gigablast, Lycos Advanced
•   inurl: Google, Teoma
•   allinurl: Google
•   link: AltaVista, Google, Gigablast, Lycos Advanced, MSN Search
•   host: AltaVista (same as site: at others)
•   ip: Gigablast
•   domain: HotBot, MSN Search
•   site: Gigablast, Google, Teoma, (use host: at AltaVista)
•   anchor: AltaVista
•   image: AltaVista
•   related: Google
•   others: AltaVista, Gigablast, Google, HotBot, MSN Search
Tipos de Documentos
• PDFs: AltaVista, Gigablast, Google, MSN Search,
  HotBot
• MS Word (.doc): Gigablast, Google, MSN Search,
  HotBot
• PowerPoint (.ppt): Gigablast, Google, MSN Search,
  HotBot
• Excel (.xls): Gigablast, Google, MSN Search, HotBot
• PostScript (.ps): Gigablast, Google
• WordPerfect (.wpd): Google
Conceitos associados à pesquisa na Web
•   Adequação (Match)
•   Pesquisa booleana (Boolean Search)
•   Parêntesis (Parentheses)
•   Pesquisa combinada (Faceted Search)
•   Pesquisa vectorial (Vector Search)
•   Pergunta (Query)
•   Linguagem Natural (Natural Language Processing - NLP)
•   Adequação difusa (Fuzzy Matching)
•   Lista de resultados (Results List)
•   Peso (Weighting)
•   Precisão (Recall and Precision)
Velocidade     Precisão
                       Resultado   Encontrar sempre
                       imediato      documentos
   Âmbito                             relevantes
 Procurar todos os
   documentos
     da Web
                 Um Motor de Localização
                                  Conhecer o local
                Pesquisa perfeito do utilizador
Actualidade
Toda a informação
  é actualizada Personalização Prioridade
                                  Os documentos
                    Conhecer as
                                  mais relevantes
                  necessidades do
                                   em primeiro
                     utilizador
                                       lugar
Componentes de um Motor de Pesquisa
 • Batedores: descobrem e recolhem automáticamente
   conteúdos da web;
 • Repositório: armazena as páginas recolhidas;
 • Indexador: extrai as palavras das páginas armazenadas e
   cria índices para acelerar as pesquisas;
 • Ordenador: ordena as páginas que contenham os termos
   pesquisados por um utilizador de modo a que as mais
   relevantes sejam apresentadas nos primeiros lugares;
 • Apresentador: gere a interface de utilização do motor de
   busca.
Indexação e ordenação
• Frequência de termos: as páginas mais importantes para uma palavra
  são as que a repetem mais vezes no texto;
• PageRank: é um algoritmo matemático em que as páginas mais
  importantes são as que recebem o maior número de links ou links das
  páginas mais importantes;
• Número de links: as páginas mais importantes são as que recebem o
  maior número de links;
• tf-idf: calcula a importância da página combinando a frequência de
  um termo com a importância desse termo no conjunto de todas as
  páginas armazenadas;
• Estrutura da página: a importância de uma página é dada pela
  localização de um termo na sua estrutura. Por exemplo, as páginas
  mais importantes são as que contêm o termo no titulo;
• Análise de URLs: as páginas mais importantes são as que contêm os
  termos no URL que as refere.
Motor de Pesquisa
•   Indexação do Texto - extraindo o conteúdo relevante de
    cada página, descartando:
        Lista de palavras vazias (SWL – Stop Word List)
    –   Artigos, preposições, conjunções e pronomes
    –   Verbos comuns (saber, ver, fazer, ser, etc.)
    –   Adjectivos comuns (grande, alto, atrasado, etc.)
    –   Qualquer palavra que apareça em todos os documentos
    –   Qualquer palavra que apareça apenas em um documento
•   Indexação META – Indexando preferencialmente as
    palavras chave colocadas pelo autor na meta-informação
    de cada página
Motor de Pesquisa
     Pertinência da Página
• Densidade das palavras
• Frequência das palavras
• Proximidade das palavras
• Links externos para a página
• META tags
Exemplo de um Problema
Impressionismo francês
Impressionismo francês

                         Claude Monet
                         Claude Monet
    Exposições
    Exposições
                         Renoir
                         Renoir
Museu de Giverny
Museu de Giverny
                         Livros
                         Livros
A solução

O destinatário    A semântica
Personalização
Personalização     Taxinomia
                   Taxinomia

 Localização
 Localização       Sinónimos
                   Sinónimos

                   Traduções
                   Traduções
Comparação entre Motores de Pesquisa




                 http://www.searchengineshowdown.com/features/
Estatísticas dos Motores de Pesquisa
Fidelidade aos Motores de Pesquisa
Forças e fraquezas do Google (Junho 2004)
• Strengths:
   * Size and scope: It is now the largest, and includes PDF, DOC, PS,
  and many other file types
   * Relevance based on sites' linkages and authority
   * Cached archive of Web pages as the looked were indexed
   * Additional databases: Google Groups, News, Directory, etc.
• Weaknesses: See also the Google Inconsistencies Page
   * Limited search features: no nesting, no truncation, does not support
  full Boolean
   * Link searches must be exact and are incomplete
   * Only indexes first 101 KB of a Web page and about 120 KB of
  PDFs
   * May search for plural/singular, synonyms, and grammatical
  variants without telling you
                          http://www.searchengineshowdown.com/features/google/review.html
Operadores booleanos no Google
 Para esta operação,     no Google é assim

        x AND y                 xy
         x OR y               x OR y
     x AND (y OR z)          x y OR z
(x AND y) OR (z AND q)   Ainda não possível
 (x OR y) AND (z OR q)    x OR y z OR q
  x AND (y OR z OR q)     x y OR z OR q
 x AND (y OR z) AND q       x y OR z q
Sites sobre recursos de pesquisa

         http://www.searchengineshowdown.com/

            http://searchenginewatch.com/


           http://www.webmasterworld.com/
Notícias
http://news.google.com/


http://www.altavista.com/news/

 http://www.alltheweb.com/?cat=news

 http://www.totalnews.com/

  http://www.newsindex.com/

   http://news.yahoo.com/
Multi-Search Engines
• Copernic http://www.copernic.com/
   AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fast
  Search), FindWhat, HotBot, LookSmart, Lycos, Mamma.com, MSN
  Web Search, Netscape Netcenter, Open Directory, Teoma, WiseNut,
  Yahoo.
• Search http://www.search.com/
  AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler,
  Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy e
  NationalDirectory.
• MetaCrawler http://www.metacrawler.com/
  Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo
  e Yahoo.
• C4 http://www.c4.com/
  AltaVista, Yahoo!, InfoSeek. Excite, Lycos, NBCi.com, Magellan,
  WebCrawler e HotBot.
• DogPile http://www.dogpile.com/
  LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory,
  About.com, Direct Hit, Lycos e AltaVista.
• InfoSpace http://www.infospace.com/
  Excite, AltaVista, Infoseek e WebCrawler.
Grandes Arquivos Históricos da WEB

 • http://web.archive.org

 • http://www.gigablast.com
Comparação entre Directórios




              http://www.searchengineshowdown.com/dir/
Directórios
• http://www.yahoo.com
• http://www.looksmart.com
• http://www.dmoz.com
Pesquisa de Imagens, Audio e Vídeo
• AllTheWeb
  http://www.alltheweb.com/
• AltaVista
  http://www.altavista.com/
• Ditto (só imagens)
  http://www.ditto.com/
• Google Images (só imagens)
  http://images.google.com
• Kazaa Media Desktop (só MP3)
  http://www.kazaa.com/
• Lycos Pictures and Sounds
  http://multimedia.lycos.com/
• MIDI Explorer (Só MIDI)
  http://www.musicrobot.com/
• Picsearch (só imagens)
  http://www.picsearch.com/
• Singingfish (Só som e video)
  http://www.singingfish.com/
Listas Telefónicas
•   Switchboard - http://www.switchboard.com/
•   InfoSpace - http://www.infospace.com/
•   AnyWho - http://www.anywho.com/
•   SuperPages.com - http://www.superpages.com/
•   SmartPages.com - http://www.smartpages.com/
•   WhoWhere - http://www.whowhere.lycos.com/
•   Infobel - http://www.infobel.com/
•   InfoUSA - http://www.infousa.com/
•   All Nations Telephone Search Engine -
    http://www.escapeartist.com/global/telephone.htm
•   Phonenumber.com - http://www.phonenumber.com/
•   International Numbering Plans - http://www.numberingplans.com/
•   411 Information - http://www.411.info
•   GeoPortals.com, Inc. - http://finder.geoportals.com/
•   140Online - http://www.140online.com/
•   Search Detective Reverse Phone Lookup - http://www.searchdetective.net/
•   McPayphone - http://www.geocities.com/bootzilla00/
•   Apni Directory - http://www.apnidirectory.com/
•   Jay Computer Services - http://nt.jcsm.com/
•   Zip and Area Code Directory - http://www.horizon-realty.us/whrzipar.htm
•   Email Address Finder - http://www.allemailaddresses.com/
Enciclopédias
                http://www.wikipedia.org/

                   http://www.britannica.com/

• Living Encyclopedia in Cyberspace -
  http://www.encyberpedia.com/ency.htm
• The Virtual Encyclopedia -
  http://www.abp1.com/knowledgeispower/index.ht
  ml
• Search-22 - Reference Search Engines -
  http://www.search-22.com/reference.html
• Access Place Library -
  http://www.accessplace.com/library.htm
Gestão do Conhecimento
•   KTweb - http://www.ktweb.org
•   The Knowledge Management Connection - http://www.KMconnection.com
•   Knowledge Management Resource Center - http://www.kmresource.com
•   Knowledge Management Resource Center - http://www.bio-
    itworld.com/resources/km/
•   Netacademy on Knowledge Media - http://www.knowledgemedia.org
•   ICASIT's Knowledge Management Central - http://www.icasit.org/km/
•   Knowledge Management Server - http://www.mccombs.utexas.edu/kman/
•   Meta Knowledge Management - http://www.metakm.com
•   Knowledge Management Center Info - http://www.kmcenter.info/
•   KMTool - http://www.kmtool.net
•   Gotcha -
    http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index.html
•   Knowledge-Portal.com - http://www.knowledge-portal.com/
•   Knowledge Management Links - http://www.lepak.com/kmlinks.html
•   Knowledge Portal on Document and Data Organization -
    http://members.lycos.co.uk/UFitsME/knowledge.html
Bibliotecas
•   LibDex - http://www.libdex.com/
•   School Libraries on the Web - http://www.sldirectory.com/
•   Lib Web Cats - http://www.librarytechnology.org/libwebcats/
•   Libweb - http://lists.webjunction.org/libweb/
•   Lii.org: Librarianship - http://lii.org/search/file/libraries
•   National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/
•   Library and Information Science - http://www.ifla.org/II/natlibs.htm
•   ALiNUS -
    http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Home.html
•   The WWW Library Directory - http://www.webpan.com/msauers/libdir/
•   NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/
•   Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html
•   Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/
•   Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html
•   UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/
•   LibraryBug - http://www.librarybug.org
•   Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html
•   ISBNDB - http://isbndb.com/
•   Internet Quick Reference Shelf: Library Resources -
    http://www.indiana.edu/~librcsd/internet/Library_Resources/
•   Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm
•   Libraries and Archives - http://www.uky.edu/Subject/libraries.html
•   List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm
•   Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm
•   Global Reach - https://cs.ala.org/global/
•   Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html
•   Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html
•   US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html
•   Bishop Library Index - http://members.lycos.co.uk/kbishoplib/
Mapas
• Maps on Other Web Sites -
  http://www.lib.utexas.edu/maps/map_sites/map_sites.html
• All the World's Maps -
  http://www.embassyworld.com/maps/maps.html
• Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php
• About.com: Maps - http://geography.about.com/cs/maps/
• Bodleian Library Map Room -
  http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm
• StreetLookup.Com - http://www.streetlookup.com/
• Alexandria Digital Library -
  http://www.alexandria.ucsb.edu/other-sites/subj_page.html
• Maps from start4all - http://maps.start4all.com/
• Links 4 Maps - http://www.links4maps.com/
Directórios




http://www.google.com/dirhp



                              http://dir.yahoo.com/
Directórios
•   The Invisible Web Directory - http://www.invisible-   •   Re-Quest dot Net - http://www.re-quest.net/
    web.net/                                              •   Blakkat Station - http://blakkat.com/
•   ThisIsOurYear - http://www.thisisouryear.com/         •   1st Spot - http://1st-spot.net/
•   Common Content - http://www.commoncontent.org/        •   Hoppa - http://hoppa.com/
•   Nations Online -                                      •   Fetch Dog - http://www.fetchdog.com/
    http://www.nationsonline.org/oneworld/                •   Forum Zilla - http://www.forumzilla.com/
•   Chiff - http://www.chiff.com/                         •   The Library Channel -
•   VisioBrand - http://www.visiobrand.com/                   http://www.thelibrarychannel.com/
•   GoGuides Directory - http://www.goguides.org          •   Wealth24.com - http://www.wealth24.com/
•   Gimpsy - http://www.gimpsy.com/                       •   intelSeek! - http://www.intelseek.com/
•   Starting Page - http://www.startingpage.com/          •   Got That Online - http://www.gotthatonline.com/
•   DateDex - http://www.datedex.com/                     •   E-lynks - http://www.e-lynks.com/
•   Surfpoint - http://www.surfpoint.com/                 •   GirlHoo - http://www.girlhoo.com/
•   123World - http://www.123world.com/                   •   Leon's Web Brain -
•   Web World Directory -                                     http://www.leonatkinson.com/brain/
    http://www.webworldindex.com/                         •   iMarvel - http://www.imarvel.com/
•   Sight Quest - http://www.sightquest.com/              •   Smart Links - http://www.smartlinks.org/
•   SearchMonster - http://www.searchmonster.org/         •   Smart Internet Guide -
•   La Toile des Toiles - http://www.la-toile.com/            http://www.smartinternetguide.com/
•   Somuch - http://www.somuch.com/                       •   A Perfect Search - http://aperfectsearch.com/
•   Andilinks - http://www.andilinks.com/                 •   Consumer2.com - http://www.consumer2.com/
•   Linkopedia - http://www.linkopedia.com/               •   MVRU.com - http://www.mvru.com
•   Josh's Sanctum - http://josh.nu/                      •   Ranks - http://ranks.com/
•   Yakeo - http://www.yakeo.com/                         •   Aeiwi - http://www.aeiwi.com/
•   All.info - http://all.info/                           •   Rex - http://rex.skyline.net/
•   Earth Station Nine - http://www.earthstation9.com/
A família Yahoo
• Yahoo! - http://www.yahoo.com/
  Directório principal

• AllTheWeb - http://www.alltheweb.com/
  Motor de pesquisa do Yahoo

• Yahooligans! - http://yahooligans.yahoo.com/
  Para crianças

• Ujiko - http://www.ujiko.com/
  Pesquisa personalizada do Yahoo
Forças e fraquezas do Yahoo (Abril 2005)
• Strengths:
    * A large, new (as of Feb. 2004) search engine database
    * Includes cached copies of pages
    * Also includes links to the Yahoo! directory
    * Supports full Boolean searching
• Weaknesses:
    * Lack of some advanced search features such as
  truncation
    * Only indexes first 500 KB of a Web page (still more than
  Google's 101KB)
    * Link searches require the inclusion of the http://
    * Includes some pay for inclusion sites

                       http://www.searchengineshowdown.com/features/yahoo/review.html
Pesquisar publicações científicas


                           http://scholar.google.pt/




                     Directórios

http://infomine.ucr.edu/                               http://lii.org/
Sítios para Crianças


Yahoo! Kids           http://www.yahooligans.com
Kids Click!           http://www.kidsclick.org
ThinkQuest Entries    http://www.thinkquest.org/library
Kids Search Tool      http://www.rcls.org/ksearch.htm
Ask Jeeves for Kids   http://www.askforkids.com/
Pesquisadores
para encaminhamento em Portugal

           http://www.iupi.pt/
          http://www.busca.pt/

           http://www.aeiou.pt/

            http://www.sapo.pt/

           http://www.cusco.pt
Portais e Jornais portugueses

          http://www.lusomundo.net

            http://www.iol.pt/


              http://dn.sapo.pt/

            http://jn.sapo.pt/


             http://www.publico.pt/
Televisões portuguesas

     http://www.rtp.pt

     http://www.sic.pt

     http://www.tvi.iol.pt

      http://www.sporttv.pt

     http://www.telecine.pt
Rádios portuguesas
http://www.radiocomercial.pt

      http://www.tsf.pt

   http://www.rdp.pt/antena1
   http://www.rdp.pt/antena2

   http://www.rdp.pt/antena3

      http://www.radiocidade.iol.pt

       http://www.rr.pt/
Legislação

  http://www.dr.incm.pt



    http://www.digesto.gov.pt/
Governo, Parlamento e Administração Pública
                 http://www.portaldocidadao.pt


                     http://www.lojadocidadao.pt

                         http://www.portugal.gov.pt

                            http://www.parlamento.pt


                                  http://www.dgo.pt


                      http://www.dgap.gov.pt
http://www.zdnet.com
http://www.hotfiles.com
http://www.shareware.com


http://www.tucows.com

http://www.jumbo.com
Notícias para os profissionais
        de Informação
• ResourceShelf
  http://www.resourceshelf.com/
• LLRX (Legislação)
  http://www.llrx.com/
• Librarians' Index to the Internet
  http://lii.org/
• INFOMINE
  http://infomine.ucr.edu/
• The Internet Scout Project
  http://scout.wisc.edu/
http://lii.org
   Sítios
confiáveis
Tipos de som na Internet
MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um
standard para a codificação e compressão de sinais áudio. Faz diminuir o
tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação
perceptual de áudio" e "compressão psico-acústica" removem partes do
sinal que pouca diferença fazem à forma como de facto ouvimos os sons.

WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por
exemplo para os pequenos ruídos que um computador emite para indicar
que o Windows foi iniciado ou a reciclagem foi limpa.

Streaming Streaming audio ou streaming media é uma técnica que
permite ouvir parte do ficheiro antes do download estar concluído.
Funciona através do download e armazenamento de uma secção suficiente
do ficheiro para actuar como buffer, permitindo a reprodução da música
mesmo que a transmissão seja brevemente interrompida. Pode tirar uma
amostra do áudio e decidir se pretende continuar a download ou
simplesmente cancelar. Se por qualquer motivo a transmissão ficar
demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos
bem.
Vídeo na Internet
AVI Audio Video Interleaved.AVI. um formato multimédia da
Microsoft , utilizado pelo Video for Windows. Os elementos áudio
e vídeo são armazenados em segmentos alternados no ficheiro
(.avi).

MPEG Moving Pictures Experts Group standard para
compressão e armazenamento de vídeos (.mpg)

Windows Media e Microsoft's Windows Media Player (.asf)

Real RealNetwork's RealVideo (.ram)

Quicktime extensão do ficheiro Windows: .mov
Requisitos de Segurança
• Integridade
      – Complecta e não alterada
• Confidencialidade
      – Acesso condicionado
• Autenticidade
      – Identidade da pessoa
• Não repúdio
      – Transacção garantida
Assinaturas digitais

                      Entidade
                       Entidade
                 a                         a
              lic                       lic
                     Certificadora
                     Certificadora
            úb
           P A                        úb
                                     P B




                                AE



    a da                                           a da
 riv
P A                                             riv
                                               P B



           A                                              B
CAPTCHA
 "Completely Automated Public Turing test to
     tell Computers and Humans Apart“
                   Carnegie Mellon University
Garantir que a resposta não é gerada por computadores, mas por humanos




                                                     Turing Test (1950)
Fishing

Mais conteúdo relacionado

Semelhante a Pesquisa Avançada na Internet

Novas Tecnologias em Comunicação
Novas Tecnologias em ComunicaçãoNovas Tecnologias em Comunicação
Novas Tecnologias em ComunicaçãoElvis Fusco
 
Monitoramento, Dados e Informação Online
Monitoramento, Dados e Informação OnlineMonitoramento, Dados e Informação Online
Monitoramento, Dados e Informação OnlineTarcízio Silva
 
Como desenvolver negócios a partir da internet
Como desenvolver negócios a partir da internetComo desenvolver negócios a partir da internet
Como desenvolver negócios a partir da internetJosé Azarite
 
Ecossistemas de Atenção - Maximidia2013
Ecossistemas de Atenção - Maximidia2013Ecossistemas de Atenção - Maximidia2013
Ecossistemas de Atenção - Maximidia2013Marcelo Coutinho Lima
 
Twittness
TwittnessTwittness
Twittnessmvitor
 
Atuação dos Estatísticos no Mercado de Internet
Atuação dos Estatísticos no Mercado de InternetAtuação dos Estatísticos no Mercado de Internet
Atuação dos Estatísticos no Mercado de InternetFabrício Gomes
 
02 aspectos históricos
02 aspectos históricos02 aspectos históricos
02 aspectos históricosCarlos Silva
 
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digital
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digitalDesafios para Corretores de Imóveis e Imobiliárias no Marketing digital
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digitalVinicius Ayres
 
Dez motivos para você continuar desenvolvendo para a Web
Dez motivos para você continuar desenvolvendo para a WebDez motivos para você continuar desenvolvendo para a Web
Dez motivos para você continuar desenvolvendo para a WebReinaldo Ferraz
 
Web 3.0: desafios e oportunidades para as empresas
Web 3.0: desafios e oportunidades para as empresasWeb 3.0: desafios e oportunidades para as empresas
Web 3.0: desafios e oportunidades para as empresasReinaldo Ferreira
 
Interatividade gerando Resultados
Interatividade gerando ResultadosInteratividade gerando Resultados
Interatividade gerando ResultadosWillie Taminato
 
Web 2.0, web 3.0 e Plataforma Flash
Web 2.0, web 3.0 e Plataforma FlashWeb 2.0, web 3.0 e Plataforma Flash
Web 2.0, web 3.0 e Plataforma FlashAna Laura Gomes
 
Palestra: Marketing Digital para Micros e Pequenas Empresas
Palestra: Marketing Digital para Micros e Pequenas EmpresasPalestra: Marketing Digital para Micros e Pequenas Empresas
Palestra: Marketing Digital para Micros e Pequenas EmpresasValdir Bácìga
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Luiz Adolfo de Andrade
 
O rotary da amazônia e as redes sociais - diminuindo distâncias.
O rotary da amazônia e as redes sociais - diminuindo distâncias.O rotary da amazônia e as redes sociais - diminuindo distâncias.
O rotary da amazônia e as redes sociais - diminuindo distâncias.Jerônimo Júnior Sodré
 
Apresentação - Curso de Marketing nas Mídias Sociais
Apresentação - Curso de Marketing nas Mídias SociaisApresentação - Curso de Marketing nas Mídias Sociais
Apresentação - Curso de Marketing nas Mídias SociaisOpus Mkt
 

Semelhante a Pesquisa Avançada na Internet (20)

Novas Tecnologias em Comunicação
Novas Tecnologias em ComunicaçãoNovas Tecnologias em Comunicação
Novas Tecnologias em Comunicação
 
Monitoramento, Dados e Informação Online
Monitoramento, Dados e Informação OnlineMonitoramento, Dados e Informação Online
Monitoramento, Dados e Informação Online
 
Como desenvolver negócios a partir da internet
Como desenvolver negócios a partir da internetComo desenvolver negócios a partir da internet
Como desenvolver negócios a partir da internet
 
Ecossistemas de Atenção - Maximidia2013
Ecossistemas de Atenção - Maximidia2013Ecossistemas de Atenção - Maximidia2013
Ecossistemas de Atenção - Maximidia2013
 
Twittness
TwittnessTwittness
Twittness
 
Atuação dos Estatísticos no Mercado de Internet
Atuação dos Estatísticos no Mercado de InternetAtuação dos Estatísticos no Mercado de Internet
Atuação dos Estatísticos no Mercado de Internet
 
02 aspectos históricos
02 aspectos históricos02 aspectos históricos
02 aspectos históricos
 
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digital
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digitalDesafios para Corretores de Imóveis e Imobiliárias no Marketing digital
Desafios para Corretores de Imóveis e Imobiliárias no Marketing digital
 
Dez motivos para você continuar desenvolvendo para a Web
Dez motivos para você continuar desenvolvendo para a WebDez motivos para você continuar desenvolvendo para a Web
Dez motivos para você continuar desenvolvendo para a Web
 
Web 3.0: desafios e oportunidades para as empresas
Web 3.0: desafios e oportunidades para as empresasWeb 3.0: desafios e oportunidades para as empresas
Web 3.0: desafios e oportunidades para as empresas
 
Interatividade gerando Resultados
Interatividade gerando ResultadosInteratividade gerando Resultados
Interatividade gerando Resultados
 
Comércio Eletrônico
Comércio EletrônicoComércio Eletrônico
Comércio Eletrônico
 
Organizações virtuais
Organizações virtuaisOrganizações virtuais
Organizações virtuais
 
Web 2.0, web 3.0 e Plataforma Flash
Web 2.0, web 3.0 e Plataforma FlashWeb 2.0, web 3.0 e Plataforma Flash
Web 2.0, web 3.0 e Plataforma Flash
 
Palestra: Marketing Digital para Micros e Pequenas Empresas
Palestra: Marketing Digital para Micros e Pequenas EmpresasPalestra: Marketing Digital para Micros e Pequenas Empresas
Palestra: Marketing Digital para Micros e Pequenas Empresas
 
Internet
InternetInternet
Internet
 
Consumidor Digital
Consumidor DigitalConsumidor Digital
Consumidor Digital
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2
 
O rotary da amazônia e as redes sociais - diminuindo distâncias.
O rotary da amazônia e as redes sociais - diminuindo distâncias.O rotary da amazônia e as redes sociais - diminuindo distâncias.
O rotary da amazônia e as redes sociais - diminuindo distâncias.
 
Apresentação - Curso de Marketing nas Mídias Sociais
Apresentação - Curso de Marketing nas Mídias SociaisApresentação - Curso de Marketing nas Mídias Sociais
Apresentação - Curso de Marketing nas Mídias Sociais
 

Mais de Luis Vidigal

Apresentação da CIeLP 5_5_2023a.pdf
Apresentação da CIeLP 5_5_2023a.pdfApresentação da CIeLP 5_5_2023a.pdf
Apresentação da CIeLP 5_5_2023a.pdfLuis Vidigal
 
Highscore - Curso de Inovação em Serviços Públicos - 11 e 12 outubro 2021
Highscore - Curso de Inovação em Serviços Públicos  - 11 e 12 outubro 2021Highscore - Curso de Inovação em Serviços Públicos  - 11 e 12 outubro 2021
Highscore - Curso de Inovação em Serviços Públicos - 11 e 12 outubro 2021Luis Vidigal
 
Highscore - Luis Vidigal - Curso de eGovernment - 11 e 12 outubro 2021
Highscore - Luis Vidigal  - Curso de eGovernment - 11 e 12 outubro 2021Highscore - Luis Vidigal  - Curso de eGovernment - 11 e 12 outubro 2021
Highscore - Luis Vidigal - Curso de eGovernment - 11 e 12 outubro 2021Luis Vidigal
 
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...Luis Vidigal
 
OGP PASC Vidigal forum 9 12 2020
OGP PASC Vidigal forum 9 12 2020OGP PASC Vidigal forum 9 12 2020
OGP PASC Vidigal forum 9 12 2020Luis Vidigal
 
Luis Vidigal - Tecnologias e Cidadania
Luis Vidigal - Tecnologias e CidadaniaLuis Vidigal - Tecnologias e Cidadania
Luis Vidigal - Tecnologias e CidadaniaLuis Vidigal
 
Luis vidigal 1999 a revolucao ap
Luis vidigal 1999   a revolucao apLuis vidigal 1999   a revolucao ap
Luis vidigal 1999 a revolucao apLuis Vidigal
 
Luis Vidigal - Rendimento Básico Universal (RBU) - Uma inevitabilidade para o...
Luis Vidigal - Rendimento Básico Universal (RBU)- Uma inevitabilidade para o...Luis Vidigal - Rendimento Básico Universal (RBU)- Uma inevitabilidade para o...
Luis Vidigal - Rendimento Básico Universal (RBU) - Uma inevitabilidade para o...Luis Vidigal
 
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019Luis Vidigal
 
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)Luis Vidigal
 
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...Luis Vidigal
 
Luis Vidigal Q-Day 2015
Luis Vidigal   Q-Day 2015Luis Vidigal   Q-Day 2015
Luis Vidigal Q-Day 2015Luis Vidigal
 
Visão TIC 2020 na AP - Contributos de Luís Vidigal
Visão TIC 2020 na AP - Contributos de Luís VidigalVisão TIC 2020 na AP - Contributos de Luís Vidigal
Visão TIC 2020 na AP - Contributos de Luís VidigalLuis Vidigal
 
Luis Vidigal - Inovação em serviços públicos - IGAS - jul 2015
Luis Vidigal -  Inovação em serviços públicos - IGAS - jul 2015Luis Vidigal -  Inovação em serviços públicos - IGAS - jul 2015
Luis Vidigal - Inovação em serviços públicos - IGAS - jul 2015Luis Vidigal
 
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015Luis Vidigal
 
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015Luis Vidigal
 
CIBI 1988 As TI face à Modernização Administrativa em Portugal - Luis Vi...
CIBI 1988   As TI face à Modernização Administrativa em Portugal - Luis Vi...CIBI 1988   As TI face à Modernização Administrativa em Portugal - Luis Vi...
CIBI 1988 As TI face à Modernização Administrativa em Portugal - Luis Vi...Luis Vidigal
 
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outrosLuis Vidigal
 
ICA 23th Conference, Oslo 1989 - Luis Vidigal - Information Technology and T...
ICA 23th Conference, Oslo 1989 -  Luis Vidigal - Information Technology and T...ICA 23th Conference, Oslo 1989 -  Luis Vidigal - Information Technology and T...
ICA 23th Conference, Oslo 1989 - Luis Vidigal - Information Technology and T...Luis Vidigal
 
Respublica - Um Olhar sobre a Administração - 1992
Respublica -  Um Olhar sobre a Administração - 1992Respublica -  Um Olhar sobre a Administração - 1992
Respublica - Um Olhar sobre a Administração - 1992Luis Vidigal
 

Mais de Luis Vidigal (20)

Apresentação da CIeLP 5_5_2023a.pdf
Apresentação da CIeLP 5_5_2023a.pdfApresentação da CIeLP 5_5_2023a.pdf
Apresentação da CIeLP 5_5_2023a.pdf
 
Highscore - Curso de Inovação em Serviços Públicos - 11 e 12 outubro 2021
Highscore - Curso de Inovação em Serviços Públicos  - 11 e 12 outubro 2021Highscore - Curso de Inovação em Serviços Públicos  - 11 e 12 outubro 2021
Highscore - Curso de Inovação em Serviços Públicos - 11 e 12 outubro 2021
 
Highscore - Luis Vidigal - Curso de eGovernment - 11 e 12 outubro 2021
Highscore - Luis Vidigal  - Curso de eGovernment - 11 e 12 outubro 2021Highscore - Luis Vidigal  - Curso de eGovernment - 11 e 12 outubro 2021
Highscore - Luis Vidigal - Curso de eGovernment - 11 e 12 outubro 2021
 
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...
BOBCATSSS 2021 - The Future of Digital Transformation in Government Administr...
 
OGP PASC Vidigal forum 9 12 2020
OGP PASC Vidigal forum 9 12 2020OGP PASC Vidigal forum 9 12 2020
OGP PASC Vidigal forum 9 12 2020
 
Luis Vidigal - Tecnologias e Cidadania
Luis Vidigal - Tecnologias e CidadaniaLuis Vidigal - Tecnologias e Cidadania
Luis Vidigal - Tecnologias e Cidadania
 
Luis vidigal 1999 a revolucao ap
Luis vidigal 1999   a revolucao apLuis vidigal 1999   a revolucao ap
Luis vidigal 1999 a revolucao ap
 
Luis Vidigal - Rendimento Básico Universal (RBU) - Uma inevitabilidade para o...
Luis Vidigal - Rendimento Básico Universal (RBU)- Uma inevitabilidade para o...Luis Vidigal - Rendimento Básico Universal (RBU)- Uma inevitabilidade para o...
Luis Vidigal - Rendimento Básico Universal (RBU) - Uma inevitabilidade para o...
 
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019
Candidatura aos Corpos Sociais da APDSI para o triénio 2017-2019
 
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)
Inovação em Serviços Públicos - Luis Vidigal (Highscore - Outubro 2016)
 
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...
Apresentação de Luís Vidigal na 1ª Conferência Nacional de Professores de Inf...
 
Luis Vidigal Q-Day 2015
Luis Vidigal   Q-Day 2015Luis Vidigal   Q-Day 2015
Luis Vidigal Q-Day 2015
 
Visão TIC 2020 na AP - Contributos de Luís Vidigal
Visão TIC 2020 na AP - Contributos de Luís VidigalVisão TIC 2020 na AP - Contributos de Luís Vidigal
Visão TIC 2020 na AP - Contributos de Luís Vidigal
 
Luis Vidigal - Inovação em serviços públicos - IGAS - jul 2015
Luis Vidigal -  Inovação em serviços públicos - IGAS - jul 2015Luis Vidigal -  Inovação em serviços públicos - IGAS - jul 2015
Luis Vidigal - Inovação em serviços públicos - IGAS - jul 2015
 
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015
Highscore - Luis Vidigal - Boas práticas de e-Government - Julho 2015
 
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015
Luis vidigal - Working in a digital and inclusive government - COST Peniche 2015
 
CIBI 1988 As TI face à Modernização Administrativa em Portugal - Luis Vi...
CIBI 1988   As TI face à Modernização Administrativa em Portugal - Luis Vi...CIBI 1988   As TI face à Modernização Administrativa em Portugal - Luis Vi...
CIBI 1988 As TI face à Modernização Administrativa em Portugal - Luis Vi...
 
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outros
 
ICA 23th Conference, Oslo 1989 - Luis Vidigal - Information Technology and T...
ICA 23th Conference, Oslo 1989 -  Luis Vidigal - Information Technology and T...ICA 23th Conference, Oslo 1989 -  Luis Vidigal - Information Technology and T...
ICA 23th Conference, Oslo 1989 - Luis Vidigal - Information Technology and T...
 
Respublica - Um Olhar sobre a Administração - 1992
Respublica -  Um Olhar sobre a Administração - 1992Respublica -  Um Olhar sobre a Administração - 1992
Respublica - Um Olhar sobre a Administração - 1992
 

Último

UFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfUFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfManuais Formação
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfAnaGonalves804156
 
geografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundogeografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundonialb
 
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 anoAdelmaTorres2
 
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfDIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfIedaGoethe
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosAntnyoAllysson
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirIedaGoethe
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesMary Alvarenga
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniCassio Meira Jr.
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Atividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoAtividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoMary Alvarenga
 
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxApostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxIsabelaRafael2
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfaulasgege
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalJacqueline Cerqueira
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
Mesoamérica.Astecas,inca,maias , olmecas
Mesoamérica.Astecas,inca,maias , olmecasMesoamérica.Astecas,inca,maias , olmecas
Mesoamérica.Astecas,inca,maias , olmecasRicardo Diniz campos
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditaduraAdryan Luiz
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 anoandrealeitetorres
 
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024Sandra Pratas
 

Último (20)

UFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdfUFCD_10392_Intervenção em populações de risco_índice .pdf
UFCD_10392_Intervenção em populações de risco_índice .pdf
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
 
geografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundogeografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundo
 
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
637743470-Mapa-Mental-Portugue-s-1.pdf 4 ano
 
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfDIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteiros
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimir
 
A Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das MãesA Arte de Escrever Poemas - Dia das Mães
A Arte de Escrever Poemas - Dia das Mães
 
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e TaniModelos de Desenvolvimento Motor - Gallahue, Newell e Tani
Modelos de Desenvolvimento Motor - Gallahue, Newell e Tani
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Atividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoAtividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu Abrigo
 
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptxApostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
Apostila da CONQUISTA_ para o 6ANO_LP_UNI1.pptx
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdf
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem Organizacional
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
Mesoamérica.Astecas,inca,maias , olmecas
Mesoamérica.Astecas,inca,maias , olmecasMesoamérica.Astecas,inca,maias , olmecas
Mesoamérica.Astecas,inca,maias , olmecas
 
trabalho wanda rocha ditadura
trabalho wanda rocha ditaduratrabalho wanda rocha ditadura
trabalho wanda rocha ditadura
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 ano
 
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
 

Pesquisa Avançada na Internet

  • 1. Pesquisa Avançada na Internet Luís Vidigal 2009
  • 2. Porquê o nome Internet? Interconnected Networks ou Internetwork System Começou a ser falada em 1973 A rede das redes
  • 3. Computadores a falar a mesma língua 1,6 biliões de utilizadores – 24% da população
  • 4. Utilização da Internet e População Mundial 31 de Março de 2009 Internet Cresci- População População % População Utilização Regiões do Mundo Utilização mento ( 2008 Est.) % do Mundo (Penetração) % do Mundo 2000-2008 Últimos dados África 975,330,899 4,514,400 54,171,500 5.6 % 1,100.0 % 3.4 % Ásia 3,780,819,792 114,304,000 657,170,816 17.4 % 474.9 % 41.2 % Europa 803,903,540 105,096,093 393,373,398 48.9 % 274.3 % 24.6 % Médio Oriente 196,767,614 3,284,800 45,861,346 23.3 % 1,296.2 % 2.9 % América do Norte 337,572,949 108,096,800 251,290,489 74.4 % 132.5 % 15.7 % América Latina e Caraíbas 581,249,892 18,068,919 173,619,140 29.9 % 860.9 % 10.9 % Oceania / Austrália 34,384,384 7,620,480 20,783,419 60.4 % 172.7 % 1.3 % TOTAL 6,710,029,070 360,985,492 1,596,270,108 23.8 % 342.2 % 100.0 %
  • 5. Utilizadores da Internet no Mundo Março 2009
  • 6. % de Penetração dos Utilizadores da Internet no Mundo Março 2009
  • 7. Tempo de penetração tecnológica 100 Televisão Electricidade Telefone Rádio Automóvel % Penetração Vídeo 50 PC el m óv Tele et ern Int 0 25 50 75 100 125 150 Anos
  • 8. As TIC estão a invadir o mundo real “Pervasive computing”
  • 9. Definições • Pesquisar: – Efectuar um exame completo de – Olhar com cuidado para encontrar algo • Resultados de Pesquisa: – Apresentação do conteúdo que corresponde aos critérios de pesquisa
  • 10. O que pesquisamos • Para apoiar o negócio (Compras electrónicas, etc.) • Para fins científicos (livros, jornais e artigos, etc.) • Para a nossa vida quotidiana (mapas, guias, etc.) • Para entretenimento (assunto específico do nosso interesse)
  • 11. Porque pesquisamos • Para ter resultados • Para poupar tempo • Para explorar recursos relacionados • Para facilitar a navegação na Internet
  • 12. História da Pesquisa na Web • 1990, Alan Emtage criou o Archie, uma das primeiras tentativas de organizar a informação na Internet. • 1991-92, Matthew Gray criou o primeiro robot na web. Chamou-se World Wide Web wanderer. • 1993, Início de três motores de pesquisa baseados em robots: JumpStation, World Wide Worm e Repository Based Software Engineering Spider. O Excite apreceu com o nome original de Architext. • 1994, Galaxy, dirctório pesquisável na web através de um ídice
  • 13. História da Pesquisa na Web • Abr. 1994, Aparecimento do Yahoo. • Out. 1994, Aparecimento do WebCrawler logo seguido do Lycos. • 1995, Aparecimento do Infoseek e do AltaVista • 1996, HotBot, MetaCrawler e SaavySearch. • Desde 1996, Outros motores de pesquisa
  • 14. Domínios Gerais ou de mais alto nível Tipo de Organização com - Organização Comercial edu - Instituição de Ensino gov - Entidade Governamental mil - Instituição Militar net - Hosts Administrativos org - Organização não lucrativa int - Organização internacional A Área Geográfica ISO 3166-1 pt - Portugal
  • 16. Tuvalu Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália
  • 18. Os recursos da Web profunda podem ser classificados nas seguintes categorias • Conteúdo dinâmico. • Conteúdos não linkados • Web privada • Web contextualizada • Conteúdo de acesso limitado. • Conteúdo acedido por scripts • Conteúdo de texto não HTML
  • 19. Fontes de Informação na Web • Académicos • Periódicos on-line • Sítios governamentais • Sítios de instituições especializadas • Sítios de contribuição individual • Sítios relacionados à indústria • Sítios comerciais
  • 20. Qualidade dos sítios Web Autoridade Informação especializada on-line deve ser oferecida por profissionais qualificados ou existe o esclarecimento que a informação foi fornecida por uma pessoa ou grupo não qualificado na área Complementaridade A informação on-line deve ser complementar, e não substituir o aconselhamento especializado Sigilo O sítio web assegura o sigilo de dados sobre pessoas e utilizadores, inclusive a sua identidade. Crédito O sítio web apresenta as referências das fontes que suportam as informações disponíveis (com respectivos links), e também as datas das últimas actualizações. Justificativa Apresenta os benefícios e o desempenho dos produtos e serviços baseados em evidências Autoria Oferece endereços de contanto para utilizadores que queiram mais informações; oferece e-mail do webmaster Patrocínio Apoios de organizações comerciais e não-comerciais são claramente identificadas Publicidade Anúncios publicitários são claramente identificados. Health on the Net – HON
  • 21. Qualidade dos sítios Web Credibilidade Qual a reputação da fonte? A informação está actualizada? A informação é útil? É usado algum processo de revisão editorial? Conteúdo O conteúdo é preciso e completo? Existem termos de responsabilidade no sítio? Transparência O propósito do sítio web é apresentado? Links O sítio web oferece links para informações relevantes, actualizadas, precisas e de confiança? Os links são de fácil navegação? Design O design é acessível? A navegação e buscas no site são fáceis de serem feitas? Interactividade Estão incluídos mecanismos de feedback ao utilizador? Limitações Está claro se o propósito é a divulgação e venda de produtos e serviços ou a divulgação de informação? Health Information Technology Institute
  • 22. Qualidade dos sítios Web Conteúdo O conteúdo é preciso e completo? O sítio web informa a autoria e as datas de publicação inicial e de actualização? Publicidade e Anúncios não devem influenciar na decisão sobre o conteúdo. Patrocínio Anúncios comerciais são proibidos? Privacidade e O sítio web deve solicitar a permissão do utilizador para Sigilo colectar dados pessoais. O sigilo deve ser respeitado. E-commerce Utilizadores e compradores de informações, produtos e serviços devem ter translações seguras e eficientes. Deve haver um link para o serviço de atendimento ao consumidor. American Medical Association
  • 23. Dado, Informação e Conhecimento Davenport (1998) Dado Informação Conhecimento Definição Simples Dado dotado de Informação valiosa da observação sobre o relevância e propósito mente humana, estado do mundo incluindo reflexão, síntese e contexto Caracte- •Facilmente •Requer unidade de •Difícil estruturação rísticas estruturado análise •Difícil captura em •Facilmente obtido •Exige consenso em máquinas por máquinas relação ao significado •Frequentemente tácito •Frequente- •Exige necessa- •Difícil transferência mente quantificado riamente a mediação •Facilmente humana transferível
  • 24. Pesquisadores Directórios Pessoas Índice de links organizados por temas (Yahoo, AOL, Netscape's open directory, DMOZ open directory project, MSN , etc.) Motores de Pesquisa Máquinas Indexação automática através de robots (spiders ou searchbots) (Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite, Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos, etc.)
  • 25. Como Entrar pesquisamos? Sim Quer Não paginar? Toque numa Caixa de secção pesquisa Toque numa Interrogação subsecção Não Sim Procure Resultados Não Está algo credíveis? na secção Sim Melhorar certa? interrogação Encontrou? Listar Não relevâncias Não Sim Ainda Frustrado? Quase Não Verificar Sim Não Será Sim Sim Encontrou? suficiente? Luís Vidigal
  • 26. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  • 27. Operadores booleanos a b c a AND b a AND b AND c a OR b a AND b NOT c
  • 28. Operadores booleanos (Exercícios) Vinho Tinto 1 2 3 5 4 6 7 Alentejo
  • 29. Tipos de Motores de Pesquisa • Generalistas híbridos –Google, FAST, Altavista, Hotbot • Especializados • Metamotores • Metamotores inteligentes
  • 30. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  • 31. Operadores booleanos nos principais Motores de Pesquisa (avançada) AND AND OR OR NOT NOT AND AND NOT NOT OR OR AND NOT
  • 32. Pesquisa por defeito (simples) • AND: HotBot, Google, MSN Search, Teoma, WiseNut • OR: GigaBlast • Frase: AltaVista (só para frases comuns)
  • 33. Sensível às maiúsculas • Sim: AltaVista Avançado, AltaVista Simples (entre aspas) • Só maiúsculas juntas: HotBot, MSN Search • Não: AltaVista Simples, Gigablast, Google, Lycos, Teoma, WiseNut
  • 34. Indexação de campos • title: AltaVista, Gigablast, HotBot, Lycos, MSN Search • intitle: Google, Teoma • allintitle: Google • url: AltaVista, Gigablast, Lycos Advanced • inurl: Google, Teoma • allinurl: Google • link: AltaVista, Google, Gigablast, Lycos Advanced, MSN Search • host: AltaVista (same as site: at others) • ip: Gigablast • domain: HotBot, MSN Search • site: Gigablast, Google, Teoma, (use host: at AltaVista) • anchor: AltaVista • image: AltaVista • related: Google • others: AltaVista, Gigablast, Google, HotBot, MSN Search
  • 35. Tipos de Documentos • PDFs: AltaVista, Gigablast, Google, MSN Search, HotBot • MS Word (.doc): Gigablast, Google, MSN Search, HotBot • PowerPoint (.ppt): Gigablast, Google, MSN Search, HotBot • Excel (.xls): Gigablast, Google, MSN Search, HotBot • PostScript (.ps): Gigablast, Google • WordPerfect (.wpd): Google
  • 36. Conceitos associados à pesquisa na Web • Adequação (Match) • Pesquisa booleana (Boolean Search) • Parêntesis (Parentheses) • Pesquisa combinada (Faceted Search) • Pesquisa vectorial (Vector Search) • Pergunta (Query) • Linguagem Natural (Natural Language Processing - NLP) • Adequação difusa (Fuzzy Matching) • Lista de resultados (Results List) • Peso (Weighting) • Precisão (Recall and Precision)
  • 37. Velocidade Precisão Resultado Encontrar sempre imediato documentos Âmbito relevantes Procurar todos os documentos da Web Um Motor de Localização Conhecer o local Pesquisa perfeito do utilizador Actualidade Toda a informação é actualizada Personalização Prioridade Os documentos Conhecer as mais relevantes necessidades do em primeiro utilizador lugar
  • 38. Componentes de um Motor de Pesquisa • Batedores: descobrem e recolhem automáticamente conteúdos da web; • Repositório: armazena as páginas recolhidas; • Indexador: extrai as palavras das páginas armazenadas e cria índices para acelerar as pesquisas; • Ordenador: ordena as páginas que contenham os termos pesquisados por um utilizador de modo a que as mais relevantes sejam apresentadas nos primeiros lugares; • Apresentador: gere a interface de utilização do motor de busca.
  • 39. Indexação e ordenação • Frequência de termos: as páginas mais importantes para uma palavra são as que a repetem mais vezes no texto; • PageRank: é um algoritmo matemático em que as páginas mais importantes são as que recebem o maior número de links ou links das páginas mais importantes; • Número de links: as páginas mais importantes são as que recebem o maior número de links; • tf-idf: calcula a importância da página combinando a frequência de um termo com a importância desse termo no conjunto de todas as páginas armazenadas; • Estrutura da página: a importância de uma página é dada pela localização de um termo na sua estrutura. Por exemplo, as páginas mais importantes são as que contêm o termo no titulo; • Análise de URLs: as páginas mais importantes são as que contêm os termos no URL que as refere.
  • 40. Motor de Pesquisa • Indexação do Texto - extraindo o conteúdo relevante de cada página, descartando: Lista de palavras vazias (SWL – Stop Word List) – Artigos, preposições, conjunções e pronomes – Verbos comuns (saber, ver, fazer, ser, etc.) – Adjectivos comuns (grande, alto, atrasado, etc.) – Qualquer palavra que apareça em todos os documentos – Qualquer palavra que apareça apenas em um documento • Indexação META – Indexando preferencialmente as palavras chave colocadas pelo autor na meta-informação de cada página
  • 41. Motor de Pesquisa Pertinência da Página • Densidade das palavras • Frequência das palavras • Proximidade das palavras • Links externos para a página • META tags
  • 42. Exemplo de um Problema Impressionismo francês Impressionismo francês Claude Monet Claude Monet Exposições Exposições Renoir Renoir Museu de Giverny Museu de Giverny Livros Livros
  • 43. A solução O destinatário A semântica Personalização Personalização Taxinomia Taxinomia Localização Localização Sinónimos Sinónimos Traduções Traduções
  • 44. Comparação entre Motores de Pesquisa http://www.searchengineshowdown.com/features/
  • 46. Fidelidade aos Motores de Pesquisa
  • 47. Forças e fraquezas do Google (Junho 2004) • Strengths: * Size and scope: It is now the largest, and includes PDF, DOC, PS, and many other file types * Relevance based on sites' linkages and authority * Cached archive of Web pages as the looked were indexed * Additional databases: Google Groups, News, Directory, etc. • Weaknesses: See also the Google Inconsistencies Page * Limited search features: no nesting, no truncation, does not support full Boolean * Link searches must be exact and are incomplete * Only indexes first 101 KB of a Web page and about 120 KB of PDFs * May search for plural/singular, synonyms, and grammatical variants without telling you http://www.searchengineshowdown.com/features/google/review.html
  • 48. Operadores booleanos no Google Para esta operação, no Google é assim x AND y xy x OR y x OR y x AND (y OR z) x y OR z (x AND y) OR (z AND q) Ainda não possível (x OR y) AND (z OR q) x OR y z OR q x AND (y OR z OR q) x y OR z OR q x AND (y OR z) AND q x y OR z q
  • 49. Sites sobre recursos de pesquisa http://www.searchengineshowdown.com/ http://searchenginewatch.com/ http://www.webmasterworld.com/
  • 51. Multi-Search Engines • Copernic http://www.copernic.com/ AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fast Search), FindWhat, HotBot, LookSmart, Lycos, Mamma.com, MSN Web Search, Netscape Netcenter, Open Directory, Teoma, WiseNut, Yahoo. • Search http://www.search.com/ AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler, Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy e NationalDirectory. • MetaCrawler http://www.metacrawler.com/ Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo e Yahoo. • C4 http://www.c4.com/ AltaVista, Yahoo!, InfoSeek. Excite, Lycos, NBCi.com, Magellan, WebCrawler e HotBot. • DogPile http://www.dogpile.com/ LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos e AltaVista. • InfoSpace http://www.infospace.com/ Excite, AltaVista, Infoseek e WebCrawler.
  • 52. Grandes Arquivos Históricos da WEB • http://web.archive.org • http://www.gigablast.com
  • 53. Comparação entre Directórios http://www.searchengineshowdown.com/dir/
  • 55. Pesquisa de Imagens, Audio e Vídeo • AllTheWeb http://www.alltheweb.com/ • AltaVista http://www.altavista.com/ • Ditto (só imagens) http://www.ditto.com/ • Google Images (só imagens) http://images.google.com • Kazaa Media Desktop (só MP3) http://www.kazaa.com/ • Lycos Pictures and Sounds http://multimedia.lycos.com/ • MIDI Explorer (Só MIDI) http://www.musicrobot.com/ • Picsearch (só imagens) http://www.picsearch.com/ • Singingfish (Só som e video) http://www.singingfish.com/
  • 56. Listas Telefónicas • Switchboard - http://www.switchboard.com/ • InfoSpace - http://www.infospace.com/ • AnyWho - http://www.anywho.com/ • SuperPages.com - http://www.superpages.com/ • SmartPages.com - http://www.smartpages.com/ • WhoWhere - http://www.whowhere.lycos.com/ • Infobel - http://www.infobel.com/ • InfoUSA - http://www.infousa.com/ • All Nations Telephone Search Engine - http://www.escapeartist.com/global/telephone.htm • Phonenumber.com - http://www.phonenumber.com/ • International Numbering Plans - http://www.numberingplans.com/ • 411 Information - http://www.411.info • GeoPortals.com, Inc. - http://finder.geoportals.com/ • 140Online - http://www.140online.com/ • Search Detective Reverse Phone Lookup - http://www.searchdetective.net/ • McPayphone - http://www.geocities.com/bootzilla00/ • Apni Directory - http://www.apnidirectory.com/ • Jay Computer Services - http://nt.jcsm.com/ • Zip and Area Code Directory - http://www.horizon-realty.us/whrzipar.htm • Email Address Finder - http://www.allemailaddresses.com/
  • 57. Enciclopédias http://www.wikipedia.org/ http://www.britannica.com/ • Living Encyclopedia in Cyberspace - http://www.encyberpedia.com/ency.htm • The Virtual Encyclopedia - http://www.abp1.com/knowledgeispower/index.ht ml • Search-22 - Reference Search Engines - http://www.search-22.com/reference.html • Access Place Library - http://www.accessplace.com/library.htm
  • 58. Gestão do Conhecimento • KTweb - http://www.ktweb.org • The Knowledge Management Connection - http://www.KMconnection.com • Knowledge Management Resource Center - http://www.kmresource.com • Knowledge Management Resource Center - http://www.bio- itworld.com/resources/km/ • Netacademy on Knowledge Media - http://www.knowledgemedia.org • ICASIT's Knowledge Management Central - http://www.icasit.org/km/ • Knowledge Management Server - http://www.mccombs.utexas.edu/kman/ • Meta Knowledge Management - http://www.metakm.com • Knowledge Management Center Info - http://www.kmcenter.info/ • KMTool - http://www.kmtool.net • Gotcha - http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index.html • Knowledge-Portal.com - http://www.knowledge-portal.com/ • Knowledge Management Links - http://www.lepak.com/kmlinks.html • Knowledge Portal on Document and Data Organization - http://members.lycos.co.uk/UFitsME/knowledge.html
  • 59. Bibliotecas • LibDex - http://www.libdex.com/ • School Libraries on the Web - http://www.sldirectory.com/ • Lib Web Cats - http://www.librarytechnology.org/libwebcats/ • Libweb - http://lists.webjunction.org/libweb/ • Lii.org: Librarianship - http://lii.org/search/file/libraries • National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/ • Library and Information Science - http://www.ifla.org/II/natlibs.htm • ALiNUS - http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Home.html • The WWW Library Directory - http://www.webpan.com/msauers/libdir/ • NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/ • Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html • Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/ • Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html • UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/ • LibraryBug - http://www.librarybug.org • Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html • ISBNDB - http://isbndb.com/ • Internet Quick Reference Shelf: Library Resources - http://www.indiana.edu/~librcsd/internet/Library_Resources/ • Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm • Libraries and Archives - http://www.uky.edu/Subject/libraries.html • List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm • Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm • Global Reach - https://cs.ala.org/global/ • Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html • Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html • US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html • Bishop Library Index - http://members.lycos.co.uk/kbishoplib/
  • 60. Mapas • Maps on Other Web Sites - http://www.lib.utexas.edu/maps/map_sites/map_sites.html • All the World's Maps - http://www.embassyworld.com/maps/maps.html • Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php • About.com: Maps - http://geography.about.com/cs/maps/ • Bodleian Library Map Room - http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm • StreetLookup.Com - http://www.streetlookup.com/ • Alexandria Digital Library - http://www.alexandria.ucsb.edu/other-sites/subj_page.html • Maps from start4all - http://maps.start4all.com/ • Links 4 Maps - http://www.links4maps.com/
  • 62. Directórios • The Invisible Web Directory - http://www.invisible- • Re-Quest dot Net - http://www.re-quest.net/ web.net/ • Blakkat Station - http://blakkat.com/ • ThisIsOurYear - http://www.thisisouryear.com/ • 1st Spot - http://1st-spot.net/ • Common Content - http://www.commoncontent.org/ • Hoppa - http://hoppa.com/ • Nations Online - • Fetch Dog - http://www.fetchdog.com/ http://www.nationsonline.org/oneworld/ • Forum Zilla - http://www.forumzilla.com/ • Chiff - http://www.chiff.com/ • The Library Channel - • VisioBrand - http://www.visiobrand.com/ http://www.thelibrarychannel.com/ • GoGuides Directory - http://www.goguides.org • Wealth24.com - http://www.wealth24.com/ • Gimpsy - http://www.gimpsy.com/ • intelSeek! - http://www.intelseek.com/ • Starting Page - http://www.startingpage.com/ • Got That Online - http://www.gotthatonline.com/ • DateDex - http://www.datedex.com/ • E-lynks - http://www.e-lynks.com/ • Surfpoint - http://www.surfpoint.com/ • GirlHoo - http://www.girlhoo.com/ • 123World - http://www.123world.com/ • Leon's Web Brain - • Web World Directory - http://www.leonatkinson.com/brain/ http://www.webworldindex.com/ • iMarvel - http://www.imarvel.com/ • Sight Quest - http://www.sightquest.com/ • Smart Links - http://www.smartlinks.org/ • SearchMonster - http://www.searchmonster.org/ • Smart Internet Guide - • La Toile des Toiles - http://www.la-toile.com/ http://www.smartinternetguide.com/ • Somuch - http://www.somuch.com/ • A Perfect Search - http://aperfectsearch.com/ • Andilinks - http://www.andilinks.com/ • Consumer2.com - http://www.consumer2.com/ • Linkopedia - http://www.linkopedia.com/ • MVRU.com - http://www.mvru.com • Josh's Sanctum - http://josh.nu/ • Ranks - http://ranks.com/ • Yakeo - http://www.yakeo.com/ • Aeiwi - http://www.aeiwi.com/ • All.info - http://all.info/ • Rex - http://rex.skyline.net/ • Earth Station Nine - http://www.earthstation9.com/
  • 63. A família Yahoo • Yahoo! - http://www.yahoo.com/ Directório principal • AllTheWeb - http://www.alltheweb.com/ Motor de pesquisa do Yahoo • Yahooligans! - http://yahooligans.yahoo.com/ Para crianças • Ujiko - http://www.ujiko.com/ Pesquisa personalizada do Yahoo
  • 64. Forças e fraquezas do Yahoo (Abril 2005) • Strengths: * A large, new (as of Feb. 2004) search engine database * Includes cached copies of pages * Also includes links to the Yahoo! directory * Supports full Boolean searching • Weaknesses: * Lack of some advanced search features such as truncation * Only indexes first 500 KB of a Web page (still more than Google's 101KB) * Link searches require the inclusion of the http:// * Includes some pay for inclusion sites http://www.searchengineshowdown.com/features/yahoo/review.html
  • 65. Pesquisar publicações científicas http://scholar.google.pt/ Directórios http://infomine.ucr.edu/ http://lii.org/
  • 66. Sítios para Crianças Yahoo! Kids http://www.yahooligans.com Kids Click! http://www.kidsclick.org ThinkQuest Entries http://www.thinkquest.org/library Kids Search Tool http://www.rcls.org/ksearch.htm Ask Jeeves for Kids http://www.askforkids.com/
  • 67. Pesquisadores para encaminhamento em Portugal http://www.iupi.pt/ http://www.busca.pt/ http://www.aeiou.pt/ http://www.sapo.pt/ http://www.cusco.pt
  • 68. Portais e Jornais portugueses http://www.lusomundo.net http://www.iol.pt/ http://dn.sapo.pt/ http://jn.sapo.pt/ http://www.publico.pt/
  • 69. Televisões portuguesas http://www.rtp.pt http://www.sic.pt http://www.tvi.iol.pt http://www.sporttv.pt http://www.telecine.pt
  • 70. Rádios portuguesas http://www.radiocomercial.pt http://www.tsf.pt http://www.rdp.pt/antena1 http://www.rdp.pt/antena2 http://www.rdp.pt/antena3 http://www.radiocidade.iol.pt http://www.rr.pt/
  • 71. Legislação http://www.dr.incm.pt http://www.digesto.gov.pt/
  • 72. Governo, Parlamento e Administração Pública http://www.portaldocidadao.pt http://www.lojadocidadao.pt http://www.portugal.gov.pt http://www.parlamento.pt http://www.dgo.pt http://www.dgap.gov.pt
  • 74. Notícias para os profissionais de Informação • ResourceShelf http://www.resourceshelf.com/ • LLRX (Legislação) http://www.llrx.com/ • Librarians' Index to the Internet http://lii.org/ • INFOMINE http://infomine.ucr.edu/ • The Internet Scout Project http://scout.wisc.edu/
  • 75. http://lii.org Sítios confiáveis
  • 76. Tipos de som na Internet MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um standard para a codificação e compressão de sinais áudio. Faz diminuir o tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação perceptual de áudio" e "compressão psico-acústica" removem partes do sinal que pouca diferença fazem à forma como de facto ouvimos os sons. WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por exemplo para os pequenos ruídos que um computador emite para indicar que o Windows foi iniciado ou a reciclagem foi limpa. Streaming Streaming audio ou streaming media é uma técnica que permite ouvir parte do ficheiro antes do download estar concluído. Funciona através do download e armazenamento de uma secção suficiente do ficheiro para actuar como buffer, permitindo a reprodução da música mesmo que a transmissão seja brevemente interrompida. Pode tirar uma amostra do áudio e decidir se pretende continuar a download ou simplesmente cancelar. Se por qualquer motivo a transmissão ficar demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos bem.
  • 77. Vídeo na Internet AVI Audio Video Interleaved.AVI. um formato multimédia da Microsoft , utilizado pelo Video for Windows. Os elementos áudio e vídeo são armazenados em segmentos alternados no ficheiro (.avi). MPEG Moving Pictures Experts Group standard para compressão e armazenamento de vídeos (.mpg) Windows Media e Microsoft's Windows Media Player (.asf) Real RealNetwork's RealVideo (.ram) Quicktime extensão do ficheiro Windows: .mov
  • 78. Requisitos de Segurança • Integridade – Complecta e não alterada • Confidencialidade – Acesso condicionado • Autenticidade – Identidade da pessoa • Não repúdio – Transacção garantida
  • 79. Assinaturas digitais Entidade Entidade a a lic lic Certificadora Certificadora úb P A úb P B AE a da a da riv P A riv P B A B
  • 80. CAPTCHA "Completely Automated Public Turing test to tell Computers and Humans Apart“ Carnegie Mellon University Garantir que a resposta não é gerada por computadores, mas por humanos Turing Test (1950)