2. Porquê o nome Internet?
Interconnected Networks
ou
Internetwork System
Começou a ser falada em 1973
A rede das redes
3. Computadores a falar a mesma língua
1,6 biliões de utilizadores – 24% da população
4. Utilização da Internet e População Mundial
31 de Março de 2009
Internet Cresci-
População População % População Utilização
Regiões do Mundo Utilização mento
( 2008 Est.) % do Mundo (Penetração) % do Mundo
2000-2008
Últimos dados
África 975,330,899 4,514,400 54,171,500 5.6 % 1,100.0 % 3.4 %
Ásia 3,780,819,792 114,304,000 657,170,816 17.4 % 474.9 % 41.2 %
Europa 803,903,540 105,096,093 393,373,398 48.9 % 274.3 % 24.6 %
Médio Oriente 196,767,614 3,284,800 45,861,346 23.3 % 1,296.2 % 2.9 %
América do Norte 337,572,949 108,096,800 251,290,489 74.4 % 132.5 % 15.7 %
América Latina e
Caraíbas
581,249,892 18,068,919 173,619,140 29.9 % 860.9 % 10.9 %
Oceania / Austrália 34,384,384 7,620,480 20,783,419 60.4 % 172.7 % 1.3 %
TOTAL 6,710,029,070 360,985,492 1,596,270,108 23.8 % 342.2 % 100.0 %
6. % de Penetração dos Utilizadores da Internet no Mundo
Março 2009
7. Tempo de penetração tecnológica
100 Televisão
Electricidade
Telefone
Rádio
Automóvel
% Penetração
Vídeo
50 PC
el
m óv
Tele
et
ern
Int
0 25 50 75 100 125 150
Anos
8. As TIC estão a invadir o mundo real
“Pervasive computing”
9. Definições
• Pesquisar:
– Efectuar um exame completo de
– Olhar com cuidado para encontrar algo
• Resultados de Pesquisa:
– Apresentação do conteúdo que corresponde aos
critérios de pesquisa
10. O que pesquisamos
• Para apoiar o negócio (Compras
electrónicas, etc.)
• Para fins científicos (livros, jornais e
artigos, etc.)
• Para a nossa vida quotidiana (mapas,
guias, etc.)
• Para entretenimento (assunto específico
do nosso interesse)
11. Porque pesquisamos
• Para ter resultados
• Para poupar tempo
• Para explorar recursos relacionados
• Para facilitar a navegação na Internet
12. História da Pesquisa na Web
• 1990, Alan Emtage criou o Archie, uma das
primeiras tentativas de organizar a informação na
Internet.
• 1991-92, Matthew Gray criou o primeiro robot na
web. Chamou-se World Wide Web wanderer.
• 1993, Início de três motores de pesquisa baseados
em robots: JumpStation, World Wide Worm e
Repository Based Software Engineering Spider. O
Excite apreceu com o nome original de Architext.
• 1994, Galaxy, dirctório pesquisável na web
através de um ídice
13. História da Pesquisa na Web
• Abr. 1994, Aparecimento do Yahoo.
• Out. 1994, Aparecimento do WebCrawler
logo seguido do Lycos.
• 1995, Aparecimento do Infoseek e do
AltaVista
• 1996, HotBot, MetaCrawler e SaavySearch.
• Desde 1996, Outros motores de pesquisa
14. Domínios Gerais
ou de mais alto nível
Tipo de Organização
com - Organização Comercial
edu - Instituição de Ensino
gov - Entidade Governamental
mil - Instituição Militar
net - Hosts Administrativos
org - Organização não lucrativa
int - Organização internacional
A Área Geográfica
ISO 3166-1
pt - Portugal
18. Os recursos da Web profunda podem ser
classificados nas seguintes categorias
• Conteúdo dinâmico.
• Conteúdos não linkados
• Web privada
• Web contextualizada
• Conteúdo de acesso limitado.
• Conteúdo acedido por scripts
• Conteúdo de texto não HTML
19. Fontes de Informação na Web
• Académicos
• Periódicos on-line
• Sítios governamentais
• Sítios de instituições especializadas
• Sítios de contribuição individual
• Sítios relacionados à indústria
• Sítios comerciais
20. Qualidade dos sítios Web
Autoridade Informação especializada on-line deve ser oferecida por profissionais
qualificados ou existe o esclarecimento que a informação foi fornecida
por uma pessoa ou grupo não qualificado na área
Complementaridade A informação on-line deve ser complementar, e não substituir o
aconselhamento especializado
Sigilo O sítio web assegura o sigilo de dados sobre pessoas e utilizadores,
inclusive a sua identidade.
Crédito O sítio web apresenta as referências das fontes que suportam as
informações disponíveis (com respectivos links), e também as datas das
últimas actualizações.
Justificativa Apresenta os benefícios e o desempenho dos produtos e serviços baseados
em evidências
Autoria Oferece endereços de contanto para utilizadores que queiram mais
informações; oferece e-mail do webmaster
Patrocínio Apoios de organizações comerciais e não-comerciais são claramente
identificadas
Publicidade Anúncios publicitários são claramente identificados.
Health on the Net – HON
21. Qualidade dos sítios Web
Credibilidade Qual a reputação da fonte? A informação está actualizada? A
informação é útil? É usado algum processo de revisão
editorial?
Conteúdo O conteúdo é preciso e completo? Existem termos de
responsabilidade no sítio?
Transparência O propósito do sítio web é apresentado?
Links O sítio web oferece links para informações relevantes,
actualizadas, precisas e de confiança? Os links são de fácil
navegação?
Design O design é acessível? A navegação e buscas no site são fáceis
de serem feitas?
Interactividade Estão incluídos mecanismos de feedback ao utilizador?
Limitações Está claro se o propósito é a divulgação e venda de produtos e
serviços ou a divulgação de informação?
Health Information Technology Institute
22. Qualidade dos sítios Web
Conteúdo O conteúdo é preciso e completo? O sítio web informa a
autoria e as datas de publicação inicial e de actualização?
Publicidade e Anúncios não devem influenciar na decisão sobre o conteúdo.
Patrocínio Anúncios comerciais são proibidos?
Privacidade e O sítio web deve solicitar a permissão do utilizador para
Sigilo colectar dados pessoais. O sigilo deve ser respeitado.
E-commerce Utilizadores e compradores de informações, produtos e
serviços devem ter translações seguras e eficientes. Deve
haver um link para o serviço de atendimento ao consumidor.
American Medical Association
23. Dado, Informação e Conhecimento
Davenport (1998)
Dado Informação Conhecimento
Definição Simples Dado dotado de Informação valiosa da
observação sobre o relevância e propósito mente humana,
estado do mundo incluindo reflexão,
síntese e contexto
Caracte- •Facilmente •Requer unidade de •Difícil estruturação
rísticas estruturado análise •Difícil captura em
•Facilmente obtido •Exige consenso em máquinas
por máquinas relação ao significado •Frequentemente tácito
•Frequente- •Exige necessa- •Difícil transferência
mente quantificado riamente a mediação
•Facilmente humana
transferível
24. Pesquisadores
Directórios Pessoas
Índice de links organizados por temas
(Yahoo, AOL, Netscape's open directory, DMOZ open directory
project, MSN , etc.)
Motores de Pesquisa Máquinas
Indexação automática através de robots
(spiders ou searchbots)
(Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite,
Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos,
etc.)
25. Como Entrar
pesquisamos?
Sim Quer Não
paginar?
Toque numa Caixa de
secção pesquisa
Toque numa
Interrogação
subsecção
Não
Sim Procure Resultados
Não
Está algo credíveis?
na secção Sim
Melhorar
certa? interrogação
Encontrou?
Listar
Não relevâncias
Não
Sim Ainda
Frustrado? Quase Não
Verificar
Sim Não Será Sim
Sim Encontrou?
suficiente?
Luís Vidigal
26. Estratégias de Pesquisa
Directórios por categorias
Pesquisa básica
• Any words (Quaisquer palavras)
• All words (Todas as palavras)
• Exact phrase (Frase exacta) ou “....”
Pesquisa avançada
• Pesquisa booleana (AND, OR, NOT)
• Palavras excluídas -xxx
• Palavras incluídas +xxx
Perguntas em linguagem natural
Personalização
35. Tipos de Documentos
• PDFs: AltaVista, Gigablast, Google, MSN Search,
HotBot
• MS Word (.doc): Gigablast, Google, MSN Search,
HotBot
• PowerPoint (.ppt): Gigablast, Google, MSN Search,
HotBot
• Excel (.xls): Gigablast, Google, MSN Search, HotBot
• PostScript (.ps): Gigablast, Google
• WordPerfect (.wpd): Google
36. Conceitos associados à pesquisa na Web
• Adequação (Match)
• Pesquisa booleana (Boolean Search)
• Parêntesis (Parentheses)
• Pesquisa combinada (Faceted Search)
• Pesquisa vectorial (Vector Search)
• Pergunta (Query)
• Linguagem Natural (Natural Language Processing - NLP)
• Adequação difusa (Fuzzy Matching)
• Lista de resultados (Results List)
• Peso (Weighting)
• Precisão (Recall and Precision)
37. Velocidade Precisão
Resultado Encontrar sempre
imediato documentos
Âmbito relevantes
Procurar todos os
documentos
da Web
Um Motor de Localização
Conhecer o local
Pesquisa perfeito do utilizador
Actualidade
Toda a informação
é actualizada Personalização Prioridade
Os documentos
Conhecer as
mais relevantes
necessidades do
em primeiro
utilizador
lugar
38. Componentes de um Motor de Pesquisa
• Batedores: descobrem e recolhem automáticamente
conteúdos da web;
• Repositório: armazena as páginas recolhidas;
• Indexador: extrai as palavras das páginas armazenadas e
cria índices para acelerar as pesquisas;
• Ordenador: ordena as páginas que contenham os termos
pesquisados por um utilizador de modo a que as mais
relevantes sejam apresentadas nos primeiros lugares;
• Apresentador: gere a interface de utilização do motor de
busca.
39. Indexação e ordenação
• Frequência de termos: as páginas mais importantes para uma palavra
são as que a repetem mais vezes no texto;
• PageRank: é um algoritmo matemático em que as páginas mais
importantes são as que recebem o maior número de links ou links das
páginas mais importantes;
• Número de links: as páginas mais importantes são as que recebem o
maior número de links;
• tf-idf: calcula a importância da página combinando a frequência de
um termo com a importância desse termo no conjunto de todas as
páginas armazenadas;
• Estrutura da página: a importância de uma página é dada pela
localização de um termo na sua estrutura. Por exemplo, as páginas
mais importantes são as que contêm o termo no titulo;
• Análise de URLs: as páginas mais importantes são as que contêm os
termos no URL que as refere.
40. Motor de Pesquisa
• Indexação do Texto - extraindo o conteúdo relevante de
cada página, descartando:
Lista de palavras vazias (SWL – Stop Word List)
– Artigos, preposições, conjunções e pronomes
– Verbos comuns (saber, ver, fazer, ser, etc.)
– Adjectivos comuns (grande, alto, atrasado, etc.)
– Qualquer palavra que apareça em todos os documentos
– Qualquer palavra que apareça apenas em um documento
• Indexação META – Indexando preferencialmente as
palavras chave colocadas pelo autor na meta-informação
de cada página
41. Motor de Pesquisa
Pertinência da Página
• Densidade das palavras
• Frequência das palavras
• Proximidade das palavras
• Links externos para a página
• META tags
42. Exemplo de um Problema
Impressionismo francês
Impressionismo francês
Claude Monet
Claude Monet
Exposições
Exposições
Renoir
Renoir
Museu de Giverny
Museu de Giverny
Livros
Livros
43. A solução
O destinatário A semântica
Personalização
Personalização Taxinomia
Taxinomia
Localização
Localização Sinónimos
Sinónimos
Traduções
Traduções
47. Forças e fraquezas do Google (Junho 2004)
• Strengths:
* Size and scope: It is now the largest, and includes PDF, DOC, PS,
and many other file types
* Relevance based on sites' linkages and authority
* Cached archive of Web pages as the looked were indexed
* Additional databases: Google Groups, News, Directory, etc.
• Weaknesses: See also the Google Inconsistencies Page
* Limited search features: no nesting, no truncation, does not support
full Boolean
* Link searches must be exact and are incomplete
* Only indexes first 101 KB of a Web page and about 120 KB of
PDFs
* May search for plural/singular, synonyms, and grammatical
variants without telling you
http://www.searchengineshowdown.com/features/google/review.html
48. Operadores booleanos no Google
Para esta operação, no Google é assim
x AND y xy
x OR y x OR y
x AND (y OR z) x y OR z
(x AND y) OR (z AND q) Ainda não possível
(x OR y) AND (z OR q) x OR y z OR q
x AND (y OR z OR q) x y OR z OR q
x AND (y OR z) AND q x y OR z q
49. Sites sobre recursos de pesquisa
http://www.searchengineshowdown.com/
http://searchenginewatch.com/
http://www.webmasterworld.com/
57. Enciclopédias
http://www.wikipedia.org/
http://www.britannica.com/
• Living Encyclopedia in Cyberspace -
http://www.encyberpedia.com/ency.htm
• The Virtual Encyclopedia -
http://www.abp1.com/knowledgeispower/index.ht
ml
• Search-22 - Reference Search Engines -
http://www.search-22.com/reference.html
• Access Place Library -
http://www.accessplace.com/library.htm
58. Gestão do Conhecimento
• KTweb - http://www.ktweb.org
• The Knowledge Management Connection - http://www.KMconnection.com
• Knowledge Management Resource Center - http://www.kmresource.com
• Knowledge Management Resource Center - http://www.bio-
itworld.com/resources/km/
• Netacademy on Knowledge Media - http://www.knowledgemedia.org
• ICASIT's Knowledge Management Central - http://www.icasit.org/km/
• Knowledge Management Server - http://www.mccombs.utexas.edu/kman/
• Meta Knowledge Management - http://www.metakm.com
• Knowledge Management Center Info - http://www.kmcenter.info/
• KMTool - http://www.kmtool.net
• Gotcha -
http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index.html
• Knowledge-Portal.com - http://www.knowledge-portal.com/
• Knowledge Management Links - http://www.lepak.com/kmlinks.html
• Knowledge Portal on Document and Data Organization -
http://members.lycos.co.uk/UFitsME/knowledge.html
59. Bibliotecas
• LibDex - http://www.libdex.com/
• School Libraries on the Web - http://www.sldirectory.com/
• Lib Web Cats - http://www.librarytechnology.org/libwebcats/
• Libweb - http://lists.webjunction.org/libweb/
• Lii.org: Librarianship - http://lii.org/search/file/libraries
• National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/
• Library and Information Science - http://www.ifla.org/II/natlibs.htm
• ALiNUS -
http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Home.html
• The WWW Library Directory - http://www.webpan.com/msauers/libdir/
• NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/
• Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html
• Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/
• Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html
• UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/
• LibraryBug - http://www.librarybug.org
• Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html
• ISBNDB - http://isbndb.com/
• Internet Quick Reference Shelf: Library Resources -
http://www.indiana.edu/~librcsd/internet/Library_Resources/
• Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm
• Libraries and Archives - http://www.uky.edu/Subject/libraries.html
• List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm
• Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm
• Global Reach - https://cs.ala.org/global/
• Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html
• Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html
• US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html
• Bishop Library Index - http://members.lycos.co.uk/kbishoplib/
60. Mapas
• Maps on Other Web Sites -
http://www.lib.utexas.edu/maps/map_sites/map_sites.html
• All the World's Maps -
http://www.embassyworld.com/maps/maps.html
• Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php
• About.com: Maps - http://geography.about.com/cs/maps/
• Bodleian Library Map Room -
http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm
• StreetLookup.Com - http://www.streetlookup.com/
• Alexandria Digital Library -
http://www.alexandria.ucsb.edu/other-sites/subj_page.html
• Maps from start4all - http://maps.start4all.com/
• Links 4 Maps - http://www.links4maps.com/
63. A família Yahoo
• Yahoo! - http://www.yahoo.com/
Directório principal
• AllTheWeb - http://www.alltheweb.com/
Motor de pesquisa do Yahoo
• Yahooligans! - http://yahooligans.yahoo.com/
Para crianças
• Ujiko - http://www.ujiko.com/
Pesquisa personalizada do Yahoo
64. Forças e fraquezas do Yahoo (Abril 2005)
• Strengths:
* A large, new (as of Feb. 2004) search engine database
* Includes cached copies of pages
* Also includes links to the Yahoo! directory
* Supports full Boolean searching
• Weaknesses:
* Lack of some advanced search features such as
truncation
* Only indexes first 500 KB of a Web page (still more than
Google's 101KB)
* Link searches require the inclusion of the http://
* Includes some pay for inclusion sites
http://www.searchengineshowdown.com/features/yahoo/review.html
67. Pesquisadores
para encaminhamento em Portugal
http://www.iupi.pt/
http://www.busca.pt/
http://www.aeiou.pt/
http://www.sapo.pt/
http://www.cusco.pt
68. Portais e Jornais portugueses
http://www.lusomundo.net
http://www.iol.pt/
http://dn.sapo.pt/
http://jn.sapo.pt/
http://www.publico.pt/
74. Notícias para os profissionais
de Informação
• ResourceShelf
http://www.resourceshelf.com/
• LLRX (Legislação)
http://www.llrx.com/
• Librarians' Index to the Internet
http://lii.org/
• INFOMINE
http://infomine.ucr.edu/
• The Internet Scout Project
http://scout.wisc.edu/
76. Tipos de som na Internet
MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um
standard para a codificação e compressão de sinais áudio. Faz diminuir o
tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação
perceptual de áudio" e "compressão psico-acústica" removem partes do
sinal que pouca diferença fazem à forma como de facto ouvimos os sons.
WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por
exemplo para os pequenos ruídos que um computador emite para indicar
que o Windows foi iniciado ou a reciclagem foi limpa.
Streaming Streaming audio ou streaming media é uma técnica que
permite ouvir parte do ficheiro antes do download estar concluído.
Funciona através do download e armazenamento de uma secção suficiente
do ficheiro para actuar como buffer, permitindo a reprodução da música
mesmo que a transmissão seja brevemente interrompida. Pode tirar uma
amostra do áudio e decidir se pretende continuar a download ou
simplesmente cancelar. Se por qualquer motivo a transmissão ficar
demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos
bem.
77. Vídeo na Internet
AVI Audio Video Interleaved.AVI. um formato multimédia da
Microsoft , utilizado pelo Video for Windows. Os elementos áudio
e vídeo são armazenados em segmentos alternados no ficheiro
(.avi).
MPEG Moving Pictures Experts Group standard para
compressão e armazenamento de vídeos (.mpg)
Windows Media e Microsoft's Windows Media Player (.asf)
Real RealNetwork's RealVideo (.ram)
Quicktime extensão do ficheiro Windows: .mov
78. Requisitos de Segurança
• Integridade
– Complecta e não alterada
• Confidencialidade
– Acesso condicionado
• Autenticidade
– Identidade da pessoa
• Não repúdio
– Transacção garantida
79. Assinaturas digitais
Entidade
Entidade
a a
lic lic
Certificadora
Certificadora
úb
P A úb
P B
AE
a da a da
riv
P A riv
P B
A B
80. CAPTCHA
"Completely Automated Public Turing test to
tell Computers and Humans Apart“
Carnegie Mellon University
Garantir que a resposta não é gerada por computadores, mas por humanos
Turing Test (1950)