SlideShare uma empresa Scribd logo
1 de 17
CEETEPS – CENTRO ESTADUAL DE EDUCAÇÃO TECNOLÓGICA
“PAULA SOUZA”
ETEC FERNANDO PRESTES
TÉCNICO EM INFOMÁTICA

Wesley Germano Otávio

MOTORES DE BUSCA

Sorocaba – SP
2013
Wesley Germano Otávio

MOTORES DE BUSCA

Trabalho de conclusão de semestre da
disciplina
Linguagens,
Trabalho
e
Tecnologia.

Professor (a): Leila

Sorocaba-SP
2013
Resumo

Este trabalho manifesta de forma visível que a expansão tecnológica e uso
crescente da internet por parte das pessoas, fazem com que elas se submetam às
vezes utilizar somente um único site de busca, e ao usa-lo encontram de maneira
rápida em sua primeira lista de conteúdos oferecidos pelo motor de busca o que
deseja. Atualmente este tipo de ocorrência tem se dado a um grande número de
indivíduos, se elas dispusessem a procurar em mais sites de buscas e em seus
conteúdos gerados, iriam abranger uma quantidade maior de conhecimento.
Também há o caso em que os buscadores de conteúdo muitas vezes retornam o
que procuramos com uma vasta diversificação, mas também a vezes que não
encontram o conteúdo relacionado à nossa busca, e assim retorna qualquer coisa,
como propagandas direcionadas fazendo com que o usuário desista sobre sua
procura. Buscamos através deste trabalho mostrar as características, formas de uso
e a história dos Motores de Buscas.
Palavras chaves: site de busca, motores de busca, conteúdo, internet, procura, web.
SUMÁRIO
1. INTRODUÇÃO ..................................................................................................... 4
2. Motores de busca ............................................................................................... 5
2.1.

História .............................................................................................................. 5

2.2.

Funcionamento .................................................................................................. 6

2.2.1.

Saber escolher suas palavras-chave ............................................................. 8

2.2.2.

A sintaxe ........................................................................................................ 9

2.3.

Tipos de buscadores ......................................................................................... 9

2.4.

Custos de armazenamento e tempo de crawling............................................. 11

2.5.

Motores de busca geoespaciais ...................................................................... 12

2.6.

Qual Utilizar? ................................................................................................... 12

2.6.1.

Os mais utilizados ........................................................................................ 13

2.6.2.

Novos motores de busca.............................................................................. 13

3. CONCLUSÃO ..................................................................................................... 15
4

1. INTRODUÇÃO

No início a internet era dotada de poucos domínios e geralmente com uma
finalidade bastante específica. A explosão de conteúdos de todas as classes
ocorridas nas últimas décadas por conta da popularização da internet fez necessária
uma nova classe de serviço na web: os buscadores. Atualmente, muitos pensam que
Google é sinônimo de busca, saiba que ele não é o único site com esta finalidade e
muito menos foi o primeiro. Se não encontrou na primeira tentativa, experimente dar
uma olhada em outro lugar antes de desistir. Os mecanismos de buscas fazem que
nossa procura seja rápida e bastante interativa pela forma em organiza as
informações.
5

2. Motores de busca
A Web é uma vasta coleção de documentos heterogêneos. Possui natureza
dinâmica e milhões de páginas surgem e desaparecem todos os dias. Por isso
sente-se um anseio para que a Web realmente alcance todo o seu potencial e se
torne uma ferramenta mais utilizável, eficaz e compreensível. Neste contexto os
motores de busca surgiram para direcionar e levar os resultados aos usuários mais
rapidamente e facilmente, pois suas bases de dados são extremamente grandes,
podendo alcançar centenas de milhões de itens, que proporcionam ao usuários
localizar itens mediantes suas buscas por palavras-chaves, ou às vezes, em
linguagem natural.
Os motores de busca surgiram quando a web começa a atingir um imenso
número de conteúdos variados que dificultavam a coleta de informações através de
uma busca manual através da navegação. Muitos trabalhos na web derivaram de
informações criadas inicialmente por professores, alunos, doutores e empresas
interessadas em ter seus conteúdos na web.
2.1. História
Os primeiros motores de busca (como o Yahoo) baseavam-se na indexação
de páginas através da sua categorização. Posteriormente surgiram as meta-buscas.
A mais recente geração de motores de busca (como a do Google) utiliza tecnologias
diversas, como a procura por palavras-chave diretamente nas páginas e o uso de
referências externas espalhadas pela web, permitindo até a tradução direta de
páginas (embora de forma básica ou errada) para a língua do utilizador. O Google,
além de fazer a busca pela Internet, oferece também o recurso de se efetuar a busca
somente dentro de um site específico. É essa a ferramenta usada na comunidade
Wiki.
Os motores de busca são buscadores que baseiam sua coleta de páginas em
um robô que varre a Internet à procura de páginas novas para introduzir em sua
base de dados automaticamente. Motores de busca típicos são Google, Yahoo e
Altavista.
A primeira ferramenta utilizada para busca na Internet foi o Archie (da palavra
em Inglês, "archive" sem a letra "v"). Foi criado em 1990 por Alan Emtage, um
estudante da McGillUniversity em Montreal. O programa baixava as listas de
diretório de todos os arquivos localizados em sites públicos de FTP (File
TransferProtocol) anônimos, criando uma base de dados que permitia busca por
nome de arquivos.
Enquanto o Archie indexava arquivos de computador, o Gopher indexava
documentos de texto. Ele foi criado em 1991, por Mark McCahill da Universidade de
Minessota, cujo nome veio do mascote da escola. Devido ao fato de serem arquivos
de texto, a maior parte dos sites Gopher tornaram-se websites após a criação da
WorldWide Web.
6

Dois outros programas, Veronica e Jughead, buscavam os arquivos
armazenados nos sistemas de índice do Gopher. Veronica (VeryEasyRodentOriented Net-wide Index toComputerizedArchives) provia uma busca por palavras
para a maioria dos títulos de menu em todas listas do Gopher. Jughead (Jonzy's
Universal GopherHierarchyExcavationAnd Display) era uma ferramenta para obter
informações de menu de vários servidores Gopher.
O primeiro searchengine Web foi o Wandex, um índice atualmente extinto
feito pela WorldWide Web Wanderer, um web crawler (programa automatizado que
acessa e percorre os sites seguindo os links presentes nas páginas.) desenvolvido
por Matthew Gray no MIT, em 1993. Outro sistema antigo, Aliweb, também apareceu
no mesmo ano e existe até hoje. O primeiro sistema "fulltext" baseado em crawler foi
o WebCrawler, que saiu em 1994. Ao contrário de seus predecessores, ele permite
aos usuários buscar por qualquer palavra em qualquer página, o que tornou-se
padrão para todos serviços de busca desde então. Também foi o primeiro a ser
conhecido pelo grande público. Ainda em 1994, o Lycos (que começou na Carnegie
MellonUniversity) foi lançado e tornou-se um grande sucesso comercial.
Logo depois, muitos sistemas apareceram, incluindo Excite, Infoseek, Inktomi,
Northern Light, e AltaVista. De certa forma, eles competiram com diretórios
populares como o Yahoo!. Posteriormente, os diretórios integraram ou adicionaram a
tecnologia de searchengine para maior funcionalidade.
Os sistemas de busca também eram conhecidos como a "mina de ouro" no
frenêsi de investimento na Internet que ocorreu no fim dos anos 1990s. Várias
empresas entraram no mercado de forma espetacular, com recorde em ganhos
durante seus primeiros anos de existência. Algumas fecharam seu sistema público, e
estão oferecendo versões corporativas somente, como a Northern Light.
Mais recentemente, os sistemas de busca também estão utilizando XML ou RSS,
permitindo indexar dados de sites com eficácia, sem a necessidade de um crawler
complexo. Os sites simplesmente provêm um xmlfeed o qual é indexado pelo
sistema de busca. Os XML feeds estão sendo cada vez mais fornecidos de forma
automática por weblogs. Exemplos são o feedster, que inclui o LjFindSearch que
provê serviços para os blogs do site LiveJournal.

2.2. Funcionamento
Os motores de busca utilizam software conhecido como ''aranhas'' ou "robots"
que percorrem "toda" a Internet em busca da informação (documentos ou endereços
de páginas web) que se pretende. Os dados são recolhidos para o index dos
motores de busca, que cria uma base de dados com essa informação. A forma como
a informação é indexada depende de cada motor de busca, podendo ser feita por
palavras, títulos, URLs ou por diretórios. Assim, sempre que se introduz uma palavra
ou um conjunto de palavras que se pretende pesquisar, as bases de dados são
percorridas em busca de documentos ou sites que lhe correspondam. O resultado da
7

busca é dado em hyperlinks, podendo clicar-se em cada uma das entradas para
aceder à informação.
Na internet encontramos centenas de motores de busca. Alguns deles são
acessíveis a partir desta página, que os distingue entre diretórios, indexantes e
meta-pesquisadores.
Uma mesma pesquisa efetuada nestes diversos motores de busca terá resultados
muito diferentes. Mesmo pesquisas realizadas num mesmo instrumento (motor de
busca) poderão dar resultados muito diferentes de um dia para o outro. Qualquer
cibernauta com alguma experiência sabe que, ao utilizar os instrumentos de
pesquisa, está a "lançar uma garrafa ao mar" com uma mensagem lá dentro. Se a
mensagem "chega a bom porto" é sempre uma incógnita. Entre os resultados da
pesquisa executada só alguns são pertinentes, pois não é possível ter um controlo
total da estratégia de pesquisa (pois não depende só do cibernauta). Também não é
a performance informática dos motores de busca que está em causa, embora ela
tenha alguma importância, mas a performance do ponto de vista documental (Diz-se
que, hoje em dia, está tudo na internet, mas nem na internet é possível encontrar
documentos que não existem).
Uma pesquisa traduz um bom desempenho quando permite encontrar os
documentos pesquisados e apenas os documentos pesquisados. De acordo com
este critério, a pesquisa na internet revela uma grande taxa de silêncio (os
documentos pertinentes não são encontrados) ou de ruído (encontramos
frequentemente um vasto conjunto de documentos não pertinentes). Por isso, só
muito dificilmente podemos efetuar uma pesquisa na internet que permita um bom
desempenho. O investimento em tempo exigido para realizar a pesquisa e o exame
e análise dos resultados obtidos são frequentemente exigentes e morosos
considerando os benefícios que se retiram da pesquisa.
Pode ser interessante conhecer as bases de funcionamento de um motor de busca,
para utilizá-lo mais eficazmente. Os robôs dos motores de busca ordenam e
classificam milhares de páginas Web durante uma busca. Vários parâmetros são
levados em conta:
A presença da palavra-chave na página: evidentemente, este é o primeiro critério.
A classificação muda de acordo com a presença da palavra no URL, no título da
página, na sua posição na página, mas também, na apresentação: sublinhado,
em negrito, e em sua reincidência.
Os Metatags: são campos invisíveis, no código da página, criados pelos
webmasters que querem melhorar a indexação de suas páginas pelos motores de
busca. No entanto, este método está, cada vez menos, sendo levado em conta
pelos robôs.
A popularidade da página: o robô também analisa o número de entradas e saídas
de conexões da página. Quanto mais links apontarem para a página mais esta
será considerado como popular pelo robô e melhor será sua classificação no
ranking.
8

Esses critérios são conhecidos como in thepage, ou seja, que dizem respeito
ao conteúdo da página. Para melhorar sua classificação, os robôs também utilizam
critérios offthepage, que levam em conta o uso, feito da página, pelos usuários.
O robô analisa a relevância dos resultados, calculando o tempo gasto, pelo
usuário, na página sugerida pelo motor e sua volta, ou não, para a página de
resultados.
Os resultados propostos pelo motor constituem, assim, uma equação que,
leva em conta todos esses parâmetros.

2.2.1. Saber escolher suas palavras-chave
Não esqueçam que os motores são meros robôs. Eles não falam nossa
língua, não pensam e não têm espírito de síntese. Então, é preciso pensar bem nas
palavras-chave a serem registradas para não digitar qualquer bobagem que passe
pela nossa cabeça, sem relação com o tema da página.
Classificar suas palavras-chave:
Palavras-chave « abrangentes »: são palavras que cobrem grandes áreas como:
comércio, cinema, arte, música, etc. Separadamente, elas trazem diversas
respostas e, logo, ineficazes.
Palavras-chave « profundas »: capazes de melhorar a busca a ser feita indicando
uma área específica da palavra-chave abrangente. Podemos digitar várias a fim
de obter resultados mais precisos. Podem ser datas, lugares, subgêneros, etc.
Palavras-chave « excluídas »: durante uma busca, também podemos querer
excluir uma palavra que possa induzir o robô a cometer um erro e a trazer
respostas inapropriadas. Para isto, basta botar um « - » (menos), antes da
palavra.
Exemplo para uma busca em seus concorrentes:

Palavra-chave abrangente: empresas
Palavras-chave profundas: construção, pintura, Lisboa
Palavra-chave proibida: artesão
Trata-se de uma busca de empresas de construção, especializadas em
pintura, em Lisboa, que exclui artesãos.
9

2.2.2. A sintaxe
Se, levar tempo para escolher bem suas palavras-chave é eficaz, isto não
determina, necessariamente, o número possível de respostas. Já vimos como excluir
uma palavra de uma busca, porém, existem muitas outras opções.
Forçá-los a encontrar várias palavras na mesma página : ao entrar várias
palavras-chave no motor, separadas apenas por um espaço, o robô exibe páginas
contendo qualquer uma das palavras. Para que os robôs exibam páginas
contendo as duas (ou mais) palavras, basta acrescentar o sinal « + », antes de
cada palavra, mantendo um espaço entre elas.

Exemplo: para procurar « política e Brasil », na mesma página:
+política +Brasil.
Procurar uma expressão: se você quiser que várias palavras apareçam de
maneira contígua, use as aspas.

Exemplo: para procurar venda à distância:
« venda à distância »
Busca complexa: para uma busca bem precisa, podemos multiplicar as
indicações.
Exemplo: para procurar um fornecedor de acesso à Internet, menos conhecido:
« fornecedor de acesso » +Internet - Net.

2.3. Tipos de buscadores

Existem variados tipos de buscadores:
Buscadores globais: são buscadores que pesquisam todos os documentos na
rede, e a apresentação do resultado é aleatória, dependendo do ranking de
acessos aos sites. As informações podem referir-se a qualquer tema. O buscador
global mais recente é oWiglr, que utiliza dados muito parecidos com
o Google e Bing, é também o primeiro buscador criado nesta década (20102020).Google, Yahoo e Bing são os buscadores globais mais acessados.
Buscadores verticais: são buscadores que realizam pesquisas "especializadas"
em bases de dados próprias de acordo com suas propensões. Geralmente, a
10

inclusão em um buscador vertical está relacionada ao pagamento de uma
mensalidade
ou
de
um
valor
por
clique. Trovit, BizRate, AchaNoticias, Oodle, Catho, SAPO, BuscaPé, Zura e Beco
me.com são alguns exemplos de buscadores verticais.
Guias locais: são buscadores exclusivamente locais ou regionais. As
informações se referem a endereços de empresas ou prestadores de serviços. O
resultado é priorizado pelo destaque de quem contrata o serviço. Listão,
GuiaMais, AcheCerto, EuAcheiFácil, Zeen! entre outras. Geralmente são
cadastros e publicações pagas. É indicado para profissionais e empresas que
desejam oferecer seus produtos ou serviços em uma região, Estado ou Cidade.
Guias de busca local ou buscador local: são buscadores de abrangência nacional
que lista as empresas e prestadores de serviços próximos ao endereço do
internauta a partir de um texto digitado. A proximidade é avaliada normalmente
pelo cep, Donavera.com, ou por coordenadas de GPs. Os cadastros Básicos são
gratuitos para que as micro empresas ou profissionais liberais possam estar
presente na WEB sem que invistam em um sites próprio. É indicado para
profissionais e empresas que desejam oferecer seus produtos ou serviços em
uma Localidade, rua, bairro, cidade ou Estado e possibilitando ainda a forma
mais rápida de atualização dos registros de contatos por seus clientes ou
fornecedores.
Diretórios de websites: são índices de sites, usualmente organizados por
categorias e subcategorias. Tem como finalidade principal permitir ao usuário
encontrar rapidamente sites que desejar, buscando por categorias, e não por
palavras-chave. Os diretórios de sites geralmente possuem uma busca interna,
para que usuários possam encontrar sites dentro de seu próprio índice. Diretórios
podem ser a nível regional, nacional (como o Achei no Brasil) ou global, e até
mesmo especializado em determinado assunto. Open Directory Project é
exemplo de diretórios.
A divulgação de sites de empresas com negócios regionais são acessados
em sua grande maioria quando os profissionais da WEB cadastram seus sites nos
Buscadores Locais para aumentarem as visitas de internautas, pois não há um
sistema de atualização automática dos dados que abranja todos os tipos de
categorias e em rapidez necessária. Por esta razão, somente cerca de 20% a 25%
de tudo que existe na WEB é publicada nos buscadores.
A novidade agora são os ontobuscadores, isto é, buscadores baseados
em Ontologias, como o Ontoweb.
Ano

Engine

Evento

Ano

Engine

Evento

1993

Wandex

Lançamento

2000

Singingfish

Lançamento

1993

Aliweb

Lançamento

2000

Teoma

Fundado

1994

WebCrawler

Lançamento

2000

Vivisimo

Fundado
11

Infoseek

Lançamento

2003

ObjectsSearch Lançamento

Lycos

Lançamento

2004

Yahoo! Search Lançamento
final
(primeiros
resultados
originais)

1995

AltaVista

Lançamento
(parte do
DEC)

1995

Sapo.pt

Lançamento

1996

Dogpile

Lançamento
beta

2005

MSN Search

Lançamento
final

Lançamento

2006

Quaero

Fundado

Inktomi
AskJeeves
1997

MSN Search

Fundado

2006

Fundado

Trovit
2007 Ask.com

Northern
Light

Lançamento

2008

Fundado

2009

Sapo.pt
1998 Google
1997

Cuil

Lançamento

Bing
2009 Zeen.com.br

Fundado
Fundado
Fundado
Fundado
Fundado

1999

AlltheWeb

Lançamento

2011

Wiglr

Lançamento

1999

Baidu

Fundado

2013

SACF Search

Lançamento

2.4. Custos de armazenamento e tempo de crawling
Os custos de armazenamento não são o recurso limitador na implementação
de um sistema de busca. Armazenar simplesmente 10 bilhões de páginas de 10
kbytes cada (comprimidas) requer 100TB e outros aproximados 100TB para índices,
dando um custo de hardware total em menos de $200k: 400 drives de disco de
500GB em 100 PCs baratos.
De qualquer forma, um sistema público de busca consideravelmente requer
mais recursos para calcular os resultados e prover alta disponibilidade. E os custos
de operar uma grande serverfarm não são triviais.
Passar por 10B páginas com 100 máquinas percorrendo links a 100
páginas/segundo levaria 1M segundos, ou 11.6 dias em uma conexão de Internet de
alta capacidade. A maior parte dos sistemas percorre uma pequena fatia da Web
(10-20% das páginas) perto desta freqüência ou melhor, mas também percorre sites
dinâmicos (por exemplo, sites de notícias e blogs) em uma freqüência muito mais
alta.
12

2.5. Motores de busca geoespaciais
Uma recente melhoria na tecnologia de busca é a adição de geocodificação e
geoparsing para o processamento dos documentos ingeridos. O geoparsing tenta
combinar qualquer referência encontrada a lugares para um quadro geoespacial de
referência, como um endereço de rua, localizações de dicionário de termos
geográficos, ou a uma área (como um limite poligonal para uma municipalidade).
Através deste processo de geoparsing, as latitudes e longitudes são atribuídas aos
lugares encontrados e são indexadas para uma busca espacial posteriores. Isto
pode melhorar muito o processo de busca, pois permite ao usuário procurar
documentos para uma dada extensão do mapa, ou ao contrário, indicar a localização
de documentos combinando com uma dada palavra-chave para analisar incidência e
agrupamento, ou qualquer combinação dos dois. Uma empresa que desenvolveu
este tipo de tecnologia é a Meta-Carta, que disponibiliza seu produto como um XML
Web Service para permitir maior integração às aplicações existentes.
A Meta-Carta também provê uma extensão para o programa GIS como a
ArcGIS (ESRI) para permitir aos analistas fazerem buscas interativamente e obter
documentos em um contexto avançado geoespacial e analítico.
2.6. Qual Utilizar?
Existem dois tipos de motores de busca: os que indexam, por título e URL,
toda a informação onde encontram a palavra ou o conjunto de palavras que pediu,
conhecidos como ''webcrawlers'' (como é o caso do Google) e aqueles que
funcionam com base em diretórios (o mais conhecido é o Yahoo). Enquanto que os
primeiros devem ser utilizados para pesquisas mais específicas, os motores de
busca baseados em diretórios deverão ser utilizados para encontrar informação mais
genérica, dado que os resultados da pesquisa são um conjunto de sites onde se
poderá encontrar o que se pretende. Exemplificando, se o objetivo é encontrar o site
do Sport Lisboa e Benfica deve utilizar-se o Yahoo, mas se pretende encontrar a
biografia do Eusébio será mais fácil pesquisar no Google.
Um dos pontos negativos de sites como o Google ou o Alta Vista é que
poderão devolver informação irrelevante para o que se procura, dado que indexam
páginas individuais que fazem referência à pesquisa efetuada, mas que não têm
nada a ver com o que se pretende. No entanto, este tipo de motores de busca é
melhor em termos de atualização da informação.
Atualmente, com a evolução da própria Internet, a maior parte dos motores de
busca já apresenta um misto de diretórios com indexantes, aumentando as
possibilidades de encontrar o que se deseja.
13

2.6.1. Os mais utilizados
O motor de busca em maior crescimento é o Google. Em 2002 apresentou um
serviço novo e mais eficaz capaz de uma busca em cerca de mil milhões de páginas
na Internet, cerca de dois terços do conteúdo da WorldWide Web, confirmando a sua
crescente popularidade.
O AltaVista também indexa milhões de páginas e documentos. Faz a
pesquisa por palavras-chave e atualiza a sua informação constantemente,
apresentando data e hora nos documentos que resultam da pesquisa efetuada.
Outro motor de busca a destacar é o HotBot, que oferece uma percentagem
de aproximação à pesquisa efetuada, devolvendo os documentos que apresentam
maior percentagem. Permite pesquisar em nove línguas e consegue procurar
imagens, vídeos e ficheiros MP3.
Tendo começado por ser um motor de busca exclusivamente baseado em
diretórios, o famoso Yahoo já permite efetuar pesquisas específicas. No entanto,
deve continuar a ser utilizado para pesquisas de informação geral devido à forma
como indexa a sua informação.
Por fim, temos um motor de busca com características particulares. O AskJeeves (tal
como a Alta Vista) permite efetuar uma pesquisa a partir de uma pergunta. Pode
perguntar ''Wherecan I findinformationabout Sport Lisboa e Benfica'' (perguntas
exclusivamente em inglês) e, após clicar na pergunta, poderá encontrar a resposta
para a sua busca.

2.6.2. Novos motores de busca
O Google ainda não precisa se preocupar mas, a concorrência continua
crescendo e aumentando seus trunfos em outras áreas : precisões, personalização,
serviços adicionais, etc. Veja aqui, o que eles têm a mais para você poupar tempo e
ter mais precisão em suas buscas.

Ask
Já na página inicial, você pode orientar suas necessidades: site, imagem,
vídeo, blog. Conforme você vai avançando em suas buscas, sugestões aparecem,
em duas colunas, uma à esquerda e outra à direita. Se inscrevendo, você terá
acesso a outros serviços: salvar buscas, palavras-chave. Desvantagem: os
resultados comerciais ocupam muito espaço.
14

Exalead, em francês.
Os resultados aparecem com uma pré-visualização das miniaturas dos sites.
À direita, um quadro vazio te ajuda a precisar a sua busca. As opções são muitas :
especificar o tipo de arquivo, o tipo de site, o país hospedeiro. Desvantagem : os
resultados nem sempre são pertinentes.

Yahoo Brasil
É o motor que mais se aproxima do Google em termos de ergonomia. Os
resultados são numerosos e bem apresentados. É possível personalizá-los,
escolhendo uma série de módulos. Desvantagem: os resultados não são tão
relevantes quanto os do Google.
15

3. CONCLUSÃO
Encontrar a informação que nos interessa na Internet pode ser como procurar
agulha em palheiro: uma tarefa complicada, demorada e, muitas vezes, frustrante
nos resultados. Ao longo dos anos, e à medida que a Internet foi crescendo, foram
sendo criados vários mecanismos e ferramentas para auxiliar a localização e acesso
aos imensos recursos informativos da Rede.
Na web conseguimos encontrar vários mecanismos que nos levam a fonte do
conteúdo que precisamos. Estes mecanismos funcionam com catálogos de dados
que com a entrada de palavras – chaves pelo usuário faz a busca pelo conteúdo
rapidamente pela internet. Essa rapidez se da pelo algoritmo de busca do
mecanismo, que se bem feito e composto para diversos tipos de busca pode
proporcionar agilidade no seu tempo de resposta.
Em alguns casos seria ótimo encontrar algo logo de cara sem precisar
procurar, mas quando não encontramos e chegamos até a desistir, por isso temos
desaber o modo em que sistema do mecanismo de busca funciona, para que
possamos efetuar nossas pesquisas por termos mais corretos, concretos e fáceis de
serem encontrados. Os conhecimentos de algumas artes manhas influenciam no
método em que buscador procura o conteúdo, normalmente essas arte manhas se
encontram escondidas, mas pode se encontrá-las através de uma busca rápida pela
web e isso às vezes pode favorecer sua pesquisa.
Se não encontrar o que procura em um site de busca, não desanime, existem
muitos outros para efetuar sua pesquisa, sendo que todos tem um sistema diferente
para efetuar sua procurar, e lembre-se há quase tudo na internet.
16

4. REFERÊNCIAS
Estado de S. Paulo – Matéria: A nova era das ferramentas de busca.
http://conjur.estadao.com.br/static/text/41493,1/

Made In Blog - Buscadores inteligentes de conteúdo.
http://icommercepage.wordpress.com/2010/02/07/buscadores-inteligentes-deconteudo/

Info Exame - O Google é inútil.
http://info.abril.com.br/noticias/internet/o-google-e-inutil-11082009-27.shl
Portal do Professor – Sites de Buscas
http://portaldoprofessor.mec.gov.br/link.html?categoria=13
Slid.es – O usos dos motores de busca na internet
http://slid.es/alanalvescorrea/projeto-tcc
Boom – Box -Bom conteúdo não teme buscadores.
http://blog.boo-box.com/br/2008/bom-conteudo-nao-teme-buscadores/

Os motores de busca numa perspectiva cognitiva - DIAS, P. ; OSÓRIO, A. J., ed. lit.
– “Challenges 2009 : actas da Conferência Internacional de Tecnologias de
Informação e Comunicação na Educação, 6, Braga, 2009”. Braga : Centro de
Competência Nónio Séc. XXI da Universidade do Minho, 2009. p. 887-900.
http://hdl.handle.net/1822/9856
Marinho, Leandro Balby – Mineração na web
http://143.54.31.10/reic/edicoes/2003e2/tutoriais/MineracaoNaWeb.pdf

Publici&Tal - Quem procura, acha: sobre marketing nos buscadores de conteúdo
http://publicital.wordpress.com/2013/03/05/quem-procura-acha-sobre-marketing-nosbuscadores-de-conteudo/

Mais conteúdo relacionado

Mais procurados

Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
fontes de informação
fontes de informaçãofontes de informação
fontes de informaçãoIngridy Dias
 
Arquitetura da Informação: Conceitos e Objetivos
Arquitetura da Informação: Conceitos e ObjetivosArquitetura da Informação: Conceitos e Objetivos
Arquitetura da Informação: Conceitos e Objetivosaiadufmg
 
Formularios
FormulariosFormularios
FormulariosAAcioli
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dadosvini_campos
 
Tecnicas de coleta de dados e instrumentos- Material maravilhoso
Tecnicas de coleta de dados e instrumentos- Material maravilhosoTecnicas de coleta de dados e instrumentos- Material maravilhoso
Tecnicas de coleta de dados e instrumentos- Material maravilhosoRosane Domingues
 
A carreira profissional do auxiliar administrativo
A carreira profissional do auxiliar administrativoA carreira profissional do auxiliar administrativo
A carreira profissional do auxiliar administrativoBenjamim Garcia Netto
 
COMO FAZER TCC PASSO A PASSO
COMO FAZER TCC PASSO A PASSOCOMO FAZER TCC PASSO A PASSO
COMO FAZER TCC PASSO A PASSOtcc-educacao
 
Era do conhecimento x Era da informaçao
Era do conhecimento  x Era da informaçaoEra do conhecimento  x Era da informaçao
Era do conhecimento x Era da informaçaogustavo berlanda
 
Informática Básica - Aula 09 - Uso de E-mail
Informática Básica - Aula 09 - Uso de E-mailInformática Básica - Aula 09 - Uso de E-mail
Informática Básica - Aula 09 - Uso de E-mailJoeldson Costa Damasceno
 
Secretariado - aula 3
Secretariado - aula 3Secretariado - aula 3
Secretariado - aula 3buriionara
 
Comportamento Organizacional
Comportamento OrganizacionalComportamento Organizacional
Comportamento OrganizacionalRui Loureiro
 
Capítulo 1 Inteligência Artificial RUSSELL
Capítulo 1 Inteligência Artificial RUSSELLCapítulo 1 Inteligência Artificial RUSSELL
Capítulo 1 Inteligência Artificial RUSSELLWellington Oliveira
 

Mais procurados (20)

Pesquisa De Mercado
Pesquisa De MercadoPesquisa De Mercado
Pesquisa De Mercado
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
fontes de informação
fontes de informaçãofontes de informação
fontes de informação
 
Arquitetura da Informação: Conceitos e Objetivos
Arquitetura da Informação: Conceitos e ObjetivosArquitetura da Informação: Conceitos e Objetivos
Arquitetura da Informação: Conceitos e Objetivos
 
Formularios
FormulariosFormularios
Formularios
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Tecnicas de coleta de dados e instrumentos- Material maravilhoso
Tecnicas de coleta de dados e instrumentos- Material maravilhosoTecnicas de coleta de dados e instrumentos- Material maravilhoso
Tecnicas de coleta de dados e instrumentos- Material maravilhoso
 
Internet das Coisas
Internet das CoisasInternet das Coisas
Internet das Coisas
 
A carreira profissional do auxiliar administrativo
A carreira profissional do auxiliar administrativoA carreira profissional do auxiliar administrativo
A carreira profissional do auxiliar administrativo
 
Sistemas de Apoio à Decisão
Sistemas de Apoio à DecisãoSistemas de Apoio à Decisão
Sistemas de Apoio à Decisão
 
COMO FAZER TCC PASSO A PASSO
COMO FAZER TCC PASSO A PASSOCOMO FAZER TCC PASSO A PASSO
COMO FAZER TCC PASSO A PASSO
 
Era do conhecimento x Era da informaçao
Era do conhecimento  x Era da informaçaoEra do conhecimento  x Era da informaçao
Era do conhecimento x Era da informaçao
 
Informática Básica - Aula 09 - Uso de E-mail
Informática Básica - Aula 09 - Uso de E-mailInformática Básica - Aula 09 - Uso de E-mail
Informática Básica - Aula 09 - Uso de E-mail
 
Secretariado - aula 3
Secretariado - aula 3Secretariado - aula 3
Secretariado - aula 3
 
Comportamento Organizacional
Comportamento OrganizacionalComportamento Organizacional
Comportamento Organizacional
 
Capítulo 1 Inteligência Artificial RUSSELL
Capítulo 1 Inteligência Artificial RUSSELLCapítulo 1 Inteligência Artificial RUSSELL
Capítulo 1 Inteligência Artificial RUSSELL
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
A Linguagem sql
A Linguagem sqlA Linguagem sql
A Linguagem sql
 
Tecnologia Da Informaçao
Tecnologia Da InformaçaoTecnologia Da Informaçao
Tecnologia Da Informaçao
 
Análise de Dados
Análise de DadosAnálise de Dados
Análise de Dados
 

Semelhante a Motores de busca

Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasSociedade da Informação
 
Slides pesquisando e aprendendo com a internet
Slides pesquisando e aprendendo com a internetSlides pesquisando e aprendendo com a internet
Slides pesquisando e aprendendo com a internetnonataguedes
 
A anatomia de um mecanismo de busca hipertextual de grande escala na web
A anatomia de um mecanismo de busca hipertextual de grande escala na webA anatomia de um mecanismo de busca hipertextual de grande escala na web
A anatomia de um mecanismo de busca hipertextual de grande escala na webfernandogallas
 
GT4 - Tópicos de Programação e Evolução WEB
GT4 - Tópicos de Programação e Evolução WEBGT4 - Tópicos de Programação e Evolução WEB
GT4 - Tópicos de Programação e Evolução WEBJhonatas Bruno
 
Curso Pesquisa Weblinux
Curso Pesquisa WeblinuxCurso Pesquisa Weblinux
Curso Pesquisa Weblinuxmarcosoliv
 
Pesquisando e aprendendo com a internet
Pesquisando e aprendendo com a internetPesquisando e aprendendo com a internet
Pesquisando e aprendendo com a internetnonataguedes
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na webUFJF
 
Web 2.0 Comunicar, Colaborar E Trabalhar V2
Web 2.0   Comunicar, Colaborar E Trabalhar V2Web 2.0   Comunicar, Colaborar E Trabalhar V2
Web 2.0 Comunicar, Colaborar E Trabalhar V2Óscar Faria
 
Curso YaCy Mecanismo de Busca de Código Aberto
Curso YaCy Mecanismo de Busca de Código AbertoCurso YaCy Mecanismo de Busca de Código Aberto
Curso YaCy Mecanismo de Busca de Código AbertoJulio Della Flora
 
Www.dicas l.com.br cursos-search_websearch
Www.dicas l.com.br cursos-search_websearchWww.dicas l.com.br cursos-search_websearch
Www.dicas l.com.br cursos-search_websearchicaroidos2
 

Semelhante a Motores de busca (20)

Curso de Pesquisa na Web
Curso de Pesquisa na WebCurso de Pesquisa na Web
Curso de Pesquisa na Web
 
Ferramentas de pesquisa na internet
Ferramentas de pesquisa na internetFerramentas de pesquisa na internet
Ferramentas de pesquisa na internet
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e Ontologias
 
Motores de Busca
Motores de BuscaMotores de Busca
Motores de Busca
 
Slides pesquisando e aprendendo com a internet
Slides pesquisando e aprendendo com a internetSlides pesquisando e aprendendo com a internet
Slides pesquisando e aprendendo com a internet
 
A anatomia de um mecanismo de busca hipertextual de grande escala na web
A anatomia de um mecanismo de busca hipertextual de grande escala na webA anatomia de um mecanismo de busca hipertextual de grande escala na web
A anatomia de um mecanismo de busca hipertextual de grande escala na web
 
GT4 - Tópicos de Programação e Evolução WEB
GT4 - Tópicos de Programação e Evolução WEBGT4 - Tópicos de Programação e Evolução WEB
GT4 - Tópicos de Programação e Evolução WEB
 
Curso Pesquisa Weblinux
Curso Pesquisa WeblinuxCurso Pesquisa Weblinux
Curso Pesquisa Weblinux
 
Pesquisando e aprendendo com a internet
Pesquisando e aprendendo com a internetPesquisando e aprendendo com a internet
Pesquisando e aprendendo com a internet
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Pesquisa na web
Pesquisa na webPesquisa na web
Pesquisa na web
 
Os mecanismos-de-busca-e-suas-implicações
Os mecanismos-de-busca-e-suas-implicaçõesOs mecanismos-de-busca-e-suas-implicações
Os mecanismos-de-busca-e-suas-implicações
 
Os mecanismos-de-busca-e-suas-implicações
Os mecanismos-de-busca-e-suas-implicaçõesOs mecanismos-de-busca-e-suas-implicações
Os mecanismos-de-busca-e-suas-implicações
 
Web 2.0 Comunicar, Colaborar E Trabalhar V2
Web 2.0   Comunicar, Colaborar E Trabalhar V2Web 2.0   Comunicar, Colaborar E Trabalhar V2
Web 2.0 Comunicar, Colaborar E Trabalhar V2
 
Internet
InternetInternet
Internet
 
Pesquisa na web_lana
Pesquisa na web_lanaPesquisa na web_lana
Pesquisa na web_lana
 
Pesquisa na Web
Pesquisa na WebPesquisa na Web
Pesquisa na Web
 
Curso YaCy Mecanismo de Busca de Código Aberto
Curso YaCy Mecanismo de Busca de Código AbertoCurso YaCy Mecanismo de Busca de Código Aberto
Curso YaCy Mecanismo de Busca de Código Aberto
 
Www.dicas l.com.br cursos-search_websearch
Www.dicas l.com.br cursos-search_websearchWww.dicas l.com.br cursos-search_websearch
Www.dicas l.com.br cursos-search_websearch
 

Mais de Wesley Germano Otávio

Zoologia de vertebrados (cordados) - professor wesley
Zoologia de vertebrados (cordados) - professor wesleyZoologia de vertebrados (cordados) - professor wesley
Zoologia de vertebrados (cordados) - professor wesleyWesley Germano Otávio
 
Caracteristicas básicas dos seres vivos
Caracteristicas básicas dos seres vivosCaracteristicas básicas dos seres vivos
Caracteristicas básicas dos seres vivosWesley Germano Otávio
 
Cosmologia - Sistema Solar - Corpos Celestes
Cosmologia - Sistema Solar - Corpos CelestesCosmologia - Sistema Solar - Corpos Celestes
Cosmologia - Sistema Solar - Corpos CelestesWesley Germano Otávio
 
Cosmologia sistema solar - os planetas
Cosmologia   sistema solar - os planetasCosmologia   sistema solar - os planetas
Cosmologia sistema solar - os planetasWesley Germano Otávio
 
Cosmologia - Sistema Solar - Origem do sol e suas características
Cosmologia - Sistema Solar - Origem do sol e suas característicasCosmologia - Sistema Solar - Origem do sol e suas características
Cosmologia - Sistema Solar - Origem do sol e suas característicasWesley Germano Otávio
 
Raios uso de tecnologia evita mortes e prejuízos
Raios   uso de tecnologia evita mortes e prejuízosRaios   uso de tecnologia evita mortes e prejuízos
Raios uso de tecnologia evita mortes e prejuízosWesley Germano Otávio
 

Mais de Wesley Germano Otávio (20)

Zoologia de vertebrados (cordados) - professor wesley
Zoologia de vertebrados (cordados) - professor wesleyZoologia de vertebrados (cordados) - professor wesley
Zoologia de vertebrados (cordados) - professor wesley
 
Revisão Zoologia - Professor Wesley
Revisão Zoologia - Professor WesleyRevisão Zoologia - Professor Wesley
Revisão Zoologia - Professor Wesley
 
Ascaridíase
AscaridíaseAscaridíase
Ascaridíase
 
Citologia
CitologiaCitologia
Citologia
 
Caracteristicas básicas dos seres vivos
Caracteristicas básicas dos seres vivosCaracteristicas básicas dos seres vivos
Caracteristicas básicas dos seres vivos
 
Cosmologia - Sistema Solar - Corpos Celestes
Cosmologia - Sistema Solar - Corpos CelestesCosmologia - Sistema Solar - Corpos Celestes
Cosmologia - Sistema Solar - Corpos Celestes
 
Cosmologia sistema solar - os planetas
Cosmologia   sistema solar - os planetasCosmologia   sistema solar - os planetas
Cosmologia sistema solar - os planetas
 
Cosmologia - Sistema Solar - Origem do sol e suas características
Cosmologia - Sistema Solar - Origem do sol e suas característicasCosmologia - Sistema Solar - Origem do sol e suas características
Cosmologia - Sistema Solar - Origem do sol e suas características
 
Cosmologia - o Universo
Cosmologia - o UniversoCosmologia - o Universo
Cosmologia - o Universo
 
Origem da vida
Origem da vidaOrigem da vida
Origem da vida
 
Método científico
Método científicoMétodo científico
Método científico
 
O que é biologia?
O que é biologia?O que é biologia?
O que é biologia?
 
Criminalização da sobrevivência
Criminalização da sobrevivênciaCriminalização da sobrevivência
Criminalização da sobrevivência
 
Energia solar
Energia solarEnergia solar
Energia solar
 
Musica popular brasileira - MPB
Musica popular brasileira - MPBMusica popular brasileira - MPB
Musica popular brasileira - MPB
 
Mario quintana
Mario quintanaMario quintana
Mario quintana
 
Risco de acidentes
Risco de acidentesRisco de acidentes
Risco de acidentes
 
Clonagem
ClonagemClonagem
Clonagem
 
Raios uso de tecnologia evita mortes e prejuízos
Raios   uso de tecnologia evita mortes e prejuízosRaios   uso de tecnologia evita mortes e prejuízos
Raios uso de tecnologia evita mortes e prejuízos
 
Jogo x Esporte
Jogo x EsporteJogo x Esporte
Jogo x Esporte
 

Motores de busca

  • 1. CEETEPS – CENTRO ESTADUAL DE EDUCAÇÃO TECNOLÓGICA “PAULA SOUZA” ETEC FERNANDO PRESTES TÉCNICO EM INFOMÁTICA Wesley Germano Otávio MOTORES DE BUSCA Sorocaba – SP 2013
  • 2. Wesley Germano Otávio MOTORES DE BUSCA Trabalho de conclusão de semestre da disciplina Linguagens, Trabalho e Tecnologia. Professor (a): Leila Sorocaba-SP 2013
  • 3. Resumo Este trabalho manifesta de forma visível que a expansão tecnológica e uso crescente da internet por parte das pessoas, fazem com que elas se submetam às vezes utilizar somente um único site de busca, e ao usa-lo encontram de maneira rápida em sua primeira lista de conteúdos oferecidos pelo motor de busca o que deseja. Atualmente este tipo de ocorrência tem se dado a um grande número de indivíduos, se elas dispusessem a procurar em mais sites de buscas e em seus conteúdos gerados, iriam abranger uma quantidade maior de conhecimento. Também há o caso em que os buscadores de conteúdo muitas vezes retornam o que procuramos com uma vasta diversificação, mas também a vezes que não encontram o conteúdo relacionado à nossa busca, e assim retorna qualquer coisa, como propagandas direcionadas fazendo com que o usuário desista sobre sua procura. Buscamos através deste trabalho mostrar as características, formas de uso e a história dos Motores de Buscas. Palavras chaves: site de busca, motores de busca, conteúdo, internet, procura, web.
  • 4. SUMÁRIO 1. INTRODUÇÃO ..................................................................................................... 4 2. Motores de busca ............................................................................................... 5 2.1. História .............................................................................................................. 5 2.2. Funcionamento .................................................................................................. 6 2.2.1. Saber escolher suas palavras-chave ............................................................. 8 2.2.2. A sintaxe ........................................................................................................ 9 2.3. Tipos de buscadores ......................................................................................... 9 2.4. Custos de armazenamento e tempo de crawling............................................. 11 2.5. Motores de busca geoespaciais ...................................................................... 12 2.6. Qual Utilizar? ................................................................................................... 12 2.6.1. Os mais utilizados ........................................................................................ 13 2.6.2. Novos motores de busca.............................................................................. 13 3. CONCLUSÃO ..................................................................................................... 15
  • 5. 4 1. INTRODUÇÃO No início a internet era dotada de poucos domínios e geralmente com uma finalidade bastante específica. A explosão de conteúdos de todas as classes ocorridas nas últimas décadas por conta da popularização da internet fez necessária uma nova classe de serviço na web: os buscadores. Atualmente, muitos pensam que Google é sinônimo de busca, saiba que ele não é o único site com esta finalidade e muito menos foi o primeiro. Se não encontrou na primeira tentativa, experimente dar uma olhada em outro lugar antes de desistir. Os mecanismos de buscas fazem que nossa procura seja rápida e bastante interativa pela forma em organiza as informações.
  • 6. 5 2. Motores de busca A Web é uma vasta coleção de documentos heterogêneos. Possui natureza dinâmica e milhões de páginas surgem e desaparecem todos os dias. Por isso sente-se um anseio para que a Web realmente alcance todo o seu potencial e se torne uma ferramenta mais utilizável, eficaz e compreensível. Neste contexto os motores de busca surgiram para direcionar e levar os resultados aos usuários mais rapidamente e facilmente, pois suas bases de dados são extremamente grandes, podendo alcançar centenas de milhões de itens, que proporcionam ao usuários localizar itens mediantes suas buscas por palavras-chaves, ou às vezes, em linguagem natural. Os motores de busca surgiram quando a web começa a atingir um imenso número de conteúdos variados que dificultavam a coleta de informações através de uma busca manual através da navegação. Muitos trabalhos na web derivaram de informações criadas inicialmente por professores, alunos, doutores e empresas interessadas em ter seus conteúdos na web. 2.1. História Os primeiros motores de busca (como o Yahoo) baseavam-se na indexação de páginas através da sua categorização. Posteriormente surgiram as meta-buscas. A mais recente geração de motores de busca (como a do Google) utiliza tecnologias diversas, como a procura por palavras-chave diretamente nas páginas e o uso de referências externas espalhadas pela web, permitindo até a tradução direta de páginas (embora de forma básica ou errada) para a língua do utilizador. O Google, além de fazer a busca pela Internet, oferece também o recurso de se efetuar a busca somente dentro de um site específico. É essa a ferramenta usada na comunidade Wiki. Os motores de busca são buscadores que baseiam sua coleta de páginas em um robô que varre a Internet à procura de páginas novas para introduzir em sua base de dados automaticamente. Motores de busca típicos são Google, Yahoo e Altavista. A primeira ferramenta utilizada para busca na Internet foi o Archie (da palavra em Inglês, "archive" sem a letra "v"). Foi criado em 1990 por Alan Emtage, um estudante da McGillUniversity em Montreal. O programa baixava as listas de diretório de todos os arquivos localizados em sites públicos de FTP (File TransferProtocol) anônimos, criando uma base de dados que permitia busca por nome de arquivos. Enquanto o Archie indexava arquivos de computador, o Gopher indexava documentos de texto. Ele foi criado em 1991, por Mark McCahill da Universidade de Minessota, cujo nome veio do mascote da escola. Devido ao fato de serem arquivos de texto, a maior parte dos sites Gopher tornaram-se websites após a criação da WorldWide Web.
  • 7. 6 Dois outros programas, Veronica e Jughead, buscavam os arquivos armazenados nos sistemas de índice do Gopher. Veronica (VeryEasyRodentOriented Net-wide Index toComputerizedArchives) provia uma busca por palavras para a maioria dos títulos de menu em todas listas do Gopher. Jughead (Jonzy's Universal GopherHierarchyExcavationAnd Display) era uma ferramenta para obter informações de menu de vários servidores Gopher. O primeiro searchengine Web foi o Wandex, um índice atualmente extinto feito pela WorldWide Web Wanderer, um web crawler (programa automatizado que acessa e percorre os sites seguindo os links presentes nas páginas.) desenvolvido por Matthew Gray no MIT, em 1993. Outro sistema antigo, Aliweb, também apareceu no mesmo ano e existe até hoje. O primeiro sistema "fulltext" baseado em crawler foi o WebCrawler, que saiu em 1994. Ao contrário de seus predecessores, ele permite aos usuários buscar por qualquer palavra em qualquer página, o que tornou-se padrão para todos serviços de busca desde então. Também foi o primeiro a ser conhecido pelo grande público. Ainda em 1994, o Lycos (que começou na Carnegie MellonUniversity) foi lançado e tornou-se um grande sucesso comercial. Logo depois, muitos sistemas apareceram, incluindo Excite, Infoseek, Inktomi, Northern Light, e AltaVista. De certa forma, eles competiram com diretórios populares como o Yahoo!. Posteriormente, os diretórios integraram ou adicionaram a tecnologia de searchengine para maior funcionalidade. Os sistemas de busca também eram conhecidos como a "mina de ouro" no frenêsi de investimento na Internet que ocorreu no fim dos anos 1990s. Várias empresas entraram no mercado de forma espetacular, com recorde em ganhos durante seus primeiros anos de existência. Algumas fecharam seu sistema público, e estão oferecendo versões corporativas somente, como a Northern Light. Mais recentemente, os sistemas de busca também estão utilizando XML ou RSS, permitindo indexar dados de sites com eficácia, sem a necessidade de um crawler complexo. Os sites simplesmente provêm um xmlfeed o qual é indexado pelo sistema de busca. Os XML feeds estão sendo cada vez mais fornecidos de forma automática por weblogs. Exemplos são o feedster, que inclui o LjFindSearch que provê serviços para os blogs do site LiveJournal. 2.2. Funcionamento Os motores de busca utilizam software conhecido como ''aranhas'' ou "robots" que percorrem "toda" a Internet em busca da informação (documentos ou endereços de páginas web) que se pretende. Os dados são recolhidos para o index dos motores de busca, que cria uma base de dados com essa informação. A forma como a informação é indexada depende de cada motor de busca, podendo ser feita por palavras, títulos, URLs ou por diretórios. Assim, sempre que se introduz uma palavra ou um conjunto de palavras que se pretende pesquisar, as bases de dados são percorridas em busca de documentos ou sites que lhe correspondam. O resultado da
  • 8. 7 busca é dado em hyperlinks, podendo clicar-se em cada uma das entradas para aceder à informação. Na internet encontramos centenas de motores de busca. Alguns deles são acessíveis a partir desta página, que os distingue entre diretórios, indexantes e meta-pesquisadores. Uma mesma pesquisa efetuada nestes diversos motores de busca terá resultados muito diferentes. Mesmo pesquisas realizadas num mesmo instrumento (motor de busca) poderão dar resultados muito diferentes de um dia para o outro. Qualquer cibernauta com alguma experiência sabe que, ao utilizar os instrumentos de pesquisa, está a "lançar uma garrafa ao mar" com uma mensagem lá dentro. Se a mensagem "chega a bom porto" é sempre uma incógnita. Entre os resultados da pesquisa executada só alguns são pertinentes, pois não é possível ter um controlo total da estratégia de pesquisa (pois não depende só do cibernauta). Também não é a performance informática dos motores de busca que está em causa, embora ela tenha alguma importância, mas a performance do ponto de vista documental (Diz-se que, hoje em dia, está tudo na internet, mas nem na internet é possível encontrar documentos que não existem). Uma pesquisa traduz um bom desempenho quando permite encontrar os documentos pesquisados e apenas os documentos pesquisados. De acordo com este critério, a pesquisa na internet revela uma grande taxa de silêncio (os documentos pertinentes não são encontrados) ou de ruído (encontramos frequentemente um vasto conjunto de documentos não pertinentes). Por isso, só muito dificilmente podemos efetuar uma pesquisa na internet que permita um bom desempenho. O investimento em tempo exigido para realizar a pesquisa e o exame e análise dos resultados obtidos são frequentemente exigentes e morosos considerando os benefícios que se retiram da pesquisa. Pode ser interessante conhecer as bases de funcionamento de um motor de busca, para utilizá-lo mais eficazmente. Os robôs dos motores de busca ordenam e classificam milhares de páginas Web durante uma busca. Vários parâmetros são levados em conta: A presença da palavra-chave na página: evidentemente, este é o primeiro critério. A classificação muda de acordo com a presença da palavra no URL, no título da página, na sua posição na página, mas também, na apresentação: sublinhado, em negrito, e em sua reincidência. Os Metatags: são campos invisíveis, no código da página, criados pelos webmasters que querem melhorar a indexação de suas páginas pelos motores de busca. No entanto, este método está, cada vez menos, sendo levado em conta pelos robôs. A popularidade da página: o robô também analisa o número de entradas e saídas de conexões da página. Quanto mais links apontarem para a página mais esta será considerado como popular pelo robô e melhor será sua classificação no ranking.
  • 9. 8 Esses critérios são conhecidos como in thepage, ou seja, que dizem respeito ao conteúdo da página. Para melhorar sua classificação, os robôs também utilizam critérios offthepage, que levam em conta o uso, feito da página, pelos usuários. O robô analisa a relevância dos resultados, calculando o tempo gasto, pelo usuário, na página sugerida pelo motor e sua volta, ou não, para a página de resultados. Os resultados propostos pelo motor constituem, assim, uma equação que, leva em conta todos esses parâmetros. 2.2.1. Saber escolher suas palavras-chave Não esqueçam que os motores são meros robôs. Eles não falam nossa língua, não pensam e não têm espírito de síntese. Então, é preciso pensar bem nas palavras-chave a serem registradas para não digitar qualquer bobagem que passe pela nossa cabeça, sem relação com o tema da página. Classificar suas palavras-chave: Palavras-chave « abrangentes »: são palavras que cobrem grandes áreas como: comércio, cinema, arte, música, etc. Separadamente, elas trazem diversas respostas e, logo, ineficazes. Palavras-chave « profundas »: capazes de melhorar a busca a ser feita indicando uma área específica da palavra-chave abrangente. Podemos digitar várias a fim de obter resultados mais precisos. Podem ser datas, lugares, subgêneros, etc. Palavras-chave « excluídas »: durante uma busca, também podemos querer excluir uma palavra que possa induzir o robô a cometer um erro e a trazer respostas inapropriadas. Para isto, basta botar um « - » (menos), antes da palavra. Exemplo para uma busca em seus concorrentes: Palavra-chave abrangente: empresas Palavras-chave profundas: construção, pintura, Lisboa Palavra-chave proibida: artesão Trata-se de uma busca de empresas de construção, especializadas em pintura, em Lisboa, que exclui artesãos.
  • 10. 9 2.2.2. A sintaxe Se, levar tempo para escolher bem suas palavras-chave é eficaz, isto não determina, necessariamente, o número possível de respostas. Já vimos como excluir uma palavra de uma busca, porém, existem muitas outras opções. Forçá-los a encontrar várias palavras na mesma página : ao entrar várias palavras-chave no motor, separadas apenas por um espaço, o robô exibe páginas contendo qualquer uma das palavras. Para que os robôs exibam páginas contendo as duas (ou mais) palavras, basta acrescentar o sinal « + », antes de cada palavra, mantendo um espaço entre elas. Exemplo: para procurar « política e Brasil », na mesma página: +política +Brasil. Procurar uma expressão: se você quiser que várias palavras apareçam de maneira contígua, use as aspas. Exemplo: para procurar venda à distância: « venda à distância » Busca complexa: para uma busca bem precisa, podemos multiplicar as indicações. Exemplo: para procurar um fornecedor de acesso à Internet, menos conhecido: « fornecedor de acesso » +Internet - Net. 2.3. Tipos de buscadores Existem variados tipos de buscadores: Buscadores globais: são buscadores que pesquisam todos os documentos na rede, e a apresentação do resultado é aleatória, dependendo do ranking de acessos aos sites. As informações podem referir-se a qualquer tema. O buscador global mais recente é oWiglr, que utiliza dados muito parecidos com o Google e Bing, é também o primeiro buscador criado nesta década (20102020).Google, Yahoo e Bing são os buscadores globais mais acessados. Buscadores verticais: são buscadores que realizam pesquisas "especializadas" em bases de dados próprias de acordo com suas propensões. Geralmente, a
  • 11. 10 inclusão em um buscador vertical está relacionada ao pagamento de uma mensalidade ou de um valor por clique. Trovit, BizRate, AchaNoticias, Oodle, Catho, SAPO, BuscaPé, Zura e Beco me.com são alguns exemplos de buscadores verticais. Guias locais: são buscadores exclusivamente locais ou regionais. As informações se referem a endereços de empresas ou prestadores de serviços. O resultado é priorizado pelo destaque de quem contrata o serviço. Listão, GuiaMais, AcheCerto, EuAcheiFácil, Zeen! entre outras. Geralmente são cadastros e publicações pagas. É indicado para profissionais e empresas que desejam oferecer seus produtos ou serviços em uma região, Estado ou Cidade. Guias de busca local ou buscador local: são buscadores de abrangência nacional que lista as empresas e prestadores de serviços próximos ao endereço do internauta a partir de um texto digitado. A proximidade é avaliada normalmente pelo cep, Donavera.com, ou por coordenadas de GPs. Os cadastros Básicos são gratuitos para que as micro empresas ou profissionais liberais possam estar presente na WEB sem que invistam em um sites próprio. É indicado para profissionais e empresas que desejam oferecer seus produtos ou serviços em uma Localidade, rua, bairro, cidade ou Estado e possibilitando ainda a forma mais rápida de atualização dos registros de contatos por seus clientes ou fornecedores. Diretórios de websites: são índices de sites, usualmente organizados por categorias e subcategorias. Tem como finalidade principal permitir ao usuário encontrar rapidamente sites que desejar, buscando por categorias, e não por palavras-chave. Os diretórios de sites geralmente possuem uma busca interna, para que usuários possam encontrar sites dentro de seu próprio índice. Diretórios podem ser a nível regional, nacional (como o Achei no Brasil) ou global, e até mesmo especializado em determinado assunto. Open Directory Project é exemplo de diretórios. A divulgação de sites de empresas com negócios regionais são acessados em sua grande maioria quando os profissionais da WEB cadastram seus sites nos Buscadores Locais para aumentarem as visitas de internautas, pois não há um sistema de atualização automática dos dados que abranja todos os tipos de categorias e em rapidez necessária. Por esta razão, somente cerca de 20% a 25% de tudo que existe na WEB é publicada nos buscadores. A novidade agora são os ontobuscadores, isto é, buscadores baseados em Ontologias, como o Ontoweb. Ano Engine Evento Ano Engine Evento 1993 Wandex Lançamento 2000 Singingfish Lançamento 1993 Aliweb Lançamento 2000 Teoma Fundado 1994 WebCrawler Lançamento 2000 Vivisimo Fundado
  • 12. 11 Infoseek Lançamento 2003 ObjectsSearch Lançamento Lycos Lançamento 2004 Yahoo! Search Lançamento final (primeiros resultados originais) 1995 AltaVista Lançamento (parte do DEC) 1995 Sapo.pt Lançamento 1996 Dogpile Lançamento beta 2005 MSN Search Lançamento final Lançamento 2006 Quaero Fundado Inktomi AskJeeves 1997 MSN Search Fundado 2006 Fundado Trovit 2007 Ask.com Northern Light Lançamento 2008 Fundado 2009 Sapo.pt 1998 Google 1997 Cuil Lançamento Bing 2009 Zeen.com.br Fundado Fundado Fundado Fundado Fundado 1999 AlltheWeb Lançamento 2011 Wiglr Lançamento 1999 Baidu Fundado 2013 SACF Search Lançamento 2.4. Custos de armazenamento e tempo de crawling Os custos de armazenamento não são o recurso limitador na implementação de um sistema de busca. Armazenar simplesmente 10 bilhões de páginas de 10 kbytes cada (comprimidas) requer 100TB e outros aproximados 100TB para índices, dando um custo de hardware total em menos de $200k: 400 drives de disco de 500GB em 100 PCs baratos. De qualquer forma, um sistema público de busca consideravelmente requer mais recursos para calcular os resultados e prover alta disponibilidade. E os custos de operar uma grande serverfarm não são triviais. Passar por 10B páginas com 100 máquinas percorrendo links a 100 páginas/segundo levaria 1M segundos, ou 11.6 dias em uma conexão de Internet de alta capacidade. A maior parte dos sistemas percorre uma pequena fatia da Web (10-20% das páginas) perto desta freqüência ou melhor, mas também percorre sites dinâmicos (por exemplo, sites de notícias e blogs) em uma freqüência muito mais alta.
  • 13. 12 2.5. Motores de busca geoespaciais Uma recente melhoria na tecnologia de busca é a adição de geocodificação e geoparsing para o processamento dos documentos ingeridos. O geoparsing tenta combinar qualquer referência encontrada a lugares para um quadro geoespacial de referência, como um endereço de rua, localizações de dicionário de termos geográficos, ou a uma área (como um limite poligonal para uma municipalidade). Através deste processo de geoparsing, as latitudes e longitudes são atribuídas aos lugares encontrados e são indexadas para uma busca espacial posteriores. Isto pode melhorar muito o processo de busca, pois permite ao usuário procurar documentos para uma dada extensão do mapa, ou ao contrário, indicar a localização de documentos combinando com uma dada palavra-chave para analisar incidência e agrupamento, ou qualquer combinação dos dois. Uma empresa que desenvolveu este tipo de tecnologia é a Meta-Carta, que disponibiliza seu produto como um XML Web Service para permitir maior integração às aplicações existentes. A Meta-Carta também provê uma extensão para o programa GIS como a ArcGIS (ESRI) para permitir aos analistas fazerem buscas interativamente e obter documentos em um contexto avançado geoespacial e analítico. 2.6. Qual Utilizar? Existem dois tipos de motores de busca: os que indexam, por título e URL, toda a informação onde encontram a palavra ou o conjunto de palavras que pediu, conhecidos como ''webcrawlers'' (como é o caso do Google) e aqueles que funcionam com base em diretórios (o mais conhecido é o Yahoo). Enquanto que os primeiros devem ser utilizados para pesquisas mais específicas, os motores de busca baseados em diretórios deverão ser utilizados para encontrar informação mais genérica, dado que os resultados da pesquisa são um conjunto de sites onde se poderá encontrar o que se pretende. Exemplificando, se o objetivo é encontrar o site do Sport Lisboa e Benfica deve utilizar-se o Yahoo, mas se pretende encontrar a biografia do Eusébio será mais fácil pesquisar no Google. Um dos pontos negativos de sites como o Google ou o Alta Vista é que poderão devolver informação irrelevante para o que se procura, dado que indexam páginas individuais que fazem referência à pesquisa efetuada, mas que não têm nada a ver com o que se pretende. No entanto, este tipo de motores de busca é melhor em termos de atualização da informação. Atualmente, com a evolução da própria Internet, a maior parte dos motores de busca já apresenta um misto de diretórios com indexantes, aumentando as possibilidades de encontrar o que se deseja.
  • 14. 13 2.6.1. Os mais utilizados O motor de busca em maior crescimento é o Google. Em 2002 apresentou um serviço novo e mais eficaz capaz de uma busca em cerca de mil milhões de páginas na Internet, cerca de dois terços do conteúdo da WorldWide Web, confirmando a sua crescente popularidade. O AltaVista também indexa milhões de páginas e documentos. Faz a pesquisa por palavras-chave e atualiza a sua informação constantemente, apresentando data e hora nos documentos que resultam da pesquisa efetuada. Outro motor de busca a destacar é o HotBot, que oferece uma percentagem de aproximação à pesquisa efetuada, devolvendo os documentos que apresentam maior percentagem. Permite pesquisar em nove línguas e consegue procurar imagens, vídeos e ficheiros MP3. Tendo começado por ser um motor de busca exclusivamente baseado em diretórios, o famoso Yahoo já permite efetuar pesquisas específicas. No entanto, deve continuar a ser utilizado para pesquisas de informação geral devido à forma como indexa a sua informação. Por fim, temos um motor de busca com características particulares. O AskJeeves (tal como a Alta Vista) permite efetuar uma pesquisa a partir de uma pergunta. Pode perguntar ''Wherecan I findinformationabout Sport Lisboa e Benfica'' (perguntas exclusivamente em inglês) e, após clicar na pergunta, poderá encontrar a resposta para a sua busca. 2.6.2. Novos motores de busca O Google ainda não precisa se preocupar mas, a concorrência continua crescendo e aumentando seus trunfos em outras áreas : precisões, personalização, serviços adicionais, etc. Veja aqui, o que eles têm a mais para você poupar tempo e ter mais precisão em suas buscas. Ask Já na página inicial, você pode orientar suas necessidades: site, imagem, vídeo, blog. Conforme você vai avançando em suas buscas, sugestões aparecem, em duas colunas, uma à esquerda e outra à direita. Se inscrevendo, você terá acesso a outros serviços: salvar buscas, palavras-chave. Desvantagem: os resultados comerciais ocupam muito espaço.
  • 15. 14 Exalead, em francês. Os resultados aparecem com uma pré-visualização das miniaturas dos sites. À direita, um quadro vazio te ajuda a precisar a sua busca. As opções são muitas : especificar o tipo de arquivo, o tipo de site, o país hospedeiro. Desvantagem : os resultados nem sempre são pertinentes. Yahoo Brasil É o motor que mais se aproxima do Google em termos de ergonomia. Os resultados são numerosos e bem apresentados. É possível personalizá-los, escolhendo uma série de módulos. Desvantagem: os resultados não são tão relevantes quanto os do Google.
  • 16. 15 3. CONCLUSÃO Encontrar a informação que nos interessa na Internet pode ser como procurar agulha em palheiro: uma tarefa complicada, demorada e, muitas vezes, frustrante nos resultados. Ao longo dos anos, e à medida que a Internet foi crescendo, foram sendo criados vários mecanismos e ferramentas para auxiliar a localização e acesso aos imensos recursos informativos da Rede. Na web conseguimos encontrar vários mecanismos que nos levam a fonte do conteúdo que precisamos. Estes mecanismos funcionam com catálogos de dados que com a entrada de palavras – chaves pelo usuário faz a busca pelo conteúdo rapidamente pela internet. Essa rapidez se da pelo algoritmo de busca do mecanismo, que se bem feito e composto para diversos tipos de busca pode proporcionar agilidade no seu tempo de resposta. Em alguns casos seria ótimo encontrar algo logo de cara sem precisar procurar, mas quando não encontramos e chegamos até a desistir, por isso temos desaber o modo em que sistema do mecanismo de busca funciona, para que possamos efetuar nossas pesquisas por termos mais corretos, concretos e fáceis de serem encontrados. Os conhecimentos de algumas artes manhas influenciam no método em que buscador procura o conteúdo, normalmente essas arte manhas se encontram escondidas, mas pode se encontrá-las através de uma busca rápida pela web e isso às vezes pode favorecer sua pesquisa. Se não encontrar o que procura em um site de busca, não desanime, existem muitos outros para efetuar sua pesquisa, sendo que todos tem um sistema diferente para efetuar sua procurar, e lembre-se há quase tudo na internet.
  • 17. 16 4. REFERÊNCIAS Estado de S. Paulo – Matéria: A nova era das ferramentas de busca. http://conjur.estadao.com.br/static/text/41493,1/ Made In Blog - Buscadores inteligentes de conteúdo. http://icommercepage.wordpress.com/2010/02/07/buscadores-inteligentes-deconteudo/ Info Exame - O Google é inútil. http://info.abril.com.br/noticias/internet/o-google-e-inutil-11082009-27.shl Portal do Professor – Sites de Buscas http://portaldoprofessor.mec.gov.br/link.html?categoria=13 Slid.es – O usos dos motores de busca na internet http://slid.es/alanalvescorrea/projeto-tcc Boom – Box -Bom conteúdo não teme buscadores. http://blog.boo-box.com/br/2008/bom-conteudo-nao-teme-buscadores/ Os motores de busca numa perspectiva cognitiva - DIAS, P. ; OSÓRIO, A. J., ed. lit. – “Challenges 2009 : actas da Conferência Internacional de Tecnologias de Informação e Comunicação na Educação, 6, Braga, 2009”. Braga : Centro de Competência Nónio Séc. XXI da Universidade do Minho, 2009. p. 887-900. http://hdl.handle.net/1822/9856 Marinho, Leandro Balby – Mineração na web http://143.54.31.10/reic/edicoes/2003e2/tutoriais/MineracaoNaWeb.pdf Publici&Tal - Quem procura, acha: sobre marketing nos buscadores de conteúdo http://publicital.wordpress.com/2013/03/05/quem-procura-acha-sobre-marketing-nosbuscadores-de-conteudo/