Nome: Camila Morgado
Fernanda Zanon
Rodrigo Pereira
 Introdução
 Histórico
 Tipos de buscador
 Funcionamento
 Coleta e Armazenamento
 Indexação
 Processamento de consulta
 Otimização para mecanismos de busca
 Bibliografia
O que é uma máquina de busca?
Feito para auxiliar a procura de informações
Rede mundial
Rede corporativa
Computador pessoal
Recuperação de Informação (RI)
Recupera informação que possa ser útil ou relevante
Palavras-chave
Grau de relevância
Criadas logo após o surgimento da internet.
Necessidade de buscar informações.
Apresentar resultados de maneira rápida e eficiente.
Os primeiros motores de busca
Archie: buscava dados em sites ftp.
Gopher: buscava arquivos de texto.
Veronica e Jughead utilizavam os arquivos
armazenados nos servidores Gopher.
Os primeiros web crowler
Wandex
Aliweb
Buscadores Típicos
Altavista: primeiro a
oferecer pesquisa de
imagem, vídeo e áudio.
Yahoo: utilizava
indexação por
categorização.
Google: utiliza
tecnologias diversas.
Buscadores Globais
Pesquisam todos os documentos da rede
Buscadores Verticais
Realizam buscas especializadas em uma base de dados
própria.
Guias Locais
Buscadores locais ou regionais, referentes a endereços
de empresas ou serviços.
Guias de Busca Local
Buscadores de abrangência nacional, listam empresas e
prestadores de serviços próximos.
Diretórios de Websites
Índices de sites, localizam sites por categoria.
Coleta e Armazenamento de documentos
Varre e guarda informações
Indexação
Armazena informações num índice invertido
Processamento de consulta
Varre o índice invertido de termos
Aplicativos para descobrir novas páginas:
Crawlers
Bots
Robots
Spiders
Robots.txt
Formato do arquivo: nome e arquivos bloqueados
 O arquivo abaixo permite acesso total a todos os bots:
User-agent: *
Disallow:
 O arquivo abaixo nega acesso de todos os bots a todos os
arquivos:
User-agent: *
Disallow: /
 O arquivo abaixo nega acesso do googlebot ao sub-diretório
/brasil:
User-agent: *
Disallow: /brasil/
O processo de coleta é dividido em:
Coletor
 Extrai links
Servidor de Armazenamento
 Extrai textos
Servidor de Nomes
 Controla requisições
Escalonador
 Coordena ação dos coletores
Escalonamento: função crítica
Técnicas para tentar pegar as melhores páginas:
Em profundidade
Em largura com sufixo de URL
Baseada em Ranking de URL
Baseada em conectividade
Varre coleção de documentos
“Indexa“ palavras e suas ocorrências
Armazena as informações em índice invertido
Exemplo:
Palavras: Lista de ocorrências da palavra:
casa-> (B, 3)(C, 12)
carro-> (A, 10)(B, 6)(C, 12)
blog-> (A, 3)
Granularidade
Stopwords
Stemming de palavras
Relação entre palavras
Calcula relevância de cada palavra consultada
Medidas TF – IDF
O que é?
Proposta de melhora do ranking da página nos
principais motores de busca(Google, Yahoo, Bing, etc).
Essencial participação e conhecimento do cliente sobre
o seu produto.
O retorno de um projeto de SEO deve ser esperado para
o médio/longo-prazo.
Como se faz?
Técnica de preparação de sites e páginas web para
alcançar bons posicionamentos nas SERPs
Hierarquia de necessidades
Análise competitiva
Combinação de chaves
Análise Inicial
Análise completa do tráfego e código do site atual
Observação da posição do site no SERP(resultado nas
páginas de busca)
Análise do serviços de SEO’s anteriores
Desenvolvimento da “lista negra do fracasso” do site
nos mecanismos de busca
Pesquisa e análise de chaves
Lista de palavras-chaves determinantes para o negócio.
Ferramentas de medição de audiência das palavras-
chave.
Elaboração da exposição e abordagem da página de
busca no site
Análise Competitiva
Quem são os concorrentes?
Quais os seus pontos fortes e fracos?
Análise dos websites e campanhas online dos
concorrentes.
Mapeamento do site
Análise dos pontos fracos da empresa em:
 Usabilidade
 Acesso
 Design
 Resoluções
 Multibrowser
Cuidados no modelo otimizado do site
Repetição das palavras-chaves(palavras-chaves
negativas)
Excesso de palavras-chaves distintas
Não utilizar as meta-tags
Resultados
Distribuição das palavras-chaves através do título,
meta-descrição , meta-tags
Submissão das url’s para os principais motores de busca
Análise dos resultados da submissão
Benefícios:
40% dos usuários se baseiam em mecanismo de busca
no processo de decisão da compra
93% dos usuários sequer passa da primeira página de
busca retornada.
72% dos usuários só consideram relevantes informações
de empresas onde podem encontrar o que precisam
facilmente.
Benefícios:
68% dos usuários somente consideram os resultados
orgânicos como relevantes.
 http://www.bruceclay.com/web_rank.htm
 http://pt.wikipedia.org/wiki/Motor_de_busca
 http://www.blogdohummel.com/2007/10/como-funciona-uma-mquina-de-busca.htm
 http://googlediscovery.com/2007/11/16/o-futuro-das-maquinas-de-busca/
 http://www.sites-de-busca.com/basico/
 http://www.mediaboon.com/pt/o-que-fazemos/outros/otimizacao-para-
maquinas-de-busca.html
 http://www.brandup.com.br/otimizacao-de-sites-seo
 http://www.pensedynamo.com/tipos-servicos-seo.htm
 http://www.artigonal.com/seo-e-sem-artigos/como-funciona-o-trabalho-
inicial-de-seo-2054231.html
 http://www.dzoe.com.br/servicos/otimizacao-de-sites-para-buscadores-seo/
 http://www.mestreseo.com.br/

Máquinas de busca

  • 1.
    Nome: Camila Morgado FernandaZanon Rodrigo Pereira
  • 2.
     Introdução  Histórico Tipos de buscador  Funcionamento  Coleta e Armazenamento  Indexação  Processamento de consulta  Otimização para mecanismos de busca  Bibliografia
  • 3.
    O que éuma máquina de busca? Feito para auxiliar a procura de informações Rede mundial Rede corporativa Computador pessoal
  • 4.
    Recuperação de Informação(RI) Recupera informação que possa ser útil ou relevante Palavras-chave Grau de relevância
  • 5.
    Criadas logo apóso surgimento da internet. Necessidade de buscar informações. Apresentar resultados de maneira rápida e eficiente.
  • 6.
    Os primeiros motoresde busca Archie: buscava dados em sites ftp. Gopher: buscava arquivos de texto. Veronica e Jughead utilizavam os arquivos armazenados nos servidores Gopher.
  • 7.
    Os primeiros webcrowler Wandex Aliweb
  • 8.
    Buscadores Típicos Altavista: primeiroa oferecer pesquisa de imagem, vídeo e áudio. Yahoo: utilizava indexação por categorização. Google: utiliza tecnologias diversas.
  • 9.
    Buscadores Globais Pesquisam todosos documentos da rede Buscadores Verticais Realizam buscas especializadas em uma base de dados própria. Guias Locais Buscadores locais ou regionais, referentes a endereços de empresas ou serviços.
  • 10.
    Guias de BuscaLocal Buscadores de abrangência nacional, listam empresas e prestadores de serviços próximos. Diretórios de Websites Índices de sites, localizam sites por categoria.
  • 11.
    Coleta e Armazenamentode documentos Varre e guarda informações Indexação Armazena informações num índice invertido Processamento de consulta Varre o índice invertido de termos
  • 12.
    Aplicativos para descobrirnovas páginas: Crawlers Bots Robots Spiders
  • 13.
    Robots.txt Formato do arquivo:nome e arquivos bloqueados  O arquivo abaixo permite acesso total a todos os bots: User-agent: * Disallow:  O arquivo abaixo nega acesso de todos os bots a todos os arquivos: User-agent: * Disallow: /  O arquivo abaixo nega acesso do googlebot ao sub-diretório /brasil: User-agent: * Disallow: /brasil/
  • 14.
    O processo decoleta é dividido em: Coletor  Extrai links Servidor de Armazenamento  Extrai textos Servidor de Nomes  Controla requisições Escalonador  Coordena ação dos coletores
  • 15.
    Escalonamento: função crítica Técnicaspara tentar pegar as melhores páginas: Em profundidade Em largura com sufixo de URL Baseada em Ranking de URL Baseada em conectividade
  • 16.
    Varre coleção dedocumentos “Indexa“ palavras e suas ocorrências Armazena as informações em índice invertido Exemplo: Palavras: Lista de ocorrências da palavra: casa-> (B, 3)(C, 12) carro-> (A, 10)(B, 6)(C, 12) blog-> (A, 3)
  • 17.
  • 18.
    Calcula relevância decada palavra consultada Medidas TF – IDF
  • 19.
    O que é? Propostade melhora do ranking da página nos principais motores de busca(Google, Yahoo, Bing, etc). Essencial participação e conhecimento do cliente sobre o seu produto. O retorno de um projeto de SEO deve ser esperado para o médio/longo-prazo.
  • 20.
    Como se faz? Técnicade preparação de sites e páginas web para alcançar bons posicionamentos nas SERPs Hierarquia de necessidades Análise competitiva Combinação de chaves
  • 22.
    Análise Inicial Análise completado tráfego e código do site atual Observação da posição do site no SERP(resultado nas páginas de busca) Análise do serviços de SEO’s anteriores Desenvolvimento da “lista negra do fracasso” do site nos mecanismos de busca
  • 23.
    Pesquisa e análisede chaves Lista de palavras-chaves determinantes para o negócio. Ferramentas de medição de audiência das palavras- chave. Elaboração da exposição e abordagem da página de busca no site
  • 24.
    Análise Competitiva Quem sãoos concorrentes? Quais os seus pontos fortes e fracos? Análise dos websites e campanhas online dos concorrentes.
  • 25.
    Mapeamento do site Análisedos pontos fracos da empresa em:  Usabilidade  Acesso  Design  Resoluções  Multibrowser
  • 26.
    Cuidados no modelootimizado do site Repetição das palavras-chaves(palavras-chaves negativas) Excesso de palavras-chaves distintas Não utilizar as meta-tags
  • 27.
    Resultados Distribuição das palavras-chavesatravés do título, meta-descrição , meta-tags Submissão das url’s para os principais motores de busca Análise dos resultados da submissão
  • 28.
    Benefícios: 40% dos usuáriosse baseiam em mecanismo de busca no processo de decisão da compra 93% dos usuários sequer passa da primeira página de busca retornada. 72% dos usuários só consideram relevantes informações de empresas onde podem encontrar o que precisam facilmente.
  • 29.
    Benefícios: 68% dos usuáriossomente consideram os resultados orgânicos como relevantes.
  • 30.
     http://www.bruceclay.com/web_rank.htm  http://pt.wikipedia.org/wiki/Motor_de_busca http://www.blogdohummel.com/2007/10/como-funciona-uma-mquina-de-busca.htm  http://googlediscovery.com/2007/11/16/o-futuro-das-maquinas-de-busca/  http://www.sites-de-busca.com/basico/  http://www.mediaboon.com/pt/o-que-fazemos/outros/otimizacao-para- maquinas-de-busca.html  http://www.brandup.com.br/otimizacao-de-sites-seo  http://www.pensedynamo.com/tipos-servicos-seo.htm  http://www.artigonal.com/seo-e-sem-artigos/como-funciona-o-trabalho- inicial-de-seo-2054231.html  http://www.dzoe.com.br/servicos/otimizacao-de-sites-para-buscadores-seo/  http://www.mestreseo.com.br/