SlideShare uma empresa Scribd logo
1 de 73
Baixar para ler offline
© 2013 IBM Corporation
Buscas no IBM WebSphere Portal
Rodrigo Reis
IT Specialist & Application Architect
IBM Collaboration Solutions
© 2013 IBM Corporation2
Agenda
Parte 1: Disponibilizando conteúdo do Portal na Internet
Parte 2: Como funciona o Portal Search?
Parte 3: Mudanças do Portal Search no WebSphere Portal 8
Parte 4: Integração com ferramentas de busca externas
© 2013 IBM Corporation
Parte 1: Disponibilizando conteúdo do
Portal na Internet
© 2013 IBM Corporation4
Como os motores de busca funcionam?
Os motores de busca coletam dados
sobre as informações publicadas na
web e constroem um enorme banco
de dados que relacionam as páginas
com os termos que elas contêm
através de um processo de quatro
etapas
© 2013 IBM Corporation5
Como os motores de busca funcionam?
1. Rastreamento (Crawlling) da Web
Os motores de busca (Search engines) executam
processos agendados chamados "bots" ou
"spiders" que usam os links encontrados na web
para "rastrear" (crawl) as páginas e documentos
2. Indexação de documentos
Uma vez que uma página tenha sido rastreada,
seu conteúdo é analisado e palavras-chave são
extraídas para a construção de um banco de
dados de documentos que compõe o "índice" de
um motor de busca
© 2013 IBM Corporation6
Como os motores de busca funcionam?
3. Processamento de consultas
Quando um pedido de informação chega ao motor
de busca, o motor recupera de seu índice todos os
documentos que correspondem a consulta
4. Classificação (Ranking) dos resultados
Uma vez que o motor de busca determinou quais
resultados correspondem a consulta, um algoritmo
executa cálculos sobre cada um dos resultados
para determinar o que é mais relevante para a
consulta dada. Ele classifica estes resultados nas
páginas de resultados, a partir do mais relevante
ao menos relevante
© 2013 IBM Corporation7
Desafios de crawlability no portal
Web Crawlers
Search Indexes
© 2013 IBM Corporation8
Desafios de crawlability no portal
© 2013 IBM Corporation9
Desafios de crawlability no portal
http://miamidade.gov/wps/portal/Main/home/!
ut/p/c5/04_SB8K8xLLM9MSSzPy8xBz9CP0os3hnQ29jA38vF98
wk1ALA08fD1MPLzNfAwN_c_1wkA6gCndHDxNzH6CQUZiBgZ
GfaXCgQWiwsYGnMUTeAAdwNND388jPTdUvyM5Oc3RUVAQ
AZBGxdA!!/dl3/d3/L2dBISEvZ0FBIS9nQSEh/
© 2013 IBM Corporation10
Desafios de crawlability no portal
● O estado de navegação contém informações sobre o estado do
portal, por exemplo, a página atual e o tema em uso. Ele também
contém informações sobre estado de portlet, por exemplo, o
modo de portlet (edit, view, help), estado da janela (minimized,
maximized) e render parameters
● A principal razão para a inclusão de todas essas informações na
URL é apoiar o bookmarking de páginas do Portal, mantendo o
layout exato e estado das informações naquele momento
© 2013 IBM Corporation11
Desafios de crawlability no portal
Home Página A Página C
Página B
URL A
URL
B
URL C
URL D
URL
E
Um crawler poderia assumir:
- URL A e URL D são diferentes
- URL B e URL E são diferentes
URLs com informações codificadas:
© 2013 IBM Corporation12
Desafios de crawlability no portal
● O Portal está preparado para enfrentar os desafios de
rastreamento usando “URLs Normalizadas”
● Quando o Portal reconhece que está sendo visitado por um
crawler, ajusta automaticamente as URLs para cada página,
retirando a maioria das informações armazenadas no estado de
navegação, deixando apenas informações exigidas para exibir a
página
● O Portal é pré-configurado para reconhecer cerca de cinquenta
motores de busca
© 2013 IBM Corporation13
Desafios de crawlability no portal
Um crawler poderia assumir:
- URL A e URL D são iguais
- URL B e URL E são iguais
Home Página A Página C
Página B
URL A
URL
B
URL C
URL D
URL
E
URLs normalizadas:
© 2013 IBM Corporation14
Sitemaps
● Mapas do Site (Sitemaps) são uma
maneira fácil para webmasters
informarem aos motores de busca
sobre as páginas dos sites que estão
disponíveis para rastreamento
● De forma simples, um Sitemap é um
arquivo XML que lista os URLs de um
site junto com metadados adicionais
sobre cada URL para que os motores
de busca possam indexar o site de
forma mais inteligente
© 2013 IBM Corporation15
Sitemaps
● Usar o protocolo Sitemap não garante que as páginas web serão
incluídas nos motores de busca, mas ajudam os crawlers a fazer
um melhor trabalho de rastreamento do seu site
● Os sites de busca sugerem apontar o crawler diretamente para um
mapa do site, ou pelo menos ter um link para o mapa do site em
algum lugar na página principal do site
● O IBM WebSphere Portal fornece um portlet Sitemap para ajudar
no atendimento às melhores práticas recomendadas pela maioria
dos motores de busca na Internet
● A melhor prática de uso do portlet Sitemap é colocar um link para
ele no topo da página, por exemplo, dentro do tema Portal
© 2013 IBM Corporation16
Sitemaps
● Informações adicionais, chamadas robot directives, podem ser
adicionadas a uma página instruindo o crawler para não rastrear
nada além do mapa do site
● As diretivas são meta dados incluídos no HTML, ou um arquivo
especial robots.txt, que fornece instruções ao crawler definindo se
rastrear seções do site é permitido ou proibido
● A semântica das diretivas são estruturadas. Por exemplo, pode
existir um instrução para permitir /home/publico/*, mas incluir
uma exceção, não permitindo /home/publico/funcionarios
● URLs do Portal são menos estruturadas, embora elas possam
começar de forma estruturada e "amigável" (para bookmarking),
depois de clicar em outros links as URLs se tornam mais
complexas e desestruturadas
© 2013 IBM Corporation17
Sitemaps
● A melhor prática para o uso de robot directives no Portal é
colocá-las no tema, com a lógica para permitir ou proibir páginas
individuais
Por exemplo, se o Portal tem um mapa do site, o tema poderia gerar:
<meta name="robots" content="noindex,follow">
Isso instrui o crawler a seguir todos os links da página com o mapa do
site, mas não incluindo ela nos resultados. Para todas as outras
páginas:
<meta name="robots" content="index,nofollow">
Esta medida assegura que as páginas serão adicionadas ao índice,
mas os links não serão rastreados, uma vez que o crawler já terá feito
isso através da página com o mapa do site
© 2013 IBM Corporation18
Crawlability do Portal com conteúdo WCM
● Se o Portal inclui conteúdo WCM, consideração adicional é
necessária para garantir a todo o conteúdo está indexado e os
resultados mostram o conteúdo no contexto correto
● Se a página inclui componentes para selecionar o conteúdo
(como um navegador WCM), a abordagem Sitemap e robot
directives descritas anteriormente não vai funcionar bem
● Se estiver usando um navegador WCM ou qualquer outro
componente que depende de request parameter, é necessário
reconfigurar a maneira que o Portal apresenta URL normalizadas
© 2013 IBM Corporation19
Search Engine Optimization
● Fazer um site aparecer nos resultados dos buscadores se tornou
uma sub-disciplina na construção de web sites. Na verdade, uma
muito madura, por isso há muita documentação, ferramentas e sites
disponíveis
● Search engine optimization (SEO) é definido na Wikipedia como o
processo de melhorar o volume ou a qualidade do tráfego para um
site a partir de sites de busca, através de resultados de pesquisa
"naturais". O oposto de Search Engine Marketing (SEM), que lida
com a inclusão paga
© 2013 IBM Corporation20
O Google
● O Google é responsável pela maior
parte de todo o tráfego relacionado com
pesquisa na Internet. De modo que
começar a otimizar seu site para o
Google, faz muito sentido
● O Google classifica os sites também por
análise de links (PageRank), se o
Google não é levado a seu site por
outros sites indexados, o Google nunca
irá lhe dar uma classificação alta
© 2013 IBM Corporation21
Otimizando seu site para o Google
● Um dos segredos para ser bem rankeado no Google é otimizar as
palavras-chave (keywords) visíveis em uma página
● A estratégia envolvendo palavras-chave tem duas etapas:
Seleção de palavras-chave: Determine quais palavras o seu
público potencial pode usar para pesquisar sua página e crie
palavras-chave com base nessas palavras
Otimização de palavras-chave: Aplicar essas palavras-chave
em todas páginas apropriadas (de 3 a 5 palavras-chave por
página é a quantidade recomendada) e otimizá-las a partir do
canto superior esquerdo para baixo. Frequentemente, estas
serão as 200 primeiras palavras em sua página - tags title,
heading, etc
© 2013 IBM Corporation22
Otimizando seu site para o Google
● Além da estratégia de palavras-chave, diversos outros fatores irão
influenciar no raking do seu site no Google, a seguir são
relacionadas algumas técnicas extraídas do documento:
Search Engine Optimization Starter Guide
http://www.google.com/webmasters/docs/search-
engine-optimization-starter-guide.pdf
© 2013 IBM Corporation23
Otimizando seu site para o Google
Objetivos e tarefas de SEO Tarefas do Portal
Utilizar a meta tag "description":
- Resumir precisamente o conteúdo da
página
- Utilize descrições únicas para cada página
Use metadados nas páginas do Portal para
permitir que os usuários finais escrever
meta tags de descrição significativas
Melhorar a estrutura das URLs:
- Use palavras nas URLs
- Criar uma estrutura de diretório simples
- Fornecer uma única versão de um URL
para chegar a um documento
Use URLs amigáveis e mapeamentos de
URLs para criar URLs semânticas para
suas páginas
Torne seu site fácil de navegar:
- Criar uma hierarquia de fluxo natural
- Usar principalmente texto para navegação
- Usar "migalhas" (breadcrumb) na
navegação
- Mantenha a sua hierarquia de páginas o
mais simples possível no Portal
- Incorporar um componente de navegação
(breadcrumb) nos seus temas
© 2013 IBM Corporation
Parte 2: Como funciona o Portal Search?
© 2013 IBM Corporation25
Buscando e indexando Sites com Portal Search
● Como visto, os serviços de busca na
Internet apenas incluem páginas do Portal
que não necessitam de autenticação
● O Portal Search pode incluir conteúdo
protegido e resultados de pesquisa
adicionais de outros sistemas internos ou
externos que podem complementar a
pesquisa inicial
● Usuários podem encontrar conteúdo via os
portlets de busca padrão ou o campo de
pesquisa no tema
© 2013 IBM Corporation26
Entendendo Portal Search
● O Portal Search consiste de uma variedade de portlets para
administrar as atividades de pesquisa e exibir resultados de
pesquisa. Além disso, existe um serviço de pesquisa que inclui
uma variedade de crawlers, incluindo Portal Site, WCM e Seedlist
● Os crawlers podem interpretar mais de 250 formatos de
documentos
● Crawlers podem ser agendados periodicamente e sua saída é
uma coleção de busca, também conhecido como um arquivo de
índice
● Usar um crawler adequado é importante
© 2013 IBM Corporation27
Arquitetura do Portal Search
● O serviço de busca do Portal pode ser configurado
para ser executado no Portal local, ou pode ser
delegado a um ou mais servidores dedicados
● Cluster vertical não deve ser utilizado para
execução do serviço de busca
● Em um ambiente de cluster horizontal, a busca
remota deve ser utilizada, de outra forma nós
individuais podem retornar diferentes resultados
de busca
© 2013 IBM Corporation28
Arquitetura do Portal Search
● A “alta disponibilidade” do Portal Search pode ser obitida através
de dois métodos:
Maiores informações no artigo:
http://www.ibm.com/developerworks/websphere/zones/portal/proddoc/dw-w-portalsearch/
© 2013 IBM Corporation29
Arquitetura do Portal Search
● Backup e Recuperação
- Se o Portal Search detecta uma configuração de
coleta corrompida ou até mesmo o indice de busca,
automaticamente inicia a recuperação a partir de
arquivos de backup
- Configurações para todas as coletas sofrem
backup automaticamente
- A localização padrão do backup é:
<wp_profile_root>/collections_config_backup/
- Ao recuperar uma configuração de coleta, crawlers
associados com a coleção não serão reiniciados. Se
houver crawlers agendados, eles serão executados
como previsto
© 2013 IBM Corporation30
Arquitetura do Portal Search
● Existem dois protocolos de comunicação disponíveis;
EJB ou SOAP, que têm diferenças relacionadas à
segurança
● Independentemente do protocolo utilizado, o Portal
manterá sempre dois tipos de segurança:
Segurança em nível de coleção - usado para
associar conjuntos com grupos de usuários
autorizados. Apenas usuários autorizados podem
procurar em uma coleção
Segurança em nível de documento - garante que
os usuários têm devidas autorizações em páginas e
portlets antes que os resultados da pesquisa sejam
apresentados a eles
© 2013 IBM Corporation31
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
© 2013 IBM Corporation32
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Coletas de Busca
© 2013 IBM Corporation33
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Portal
Crawler
WCM
Crawler
Web
Crawler
Portal
Crawler
WCM
Crawler
Web
Crawler
Coletas de Busca Fontes de Busca
© 2013 IBM Corporation34
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Portal
Crawler
WCM
Crawler
Web
Crawler
Portal
Crawler
WCM
Crawler
Web
Crawler
Escopo de
Busca 1
Escopo de
Busca 2
Coletas de Busca Fontes de Busca
© 2013 IBM Corporation35
Interfaces de Busca e Administração
● Centro de Procura
- Este portlet é utilizado para
exbir resultados de pesquisa
a partir de multiplas coletas e
disponibliza recursos como
type-ahead
- O usuário também pode fazer uma pesquisa a partir da caixa
de pesquisa do tema Portal, e será redirecionado para uma
página contendo este portlet
- Os resultados são apresentados, junto com resumo e
classificação para cada um
© 2013 IBM Corporation36
Interfaces de Busca e Administração
● Links Sugeridos
- Este portlet pode ser configurado para exibir resultados de
pesquisa recomendadas com base em palavras-chave digitadas
na solicitação de pesquisa
- Os administradores podem mapear manualmente as principais
fontes de informação / documentos para procurar termos, e
entregar resultados prioritários para os usuários
- Os resultados são exibidos ao lado dos resultados de busca
de outros portlets de pesquisa.
© 2013 IBM Corporation37
Interfaces de Busca e Administração
● Resultados da Procura Externos
- Este portlet pode ser usado para exibir os resultados de
pesquisa obtidos a partir de um serviço de busca interno ou
externo
- O serviço de busca deve fornecer uma interface Web pública e
devolver o resultado da pesquisa como um feed RSS ou Atom
- Os resultados são exibidos ao lado dos resultados de busca
de outros portlets de pesquisa
- Páginas de resultado em HTML não podem ser processadas
pelo portlet
© 2013 IBM Corporation38
Interfaces de Busca e Administração
● Gerenciar Procura
Através deste portlet são feitas todas
configurações e gestão de serviços de
busca, coletas e escopos, para busca
local ou remota
© 2013 IBM Corporation39
Interfaces de Busca e Administração
● Componente de Busca
- Este não é um portlet, mas um componente WCM que permite
que os resultados da busca possam ser incorporados em
conteúdo ou modelos de WCM
- O componente está configurado para apresentar os resultados
de uma coleção de pesquisa do Portal
- É muito útil para sites baseados em conteúdo WCM
© 2013 IBM Corporation40
Portal Search API
● O Portal fornece o Search and Index API (SIAPI), que pode ser
usado para desenvolver portlets de pesquisa personalizados para
realizar operações de busca e indexação.
● Além da SIAPI, uma interface RESTful pode ser utilizada para
retornar resultados de pesquisa. Um pedido REST é feito através
de HTTP e uma variedade de parâmetros estão disponíveis
Exemplo de uma consulta simples:
http://www.<hostname>:<port>/searchfeed/myportal/search?
query=testresults=10
Artigo sobre uso do Search REST API:
http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Leverage_Search_Expierence_based_on_Portal_Search_REST_API
© 2013 IBM Corporation41
Seedlist framework
● Ao configurar uma fonte de conteúdo para rastrear conteúdo WCM
ou Portal, um seedlist é gerado automaticamente pelo Portal
● Um seedlist é como uma extensão de um mapa do site e é
baseado no Atom Syndication Format [RFC4287]
● A IBM fornece um White paper e código fonte para facilitar a
criação de seedlists para qualquer tipo de repositórios de
conteúdo
● Fontes de conteúdo adicionais podem ser adicionados ao Portal
para rastrear um novo feed seedlist, e adicionar os documentos
para a coleta de busca
© 2013 IBM Corporation
Parte 3: Mudanças do Portal Search no
WebSphere Portal 8
© 2013 IBM Corporation43
Coletas e Origem de Conteúdos padrões
● Coleta de Procura
● Default Search Collection
● JCRCollection1
© 2013 IBM Corporation44
Fontes de Conteúdo em Portais Virtuais
● Portal crawler:
http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>?
Source=com.ibm.lotus.search.plugins.seedlist.retriever.portal.PortalRetrieverFact
ory&Action=GetDocuments&Range=100
● WCM crawler :
http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>?
SeedlistId=&Source=com.ibm.workplace.wcm.plugins.seedlist.retriever.WCMRetri
everFactory&Action=GetDocuments
● JCR crawler:
http://<hostname>:<port>/wps/seedlist/server?
Action=GetDocuments&Format=ATOM&Locale=en_US&Range=100&Source=co
m.ibm.lotus.search.plugins.seedlist.retriever.jcr.JCRRetrieverFactory&Start=0&Se
edlistId=3@OOTB_CRAWLER3
© 2013 IBM Corporation45
Fonte de conteúdo
● Reunir documentos da Fonte de Conteúdo
Isso exclui todos os documentos existentes a partir da fonte de conteúdo
especificada e, em seguida, começa um rastreamento completo
© 2013 IBM Corporation46
Mudanças no portlet Centro de Procura
● Seedlist – Configuração da Origem de Conteúdo
- A guia Parâmetros Gerais foi modificada:
Menos opções de configuração (opções como: "Os níveis de links a seguir",
"Número de documentos para coletar", "Pare de coleta depois", "Ligações
expiram após" - foram removidos e existe somente para origem de conteúdo
Web)
- Guia Filtros removida
Novo timeout
© 2013 IBM Corporation47
Mudanças no portlet Centro de Procura
- Planejadores, apenas um agendamento pode ser definido
Sem opção
para criar novo
agendamento
© 2013 IBM Corporation48
- Portlet Busca e Navegação migrado para o Centro de Procura
- A opção de editar Metadados foi removida
Portal 7: Portal 8:
- Removido “Carregar documento manualmente para coleta”
Portal 7: Portal 8:
Mudanças no portlet Centro de Procura
© 2013 IBM Corporation49
Search Engine atualizado
● Foram adicionados novos arquivos jar na pasta
/PortalServer/search:
● Como resultado, os traces de rastreamento foram alteradas de
com.ibm.crawler. * = All para com.ibm.lotus.search.engine. * = All
© 2013 IBM Corporation50
Links Sugeridos e serviço Tagging & Rating
● O administrador pode associar recursos do Portal com palavras-
chave
Como um substituto para "atualização de metadados" (palavras-chave) que
foi removido do Centro de Procura
© 2013 IBM Corporation51
Links Sugeridos e serviço Tagging & Rating
● Usuários finais podem pesquisar e obter links sugeridos na página
de pesquisa principal:
Portlet Links Sugeridos
© 2013 IBM Corporation52
Links Sugeridos e serviço Tagging & Rating
● O administrador pode visualizar os links Tagging & Rating filtrados
pela categoria "Links sugeridos"
Para ver a opção "Links Sugeridos", acesse "Editar Configurações
Compartilhadas" do portlet Tags e escolha "Links sugeridos"
Palavras-chave
adicionadas a Link
Sugeridos
Opção Links sugeridos
© 2013 IBM Corporation53
Crawling bibliotecas WCM
● Por padrão, o WCM crawler rastreia todas as bibliotecas
existentes. Isto é feito, deixando o parâmetro SeedlistId vazio:
&SeedlistId=&Format=...
● Se o administrador desejar criar um crawler que rastreia apenas
uma biblioteca específica, pode fazer usando o nome da biblioteca
como parâmetro:
&SeedlistId=mylibrary&Format=...
● É possível definir seedlist em mais de uma biblioteca, usando
vírgula como separador:
&SeedlistId=myLibrary1,myLibrary2&Format=...
Para maiores informações:
http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Seedlist_1.0_REST_service_API_wcm7
© 2013 IBM Corporation54
Tornando um conteúdo do Portal não pesquisável
● Existe uma propriedade no portlet que deve ser adicionada ou
atualizada
- Se "INCLUDE_IN_SEARCH_INDEX = true" é definido para um portlet
específico, este é adicionado à lista de portlets que devem ser indexados
- Por padrão, o parâmetro não existe, se você quiser que o portlet não seja
procurado, precisa adicionar esta propriedade com valor false
© 2013 IBM Corporation55
Tornando um conteúdo WCM não pesquisável
● No portlet de Autoria do
WCM, você pode clicar em
um conteúdo e excluí-lo da
seedlist. Isto pode ser feito
através de modelo de
autoria. Para ver essa
opção, você precisa clicar
em "Mostrar campos
ocultos".
Por padrão é
pesquisável
© 2013 IBM Corporation56
Portlet Procura e Navegação removido
● Como visto anteriormente, o portlet Procura e Navegação não
existe no Portal 8
● Como substituto para a busca avançada que ele oferecia, o portlet
Centro de Procura pode ser usado
- Os filtros personalizados foram adicionados ao Centro de Procura
- Configure o portlet Centro de Procura e altere o valor do parâmetro
displaySearchFilters para true. Isso permitirá seus usuários relizar buscas
por filtros de metadados. Por padrão, título e descrição são fornecidos como
filtros de pesquisa.
© 2013 IBM Corporation57
Atualização do portlet Centro de Procura
● Ordenar por data
© 2013 IBM Corporation58
Atualização do portlet Centro de Procura
● Busca utilizando tags
Pesquisando com tags
Tags nos resultados
© 2013 IBM Corporation
Parte 4: Integração com ferramentas de
busca externas
© 2013 IBM Corporation60
Comentários gerais sobre integração
● Posso integrar “meu” motor de busca com o Portal?
● Portal fornece frameworks que permitem utilização de motores de
busca externos
- Um framework para consumir Portal e outros recursos como WCM e
IBM Connections (incluindo suporte a "segurança")
- Um framework para acessar um serviço de busca para realizar
pesquisas
- Portlet que permite adicionar um serviço de busca e exibir os
resultados
● Autonomy já fornece o "IBM Connector" (seedlist rastreador)
● Google Search Appliance está chegando lá com o seu 'feed
crawler " mas ainda não é compatível
© 2013 IBM Corporation61
Tecnologia de busca embutida
● O motor de busca dentro do WebSphere Portal oferece uma
solução de entrada, adequada para a pesquisas através de Sites e
Conteúdos gerenciados de tamanho moderado. Ideal para
pequenas e médias instalações do WebSphere Portal
● Algumas limitações do Portal Search:
- Capacidade de pesquisa limitada a menos de 800 mil
documentos por índice
- Sem suporte nativo a alta disponibilidade
- Sem suporte a busca semântica
© 2013 IBM Corporation62
Precisa de uma busca mas poderosa?
● Tecnologias de busca IBM:
- Busca básica - Portal Search
- Busca avançada - IBM Content Analytics com Enterprise
Search
open source Lucene
IBM Lucene Extension Library
Portal Search
IBM Content Analytics
with Enterprise Search
IBM Search REST
© 2013 IBM Corporation63
IBM Content Analytics com Enterprise Search
● Experiência de usuário
● Navegação de alto desempenho
● Salvar pesquisas
● Perfis de busca
● Pre-visualização de documentos
● E muito mais ...
● Experiência administrativa
● Maior escalabilidade
● Suporte à indexação incremental
● Flexíbilidade scale-out & HA
● Opções de ajuste de relevância
● E muito mais ... Auto completar:
- Termos sugeridos baseado no indice e buscas anteriores
- Customizável pelos Administradores
© 2013 IBM Corporation64
ICA – Suporte a dezenas de fontes de conteúdo
• IBM Case Manager V5.0
• IBM Lotus Connections 2.5,
3, 4 and 4.5
• IBM Lotus Domino DM 6.5.1,
7.0,
• IBM Lotus Domino R7, R8,
R8.5 and R9
• IBM Lotus Quickr (NSF &
J2EE), 8.1, 8.2 and 8.5
• IBM Web Content
Management 6.1, 7 and 8
• IBM WebSphere Portal 6.1, 7
and 8
• DB2 for iSeries 5.4 and 6.1
• DB2 UDB for Linux, UNIX,
Windows 9.1, 9.5 and 9.7
• DB2 for z/OS 8.1, 9.1
• IMS 10.0 and 11.0.1
• Informix Dynamic Server
11.10 and 11.50
• Microsoft SQL Server 2005,
2008
• MySQL 5.0
• Oracle 10g and 11g
• Software AG Adabas 7.1
• Sybase 11.9.2, 12.0, 12.5x
Colaboração
• IBM Case Manager V5.0
• IBM Content Manager
Enterprise Edition 8.4, 8.4.1,
8.4.2
• FileNet Content Services
5.4, 5.5
• FileNet P8 Content Manager
4.0, 4.5, 4.5.1 and 5.0
• Hummingbird DM 5.1.0.5
with SR6 and 6.0.4
• EMC/Documentum 6.0 and
6.5
• CA-Datacom 10
• Open Text Livelink Enterprise
Server 9.6, 9.7 and 9.7.1
Gerenciamento
de Dados
Outras fontes
• Microsoft Exchange Server
2003
• Microsoft Windows
SharePoint Services 3.0
• SharePoint Server 2003 SP2,
2007, 2010 Farm Support
• Windows file systems: 2003
and 2008 servers
• Network News Protocol
Newsgroup
• UNIX file systems
• VSAM for z/OS 1.4
• Web (HTTP or HTTPS)
Gerenciamento
de Conteúdo
© 2013 IBM Corporation65
Integração do Centro de Procura com o ICA
© 2013 IBM Corporation66
IBM Content Analytics portlets
© 2013 IBM Corporation67
Integração com IBM Connections
● Opção 1 – Use seedlists do IBM Connections para rastrear seus
repositórios
- Uma seedlist por tipo de recurso, por exemplo, Wiki, blogs, perfis,
arquivos, etc.
● Opção 2 – Integrar a busca do IBM Connections com o Centro de
Procura do Portal
- use o recurso 'Remote Content Search Service "(RCSS) para
registrar a busca do Connections como um serviço de busca
- IBM Connections e WebSphere Portal (e ICA) utilizam a IBM Search
REST API
© 2013 IBM Corporation68
© 2013 IBM Corporation69
Dúvidas?
© 2013 IBM Corporation
Para saber mais...
WebSphere Portal and IBM Web Content Manager Information Center
http://www.ibm.com/developerworks/websphere/zones/portal/proddoc.html
WebSphere Portal and Web Content Manager Business Solutions Catalog
https://greenhouse.lotus.com/catalog/
WebSphere Portal developerWorks forum
http://www.ibm.com/developerworks/forums/forum.jspa?forumID=168
The WebSphere Portal wiki
http://www-10.lotus.com/ldd/portalwiki.nsf/xpViewCategories.xsp?lookupNa
me=IBM%20WebSphere%20Portal%208%20Product%20Documentation
IBM Redbooks® publications
http://www.redbooks.ibm.com/portals/websphere
© 2013 IBM Corporation
Referências

Understanding the Essentials of IBM Web Experience software Search services,
Excepcional Web Experience 2013 Americas - Todd Leyba, Andreas Prokoph

Integrating Search with WebSphere Portal – Best Practices, IBM Portal Excellence
Conference - Andreas Prokoph

Creating External Facing Web Sites with WebSphere Portal - Adam de Leeuw, Ali
Beklen, David Axinn, Fanie Korff, Graham Wallace, Janice Taylor, JP
Thambuganipalle, Projjwal Saha, Rajaguru Balagurusamy, Raul Munoz Serrano,
Bart Jacob

High availability options for IBM WebSphere Portal 6.1 search - Andreas Prokoph,
Eitan Shapiro
© 2013 IBM Corporation
Obrigado!!!
Rodrigo Reis
rodrigoareis@br.ibm.com
IT Specialist & Application Architect
IBM Collaboration Solutions
© 2013 IBM Corporation
© IBM Corporation 2013. All Rights Reserved.
The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and
accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this
information is based on IBM’s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for
any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended
to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of
the applicable license agreement governing the use of IBM software
.
References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates.
Product release dates and/or capabilities referenced in this presentation may change at any time at IBM’s sole discretion based on market
opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these
materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue
growth or other results.
Performance is based on measurements and projections using standard IBM benchmarks in a controlled environment. The actual throughput or
performance that any user will experience will vary depending upon many factors, including considerations such as the amount of multiprogramming
in the user's job stream, the I/O configuration, the storage configuration, and the workload processed. Therefore, no assurance can be given that an
individual user will achieve results similar to those stated here.
Adobe, the Adobe logo, PostScript, and the PostScript logo are either registered trademarks or trademarks of Adobe Systems Incorporated in the
United States, and/or other countries.
Java and all Java-based trademarks are trademarks of Sun Microsystems, Inc. in the United States, other countries, or both.
Microsoft and Windows are trademarks of Microsoft Corporation in the United States, other countries, or both.
ries in the United States and other countries.
Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both. Other company, product, or service names may be
trademarks or service marks of others.
All references to OpenFinancial, Greenwell and Open Bier refer to a fictitious company and are used for illustration purposes only.

Mais conteúdo relacionado

Semelhante a Buscas no IBM WebSphere Portal

O que todos os developers devem saber sobre seo
O que todos os developers devem saber sobre seoO que todos os developers devem saber sobre seo
O que todos os developers devem saber sobre seo
introfini
 
Reformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuíReformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuí
guest08c9fd6
 
Seo com Drupal - drupal camp lisboa 2011
Seo com Drupal -  drupal camp lisboa 2011Seo com Drupal -  drupal camp lisboa 2011
Seo com Drupal - drupal camp lisboa 2011
introfini
 
12 segredos do google
12 segredos do google12 segredos do google
12 segredos do google
alipionunes
 

Semelhante a Buscas no IBM WebSphere Portal (20)

Dicas de seo
Dicas de seoDicas de seo
Dicas de seo
 
Melhores Praticas de Busca WebSphere Portal 8
Melhores Praticas de Busca WebSphere Portal 8Melhores Praticas de Busca WebSphere Portal 8
Melhores Praticas de Busca WebSphere Portal 8
 
O que todos os developers devem saber sobre seo
O que todos os developers devem saber sobre seoO que todos os developers devem saber sobre seo
O que todos os developers devem saber sobre seo
 
Otimizando seu Site para Alta Performance - ConaSearch
Otimizando seu Site para Alta Performance - ConaSearchOtimizando seu Site para Alta Performance - ConaSearch
Otimizando seu Site para Alta Performance - ConaSearch
 
Case Study de SEO do E-commerce Sonae MC
Case Study de SEO do E-commerce Sonae MCCase Study de SEO do E-commerce Sonae MC
Case Study de SEO do E-commerce Sonae MC
 
Reformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuíReformulação do Website da TcheCotrijuí
Reformulação do Website da TcheCotrijuí
 
Seo - Optimização de Página
Seo - Optimização de PáginaSeo - Optimização de Página
Seo - Optimização de Página
 
SEO | DZ Estúdio
SEO | DZ EstúdioSEO | DZ Estúdio
SEO | DZ Estúdio
 
Palestra de seo
Palestra de seoPalestra de seo
Palestra de seo
 
Google Webmaster Tools - Leonardo Finoti
Google Webmaster Tools - Leonardo FinotiGoogle Webmaster Tools - Leonardo Finoti
Google Webmaster Tools - Leonardo Finoti
 
Curso Básico de SEO
Curso Básico de SEOCurso Básico de SEO
Curso Básico de SEO
 
SEO/SEM - Otimização de Websites
SEO/SEM - Otimização de WebsitesSEO/SEM - Otimização de Websites
SEO/SEM - Otimização de Websites
 
Palestra SEO para Desenvolvedores - TDC 2017
Palestra SEO para Desenvolvedores - TDC 2017Palestra SEO para Desenvolvedores - TDC 2017
Palestra SEO para Desenvolvedores - TDC 2017
 
TDC2017 | POA Trilha Marketing Digital - SEO para Desenvolvedores
TDC2017 | POA Trilha Marketing Digital - SEO para DesenvolvedoresTDC2017 | POA Trilha Marketing Digital - SEO para Desenvolvedores
TDC2017 | POA Trilha Marketing Digital - SEO para Desenvolvedores
 
Web crawler
Web crawlerWeb crawler
Web crawler
 
Seo
SeoSeo
Seo
 
Seo com Drupal - drupal camp lisboa 2011
Seo com Drupal -  drupal camp lisboa 2011Seo com Drupal -  drupal camp lisboa 2011
Seo com Drupal - drupal camp lisboa 2011
 
SEO - SEARCH ENGINE OPTIMIZATION
SEO - SEARCH ENGINE OPTIMIZATIONSEO - SEARCH ENGINE OPTIMIZATION
SEO - SEARCH ENGINE OPTIMIZATION
 
SEO Na Prática
SEO Na PráticaSEO Na Prática
SEO Na Prática
 
12 segredos do google
12 segredos do google12 segredos do google
12 segredos do google
 

Buscas no IBM WebSphere Portal

  • 1. © 2013 IBM Corporation Buscas no IBM WebSphere Portal Rodrigo Reis IT Specialist & Application Architect IBM Collaboration Solutions
  • 2. © 2013 IBM Corporation2 Agenda Parte 1: Disponibilizando conteúdo do Portal na Internet Parte 2: Como funciona o Portal Search? Parte 3: Mudanças do Portal Search no WebSphere Portal 8 Parte 4: Integração com ferramentas de busca externas
  • 3. © 2013 IBM Corporation Parte 1: Disponibilizando conteúdo do Portal na Internet
  • 4. © 2013 IBM Corporation4 Como os motores de busca funcionam? Os motores de busca coletam dados sobre as informações publicadas na web e constroem um enorme banco de dados que relacionam as páginas com os termos que elas contêm através de um processo de quatro etapas
  • 5. © 2013 IBM Corporation5 Como os motores de busca funcionam? 1. Rastreamento (Crawlling) da Web Os motores de busca (Search engines) executam processos agendados chamados "bots" ou "spiders" que usam os links encontrados na web para "rastrear" (crawl) as páginas e documentos 2. Indexação de documentos Uma vez que uma página tenha sido rastreada, seu conteúdo é analisado e palavras-chave são extraídas para a construção de um banco de dados de documentos que compõe o "índice" de um motor de busca
  • 6. © 2013 IBM Corporation6 Como os motores de busca funcionam? 3. Processamento de consultas Quando um pedido de informação chega ao motor de busca, o motor recupera de seu índice todos os documentos que correspondem a consulta 4. Classificação (Ranking) dos resultados Uma vez que o motor de busca determinou quais resultados correspondem a consulta, um algoritmo executa cálculos sobre cada um dos resultados para determinar o que é mais relevante para a consulta dada. Ele classifica estes resultados nas páginas de resultados, a partir do mais relevante ao menos relevante
  • 7. © 2013 IBM Corporation7 Desafios de crawlability no portal Web Crawlers Search Indexes
  • 8. © 2013 IBM Corporation8 Desafios de crawlability no portal
  • 9. © 2013 IBM Corporation9 Desafios de crawlability no portal http://miamidade.gov/wps/portal/Main/home/! ut/p/c5/04_SB8K8xLLM9MSSzPy8xBz9CP0os3hnQ29jA38vF98 wk1ALA08fD1MPLzNfAwN_c_1wkA6gCndHDxNzH6CQUZiBgZ GfaXCgQWiwsYGnMUTeAAdwNND388jPTdUvyM5Oc3RUVAQ AZBGxdA!!/dl3/d3/L2dBISEvZ0FBIS9nQSEh/
  • 10. © 2013 IBM Corporation10 Desafios de crawlability no portal ● O estado de navegação contém informações sobre o estado do portal, por exemplo, a página atual e o tema em uso. Ele também contém informações sobre estado de portlet, por exemplo, o modo de portlet (edit, view, help), estado da janela (minimized, maximized) e render parameters ● A principal razão para a inclusão de todas essas informações na URL é apoiar o bookmarking de páginas do Portal, mantendo o layout exato e estado das informações naquele momento
  • 11. © 2013 IBM Corporation11 Desafios de crawlability no portal Home Página A Página C Página B URL A URL B URL C URL D URL E Um crawler poderia assumir: - URL A e URL D são diferentes - URL B e URL E são diferentes URLs com informações codificadas:
  • 12. © 2013 IBM Corporation12 Desafios de crawlability no portal ● O Portal está preparado para enfrentar os desafios de rastreamento usando “URLs Normalizadas” ● Quando o Portal reconhece que está sendo visitado por um crawler, ajusta automaticamente as URLs para cada página, retirando a maioria das informações armazenadas no estado de navegação, deixando apenas informações exigidas para exibir a página ● O Portal é pré-configurado para reconhecer cerca de cinquenta motores de busca
  • 13. © 2013 IBM Corporation13 Desafios de crawlability no portal Um crawler poderia assumir: - URL A e URL D são iguais - URL B e URL E são iguais Home Página A Página C Página B URL A URL B URL C URL D URL E URLs normalizadas:
  • 14. © 2013 IBM Corporation14 Sitemaps ● Mapas do Site (Sitemaps) são uma maneira fácil para webmasters informarem aos motores de busca sobre as páginas dos sites que estão disponíveis para rastreamento ● De forma simples, um Sitemap é um arquivo XML que lista os URLs de um site junto com metadados adicionais sobre cada URL para que os motores de busca possam indexar o site de forma mais inteligente
  • 15. © 2013 IBM Corporation15 Sitemaps ● Usar o protocolo Sitemap não garante que as páginas web serão incluídas nos motores de busca, mas ajudam os crawlers a fazer um melhor trabalho de rastreamento do seu site ● Os sites de busca sugerem apontar o crawler diretamente para um mapa do site, ou pelo menos ter um link para o mapa do site em algum lugar na página principal do site ● O IBM WebSphere Portal fornece um portlet Sitemap para ajudar no atendimento às melhores práticas recomendadas pela maioria dos motores de busca na Internet ● A melhor prática de uso do portlet Sitemap é colocar um link para ele no topo da página, por exemplo, dentro do tema Portal
  • 16. © 2013 IBM Corporation16 Sitemaps ● Informações adicionais, chamadas robot directives, podem ser adicionadas a uma página instruindo o crawler para não rastrear nada além do mapa do site ● As diretivas são meta dados incluídos no HTML, ou um arquivo especial robots.txt, que fornece instruções ao crawler definindo se rastrear seções do site é permitido ou proibido ● A semântica das diretivas são estruturadas. Por exemplo, pode existir um instrução para permitir /home/publico/*, mas incluir uma exceção, não permitindo /home/publico/funcionarios ● URLs do Portal são menos estruturadas, embora elas possam começar de forma estruturada e "amigável" (para bookmarking), depois de clicar em outros links as URLs se tornam mais complexas e desestruturadas
  • 17. © 2013 IBM Corporation17 Sitemaps ● A melhor prática para o uso de robot directives no Portal é colocá-las no tema, com a lógica para permitir ou proibir páginas individuais Por exemplo, se o Portal tem um mapa do site, o tema poderia gerar: <meta name="robots" content="noindex,follow"> Isso instrui o crawler a seguir todos os links da página com o mapa do site, mas não incluindo ela nos resultados. Para todas as outras páginas: <meta name="robots" content="index,nofollow"> Esta medida assegura que as páginas serão adicionadas ao índice, mas os links não serão rastreados, uma vez que o crawler já terá feito isso através da página com o mapa do site
  • 18. © 2013 IBM Corporation18 Crawlability do Portal com conteúdo WCM ● Se o Portal inclui conteúdo WCM, consideração adicional é necessária para garantir a todo o conteúdo está indexado e os resultados mostram o conteúdo no contexto correto ● Se a página inclui componentes para selecionar o conteúdo (como um navegador WCM), a abordagem Sitemap e robot directives descritas anteriormente não vai funcionar bem ● Se estiver usando um navegador WCM ou qualquer outro componente que depende de request parameter, é necessário reconfigurar a maneira que o Portal apresenta URL normalizadas
  • 19. © 2013 IBM Corporation19 Search Engine Optimization ● Fazer um site aparecer nos resultados dos buscadores se tornou uma sub-disciplina na construção de web sites. Na verdade, uma muito madura, por isso há muita documentação, ferramentas e sites disponíveis ● Search engine optimization (SEO) é definido na Wikipedia como o processo de melhorar o volume ou a qualidade do tráfego para um site a partir de sites de busca, através de resultados de pesquisa "naturais". O oposto de Search Engine Marketing (SEM), que lida com a inclusão paga
  • 20. © 2013 IBM Corporation20 O Google ● O Google é responsável pela maior parte de todo o tráfego relacionado com pesquisa na Internet. De modo que começar a otimizar seu site para o Google, faz muito sentido ● O Google classifica os sites também por análise de links (PageRank), se o Google não é levado a seu site por outros sites indexados, o Google nunca irá lhe dar uma classificação alta
  • 21. © 2013 IBM Corporation21 Otimizando seu site para o Google ● Um dos segredos para ser bem rankeado no Google é otimizar as palavras-chave (keywords) visíveis em uma página ● A estratégia envolvendo palavras-chave tem duas etapas: Seleção de palavras-chave: Determine quais palavras o seu público potencial pode usar para pesquisar sua página e crie palavras-chave com base nessas palavras Otimização de palavras-chave: Aplicar essas palavras-chave em todas páginas apropriadas (de 3 a 5 palavras-chave por página é a quantidade recomendada) e otimizá-las a partir do canto superior esquerdo para baixo. Frequentemente, estas serão as 200 primeiras palavras em sua página - tags title, heading, etc
  • 22. © 2013 IBM Corporation22 Otimizando seu site para o Google ● Além da estratégia de palavras-chave, diversos outros fatores irão influenciar no raking do seu site no Google, a seguir são relacionadas algumas técnicas extraídas do documento: Search Engine Optimization Starter Guide http://www.google.com/webmasters/docs/search- engine-optimization-starter-guide.pdf
  • 23. © 2013 IBM Corporation23 Otimizando seu site para o Google Objetivos e tarefas de SEO Tarefas do Portal Utilizar a meta tag "description": - Resumir precisamente o conteúdo da página - Utilize descrições únicas para cada página Use metadados nas páginas do Portal para permitir que os usuários finais escrever meta tags de descrição significativas Melhorar a estrutura das URLs: - Use palavras nas URLs - Criar uma estrutura de diretório simples - Fornecer uma única versão de um URL para chegar a um documento Use URLs amigáveis e mapeamentos de URLs para criar URLs semânticas para suas páginas Torne seu site fácil de navegar: - Criar uma hierarquia de fluxo natural - Usar principalmente texto para navegação - Usar "migalhas" (breadcrumb) na navegação - Mantenha a sua hierarquia de páginas o mais simples possível no Portal - Incorporar um componente de navegação (breadcrumb) nos seus temas
  • 24. © 2013 IBM Corporation Parte 2: Como funciona o Portal Search?
  • 25. © 2013 IBM Corporation25 Buscando e indexando Sites com Portal Search ● Como visto, os serviços de busca na Internet apenas incluem páginas do Portal que não necessitam de autenticação ● O Portal Search pode incluir conteúdo protegido e resultados de pesquisa adicionais de outros sistemas internos ou externos que podem complementar a pesquisa inicial ● Usuários podem encontrar conteúdo via os portlets de busca padrão ou o campo de pesquisa no tema
  • 26. © 2013 IBM Corporation26 Entendendo Portal Search ● O Portal Search consiste de uma variedade de portlets para administrar as atividades de pesquisa e exibir resultados de pesquisa. Além disso, existe um serviço de pesquisa que inclui uma variedade de crawlers, incluindo Portal Site, WCM e Seedlist ● Os crawlers podem interpretar mais de 250 formatos de documentos ● Crawlers podem ser agendados periodicamente e sua saída é uma coleção de busca, também conhecido como um arquivo de índice ● Usar um crawler adequado é importante
  • 27. © 2013 IBM Corporation27 Arquitetura do Portal Search ● O serviço de busca do Portal pode ser configurado para ser executado no Portal local, ou pode ser delegado a um ou mais servidores dedicados ● Cluster vertical não deve ser utilizado para execução do serviço de busca ● Em um ambiente de cluster horizontal, a busca remota deve ser utilizada, de outra forma nós individuais podem retornar diferentes resultados de busca
  • 28. © 2013 IBM Corporation28 Arquitetura do Portal Search ● A “alta disponibilidade” do Portal Search pode ser obitida através de dois métodos: Maiores informações no artigo: http://www.ibm.com/developerworks/websphere/zones/portal/proddoc/dw-w-portalsearch/
  • 29. © 2013 IBM Corporation29 Arquitetura do Portal Search ● Backup e Recuperação - Se o Portal Search detecta uma configuração de coleta corrompida ou até mesmo o indice de busca, automaticamente inicia a recuperação a partir de arquivos de backup - Configurações para todas as coletas sofrem backup automaticamente - A localização padrão do backup é: <wp_profile_root>/collections_config_backup/ - Ao recuperar uma configuração de coleta, crawlers associados com a coleção não serão reiniciados. Se houver crawlers agendados, eles serão executados como previsto
  • 30. © 2013 IBM Corporation30 Arquitetura do Portal Search ● Existem dois protocolos de comunicação disponíveis; EJB ou SOAP, que têm diferenças relacionadas à segurança ● Independentemente do protocolo utilizado, o Portal manterá sempre dois tipos de segurança: Segurança em nível de coleção - usado para associar conjuntos com grupos de usuários autorizados. Apenas usuários autorizados podem procurar em uma coleção Segurança em nível de documento - garante que os usuários têm devidas autorizações em páginas e portlets antes que os resultados da pesquisa sejam apresentados a eles
  • 31. © 2013 IBM Corporation31 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B
  • 32. © 2013 IBM Corporation32 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Coletas de Busca
  • 33. © 2013 IBM Corporation33 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Portal Crawler WCM Crawler Web Crawler Portal Crawler WCM Crawler Web Crawler Coletas de Busca Fontes de Busca
  • 34. © 2013 IBM Corporation34 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Portal Crawler WCM Crawler Web Crawler Portal Crawler WCM Crawler Web Crawler Escopo de Busca 1 Escopo de Busca 2 Coletas de Busca Fontes de Busca
  • 35. © 2013 IBM Corporation35 Interfaces de Busca e Administração ● Centro de Procura - Este portlet é utilizado para exbir resultados de pesquisa a partir de multiplas coletas e disponibliza recursos como type-ahead - O usuário também pode fazer uma pesquisa a partir da caixa de pesquisa do tema Portal, e será redirecionado para uma página contendo este portlet - Os resultados são apresentados, junto com resumo e classificação para cada um
  • 36. © 2013 IBM Corporation36 Interfaces de Busca e Administração ● Links Sugeridos - Este portlet pode ser configurado para exibir resultados de pesquisa recomendadas com base em palavras-chave digitadas na solicitação de pesquisa - Os administradores podem mapear manualmente as principais fontes de informação / documentos para procurar termos, e entregar resultados prioritários para os usuários - Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa.
  • 37. © 2013 IBM Corporation37 Interfaces de Busca e Administração ● Resultados da Procura Externos - Este portlet pode ser usado para exibir os resultados de pesquisa obtidos a partir de um serviço de busca interno ou externo - O serviço de busca deve fornecer uma interface Web pública e devolver o resultado da pesquisa como um feed RSS ou Atom - Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa - Páginas de resultado em HTML não podem ser processadas pelo portlet
  • 38. © 2013 IBM Corporation38 Interfaces de Busca e Administração ● Gerenciar Procura Através deste portlet são feitas todas configurações e gestão de serviços de busca, coletas e escopos, para busca local ou remota
  • 39. © 2013 IBM Corporation39 Interfaces de Busca e Administração ● Componente de Busca - Este não é um portlet, mas um componente WCM que permite que os resultados da busca possam ser incorporados em conteúdo ou modelos de WCM - O componente está configurado para apresentar os resultados de uma coleção de pesquisa do Portal - É muito útil para sites baseados em conteúdo WCM
  • 40. © 2013 IBM Corporation40 Portal Search API ● O Portal fornece o Search and Index API (SIAPI), que pode ser usado para desenvolver portlets de pesquisa personalizados para realizar operações de busca e indexação. ● Além da SIAPI, uma interface RESTful pode ser utilizada para retornar resultados de pesquisa. Um pedido REST é feito através de HTTP e uma variedade de parâmetros estão disponíveis Exemplo de uma consulta simples: http://www.<hostname>:<port>/searchfeed/myportal/search? query=testresults=10 Artigo sobre uso do Search REST API: http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Leverage_Search_Expierence_based_on_Portal_Search_REST_API
  • 41. © 2013 IBM Corporation41 Seedlist framework ● Ao configurar uma fonte de conteúdo para rastrear conteúdo WCM ou Portal, um seedlist é gerado automaticamente pelo Portal ● Um seedlist é como uma extensão de um mapa do site e é baseado no Atom Syndication Format [RFC4287] ● A IBM fornece um White paper e código fonte para facilitar a criação de seedlists para qualquer tipo de repositórios de conteúdo ● Fontes de conteúdo adicionais podem ser adicionados ao Portal para rastrear um novo feed seedlist, e adicionar os documentos para a coleta de busca
  • 42. © 2013 IBM Corporation Parte 3: Mudanças do Portal Search no WebSphere Portal 8
  • 43. © 2013 IBM Corporation43 Coletas e Origem de Conteúdos padrões ● Coleta de Procura ● Default Search Collection ● JCRCollection1
  • 44. © 2013 IBM Corporation44 Fontes de Conteúdo em Portais Virtuais ● Portal crawler: http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>? Source=com.ibm.lotus.search.plugins.seedlist.retriever.portal.PortalRetrieverFact ory&Action=GetDocuments&Range=100 ● WCM crawler : http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>? SeedlistId=&Source=com.ibm.workplace.wcm.plugins.seedlist.retriever.WCMRetri everFactory&Action=GetDocuments ● JCR crawler: http://<hostname>:<port>/wps/seedlist/server? Action=GetDocuments&Format=ATOM&Locale=en_US&Range=100&Source=co m.ibm.lotus.search.plugins.seedlist.retriever.jcr.JCRRetrieverFactory&Start=0&Se edlistId=3@OOTB_CRAWLER3
  • 45. © 2013 IBM Corporation45 Fonte de conteúdo ● Reunir documentos da Fonte de Conteúdo Isso exclui todos os documentos existentes a partir da fonte de conteúdo especificada e, em seguida, começa um rastreamento completo
  • 46. © 2013 IBM Corporation46 Mudanças no portlet Centro de Procura ● Seedlist – Configuração da Origem de Conteúdo - A guia Parâmetros Gerais foi modificada: Menos opções de configuração (opções como: "Os níveis de links a seguir", "Número de documentos para coletar", "Pare de coleta depois", "Ligações expiram após" - foram removidos e existe somente para origem de conteúdo Web) - Guia Filtros removida Novo timeout
  • 47. © 2013 IBM Corporation47 Mudanças no portlet Centro de Procura - Planejadores, apenas um agendamento pode ser definido Sem opção para criar novo agendamento
  • 48. © 2013 IBM Corporation48 - Portlet Busca e Navegação migrado para o Centro de Procura - A opção de editar Metadados foi removida Portal 7: Portal 8: - Removido “Carregar documento manualmente para coleta” Portal 7: Portal 8: Mudanças no portlet Centro de Procura
  • 49. © 2013 IBM Corporation49 Search Engine atualizado ● Foram adicionados novos arquivos jar na pasta /PortalServer/search: ● Como resultado, os traces de rastreamento foram alteradas de com.ibm.crawler. * = All para com.ibm.lotus.search.engine. * = All
  • 50. © 2013 IBM Corporation50 Links Sugeridos e serviço Tagging & Rating ● O administrador pode associar recursos do Portal com palavras- chave Como um substituto para "atualização de metadados" (palavras-chave) que foi removido do Centro de Procura
  • 51. © 2013 IBM Corporation51 Links Sugeridos e serviço Tagging & Rating ● Usuários finais podem pesquisar e obter links sugeridos na página de pesquisa principal: Portlet Links Sugeridos
  • 52. © 2013 IBM Corporation52 Links Sugeridos e serviço Tagging & Rating ● O administrador pode visualizar os links Tagging & Rating filtrados pela categoria "Links sugeridos" Para ver a opção "Links Sugeridos", acesse "Editar Configurações Compartilhadas" do portlet Tags e escolha "Links sugeridos" Palavras-chave adicionadas a Link Sugeridos Opção Links sugeridos
  • 53. © 2013 IBM Corporation53 Crawling bibliotecas WCM ● Por padrão, o WCM crawler rastreia todas as bibliotecas existentes. Isto é feito, deixando o parâmetro SeedlistId vazio: &SeedlistId=&Format=... ● Se o administrador desejar criar um crawler que rastreia apenas uma biblioteca específica, pode fazer usando o nome da biblioteca como parâmetro: &SeedlistId=mylibrary&Format=... ● É possível definir seedlist em mais de uma biblioteca, usando vírgula como separador: &SeedlistId=myLibrary1,myLibrary2&Format=... Para maiores informações: http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Seedlist_1.0_REST_service_API_wcm7
  • 54. © 2013 IBM Corporation54 Tornando um conteúdo do Portal não pesquisável ● Existe uma propriedade no portlet que deve ser adicionada ou atualizada - Se "INCLUDE_IN_SEARCH_INDEX = true" é definido para um portlet específico, este é adicionado à lista de portlets que devem ser indexados - Por padrão, o parâmetro não existe, se você quiser que o portlet não seja procurado, precisa adicionar esta propriedade com valor false
  • 55. © 2013 IBM Corporation55 Tornando um conteúdo WCM não pesquisável ● No portlet de Autoria do WCM, você pode clicar em um conteúdo e excluí-lo da seedlist. Isto pode ser feito através de modelo de autoria. Para ver essa opção, você precisa clicar em "Mostrar campos ocultos". Por padrão é pesquisável
  • 56. © 2013 IBM Corporation56 Portlet Procura e Navegação removido ● Como visto anteriormente, o portlet Procura e Navegação não existe no Portal 8 ● Como substituto para a busca avançada que ele oferecia, o portlet Centro de Procura pode ser usado - Os filtros personalizados foram adicionados ao Centro de Procura - Configure o portlet Centro de Procura e altere o valor do parâmetro displaySearchFilters para true. Isso permitirá seus usuários relizar buscas por filtros de metadados. Por padrão, título e descrição são fornecidos como filtros de pesquisa.
  • 57. © 2013 IBM Corporation57 Atualização do portlet Centro de Procura ● Ordenar por data
  • 58. © 2013 IBM Corporation58 Atualização do portlet Centro de Procura ● Busca utilizando tags Pesquisando com tags Tags nos resultados
  • 59. © 2013 IBM Corporation Parte 4: Integração com ferramentas de busca externas
  • 60. © 2013 IBM Corporation60 Comentários gerais sobre integração ● Posso integrar “meu” motor de busca com o Portal? ● Portal fornece frameworks que permitem utilização de motores de busca externos - Um framework para consumir Portal e outros recursos como WCM e IBM Connections (incluindo suporte a "segurança") - Um framework para acessar um serviço de busca para realizar pesquisas - Portlet que permite adicionar um serviço de busca e exibir os resultados ● Autonomy já fornece o "IBM Connector" (seedlist rastreador) ● Google Search Appliance está chegando lá com o seu 'feed crawler " mas ainda não é compatível
  • 61. © 2013 IBM Corporation61 Tecnologia de busca embutida ● O motor de busca dentro do WebSphere Portal oferece uma solução de entrada, adequada para a pesquisas através de Sites e Conteúdos gerenciados de tamanho moderado. Ideal para pequenas e médias instalações do WebSphere Portal ● Algumas limitações do Portal Search: - Capacidade de pesquisa limitada a menos de 800 mil documentos por índice - Sem suporte nativo a alta disponibilidade - Sem suporte a busca semântica
  • 62. © 2013 IBM Corporation62 Precisa de uma busca mas poderosa? ● Tecnologias de busca IBM: - Busca básica - Portal Search - Busca avançada - IBM Content Analytics com Enterprise Search open source Lucene IBM Lucene Extension Library Portal Search IBM Content Analytics with Enterprise Search IBM Search REST
  • 63. © 2013 IBM Corporation63 IBM Content Analytics com Enterprise Search ● Experiência de usuário ● Navegação de alto desempenho ● Salvar pesquisas ● Perfis de busca ● Pre-visualização de documentos ● E muito mais ... ● Experiência administrativa ● Maior escalabilidade ● Suporte à indexação incremental ● Flexíbilidade scale-out & HA ● Opções de ajuste de relevância ● E muito mais ... Auto completar: - Termos sugeridos baseado no indice e buscas anteriores - Customizável pelos Administradores
  • 64. © 2013 IBM Corporation64 ICA – Suporte a dezenas de fontes de conteúdo • IBM Case Manager V5.0 • IBM Lotus Connections 2.5, 3, 4 and 4.5 • IBM Lotus Domino DM 6.5.1, 7.0, • IBM Lotus Domino R7, R8, R8.5 and R9 • IBM Lotus Quickr (NSF & J2EE), 8.1, 8.2 and 8.5 • IBM Web Content Management 6.1, 7 and 8 • IBM WebSphere Portal 6.1, 7 and 8 • DB2 for iSeries 5.4 and 6.1 • DB2 UDB for Linux, UNIX, Windows 9.1, 9.5 and 9.7 • DB2 for z/OS 8.1, 9.1 • IMS 10.0 and 11.0.1 • Informix Dynamic Server 11.10 and 11.50 • Microsoft SQL Server 2005, 2008 • MySQL 5.0 • Oracle 10g and 11g • Software AG Adabas 7.1 • Sybase 11.9.2, 12.0, 12.5x Colaboração • IBM Case Manager V5.0 • IBM Content Manager Enterprise Edition 8.4, 8.4.1, 8.4.2 • FileNet Content Services 5.4, 5.5 • FileNet P8 Content Manager 4.0, 4.5, 4.5.1 and 5.0 • Hummingbird DM 5.1.0.5 with SR6 and 6.0.4 • EMC/Documentum 6.0 and 6.5 • CA-Datacom 10 • Open Text Livelink Enterprise Server 9.6, 9.7 and 9.7.1 Gerenciamento de Dados Outras fontes • Microsoft Exchange Server 2003 • Microsoft Windows SharePoint Services 3.0 • SharePoint Server 2003 SP2, 2007, 2010 Farm Support • Windows file systems: 2003 and 2008 servers • Network News Protocol Newsgroup • UNIX file systems • VSAM for z/OS 1.4 • Web (HTTP or HTTPS) Gerenciamento de Conteúdo
  • 65. © 2013 IBM Corporation65 Integração do Centro de Procura com o ICA
  • 66. © 2013 IBM Corporation66 IBM Content Analytics portlets
  • 67. © 2013 IBM Corporation67 Integração com IBM Connections ● Opção 1 – Use seedlists do IBM Connections para rastrear seus repositórios - Uma seedlist por tipo de recurso, por exemplo, Wiki, blogs, perfis, arquivos, etc. ● Opção 2 – Integrar a busca do IBM Connections com o Centro de Procura do Portal - use o recurso 'Remote Content Search Service "(RCSS) para registrar a busca do Connections como um serviço de busca - IBM Connections e WebSphere Portal (e ICA) utilizam a IBM Search REST API
  • 68. © 2013 IBM Corporation68
  • 69. © 2013 IBM Corporation69 Dúvidas?
  • 70. © 2013 IBM Corporation Para saber mais... WebSphere Portal and IBM Web Content Manager Information Center http://www.ibm.com/developerworks/websphere/zones/portal/proddoc.html WebSphere Portal and Web Content Manager Business Solutions Catalog https://greenhouse.lotus.com/catalog/ WebSphere Portal developerWorks forum http://www.ibm.com/developerworks/forums/forum.jspa?forumID=168 The WebSphere Portal wiki http://www-10.lotus.com/ldd/portalwiki.nsf/xpViewCategories.xsp?lookupNa me=IBM%20WebSphere%20Portal%208%20Product%20Documentation IBM Redbooks® publications http://www.redbooks.ibm.com/portals/websphere
  • 71. © 2013 IBM Corporation Referências  Understanding the Essentials of IBM Web Experience software Search services, Excepcional Web Experience 2013 Americas - Todd Leyba, Andreas Prokoph  Integrating Search with WebSphere Portal – Best Practices, IBM Portal Excellence Conference - Andreas Prokoph  Creating External Facing Web Sites with WebSphere Portal - Adam de Leeuw, Ali Beklen, David Axinn, Fanie Korff, Graham Wallace, Janice Taylor, JP Thambuganipalle, Projjwal Saha, Rajaguru Balagurusamy, Raul Munoz Serrano, Bart Jacob  High availability options for IBM WebSphere Portal 6.1 search - Andreas Prokoph, Eitan Shapiro
  • 72. © 2013 IBM Corporation Obrigado!!! Rodrigo Reis rodrigoareis@br.ibm.com IT Specialist & Application Architect IBM Collaboration Solutions
  • 73. © 2013 IBM Corporation © IBM Corporation 2013. All Rights Reserved. The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this information is based on IBM’s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software . References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in this presentation may change at any time at IBM’s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue growth or other results. Performance is based on measurements and projections using standard IBM benchmarks in a controlled environment. The actual throughput or performance that any user will experience will vary depending upon many factors, including considerations such as the amount of multiprogramming in the user's job stream, the I/O configuration, the storage configuration, and the workload processed. Therefore, no assurance can be given that an individual user will achieve results similar to those stated here. Adobe, the Adobe logo, PostScript, and the PostScript logo are either registered trademarks or trademarks of Adobe Systems Incorporated in the United States, and/or other countries. Java and all Java-based trademarks are trademarks of Sun Microsystems, Inc. in the United States, other countries, or both. Microsoft and Windows are trademarks of Microsoft Corporation in the United States, other countries, or both. ries in the United States and other countries. Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both. Other company, product, or service names may be trademarks or service marks of others. All references to OpenFinancial, Greenwell and Open Bier refer to a fictitious company and are used for illustration purposes only.