Todo o conteúdo deste material é de propriedade intelectual da Tarkena. Esta apresentação é para uso exclusivo da Web Site...
Sistema Tarkena Busca
Tarkena Busca <ul><li>Sistema de busca de expressões para bancos de dados </li></ul><ul><ul><li>ex.: busca de ( títulos | ...
Tarkena Busca: Características Principais
Relevância <ul><li>O sistema Tarkena Busca foi especialmente concebido para trazer resultados de máxima relevância entre o...
Robustez <ul><li>Robustez = tolerância a erros na expressão de busca </li></ul><ul><li>Tipos de erros frequentes </li></ul...
Capacidade <ul><li>Capacidade = número de termos efetivamente utilizados da expressão de busca fornecida </li></ul><ul><li...
Performance <ul><li>Algoritmos de busca com relevância, robustez e alta capacidade são computacionalmente mais custosos do...
Regras de Negócios <ul><li>O sistema Tarkena Busca permite a incorporação de regras de negócio aos mecanismos de busca </l...
Test Drive gratuito sem compromisso
Test Drive gratuito e sem compromisso <ul><li>A Tarkena oferece a possibilidade de avaliação do sistema com dados reais do...
Contatos <ul><li>Empresa Credenciada para Comercialização: Web Sites Factory </li></ul><ul><li>Rubens Neistein ( [email_ad...
Próximos SlideShares
Carregando em…5
×

Smart Search de Busca

520 visualizações

Publicada em

O sistema Smart Search de Busca foi especialmente concebido para trazer resultados de máxima relevância entre o texto buscado e as entradas do banco de dados.

Publicada em: Negócios
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
520
No SlideShare
0
A partir de incorporações
0
Número de incorporações
19
Ações
Compartilhamentos
0
Downloads
3
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Smart Search de Busca

  1. 1. Todo o conteúdo deste material é de propriedade intelectual da Tarkena. Esta apresentação é para uso exclusivo da Web Sites Factory. Nenhuma de suas partes pode ser veiculada, transcrita ou reproduzida para distribuição para terceiros fora da organização da Web Sites Factory, sem prévio consentimento por escrito da Tarkena.
  2. 2. Sistema Tarkena Busca
  3. 3. Tarkena Busca <ul><li>Sistema de busca de expressões para bancos de dados </li></ul><ul><ul><li>ex.: busca de ( títulos | autores | editoras ) para livros </li></ul></ul><ul><ul><li>ex.: busca de ( títulos | gênero | diretor | tags ) para filmes </li></ul></ul><ul><li>Baseada em algoritmos utilizados com sucesso documentado em tarefas complexas e de grande volume </li></ul><ul><ul><li>ex.: censo EUA </li></ul></ul><ul><li>Adaptado à grafia e à fonética do Português do Brasil </li></ul><ul><li>Implementação no próprio banco de dados </li></ul><ul><ul><li>a busca é uma simples função de banco de dados que retorna os resultados </li></ul></ul><ul><ul><li>facilidade de implantação e integração com os demais sistemas </li></ul></ul><ul><ul><li>tira proveito de todas as tecnologias de alto desempenho disponíveis para os principais bancos de dados (SQL Server, Oracle, etc.) </li></ul></ul><ul><li>Alta performance e alta escalabilidade </li></ul>
  4. 4. Tarkena Busca: Características Principais
  5. 5. Relevância <ul><li>O sistema Tarkena Busca foi especialmente concebido para trazer resultados de máxima relevância entre o texto buscado e as entradas do banco de dados </li></ul><ul><li>Resultados contendo termos não encontrados na expressão de busca são cuidadosamente analisados </li></ul><ul><li>Exemplo : busca pela expressão “Redes Neurais” numa base de títulos de livros </li></ul><ul><ul><li>matching perfeito: Redes Neurais </li></ul></ul><ul><ul><li>alta relevância: Teoria de Redes Neurais </li></ul></ul><ul><ul><li>baixa relevância: Redes Neurais Artificiais Aplicadas à Hidrologia </li></ul></ul><ul><ul><li>os termos “ Teoria de ” são menos específicos que “ Artificiais ” e “ Hidrologia ” </li></ul></ul><ul><li>As regras de relevância podem ser combinadas com as regras de negócios, trazendo resultados que consideram os 2 critérios </li></ul>
  6. 6. Robustez <ul><li>Robustez = tolerância a erros na expressão de busca </li></ul><ul><li>Tipos de erros frequentes </li></ul><ul><ul><li>erros de grafia: “Harry Po tt er” x “Harry Po t er” </li></ul></ul><ul><ul><li>erros fonéticos: “Bar c elona” x “Bar s elona” </li></ul></ul><ul><ul><li>inversão de caracteres: “Neura is ” x “Neua si ” </li></ul></ul><ul><ul><li>inversão de termos: “ Teoria e Aplicações ” x “ Aplicações e Teoria ” </li></ul></ul><ul><li>O sistema Tarkena Busca foi projetado para tratar todos estes tipos de erros </li></ul><ul><ul><li>algoritmos sofisticados de cálculo de distância entre termos </li></ul></ul><ul><ul><li>algoritmos especialmente concebidos para indexação fonética dos termos e adaptados para o Português do Brasil </li></ul></ul><ul><ul><li>tolerância à inversão de termos </li></ul></ul>
  7. 7. Capacidade <ul><li>Capacidade = número de termos efetivamente utilizados da expressão de busca fornecida </li></ul><ul><li>Baixa capacidade </li></ul><ul><ul><li>3 ~ 5 termos, problemas para encontrar expressões longas (ex.: resenhas, parágrafos completos) </li></ul></ul><ul><li>Alta capacidade </li></ul><ul><ul><li>~ 50 termos (Google), grande capacidade para encontrar expressões longas </li></ul></ul><ul><li>Sistemas de alta capacidade devem selecionar os termos mais importantes dentro da expressão de busca </li></ul><ul><li>O sistema Tarkena Busca permite adaptar a capacidade ao hardware disponível </li></ul><ul><ul><li>15 termos de busca já disponíveis em hardware “low end” (notebook comum) </li></ul></ul>
  8. 8. Performance <ul><li>Algoritmos de busca com relevância, robustez e alta capacidade são computacionalmente mais custosos do que algoritmos simples </li></ul><ul><ul><li>a duração do processo de busca deve ser imperceptível ao usuário final </li></ul></ul><ul><li>Abordagens simples podem levar a resultados insatisfatórios </li></ul><ul><ul><li>“ nenhum produto encontrado”  “busca avançada” </li></ul></ul><ul><ul><li>excesso de falsos positivos </li></ul></ul><ul><li>Abordagens complexas podem ter problemas de performance </li></ul><ul><ul><li>resultados relevantes, mas num tempo inaceitável </li></ul></ul><ul><ul><li>problema mais grave quanto maior o tamanho da base a ser buscada </li></ul></ul><ul><ul><li>necessidade de investimentos gigantescos em hardware para compensar </li></ul></ul><ul><li>O sistema Tarkena Busca oferece performance e escalabilidade </li></ul><ul><ul><li>tempo de 300 ms sobre base de 3.300.000 de expressões já disponível em hardware “low end” </li></ul></ul><ul><ul><li>permite ampliar a complexidade das buscas conforme hardware disponível </li></ul></ul>
  9. 9. Regras de Negócios <ul><li>O sistema Tarkena Busca permite a incorporação de regras de negócio aos mecanismos de busca </li></ul><ul><li>Ex. 1: produtos de determinados fornecedores devem ter preferência sobre os demais, sem abrir mão da relevância </li></ul><ul><li>Ex. 2: produtos de maior margem devem ser trazidos mais próximos ao topo da lista </li></ul><ul><li>Ex. 3: lançamentos devem ser trazidos antes de coleções antigas </li></ul>
  10. 10. Test Drive gratuito sem compromisso
  11. 11. Test Drive gratuito e sem compromisso <ul><li>A Tarkena oferece a possibilidade de avaliação do sistema com dados reais do cliente </li></ul><ul><li>O cliente deve fornecer </li></ul><ul><ul><li>arquivo (.txt) contendo somente nomes dos produtos em catálogo </li></ul></ul><ul><li>A Tarkena irá </li></ul><ul><ul><li>construir uma base de testes com os nomes fornecidos </li></ul></ul><ul><ul><li>fazer uma demonstração in loco , permitindo a comparação com a solução de busca atual do cliente </li></ul></ul><ul><li>Confidencialidade </li></ul><ul><ul><li>um termo de confidencialidade com esta finalidade específica é firmado </li></ul></ul><ul><ul><li>os dados não serão fornecidos a terceiros sob qualquer hipótese </li></ul></ul><ul><ul><li>todos os dados fornecidos serão destruídos após a demonstração </li></ul></ul><ul><li>Gratuito, sem compromisso e rápido (apenas 2 dias) </li></ul>
  12. 12. Contatos <ul><li>Empresa Credenciada para Comercialização: Web Sites Factory </li></ul><ul><li>Rubens Neistein ( [email_address] ) </li></ul><ul><li>Tel: 011-3361-2270 </li></ul>

×