Mineração de Padrões Sequenciais
Motivação
● Suponha que você como um gerente de um
grande redede supermercado deseja conhecer
a evolução das compras do se...
Motivação
Sequência de produtos <p1,p2,p3> é
frequentemente comprado pelos clientes.
● Você poderia criar/enviar folhetos ...
Como descobrir essas sequências?
● É necessário dispor de um banco de dados de
transações dos clientes, onde estes estejam...
Exemplo
Uma sequência ou padrão sequencial é uma coleção de itemsets.
S = <{TV, aparelho-de-som},{Vídeo},{DVDPlayer}>
Transformação dos Dados
Primeiramente deve-se realizar a transformação
dos dados agregando todos os itemsets
comprados por...
Conceitos importantes
Sejam t e s duas sequências. Como analisar que s
está contida em T?
t = <{1,3,4},{2,4,5},{1,7,8}>
s ...
Conceitos importantes
Sejam t e s duas sequências. Como analisar que
s está contida em T?
t = <{1,3,4},{2,4,5},{1,7,8}>
s'...
Conceitos Importantes
● Sequências do banco de dados = sequência do
cliente
● Sequências que são possíveis padrões =
padrã...
Conceitos importantes
suporte(s)=
númerodesequênciasdeclientesquesuportams
númerototaldesequênciasdeclientes
Exemplo
s=<{TV},{Vídeo}>
Suporte = 2/4=0,5
Como encontrar padrões
sequenciais?
● Gerar os candidatos a itemSets frequentes a
cada iteração e calcular o suporte até q...
Exemplo
Base de dados suporte = 2/3
<{a,b}, {f}>
<{a}, {b}, {c}>
<{d}, {a,e}, {b} ,{e,c} >
C1 = <a> <b> <c> <d> <e> <f> F1...
Exercício
Id_Sequencia Seqüência
10 <{a}{abc}{ac}>
20 <{ad}{c}{ae}>
30 <{cf}{df}{c}{b}>
40 <{e}{g}{b}{c}>
Encontre os padr...
Próximos SlideShares
Carregando em…5
×

Aula 4 mineração de padrões sequenciais

315 visualizações

Publicada em

Informática

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
315
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Aula 4 mineração de padrões sequenciais

  1. 1. Mineração de Padrões Sequenciais
  2. 2. Motivação ● Suponha que você como um gerente de um grande redede supermercado deseja conhecer a evolução das compras do seus clientes. “Que sequência de produtos são comprados por um mesmo cliente em momentos consecutivos?”
  3. 3. Motivação Sequência de produtos <p1,p2,p3> é frequentemente comprado pelos clientes. ● Você poderia criar/enviar folhetos promocionais aos clientes envolvendo os produtos. ● Criar estratégias de marketing envolvendo estes produtos.
  4. 4. Como descobrir essas sequências? ● É necessário dispor de um banco de dados de transações dos clientes, onde estes estejam identificados. ● Além disso, é necessário ter as datas em que as transações foram criadas.
  5. 5. Exemplo Uma sequência ou padrão sequencial é uma coleção de itemsets. S = <{TV, aparelho-de-som},{Vídeo},{DVDPlayer}>
  6. 6. Transformação dos Dados Primeiramente deve-se realizar a transformação dos dados agregando todos os itemsets comprados por cada cliente na ordem em que os mesmos foram comprados de acordo com o campo data.
  7. 7. Conceitos importantes Sejam t e s duas sequências. Como analisar que s está contida em T? t = <{1,3,4},{2,4,5},{1,7,8}> s = <{3},{1,8}> s está contida em t, pois {3} está no primeiro itemSet de t e {1,8} está no terceiro itemSet de t.
  8. 8. Conceitos importantes Sejam t e s duas sequências. Como analisar que s está contida em T? t = <{1,3,4},{2,4,5},{1,7,8}> s' = <{8},{7}> s' não está contida em t. Por que?
  9. 9. Conceitos Importantes ● Sequências do banco de dados = sequência do cliente ● Sequências que são possíveis padrões = padrão sequencial Ambas são sequências de itemSets. Uma sequência de cliente t suporta um padrão sequencial s se s está contido em t.
  10. 10. Conceitos importantes suporte(s)= númerodesequênciasdeclientesquesuportams númerototaldesequênciasdeclientes
  11. 11. Exemplo s=<{TV},{Vídeo}> Suporte = 2/4=0,5
  12. 12. Como encontrar padrões sequenciais? ● Gerar os candidatos a itemSets frequentes a cada iteração e calcular o suporte até que chegue a uma iteração que não possa mais gerar itemSets.
  13. 13. Exemplo Base de dados suporte = 2/3 <{a,b}, {f}> <{a}, {b}, {c}> <{d}, {a,e}, {b} ,{e,c} > C1 = <a> <b> <c> <d> <e> <f> F1 = <a>, <b>, <c> C2 = <{a},{a}>; <{a,b}>; <{a},{b}>; <{b},{a}>; <{b},{b}>; <{a},{c}>; <{c},{a}>; <{a,c}>; <{b,c}>; <{b},{c}>; <{c},{c}>; <{c},{b}> F2 = <{a},{b}>; <{a},{c}>; <{b},{c}> C3 = <{a},{b},{c}> F3 = <{a},{b},{c}> C4 = vazio
  14. 14. Exercício Id_Sequencia Seqüência 10 <{a}{abc}{ac}> 20 <{ad}{c}{ae}> 30 <{cf}{df}{c}{b}> 40 <{e}{g}{b}{c}> Encontre os padrões sequencias com suporte maior ou igual a 3/4

×