O documento discute a mineração de padrões sequenciais para analisar as sequências de compras de clientes em um supermercado. Ele explica como transformar os dados de transações em sequências de itens comprados e define conceitos como suporte e padrões sequenciais. O processo de mineração envolve gerar candidatos frequentes iterativamente e calcular seu suporte até não haver mais itens para gerar.
2. Motivação
● Suponha que você como um gerente de um
grande redede supermercado deseja conhecer
a evolução das compras do seus clientes.
“Que sequência de produtos são comprados
por um mesmo cliente em momentos
consecutivos?”
3. Motivação
Sequência de produtos <p1,p2,p3> é
frequentemente comprado pelos clientes.
● Você poderia criar/enviar folhetos promocionais
aos clientes envolvendo os produtos.
● Criar estratégias de marketing envolvendo
estes produtos.
4. Como descobrir essas sequências?
● É necessário dispor de um banco de dados de
transações dos clientes, onde estes estejam
identificados.
● Além disso, é necessário ter as datas em que
as transações foram criadas.
5. Exemplo
Uma sequência ou padrão sequencial é uma coleção de itemsets.
S = <{TV, aparelho-de-som},{Vídeo},{DVDPlayer}>
6. Transformação dos Dados
Primeiramente deve-se realizar a transformação
dos dados agregando todos os itemsets
comprados por cada cliente na ordem em que os
mesmos foram comprados de acordo com o
campo data.
7. Conceitos importantes
Sejam t e s duas sequências. Como analisar que s
está contida em T?
t = <{1,3,4},{2,4,5},{1,7,8}>
s = <{3},{1,8}>
s está contida em t, pois {3} está no primeiro
itemSet de t e {1,8} está no terceiro itemSet de t.
8. Conceitos importantes
Sejam t e s duas sequências. Como analisar que
s está contida em T?
t = <{1,3,4},{2,4,5},{1,7,8}>
s' = <{8},{7}>
s' não está contida em t. Por que?
9. Conceitos Importantes
● Sequências do banco de dados = sequência do
cliente
● Sequências que são possíveis padrões =
padrão sequencial
Ambas são sequências de itemSets.
Uma sequência de cliente t suporta um padrão
sequencial s se s está contido em t.
12. Como encontrar padrões
sequenciais?
● Gerar os candidatos a itemSets frequentes a
cada iteração e calcular o suporte até que
chegue a uma iteração que não possa mais
gerar itemSets.