Apresentação sobre algoritmos de Sistemas de Recomendação, filtragem colaborativa, recomendação por conteúdo e filtragem híbrida. Algoritmos de machine learning, fatoração de matrizes, deep learning e classificação.
2. Colaborativa
Filtragem
• Baseado em itens e produtos
• Experiências e avaliações
anteriores são usados para as
próximas recomendações
User Based
3. Filtragem
• Algoritmos usam propriedades
dos itens
• A similaridade é medida
através dos usuários
Item Based
Colaborativa
4. Desafios
Filtragem colaborativa
por itens e usuários
Como iniciar a recomendação com
poucas informações e usuários sem
pouco ou nenhum ranking
A opção mais popular é uma
recomendação básica, mas a quantidade
aumentada em relação aos outros
produtos pode gerar um viés
Valores muito raros em comparação ao
total de possibilidades gera matrizes
muito “vazias” que dificultam os cálculos
Cold Starts
Viés de Popularidade
Esparcidade
5. Por Conteúdo
Filtragem
• Algoritmos usam propriedades
dos itens
• Variáveis sobre os itens, por
exemplo: um filme pode ser
uma comédia ou drama, pode
ter personagens femininas
fortes, ter violência ou ser
baseado em fatos reais
Highlight text
7. Vantagens
Filtragem por
conteúdo e híbrida
Além de usar as avaliações essa técnicas
também usam variáveis e acrescentam
informação a usuários sem muito
histórico
Em usuários sem informações é uma
abordagem segura e simples, pode usar
informações demográficas e
características dos produtos
Várias medidas de similaridades podem
ser escolhidas
Variáveis
Baseadas em características
similaridades
8. Regras de associação
atendem a um suporte
e confiança mínimos
O suporte é a probabilidade
Do evento A ocorrer em
toda a base
Confiança é a força das
regras, o % de B dado
A (A = 1 ou mais itens)
As regras com suporte e
confiança significativos
entram para o sistema
1
2
3
4
5
Apriori
Algoritmo
Objetivo é achar regras
do tipo X ⇒ Y
19. 1
2
3
Fatoração
d e M a t r i z e s
Algoritmo
MF como uma família de métodos que
decompõem uma matriz de classificação para
filtragem colaborativa.
A matriz de interação usuário-item listam
usuários e itens em linhas e colunas,
respectivamente
ela deve ser decomposta em duas
matrizes, que são a matriz usuário e a
matriz item
26. • Na similaridade de Jaccard a coocorrência
é ponderada pela ocorrência da dupla de
produtos
• Basicamente é a intersecção pela união
Métrica de Similaridade
Similaridade de Jaccard