Sistemas de
recomendação em Ruby
Daniel Lopes
Agenda
- Tipos de Sistemas
- Gems Ruby
- Performance
- Métricas
- Referências
Tipos de recomendação
- Content-based filtering (Baseadas em
conteúdo dos itens)
- Collaborative filtering (Baseadas em
usuarios)
- Hibridas
Content-based filtering
Baseado em conteúdos dos itens, verifica a
semelhança .
Algoritmos mais comuns são: tf-idf (term
frequency–inverse document frequency), a
Correlação de Pearson - mede a correlação
entre duas variáveis X e Y numa faixa [-1] ~ [1]
Collaborative filtering
Baseado nos usuários, verifica a semelhança
entre eles e procura a similaridade entre eles.
Algoritmo mais comum é o: k-NN (k vizinhos
mais próximos) procura o vizinho mais próximo
Ferramentas em Ruby
Como o ruby tem menos tradição científica,
como python, há menos gems :(
SciRuby (http://sciruby.com/) :)
Tools for Scientific Computing in Ruby
Performance do dataset/algoritmo
- MSE (root mean square) Calcula o valor
eficaz de uma função variável continua ou
uma série discreta, MSE = 0 indica
simulação perfeita.
- RMSE (root-mean-square error) apresenta
valores do erro nas mesmas dimensões da
variável analisada.
Métrica
- Presição: Mede o acerto das
recomendações. precisao=tp/(tp+fp)
- Recall: quantidade de itens de interesse do
usuário que aparecem na lista de
recomendações. recall=tp/(tp+fn)
Referências
Recommender Systems with Ruby
http://pt.slideshare.net/marcelcaraciolo/recomm
ender-systems-with-ruby-adding-machine-
learning-statistics-etc
Big Data, Data Mining, and Machine
Learning, Jared Dean, 2014
Obrigado!
Daniel Lopes
Engenheiro em Computação
@dannyeuu
daniel@bankfacil.com.br
about.me/dannyeuu
Junte-se
a nós
bankfacil.com.br/dev

Sistemas de recomendação em ruby

  • 1.
  • 2.
    Agenda - Tipos deSistemas - Gems Ruby - Performance - Métricas - Referências
  • 3.
    Tipos de recomendação -Content-based filtering (Baseadas em conteúdo dos itens) - Collaborative filtering (Baseadas em usuarios) - Hibridas
  • 4.
    Content-based filtering Baseado emconteúdos dos itens, verifica a semelhança . Algoritmos mais comuns são: tf-idf (term frequency–inverse document frequency), a Correlação de Pearson - mede a correlação entre duas variáveis X e Y numa faixa [-1] ~ [1]
  • 5.
    Collaborative filtering Baseado nosusuários, verifica a semelhança entre eles e procura a similaridade entre eles. Algoritmo mais comum é o: k-NN (k vizinhos mais próximos) procura o vizinho mais próximo
  • 6.
    Ferramentas em Ruby Comoo ruby tem menos tradição científica, como python, há menos gems :( SciRuby (http://sciruby.com/) :) Tools for Scientific Computing in Ruby
  • 7.
    Performance do dataset/algoritmo -MSE (root mean square) Calcula o valor eficaz de uma função variável continua ou uma série discreta, MSE = 0 indica simulação perfeita. - RMSE (root-mean-square error) apresenta valores do erro nas mesmas dimensões da variável analisada.
  • 8.
    Métrica - Presição: Medeo acerto das recomendações. precisao=tp/(tp+fp) - Recall: quantidade de itens de interesse do usuário que aparecem na lista de recomendações. recall=tp/(tp+fn)
  • 9.
    Referências Recommender Systems withRuby http://pt.slideshare.net/marcelcaraciolo/recomm ender-systems-with-ruby-adding-machine- learning-statistics-etc Big Data, Data Mining, and Machine Learning, Jared Dean, 2014
  • 10.
    Obrigado! Daniel Lopes Engenheiro emComputação @dannyeuu daniel@bankfacil.com.br about.me/dannyeuu Junte-se a nós bankfacil.com.br/dev