SlideShare uma empresa Scribd logo
1 de 47
Baixar para ler offline
Avaliação e Testes em 

Sistemas de Recomendação"
  Börje Karlsson & Francimar Maciel
Recomendação


 Personalização"
Otimização de Tempo                               Conteúdos"
                                                  relevantes
Serviço específicos
                                                  Confiança e
Conteúdo de interesse                             relacionamento




    Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Quem Recomenda




                                     Você, seus amigos,
                                       sua família etc


Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Sistema de Recomendação
                                                         Personalização Automática
                                                       Usuário diferente, experiência diferente
                                                             Precisa de dados do usuário


                                                      Recomendações por contexto
Consulta             Recomendações                              Dados usuário–item–contexto
                                                                tempo, lugar, atividade, papel


           Itens!                                    Recomendações por conteúdo
                                                          Metadados de usuário (demográficos)
                                                             Metadata dos itens (catálogo)

Produtos: websites, blogs,
notícias, músicas, livros, …

               Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Dados e Uso




    Histórico de    Compilar grandes “Pessoas que gostam
 acessos, consumo,   quantidades de    disto também …”
     contatos e     dados e mostrar     Agregar dados
compartilhamento de    tendências      comportamentais
     conteúdo        personalizadas       para realizar
                      que agreguem     recomendações
                     valor ao usuário

           Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Amazon.com
        3!


                            1!




                                                                  2!




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Netflix
                                                              3!

                     1!




2!




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Last.fm

                      1!

2!


                                                      3!




     Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Em Ambientes Móveis…




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Também em Propaganda Personalizada




      Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
O Que é um Recomendador?

1.  Coleta de 2.  Treinamento do Modelo                                       3.     Gerador de
      dados       •    ”Aprende” ao processar os dados                               Recomendações


                                                               Perfis dos itens!
                                            gostos!



                                                                              constrói!
           recomenda!

                                                  casa!                 Azul!
                                                                      Círculos!
                                                                     Triângulos!
                                                              Perfil do usuário!
              Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Como se Testa um SR?




•  Testes funcionais
•  Testes do algoritmo de recomendação
•  Teste da experiência do usuário
 Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Avaliação do Algoritmo
•  Avaliações geralmente offline"
•  Comparação de predições com notas"
   •  Root-mean-square error (RMSE)"
•  Correlações"




•  Modelo 0/1 (Interessante / Não interessante)"
   •  Cobertura"
                            Deveria comparar alternativas!"

                  Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Contexto
“Contexto é qualquer informação que pode ser utilizada
para caracterizar a situação de uma entidade”
 (A. K. Dey et al., Understanding and using context, 2001)


No caso de Sistemas de Recomendação:
     - Contexto de usabilidade (pessoa)
     - Contexto para recomendação (sistema)




             Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
User Experience "
“Momentary, primarily evaluative feeling
(good-bad) while interacting with a product or
service.” (Hassenzahl 2008 apud Knijnenburg et al 2012)

     “Experience is a very dynamic, complex and
     subjective phenomenon. It depends of upon
   the perception of multiple sensory qualities f a
      design, interpreted through filters relating to
                    contextual factors” (Buxton, 2007)

         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Experiência de Uso (UX) & Sistema de Recomendação"
 (Aspectos subjetivos) + (Algoritmos de aprendizado)"
                           !




   Componentes da UX"
    Dificuldade!               Conforto!                    Estes fatores não
     Esforço!                 Contexto!                     tem recebido a
                                                            devida atenção
     Satisfacão com a escolha!                             (Knijnenburg et al 2012)

   Eficiência percebida do sistema!




         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
User Experience "
Conteúdo                    Rapidez                                         Necessidades
                            Sugestões
Processo                    Explorar                                        Expectativas
                            Compartilhar
Flexibilidade               Intuitividade                                   Semântica
                            Quantidade
Controle                    Disponibilidade                                 Barreiras
                            Custo x Benefício

“A good experience varies from person to person, product to
product, and task to task, but a good general definition is to define
something as ‘usable’ if it is funcional, efficient and desirable to its
intend audience.” (Kuniavsky, 2003)
              Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012)


         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012)


         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012)


         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Entrevistas, Grupos de Foco,
Pesquisa Contextual, Questionários
Observação Participativa,
Testes de Usabilidade.
•  Recrutamento
•  Criação de tarefas específicas
•  Observação e registro – ferramentas e meios
   utilizados, sequências de ações, métodos de
   organização, como são as interações.
•  Transferências e compartilhamento de
   conhecimento

           Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Escalas de Avaliação




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Escalas de Avaliação




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Escalas de Avaliação




•  NPS no celular



       Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Contexto para Recomendação
             Comportamento + Ambiente + Interações


Informação fluindo dos, e para os, usuários:
 extraída do conteúdo; inferida das atividades; sensorial; explícita
 (comentários, bookmarks, etc.)




               Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Contexto para Recomendação
                             Microphone"

      Camera"                                       GPS"



   WLAN                                                    Accelerometer"
  positioning"




 Camera"
                                                      Databases"
                                                                             Time table"

                                                 Maps"
                    Documents"                               Music Catalogue"

      Websites
             "
                       Wikipedia"



     Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Modelos de Contexto
                                                  Requisitos"

Usabilidade do
Formalismo de                                                                                         Lidar com
 Modelagem"                                                                                          Imperfeições"



      Provisionamento                                                                        Raciocínio"
         Eficiente
        do Contexto"                                                     Relacionamentos e
                                                                           Dependências"
                                Timeliness"
                                                           Heterogeneidade"
                 (Bettini et al., A Survey of Context Modeling and Reasoning Techniques, 2009)!




                     Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Contexto
Ambiente
Conhecimento
Atitudes
Familiaridade

    Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012)



             Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Níveis de Inteligência Contextual




                                                         From Xerox PARC!

     Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Compreensão do Processo
                  Não em detalhes

Etapas em alto nível
!




                                                                                                 Stern, Herbrich,
                                                                                                  Graepel 2009!



           Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Music Intelligence Spearhead (MIS)
- Dispositivos móveis estão sempre com os usuários
- Ouvir música é bastante pessoal e situacional




            Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Music Intelligence Spearhead (MIS)
•  Podemos usar Contexto para melhorar recomendações de música?

•  A aplicação deveria “just work”
    •  coletar dados contextuais;
    •  entender o contexto do usuário;
    •  recomendar quando e o que tocar.!

•  Arquitetura e sistema capaz de
   suportar futuras pesquisas.
•  Testes com usuários em
   quatro países.




                 Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Music Intelligence Spearhead (MIS)




      Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Avaliação
•  10 Usuários de música no celular | 18-32 anos
•  Entrevistas em profundidade
•  Cada usuário, 1 semana de uso
•  Lista de tarefas acompanhadas e orientadas de forma
   presencial e via SMS
•  Cada usuário recebeu 80 libras como estímulo para
   experimentar e comprar novas músicas.




           Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Avaliação
                     Procedimentos iniciais

                     • Tranferência de 200 músicas

                     • Lista de tarefas para estimular o
                     uso do aplicativo e familiarização
                     com as telas (Percepção inicial)

                     • Instrução sobre os próximos
                     passos da avaliação



Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Resultados




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Resultados
                     •  A recomendação deveria ser
                        mais rápida.

                     •  A recomendação não foi
                        relevante.

                     •  Gostei! Mas eu não compraria.

                     •  Queria entender como isso
                        funciona.

                     •  Eu gostei, mas não
                        recomendaria para meu amigo.

Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Resultados

                     •  Eu gostei mas gostaria de
                        receber mais conteúdos de um
                        gênero específico.

                     •  Superou minhas expectativas

                     •  Interessante, mas gostaria de
                        receber as músicas de acordo
                        com o gênero que estou
                        escutando naquele determinado
                        momento.


Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Resultados




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Resultados




Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
MIS - Aprendizados

•  Quanto mais testes melhor.

•  Recompensas e Bônus não foram estímulos
   significativos. O que realmente importou?
   Receber o conteúdo de interesse. !

•  A pesquisa deve ser Qualitativa e Quantitativa

•  Maior alinhamento com a equipe de software e
   desenvolvimento para melhorias contínuas e maior
   controle durante a avaliação destes sistemas.

           Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
“So, if we decide that we want to strive for a comparable
standard of experience in the products that we are
designing, and therefore adopt an appropriate process
for doing so, what might that process be? Making a
contribution toward answering this question is at heart
of what follows.” Bill Buxton (Sketching User Experience)




         Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Referências
KNIJNENBURG, B. P.; WILLEMSEN, M. C.; GARTNER, Z.; SONCU, H.; NEWELL, C.
Explaining the user experience of recommender systems. User Modeling and User-
Adapted Interaction. October 2012, Volume 22, Issue 4-5. pp 441-504. Disponível em:<
http://www.usabart.nl/portfolio/KnijnenburgWillemsen-UMUAI2011_UIRecSy.pdf>.

REICHHELD, F. F. A pergunta definitiva 2.0. Como as empresas que implementam o net
promoter score prosperam em um mundo voltado aos clientes. Rio de Janeiro: Elsevier,
2011.

BUXTON, B. Sketching User Experiences, getting the design right and the right design.
San Francisco: Elsevier, 2007.

KUNIAVSKY, M. Observing the user experience. San Francisco: Morgan Kaufmann
Publishers, 2003.

KNIJNENBURG, B. P.; WILLEMSEN, M. C.; KOBSA, A. A Pragmatic Procedure to Support
the User-Centric Evaluation of Recommender Systems. Proceedings of the fifth ACM
conference on Recommender systems. Chicago, IL, 2011. Disponível em: < http://
www.ics.uci.edu/~kobsa/papers/2011-RecSys-kobsa.pdf>.




               Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
Börje:"
                  Fran:"
    !@tellarin!
                      !@narf2916!

Mais conteúdo relacionado

Destaque

Sistemas De RecomendaçãO Pronto
Sistemas De RecomendaçãO ProntoSistemas De RecomendaçãO Pronto
Sistemas De RecomendaçãO ProntoJosephRosa
 
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...Arthur Fortes
 
Sistema de Recomendação de Lojas
Sistema de Recomendação de LojasSistema de Recomendação de Lojas
Sistema de Recomendação de LojasGustavo Carvalho
 
Sistema de Recomendação de Produtos Utilizando Mineração de Dados
Sistema de Recomendação de Produtos Utilizando Mineração de DadosSistema de Recomendação de Produtos Utilizando Mineração de Dados
Sistema de Recomendação de Produtos Utilizando Mineração de DadosCássio Alan Garcia
 

Destaque (6)

OER-Unesco June08
OER-Unesco June08OER-Unesco June08
OER-Unesco June08
 
Sistemas De RecomendaçãO Pronto
Sistemas De RecomendaçãO ProntoSistemas De RecomendaçãO Pronto
Sistemas De RecomendaçãO Pronto
 
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...
 
Sistema de Recomendação de Lojas
Sistema de Recomendação de LojasSistema de Recomendação de Lojas
Sistema de Recomendação de Lojas
 
Sistemas de Recomendação
Sistemas de Recomendação Sistemas de Recomendação
Sistemas de Recomendação
 
Sistema de Recomendação de Produtos Utilizando Mineração de Dados
Sistema de Recomendação de Produtos Utilizando Mineração de DadosSistema de Recomendação de Produtos Utilizando Mineração de Dados
Sistema de Recomendação de Produtos Utilizando Mineração de Dados
 

Semelhante a Avaliação e Testes em Sist. de Recomendação by Börje Karlsson & Fran Maciel

[Jose Ahirton Lopes] Algoritmos de Recomendacao
[Jose Ahirton Lopes] Algoritmos de Recomendacao[Jose Ahirton Lopes] Algoritmos de Recomendacao
[Jose Ahirton Lopes] Algoritmos de RecomendacaoAhirton Lopes
 
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerce
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerceO caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerce
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerceFrancesco Cardi
 
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...E-Commerce Brasil
 
[Jose Ahirton Lopes] Algoritmos de Recomendacao II
[Jose Ahirton Lopes] Algoritmos de Recomendacao II[Jose Ahirton Lopes] Algoritmos de Recomendacao II
[Jose Ahirton Lopes] Algoritmos de Recomendacao IIAhirton Lopes
 
Sistemas de Recomendação e Inteligência Coletiva
Sistemas de Recomendação e Inteligência ColetivaSistemas de Recomendação e Inteligência Coletiva
Sistemas de Recomendação e Inteligência ColetivaMarcel Caraciolo
 
Metodos e Processos de Pesquisa em Design de Interação
Metodos e Processos de Pesquisa em Design de InteraçãoMetodos e Processos de Pesquisa em Design de Interação
Metodos e Processos de Pesquisa em Design de InteraçãoGonçalo Ferraz
 
Qualidade de Software
Qualidade de SoftwareQualidade de Software
Qualidade de SoftwareQualister
 
Testes em métodos ágeis
Testes em métodos ágeisTestes em métodos ágeis
Testes em métodos ágeisQualister
 
Aula 08 - Gerenciamento da Qualidade
Aula 08 - Gerenciamento da QualidadeAula 08 - Gerenciamento da Qualidade
Aula 08 - Gerenciamento da QualidadeSuzana Viana Mota
 
Arquitetura da Informação
Arquitetura da InformaçãoArquitetura da Informação
Arquitetura da InformaçãoMarcello Cardoso
 
Aprendizagem Ativa em Sistemas de Filtragem Colaborativa
Aprendizagem Ativa em Sistemas de Filtragem ColaborativaAprendizagem Ativa em Sistemas de Filtragem Colaborativa
Aprendizagem Ativa em Sistemas de Filtragem Colaborativaigorsampaio
 
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de Oliveira
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de OliveiraInteração Humano Computador Capítulo 10 Avaliação - Wellington Pinto de Oliveira
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de OliveiraWellington Oliveira
 

Semelhante a Avaliação e Testes em Sist. de Recomendação by Börje Karlsson & Fran Maciel (20)

Sistemas de Recomendação na web
Sistemas de Recomendação na webSistemas de Recomendação na web
Sistemas de Recomendação na web
 
Aula mestrado
Aula mestradoAula mestrado
Aula mestrado
 
Personalização: O que é?
Personalização: O que é?Personalização: O que é?
Personalização: O que é?
 
Oficina protótipos dia 1
Oficina protótipos   dia 1Oficina protótipos   dia 1
Oficina protótipos dia 1
 
[Jose Ahirton Lopes] Algoritmos de Recomendacao
[Jose Ahirton Lopes] Algoritmos de Recomendacao[Jose Ahirton Lopes] Algoritmos de Recomendacao
[Jose Ahirton Lopes] Algoritmos de Recomendacao
 
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerce
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerceO caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerce
O caminho para a personalização eficaz: melhorando os KPIs do seu e-­‐commerce
 
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...
ChaordicRecomendações personalizadas: melhorando a experiência de compra dos ...
 
[Jose Ahirton Lopes] Algoritmos de Recomendacao II
[Jose Ahirton Lopes] Algoritmos de Recomendacao II[Jose Ahirton Lopes] Algoritmos de Recomendacao II
[Jose Ahirton Lopes] Algoritmos de Recomendacao II
 
Usabilidade Simples
Usabilidade SimplesUsabilidade Simples
Usabilidade Simples
 
Sistemas de Recomendação e Inteligência Coletiva
Sistemas de Recomendação e Inteligência ColetivaSistemas de Recomendação e Inteligência Coletiva
Sistemas de Recomendação e Inteligência Coletiva
 
Metodos e Processos de Pesquisa em Design de Interação
Metodos e Processos de Pesquisa em Design de InteraçãoMetodos e Processos de Pesquisa em Design de Interação
Metodos e Processos de Pesquisa em Design de Interação
 
Qualidade de Software
Qualidade de SoftwareQualidade de Software
Qualidade de Software
 
Testes em métodos ágeis
Testes em métodos ágeisTestes em métodos ágeis
Testes em métodos ágeis
 
Pensando fora da caixa
Pensando fora da caixa Pensando fora da caixa
Pensando fora da caixa
 
Aula 08 - Gerenciamento da Qualidade
Aula 08 - Gerenciamento da QualidadeAula 08 - Gerenciamento da Qualidade
Aula 08 - Gerenciamento da Qualidade
 
Workshop de Requisitos
Workshop de RequisitosWorkshop de Requisitos
Workshop de Requisitos
 
Arquitetura da Informação
Arquitetura da InformaçãoArquitetura da Informação
Arquitetura da Informação
 
Aprendizagem Ativa em Sistemas de Filtragem Colaborativa
Aprendizagem Ativa em Sistemas de Filtragem ColaborativaAprendizagem Ativa em Sistemas de Filtragem Colaborativa
Aprendizagem Ativa em Sistemas de Filtragem Colaborativa
 
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de Oliveira
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de OliveiraInteração Humano Computador Capítulo 10 Avaliação - Wellington Pinto de Oliveira
Interação Humano Computador Capítulo 10 Avaliação - Wellington Pinto de Oliveira
 
Pesquisa comportamento a2
Pesquisa comportamento a2Pesquisa comportamento a2
Pesquisa comportamento a2
 

Mais de Fran Maciel

An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1
An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1 An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1
An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1 Fran Maciel
 
The Need for Cognition by John T. Cacioppo, and Richard E. Petty
The Need for Cognition by John T. Cacioppo, and Richard E. PettyThe Need for Cognition by John T. Cacioppo, and Richard E. Petty
The Need for Cognition by John T. Cacioppo, and Richard E. PettyFran Maciel
 
Casos de Usabilidade by Fran Maciel
Casos de Usabilidade by Fran MacielCasos de Usabilidade by Fran Maciel
Casos de Usabilidade by Fran MacielFran Maciel
 
An Introduction to Content Analysis by Bruce L. Berg
An Introduction to Content Analysis by Bruce L. BergAn Introduction to Content Analysis by Bruce L. Berg
An Introduction to Content Analysis by Bruce L. BergFran Maciel
 
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...Fran Maciel
 
Medication Adherence in America reportcard full by National Community Pharmac...
Medication Adherence in America reportcard full by National Community Pharmac...Medication Adherence in America reportcard full by National Community Pharmac...
Medication Adherence in America reportcard full by National Community Pharmac...Fran Maciel
 
PALMA: Usability Testing of an Application for Adult Literacy in Brazil by F...
PALMA: Usability Testing of an Application  for Adult Literacy in Brazil by F...PALMA: Usability Testing of an Application  for Adult Literacy in Brazil by F...
PALMA: Usability Testing of an Application for Adult Literacy in Brazil by F...Fran Maciel
 
State of the art on the cognitive walkthrough method by MAHATODY, SAGAR and ...
State of the  art on the cognitive walkthrough method by MAHATODY, SAGAR and ...State of the  art on the cognitive walkthrough method by MAHATODY, SAGAR and ...
State of the art on the cognitive walkthrough method by MAHATODY, SAGAR and ...Fran Maciel
 
Briefing by Rafael Sampaio
Briefing by Rafael SampaioBriefing by Rafael Sampaio
Briefing by Rafael SampaioFran Maciel
 
Improving Students’ Learning With Effective Learning Techniques: Promising ...
Improving Students’ Learning With  Effective Learning Techniques: Promising  ...Improving Students’ Learning With  Effective Learning Techniques: Promising  ...
Improving Students’ Learning With Effective Learning Techniques: Promising ...Fran Maciel
 
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …Fran Maciel
 
Brainstorming via LECHA-UFF
Brainstorming via LECHA-UFFBrainstorming via LECHA-UFF
Brainstorming via LECHA-UFFFran Maciel
 
Design Participativo: uma experiência com produtos e s…
Design Participativo: uma experiência com produtos e s…Design Participativo: uma experiência com produtos e s…
Design Participativo: uma experiência com produtos e s…Fran Maciel
 
Economia solidaria- by Robson Santos & Fran Maciel
Economia solidaria- by Robson Santos & Fran MacielEconomia solidaria- by Robson Santos & Fran Maciel
Economia solidaria- by Robson Santos & Fran MacielFran Maciel
 
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...Fran Maciel
 
Playing to Learn Teaching User Research to Game Design Students by Heather De...
Playing to Learn Teaching User Research to Game Design Students by Heather De...Playing to Learn Teaching User Research to Game Design Students by Heather De...
Playing to Learn Teaching User Research to Game Design Students by Heather De...Fran Maciel
 
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...Fran Maciel
 
Terminei o mestrado e agora? by Lucia Oliveira
Terminei o mestrado e agora? by Lucia OliveiraTerminei o mestrado e agora? by Lucia Oliveira
Terminei o mestrado e agora? by Lucia OliveiraFran Maciel
 
Teoria Geral dos Sistemas by Lillian Alvares - UNB
Teoria Geral dos Sistemas by Lillian Alvares - UNBTeoria Geral dos Sistemas by Lillian Alvares - UNB
Teoria Geral dos Sistemas by Lillian Alvares - UNBFran Maciel
 
2013 Policy guidelines for mobile learning by UNESCO
2013 Policy guidelines for mobile learning by UNESCO2013 Policy guidelines for mobile learning by UNESCO
2013 Policy guidelines for mobile learning by UNESCOFran Maciel
 

Mais de Fran Maciel (20)

An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1
An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1 An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1
An_Invitation_to_Cultural_Psychology by Jaan Valsiner, Chapter 1
 
The Need for Cognition by John T. Cacioppo, and Richard E. Petty
The Need for Cognition by John T. Cacioppo, and Richard E. PettyThe Need for Cognition by John T. Cacioppo, and Richard E. Petty
The Need for Cognition by John T. Cacioppo, and Richard E. Petty
 
Casos de Usabilidade by Fran Maciel
Casos de Usabilidade by Fran MacielCasos de Usabilidade by Fran Maciel
Casos de Usabilidade by Fran Maciel
 
An Introduction to Content Analysis by Bruce L. Berg
An Introduction to Content Analysis by Bruce L. BergAn Introduction to Content Analysis by Bruce L. Berg
An Introduction to Content Analysis by Bruce L. Berg
 
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...
2014 - hábitos de consumo de mídia pela população brasileira by Secretaria de...
 
Medication Adherence in America reportcard full by National Community Pharmac...
Medication Adherence in America reportcard full by National Community Pharmac...Medication Adherence in America reportcard full by National Community Pharmac...
Medication Adherence in America reportcard full by National Community Pharmac...
 
PALMA: Usability Testing of an Application for Adult Literacy in Brazil by F...
PALMA: Usability Testing of an Application  for Adult Literacy in Brazil by F...PALMA: Usability Testing of an Application  for Adult Literacy in Brazil by F...
PALMA: Usability Testing of an Application for Adult Literacy in Brazil by F...
 
State of the art on the cognitive walkthrough method by MAHATODY, SAGAR and ...
State of the  art on the cognitive walkthrough method by MAHATODY, SAGAR and ...State of the  art on the cognitive walkthrough method by MAHATODY, SAGAR and ...
State of the art on the cognitive walkthrough method by MAHATODY, SAGAR and ...
 
Briefing by Rafael Sampaio
Briefing by Rafael SampaioBriefing by Rafael Sampaio
Briefing by Rafael Sampaio
 
Improving Students’ Learning With Effective Learning Techniques: Promising ...
Improving Students’ Learning With  Effective Learning Techniques: Promising  ...Improving Students’ Learning With  Effective Learning Techniques: Promising  ...
Improving Students’ Learning With Effective Learning Techniques: Promising ...
 
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …
Uso da Internet por crianças e adolescentes no Brasil by Comitê Gestor da …
 
Brainstorming via LECHA-UFF
Brainstorming via LECHA-UFFBrainstorming via LECHA-UFF
Brainstorming via LECHA-UFF
 
Design Participativo: uma experiência com produtos e s…
Design Participativo: uma experiência com produtos e s…Design Participativo: uma experiência com produtos e s…
Design Participativo: uma experiência com produtos e s…
 
Economia solidaria- by Robson Santos & Fran Maciel
Economia solidaria- by Robson Santos & Fran MacielEconomia solidaria- by Robson Santos & Fran Maciel
Economia solidaria- by Robson Santos & Fran Maciel
 
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...
Artigo: Aplicação do Design Participativo para geração ideias de produtos e s...
 
Playing to Learn Teaching User Research to Game Design Students by Heather De...
Playing to Learn Teaching User Research to Game Design Students by Heather De...Playing to Learn Teaching User Research to Game Design Students by Heather De...
Playing to Learn Teaching User Research to Game Design Students by Heather De...
 
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...
Planejamento de workshop - Cap 15 | Gestão estratégica by Eliezer Arantes da ...
 
Terminei o mestrado e agora? by Lucia Oliveira
Terminei o mestrado e agora? by Lucia OliveiraTerminei o mestrado e agora? by Lucia Oliveira
Terminei o mestrado e agora? by Lucia Oliveira
 
Teoria Geral dos Sistemas by Lillian Alvares - UNB
Teoria Geral dos Sistemas by Lillian Alvares - UNBTeoria Geral dos Sistemas by Lillian Alvares - UNB
Teoria Geral dos Sistemas by Lillian Alvares - UNB
 
2013 Policy guidelines for mobile learning by UNESCO
2013 Policy guidelines for mobile learning by UNESCO2013 Policy guidelines for mobile learning by UNESCO
2013 Policy guidelines for mobile learning by UNESCO
 

Avaliação e Testes em Sist. de Recomendação by Börje Karlsson & Fran Maciel

  • 1. Avaliação e Testes em 
 Sistemas de Recomendação" Börje Karlsson & Francimar Maciel
  • 2. Recomendação Personalização" Otimização de Tempo Conteúdos" relevantes Serviço específicos Confiança e Conteúdo de interesse relacionamento Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 3. Quem Recomenda Você, seus amigos, sua família etc Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 4. Sistema de Recomendação Personalização Automática Usuário diferente, experiência diferente Precisa de dados do usuário Recomendações por contexto Consulta Recomendações Dados usuário–item–contexto tempo, lugar, atividade, papel Itens! Recomendações por conteúdo Metadados de usuário (demográficos) Metadata dos itens (catálogo) Produtos: websites, blogs, notícias, músicas, livros, … Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 5. Dados e Uso Histórico de Compilar grandes “Pessoas que gostam acessos, consumo, quantidades de disto também …” contatos e dados e mostrar Agregar dados compartilhamento de tendências comportamentais conteúdo personalizadas para realizar que agreguem recomendações valor ao usuário Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 6. Amazon.com 3! 1! 2! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 7. Netflix 3! 1! 2! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 8. Last.fm 1! 2! 3! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 9. Em Ambientes Móveis… Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 10. Também em Propaganda Personalizada Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 11. O Que é um Recomendador? 1.  Coleta de 2.  Treinamento do Modelo 3.  Gerador de dados •  ”Aprende” ao processar os dados Recomendações Perfis dos itens! gostos! constrói! recomenda! casa! Azul! Círculos! Triângulos! Perfil do usuário! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 12. Como se Testa um SR? •  Testes funcionais •  Testes do algoritmo de recomendação •  Teste da experiência do usuário Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 13. Avaliação do Algoritmo •  Avaliações geralmente offline" •  Comparação de predições com notas" •  Root-mean-square error (RMSE)" •  Correlações" •  Modelo 0/1 (Interessante / Não interessante)" •  Cobertura" Deveria comparar alternativas!" Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 14. Contexto “Contexto é qualquer informação que pode ser utilizada para caracterizar a situação de uma entidade” (A. K. Dey et al., Understanding and using context, 2001) No caso de Sistemas de Recomendação: - Contexto de usabilidade (pessoa) - Contexto para recomendação (sistema) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 15. User Experience " “Momentary, primarily evaluative feeling (good-bad) while interacting with a product or service.” (Hassenzahl 2008 apud Knijnenburg et al 2012) “Experience is a very dynamic, complex and subjective phenomenon. It depends of upon the perception of multiple sensory qualities f a design, interpreted through filters relating to contextual factors” (Buxton, 2007) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 16. Experiência de Uso (UX) & Sistema de Recomendação" (Aspectos subjetivos) + (Algoritmos de aprendizado)" ! Componentes da UX" Dificuldade! Conforto! Estes fatores não Esforço! Contexto! tem recebido a devida atenção Satisfacão com a escolha! (Knijnenburg et al 2012) Eficiência percebida do sistema! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 17. User Experience " Conteúdo Rapidez Necessidades Sugestões Processo Explorar Expectativas Compartilhar Flexibilidade Intuitividade Semântica Quantidade Controle Disponibilidade Barreiras Custo x Benefício “A good experience varies from person to person, product to product, and task to task, but a good general definition is to define something as ‘usable’ if it is funcional, efficient and desirable to its intend audience.” (Kuniavsky, 2003) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 18. Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 19. Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 20. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 21. Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 22. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 23. Entrevistas, Grupos de Foco, Pesquisa Contextual, Questionários Observação Participativa, Testes de Usabilidade. •  Recrutamento •  Criação de tarefas específicas •  Observação e registro – ferramentas e meios utilizados, sequências de ações, métodos de organização, como são as interações. •  Transferências e compartilhamento de conhecimento Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 24. Escalas de Avaliação Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 25. Escalas de Avaliação Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 26. Escalas de Avaliação •  NPS no celular Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 27. Contexto para Recomendação Comportamento + Ambiente + Interações Informação fluindo dos, e para os, usuários: extraída do conteúdo; inferida das atividades; sensorial; explícita (comentários, bookmarks, etc.) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 28. Contexto para Recomendação Microphone" Camera" GPS" WLAN Accelerometer" positioning" Camera" Databases" Time table" Maps" Documents" Music Catalogue" Websites " Wikipedia" Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 29. Modelos de Contexto Requisitos" Usabilidade do Formalismo de Lidar com Modelagem" Imperfeições" Provisionamento Raciocínio" Eficiente do Contexto" Relacionamentos e Dependências" Timeliness" Heterogeneidade" (Bettini et al., A Survey of Context Modeling and Reasoning Techniques, 2009)! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 30. Contexto Ambiente Conhecimento Atitudes Familiaridade Framework para Avaliação de Sistemas de Recomendação (Knijnenburg et al 2012) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 31. Níveis de Inteligência Contextual From Xerox PARC! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 32. Compreensão do Processo Não em detalhes Etapas em alto nível ! Stern, Herbrich, Graepel 2009! Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 33. Music Intelligence Spearhead (MIS) - Dispositivos móveis estão sempre com os usuários - Ouvir música é bastante pessoal e situacional Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 34. Music Intelligence Spearhead (MIS) •  Podemos usar Contexto para melhorar recomendações de música? •  A aplicação deveria “just work” •  coletar dados contextuais; •  entender o contexto do usuário; •  recomendar quando e o que tocar.! •  Arquitetura e sistema capaz de suportar futuras pesquisas. •  Testes com usuários em quatro países. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 35. Music Intelligence Spearhead (MIS) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 36. MIS - Avaliação •  10 Usuários de música no celular | 18-32 anos •  Entrevistas em profundidade •  Cada usuário, 1 semana de uso •  Lista de tarefas acompanhadas e orientadas de forma presencial e via SMS •  Cada usuário recebeu 80 libras como estímulo para experimentar e comprar novas músicas. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 37. MIS - Avaliação Procedimentos iniciais • Tranferência de 200 músicas • Lista de tarefas para estimular o uso do aplicativo e familiarização com as telas (Percepção inicial) • Instrução sobre os próximos passos da avaliação Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 38. MIS - Resultados Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 39. MIS - Resultados •  A recomendação deveria ser mais rápida. •  A recomendação não foi relevante. •  Gostei! Mas eu não compraria. •  Queria entender como isso funciona. •  Eu gostei, mas não recomendaria para meu amigo. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 40. MIS - Resultados •  Eu gostei mas gostaria de receber mais conteúdos de um gênero específico. •  Superou minhas expectativas •  Interessante, mas gostaria de receber as músicas de acordo com o gênero que estou escutando naquele determinado momento. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 41. MIS - Resultados Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 42. MIS - Resultados Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 43. MIS - Aprendizados •  Quanto mais testes melhor. •  Recompensas e Bônus não foram estímulos significativos. O que realmente importou? Receber o conteúdo de interesse. ! •  A pesquisa deve ser Qualitativa e Quantitativa •  Maior alinhamento com a equipe de software e desenvolvimento para melhorias contínuas e maior controle durante a avaliação destes sistemas. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 44. “So, if we decide that we want to strive for a comparable standard of experience in the products that we are designing, and therefore adopt an appropriate process for doing so, what might that process be? Making a contribution toward answering this question is at heart of what follows.” Bill Buxton (Sketching User Experience) Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 45. Referências KNIJNENBURG, B. P.; WILLEMSEN, M. C.; GARTNER, Z.; SONCU, H.; NEWELL, C. Explaining the user experience of recommender systems. User Modeling and User- Adapted Interaction. October 2012, Volume 22, Issue 4-5. pp 441-504. Disponível em:< http://www.usabart.nl/portfolio/KnijnenburgWillemsen-UMUAI2011_UIRecSy.pdf>. REICHHELD, F. F. A pergunta definitiva 2.0. Como as empresas que implementam o net promoter score prosperam em um mundo voltado aos clientes. Rio de Janeiro: Elsevier, 2011. BUXTON, B. Sketching User Experiences, getting the design right and the right design. San Francisco: Elsevier, 2007. KUNIAVSKY, M. Observing the user experience. San Francisco: Morgan Kaufmann Publishers, 2003. KNIJNENBURG, B. P.; WILLEMSEN, M. C.; KOBSA, A. A Pragmatic Procedure to Support the User-Centric Evaluation of Recommender Systems. Proceedings of the fifth ACM conference on Recommender systems. Chicago, IL, 2011. Disponível em: < http:// www.ics.uci.edu/~kobsa/papers/2011-RecSys-kobsa.pdf>. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 46. Avaliação e testes em Sistemas de Recomendação | Börje Karlsson & Francimar Maciel"
  • 47. Börje:" Fran:" !@tellarin! !@narf2916!