O documento discute técnicas de sistemas de recomendação, incluindo filtragem colaborativa por usuário e produto e recomendação baseada em conteúdo. Também aborda como os dados são coletados, os métodos de avaliação de precisão e tecnologias populares como PredictionIO.
Monitoramento de Mídias Sociais - Cásper Líbero - 07/2015 - parte 03Tarcízio Silva
Disponibilização do material apresentado na terceira parte do curso Monitoramento de Mídias Sociais: Inteligência de Mercado, em 28/07/15, na Casper Líbero.
O documento discute as tendências do varejo, especificamente sobre canais únicos versus múltiplos canais e a conexão entre eles. O documento também fornece o currículo de Thiago Sarraf, um especialista em e-commerce, e discute os desafios e pilares do e-commerce.
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...Arthur Fortes
O documento discute sistemas de recomendação aplicados à web para converter visitantes em compradores. Apresenta os autores e suas formações, define web 1.0, 2.0 e 3.0, explica o que são sistemas de recomendação e como funcionam, e discute como esses sistemas podem ser aplicados no e-commerce para aumentar conversões, vendas e fidelização de clientes.
Este documento apresenta os serviços de uma empresa de consultoria em pesquisa de mercado, descrevendo: 1) suas soluções de insights para consumidores utilizando mídias online e sociais; 2) sua experiência implementando novas metodologias de pesquisa; 3) exemplos de casos com pesquisa etnográfica digital e em pontos de venda.
Saiba como funciona EnqueteFacil.com, um meio simples e econômico de realizar pesquisas de diversos tipos, de satisfação do cliente a testes de produto
[Conferência SANTA CATARINA 2020] Data-driven: como vender mais tendo como no...E-Commerce Brasil
Inteligência Artificial pode ser usada para personalizar a experiência dos clientes e aumentar as vendas no varejo. Apresenta casos de uso de IA para precificar dinamicamente produtos com base em correlações encontradas nos dados, visando maximizar as vendas de cobertores e aumentar as vendas digitais de seguros automotivos.
EBAI2010 - PREDICTA - Etnografia digital | Projeto piloto com mulheres de cla...Juliana Gaiba
Observação da vida online no seu ambiente natural, a própria web. Visa entender a interação com o meio online usando uma ferramenta de observação em tempo real e como isso afeta a vida fora da rede.
Monitoramento de Mídias Sociais - Cásper Líbero - 07/2015 - parte 03Tarcízio Silva
Disponibilização do material apresentado na terceira parte do curso Monitoramento de Mídias Sociais: Inteligência de Mercado, em 28/07/15, na Casper Líbero.
O documento discute as tendências do varejo, especificamente sobre canais únicos versus múltiplos canais e a conexão entre eles. O documento também fornece o currículo de Thiago Sarraf, um especialista em e-commerce, e discute os desafios e pilares do e-commerce.
Sistemas de Recomendação Aplicados a WebComo converter visitantes em comprado...Arthur Fortes
O documento discute sistemas de recomendação aplicados à web para converter visitantes em compradores. Apresenta os autores e suas formações, define web 1.0, 2.0 e 3.0, explica o que são sistemas de recomendação e como funcionam, e discute como esses sistemas podem ser aplicados no e-commerce para aumentar conversões, vendas e fidelização de clientes.
Este documento apresenta os serviços de uma empresa de consultoria em pesquisa de mercado, descrevendo: 1) suas soluções de insights para consumidores utilizando mídias online e sociais; 2) sua experiência implementando novas metodologias de pesquisa; 3) exemplos de casos com pesquisa etnográfica digital e em pontos de venda.
Saiba como funciona EnqueteFacil.com, um meio simples e econômico de realizar pesquisas de diversos tipos, de satisfação do cliente a testes de produto
[Conferência SANTA CATARINA 2020] Data-driven: como vender mais tendo como no...E-Commerce Brasil
Inteligência Artificial pode ser usada para personalizar a experiência dos clientes e aumentar as vendas no varejo. Apresenta casos de uso de IA para precificar dinamicamente produtos com base em correlações encontradas nos dados, visando maximizar as vendas de cobertores e aumentar as vendas digitais de seguros automotivos.
EBAI2010 - PREDICTA - Etnografia digital | Projeto piloto com mulheres de cla...Juliana Gaiba
Observação da vida online no seu ambiente natural, a própria web. Visa entender a interação com o meio online usando uma ferramenta de observação em tempo real e como isso afeta a vida fora da rede.
A Criação de uma Fantástica Experiência de ComprasRakuten Brasil
As melhores práticas para ajudar você a fidelizar clientes através de uma fantástica operação de loja virtual.
Uma vez que o comércio eletrônico está se tornando cada vez mais sofisticado, é cada vez mais importante diferenciar a sua marca da sua loja virtual através de uma fantástica experiência de compras.
Esse curso irá mostrar quais são os passos chaves envolvidos na construção e manutenção de uma incrível experiência de compras online para os clientes da sua loja virtual – levando a fidelidade e engajamento do cliente no longo prazo.
Pesquisas recentes mostram que 80% dos clientes não voltam a comprar em uma loja virtual depois que tiveram uma experiência de compras negativa. Quem pode se dar ao luxo de perder clientes hoje em dia?
O curso é desenhado para explorar as atividades envolvidas na criação e mensuração de experiências online engajadoras, e na melhoria da retenção dos clientes.
Cultura de experimentação na OLX - OLX - Thiago Belluf - Product Camp 2017Product Camp Brasil
Cultura de experimentação na OLX - OLX - Thiago Belluf - Product Camp 2017
Todas as palestras dessa edição foram gravadas e estão disponíveis no Youtube do evento. Acesse: http://bit.ly/youtubedoeventodeproduto
1) A Netquest fornece pesquisas online avançadas e gerenciamento de painéis para institutos de pesquisa de mercado.
2) Eles têm painéis próprios no Brasil, México, Espanha e outros países da América Latina com dezenas de milhares de participantes.
3) A Netquest usa incentivos não monetários e estritas medidas de qualidade para garantir a pureza e representatividade de seus painéis.
O documento fornece orientações sobre como validar uma ideia de negócio, incluindo validar o problema, a solução e o público-alvo por meio de pesquisas qualitativas e quantitativas, observação, entrevistas e protótipos para aprender e ajustar a ideia antes de lançá-la no mercado.
O documento apresenta uma introdução à aprendizagem de máquina para neurociência. Discute categorias de aprendizagem de máquina como supervisionada, não-supervisionada e por reforço e como podem ser aplicadas em neurociência, por exemplo para classificação e redução de dimensionalidade de dados neurológicos. Também descreve as etapas de desenvolvimento de um modelo de aprendizagem de máquina, incluindo coleta e preparação de dados, escolha do modelo, treinamento e avaliação.
O que, por que e como VALIDAR sua ideia - #SWCAXIASDOSULCíntia Citton
O documento discute como validar ideias de negócio através de testes com clientes-alvo. Explica que a validação envolve entender o problema do cliente, testar hipóteses com ferramentas como Google Trends e entrevistas, e iterar com base nos resultados para aperfeiçoar a solução proposta.
O documento discute o monitoramento de redes sociais, definindo-o como o ato de acompanhar e avaliar o que as pessoas estão falando sobre uma marca, produto ou assunto nas redes sociais. Também aborda a importância de monitorar redes sociais para entender a percepção dos consumidores e como as ferramentas gratuitas e pagas podem ser usadas para esse fim.
A empresa oferece pesquisas em tempo real para fornecer informações atualizadas sobre clientes, mercado e concorrência, permitindo que empresas tomem decisões informadas. Eles têm mais de 400 clientes e soluções customizadas para entender necessidades específicas e gerar insights. A empresa conduz pesquisas online de forma anônima para monitorar satisfação, clima e desempenho de vendas.
Experiência do cliente 2.0 Omnichannel e o futuro das lojas fisicas - Sérgio ...E-Commerce Brasil
Sérgio Herz – CEO da Livraria Cultura fala sobre "Experiência do cliente 2.0: Omnichannel e o futuro das lojas físicas" no Congresso de Experiência do Cliente 2014.
5 Formas de Transformar o Google no Maior Ativo da sua Empresa | Magowebinar ...Silvio Tanabe
O documento discute 5 formas de transformar o Google no maior ativo de uma empresa: 1) Avaliar o mercado e as palavras-chave relevantes; 2) Ser relevante para clientes em potencial; 3) Ser encontrado no Google e em outros canais; 4) Mensurar os resultados das estratégias; 5) Fazer um planejamento estratégico considerando pesquisa, produção, publicação e promoção.
1) O documento discute sistemas de recomendação, comparando filtragem colaborativa e baseada em conteúdo.
2) A filtragem colaborativa usa dados de outros usuários para fazer recomendações, enquanto a baseada em conteúdo analisa características dos itens.
3) Sistemas híbridos combinam essas abordagens para superar limitações individuais.
O documento discute os objetivos, etapas e tipos de pesquisa de marketing. A pesquisa pode ser exploratória, descritiva ou causal para avaliar produtos, segmentar mercados, dimensionar oportunidades e avaliar concorrentes. Dados primários e secundários podem ser coletados por questionários, entrevistas ou observações para gerar insights e sugerir ações de marketing.
O documento apresenta uma palestra sobre empreendedorismo em informática. A palestra aborda conceitos como inovação, tendências, mundo online e offline e conhecimento. Apresenta também a agenda da palestra e informações sobre o palestrante.
O documento discute as principais ferramentas de marketing digital como Google e Facebook, abordando tópicos como mercado, públicos-alvo, mensuração de resultados e cases de sucesso. O palestrante também fornece dicas sobre como identificar os usuários-alvo, criar conteúdo relevante e mensurar o retorno sobre o investimento.
O documento discute sistemas de marketing, incluindo sistemas de registros internos, sistemas de informação de vendas, sistemas de inteligência de marketing e sistemas de pesquisa de marketing. Também descreve o processo de pesquisa de marketing, coleta de informações, análise de informações e apresentação de conclusões. Por fim, lista sete características de uma boa pesquisa de marketing.
O documento discute os desafios e benefícios do teste em produção, sugerindo abordagens como A/B testing e ramped deployment para descobrir o comportamento real dos usuários e atender suas necessidades enquanto se lança novos produtos de forma gradual e controlada, mitigando riscos.
O documento discute a jornada do usuário em e-commerces, desde a busca inicial por produtos até a entrega final. Ele destaca a importância de entender cada etapa da jornada para oferecer a melhor experiência personalizada possível ao usuário. Também discute técnicas como recomendação, categorização, prevenção de fraude e logística que podem aprimorar essa jornada.
"Como iniciar e promover seu e commerce com a Plataforma JET ONE"JET e-Commerce
Conteúdo produzido por Thiago Sarraf, consultor de e-commerce, focado na integração JET e All Nations e nas ferramentas de Marketing e Gestão da plataforma JET ONE.
Obter sucesso através das redes sociais [Seminário II, Utad - 15 - 05 - 2012]João Nascimento
O documento discute como a empresa Tecnisa obteve sucesso através das redes sociais, levando a aumentos nos lucros, número de clientes e reconhecimento. O diretor de redes sociais da Tecnisa explica que eles começaram a usar redes sociais por causa da inovação e fácil comunicação, e que estudos prévios sobre cada plataforma são essenciais para o sucesso de uma estratégia de mídia social.
Testes de usabilidade com uma pitada de lean uxQualister
Este documento discute técnicas de testes de usabilidade e Lean UX para validar produtos digitais com usuários, incluindo amostras de experiência, portas falsas e observação. Também compara testes moderados versus não moderados, destacando a importância de recrutar os usuários certos e criar testes que simulem o uso real do sistema.
A linguagem C# aproveita conceitos de muitas outras linguagens,
mas especialmente de C++ e Java. Sua sintaxe é relativamente fácil, o que
diminui o tempo de aprendizado. Todos os programas desenvolvidos devem
ser compilados, gerando um arquivo com a extensão DLL ou EXE. Isso torna a
execução dos programas mais rápida se comparados com as linguagens de
script (VBScript , JavaScript) que atualmente utilizamos na internet
A Criação de uma Fantástica Experiência de ComprasRakuten Brasil
As melhores práticas para ajudar você a fidelizar clientes através de uma fantástica operação de loja virtual.
Uma vez que o comércio eletrônico está se tornando cada vez mais sofisticado, é cada vez mais importante diferenciar a sua marca da sua loja virtual através de uma fantástica experiência de compras.
Esse curso irá mostrar quais são os passos chaves envolvidos na construção e manutenção de uma incrível experiência de compras online para os clientes da sua loja virtual – levando a fidelidade e engajamento do cliente no longo prazo.
Pesquisas recentes mostram que 80% dos clientes não voltam a comprar em uma loja virtual depois que tiveram uma experiência de compras negativa. Quem pode se dar ao luxo de perder clientes hoje em dia?
O curso é desenhado para explorar as atividades envolvidas na criação e mensuração de experiências online engajadoras, e na melhoria da retenção dos clientes.
Cultura de experimentação na OLX - OLX - Thiago Belluf - Product Camp 2017Product Camp Brasil
Cultura de experimentação na OLX - OLX - Thiago Belluf - Product Camp 2017
Todas as palestras dessa edição foram gravadas e estão disponíveis no Youtube do evento. Acesse: http://bit.ly/youtubedoeventodeproduto
1) A Netquest fornece pesquisas online avançadas e gerenciamento de painéis para institutos de pesquisa de mercado.
2) Eles têm painéis próprios no Brasil, México, Espanha e outros países da América Latina com dezenas de milhares de participantes.
3) A Netquest usa incentivos não monetários e estritas medidas de qualidade para garantir a pureza e representatividade de seus painéis.
O documento fornece orientações sobre como validar uma ideia de negócio, incluindo validar o problema, a solução e o público-alvo por meio de pesquisas qualitativas e quantitativas, observação, entrevistas e protótipos para aprender e ajustar a ideia antes de lançá-la no mercado.
O documento apresenta uma introdução à aprendizagem de máquina para neurociência. Discute categorias de aprendizagem de máquina como supervisionada, não-supervisionada e por reforço e como podem ser aplicadas em neurociência, por exemplo para classificação e redução de dimensionalidade de dados neurológicos. Também descreve as etapas de desenvolvimento de um modelo de aprendizagem de máquina, incluindo coleta e preparação de dados, escolha do modelo, treinamento e avaliação.
O que, por que e como VALIDAR sua ideia - #SWCAXIASDOSULCíntia Citton
O documento discute como validar ideias de negócio através de testes com clientes-alvo. Explica que a validação envolve entender o problema do cliente, testar hipóteses com ferramentas como Google Trends e entrevistas, e iterar com base nos resultados para aperfeiçoar a solução proposta.
O documento discute o monitoramento de redes sociais, definindo-o como o ato de acompanhar e avaliar o que as pessoas estão falando sobre uma marca, produto ou assunto nas redes sociais. Também aborda a importância de monitorar redes sociais para entender a percepção dos consumidores e como as ferramentas gratuitas e pagas podem ser usadas para esse fim.
A empresa oferece pesquisas em tempo real para fornecer informações atualizadas sobre clientes, mercado e concorrência, permitindo que empresas tomem decisões informadas. Eles têm mais de 400 clientes e soluções customizadas para entender necessidades específicas e gerar insights. A empresa conduz pesquisas online de forma anônima para monitorar satisfação, clima e desempenho de vendas.
Experiência do cliente 2.0 Omnichannel e o futuro das lojas fisicas - Sérgio ...E-Commerce Brasil
Sérgio Herz – CEO da Livraria Cultura fala sobre "Experiência do cliente 2.0: Omnichannel e o futuro das lojas físicas" no Congresso de Experiência do Cliente 2014.
5 Formas de Transformar o Google no Maior Ativo da sua Empresa | Magowebinar ...Silvio Tanabe
O documento discute 5 formas de transformar o Google no maior ativo de uma empresa: 1) Avaliar o mercado e as palavras-chave relevantes; 2) Ser relevante para clientes em potencial; 3) Ser encontrado no Google e em outros canais; 4) Mensurar os resultados das estratégias; 5) Fazer um planejamento estratégico considerando pesquisa, produção, publicação e promoção.
1) O documento discute sistemas de recomendação, comparando filtragem colaborativa e baseada em conteúdo.
2) A filtragem colaborativa usa dados de outros usuários para fazer recomendações, enquanto a baseada em conteúdo analisa características dos itens.
3) Sistemas híbridos combinam essas abordagens para superar limitações individuais.
O documento discute os objetivos, etapas e tipos de pesquisa de marketing. A pesquisa pode ser exploratória, descritiva ou causal para avaliar produtos, segmentar mercados, dimensionar oportunidades e avaliar concorrentes. Dados primários e secundários podem ser coletados por questionários, entrevistas ou observações para gerar insights e sugerir ações de marketing.
O documento apresenta uma palestra sobre empreendedorismo em informática. A palestra aborda conceitos como inovação, tendências, mundo online e offline e conhecimento. Apresenta também a agenda da palestra e informações sobre o palestrante.
O documento discute as principais ferramentas de marketing digital como Google e Facebook, abordando tópicos como mercado, públicos-alvo, mensuração de resultados e cases de sucesso. O palestrante também fornece dicas sobre como identificar os usuários-alvo, criar conteúdo relevante e mensurar o retorno sobre o investimento.
O documento discute sistemas de marketing, incluindo sistemas de registros internos, sistemas de informação de vendas, sistemas de inteligência de marketing e sistemas de pesquisa de marketing. Também descreve o processo de pesquisa de marketing, coleta de informações, análise de informações e apresentação de conclusões. Por fim, lista sete características de uma boa pesquisa de marketing.
O documento discute os desafios e benefícios do teste em produção, sugerindo abordagens como A/B testing e ramped deployment para descobrir o comportamento real dos usuários e atender suas necessidades enquanto se lança novos produtos de forma gradual e controlada, mitigando riscos.
O documento discute a jornada do usuário em e-commerces, desde a busca inicial por produtos até a entrega final. Ele destaca a importância de entender cada etapa da jornada para oferecer a melhor experiência personalizada possível ao usuário. Também discute técnicas como recomendação, categorização, prevenção de fraude e logística que podem aprimorar essa jornada.
"Como iniciar e promover seu e commerce com a Plataforma JET ONE"JET e-Commerce
Conteúdo produzido por Thiago Sarraf, consultor de e-commerce, focado na integração JET e All Nations e nas ferramentas de Marketing e Gestão da plataforma JET ONE.
Obter sucesso através das redes sociais [Seminário II, Utad - 15 - 05 - 2012]João Nascimento
O documento discute como a empresa Tecnisa obteve sucesso através das redes sociais, levando a aumentos nos lucros, número de clientes e reconhecimento. O diretor de redes sociais da Tecnisa explica que eles começaram a usar redes sociais por causa da inovação e fácil comunicação, e que estudos prévios sobre cada plataforma são essenciais para o sucesso de uma estratégia de mídia social.
Testes de usabilidade com uma pitada de lean uxQualister
Este documento discute técnicas de testes de usabilidade e Lean UX para validar produtos digitais com usuários, incluindo amostras de experiência, portas falsas e observação. Também compara testes moderados versus não moderados, destacando a importância de recrutar os usuários certos e criar testes que simulem o uso real do sistema.
Semelhante a Introdução aos sistemas de recomendação usando Machine Learning (20)
A linguagem C# aproveita conceitos de muitas outras linguagens,
mas especialmente de C++ e Java. Sua sintaxe é relativamente fácil, o que
diminui o tempo de aprendizado. Todos os programas desenvolvidos devem
ser compilados, gerando um arquivo com a extensão DLL ou EXE. Isso torna a
execução dos programas mais rápida se comparados com as linguagens de
script (VBScript , JavaScript) que atualmente utilizamos na internet
As classes de modelagem podem ser comparadas a moldes ou
formas que definem as características e os comportamentos dos
objetos criados a partir delas. Vale traçar um paralelo com o projeto de
um automóvel. Os engenheiros definem as medidas, a quantidade de
portas, a potência do motor, a localização do estepe, dentre outras
descrições necessárias para a fabricação de um veículo
Introdução aos sistemas de recomendação usando Machine Learning
1. Como a e a sabem
o que quer comprar e assistir?
@MumHaBR
#recommendersystems
#datascience
#predictionIO
https://br.linkedin.com/in/rafaelleonhardt
2. • inteligência artificial
• algoritmos e técnicas que aprendem
• extrai regras e padrões
• mineração de dados e estatísticas
Fonte: https://pt.wikipedia.org/wiki/Aprendizado_de_máquina
3. Áreas de aplicação
LOGÍSTICA
manutenção
rota de entrega
self-driver
carregamento
gestão de risco
ACESSO & SEGURANÇA
identificação
reconhecimento
monitoramento
robôs autônomos
ERP
manutenção
anti-fraude
otimização
ações automáticas
vendas
e-commerce
RH
turn-over
contratações
promoção
treinamentos
7. Métodos comuns
SUPERVISIONADO NÃO SUPERVISIONADO
Na cesta tem:
• Maça (vermelha, médio),
• Uva (verde, pequeno)
• Banana (amarela, médio), etc.
Classificações: Maça, Uva, Banana, etc
Não sei o que tem na cesta.
Atributos: cor, tamanho, etc
Grupos: A, B, C, D, E, F, etc
11. Coleta de dados – EXPLÍCITA
[ ? ] Eu possuo
[ ? ] Não tenho interesse
[ ? ] Avalie este item
[ ? ] Classificação
[ ? ] Minha lista
[ ? ] Gosto de: ação, suspense, etc
12. Vocês são sinceros ao avaliar um produto?
Gera recomendações de alta qualidade
SEMPRE avaliam um produto?
Geralmente avaliamos poucos itens.
O que os motiva avaliarem?
Geralmente nos extremos: muito bom ou muito ruim.
Quantos filmes e séries faltam assistir para “ZERAR” o Netflix?
Um usuário consome um % pequeno de itens e avalie menos ainda.
Coleta de dados – EXPLÍCITA
13. Coleta de dados – IMPLÍCITA
[ ! ] Porque você comprou “It´s so easy”
[ ! ] Porque você visualizou “X”
[ ! ] Porque você compartilhou “Y”
[ ! ] Porque você assistiu “Marco Polo”
Outras formas:
• Tipo do dispositivo utilizado
• Browser utilizado
• Região de onde está acessando
• Histórico de navegação
14. Em um site, quais informações eles sabem de vocês?
Eles sabem, gostem ou não. (Celular, Browser, Cidade, Horário, Navegação, etc)
Vocês já compraram algo que não era para vocês?
Eu comprei o livro Slash e o Peppa Pig.
Logo, quem gosta de Guns gosta de Peppa?
Mais alguém da casa usa sua conta?
Eu escuto Guns N Roses e minha filha Xuxa.
Coleta de dados – IMPLÍCITA
Como resolver?
- detectar ações fora do padrão e ignorar
- permitir aos usuários corrigirem
20. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
21. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
Problemas
• Novos produtos e usuários
22. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
Problemas
• Novos produtos e usuários
• Itens populares
23. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
Problemas
• Novos produtos e usuários
• Itens populares
• Esparcidade
(avaliações do usuário X qtde produtos)
24. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
Problemas
• Novos produtos e usuários
• Itens populares
• Esparcidade
• Maior processamento - 18 milhões de usuários
25. Técnica – Filtragem Colaborativa por Usuário
Vantagens
• Não precisa de detalhes sobre os itens (produtos)
• Usuários geram mais informações voluntariamente
Problemas
• Novos produtos e usuários
• Itens populares
• Esparcidade
• Maior processamento
• Precisa de um volume grande de avaliações do usuário para ser assertivo
30. Técnica – Filtragem Colaborativa por Produto
Vantagens
• Não precisa de detalhes sobre os produtos
• Menos processamento
• Menor esparcidade
• Não precisa recalcular as similaridade toda hora
Problemas
• Novos produtos e usuários
• Itens populares
• Mais complexo
31. Técnica – Baseada em Conteúdo
Suspense
Ação
Violência
Suspense
Violência
Sitcom
Humor
Desenho
Humor
Infantil
série dramática
e pós-
apocalíptica co
m zumbis;
sobre os
primeiros anos
de Marco Polo
no Império
Mongol
Sitcom sobre
grupo de
amigos que
vivia em Nova
York
Série britânica
de desenhos
animados para
crianças em
idade pré-
escolar
Termo Frequência Relevância
Suspense 2 8
Violência 2 8
Humor 2 8
Desenho 1 10
Amigos 1 10
de 3 6
Etc ...
TF-IDF
33. Técnica – Baseada em Conteúdo
Vantagens
• Não depende de dados de outros usuários
• Novos produtos e não populares podem ser recomendados
Problemas
• Difícil identificar quais atributos são importantes descrever
• Novos usuários
• Mesmos itens (itens de maior relevância)
35. Como avaliar a precisão?
• Mean Absolute Error
• Mean Squared error
• Root Mean Squared Error
Acurácia
quanto a recomendação foi assertiva
Cobertura
% de produtos e usuários com
recomendação
Diversidade
variedade de produtos
recomendados
sub-campo da inteligência artificial
focado em algoritmos e técnicas que permitam ao computador aperfeiçoar seu desempenho em uma tarefa (melhorar o resultado)
raciocínio indutivo - extrai regras e padrões de grandes conjuntos de dados
“ligado” à mineração de dados.
O raciocínio dedutivo, chega a conclusões. Por exemplo, todo pássaro voa; papagaio é um pássaro. Logo papagaio voa.
Diferença entre
- mineração de dados descobre padrões e conhecimento previamente desconhecidos.
aprendizado de máquina reproduz padrões e conhecimento conhecidos aplicado a novos dados
Deep learning usa redes neurais para entender padrões mais complexos. Usado no reconhecimento de imagens, textos e voz, tradução automática, etc.
RH – gap de treinamentos, recomendar treinamentos,
Acessar uma catraca em determinado momento fora do comum é um alerta de segurança?
Uma pessoa que normalmente acessa alguns locais em um horário fora do comum acessa outro local? É um alerta?
Carrinho:
Verajo: um pedido pode ser um pgto de fraudulento?
HelpDesk – perceber o tom da escrita dos chamados ou de uma ligação de voz?
Busca dentro dos sistemas, “folha de pagamento”
Carros dirigindo sozinho
Medindo o que as pessoas estão dizendo nas redes sociais
Deteccao de fraude em pgto
Previsão de falhas em equipamentos na manutafura e logística, manutenção preventiva
Recomhecimento de imagens
Ronda de vigilantes, o vigia faz uma rota fora do comum – analise em tempo real.
O que são os sistemas de recomendação?
Vamos ver uma introdução aos sistemas de recomendação...
Onde uma das técnicas mais comuns utilizadas esta o Machine Learning.
Mail marketing
Carrinho abandonado
E-commerce
Força de vendas
Simulação de novos produtos
Classifica no supervisionado.
Agrupa no não supervisionado.
Dois métodos comuns usados em recomendação.
http://www.sas.com/pt_br/insights/analytics/machine-learning.html
http://pt.slideshare.net/AmazonWebServicesLATAM/webinar-amazon-machine-learning?qid=7a2f4a74-039e-44b9-a068-abaed06515fd&v=&b=&from_search=12
Supervisionado
Não supervisionado
Dados não rotulados
Mostra uma imagem de maça mas não diz que aquilo é uma maça
Supervisionado
O sistema recebe um conjunto de dados que já se sabe a resposta correta.
Controle de fraude – já houve casos positivos e negativos de fraude. Ele aprende com o histórico para prever o futuro.
Previsa de casos positivos e negativos.
KNN muito usado.
Não supervisionado
Segmentos de clientes parecidos para uma campanha de marketing
Em pesquisas de texto
Por Reforço
Evolutivo -
Clientes não registrados
Clientes registrados
Primeiro passo é coletar dados.
- Geram recomendações de excelente qualidade
Quase nunca avaliam. O algoritmo depende do usuário tomar uma ação.
Avaliam quando gostam ou não gostam MUITO, apenas nos extremos.
Normalmente consumimos um percentual pequeno do que tem disponível. E avaliamos menos ainda. Espacidade.
Simplesmente uso o serviço e ele vai coletando e armazenando informações.
Vantagens
Vocês sabem quais informações suas estão sendo armazenadas?
Não depende de ação extra do usuário
Desvantagens
- Amazon acha que eu gosto de livros sobre Guns N Roses e Peppa Pig. Se outro usuário gosta de Guns N Roses significa que também gosta de Peppa Pig?
- Netlix acha que eu gosto de Breaking Bad e Peppa Pig
Vantagens – criar a imagem acessando de um iphone e destacar as informações que podem ser coletadas
dispositivo, resolução, pelo IP a cidade, histórico de navegação, o que poe no carrinho de compra.
desenhar na mão.
Spotify – o Spotify acha que eu gosto de Heavy Metal e Xuxa.
Netflix – que eu gosto de Walking Dead e Pepa Pig
Tecnica para evitar isso é excluir os extremos ou itens que tem poucas combinações.
Filtragem Colaborativa e Baseado em Conteúdo.
Tambem chamado de Baseado em Memória.
Visão simplificada dos algoritmos.
Tambem chamado de Baseado em Memória.
Calculos de similaridade: coseno, distancia euclidiana, correlação do coeficiente de Pearson, coeficiente de jaccard
Então usa o K-nn para descobrir os vizinhos mais próximos. ALS
Tambem chamado de Baseado em Memória.
O que os vizinhos mais próximos gostaram?
Montado uma lista de recomendações para o usuário.
Esparcidade – um usuário consome um percentual pequeno dos produtos, e avalia menos ainda.
Como melhorar.
Colocar a planilha do slide anterior simulando as vantagens e desvantagens.
Esparcidade – um usuário consome um percentual pequeno dos produtos, e avalia menos ainda.
Colocar a planilha do slide anterior simulando as vantagens e desvantagens.
Esparcidade – um usuário consome um percentual pequeno dos produtos, e avalia menos ainda.
Colocar a planilha do slide anterior simulando as vantagens e desvantagens.
Esparcidade – um usuário consome um percentual pequeno dos produtos, e avalia menos ainda.
Maior processamento – criar a matriz incluindo todos os usuários, quando alguém dá um voto teria que recalcular.
Colocar a planilha do slide anterior simulando as vantagens e desvantagens.
Esparcidade – um usuário consome um percentual pequeno dos produtos, e avalia menos ainda.
De modo geral baseado em produto é melhor que o baseado em usuário.
Amazon: ~353 milhões de produtos / 350 milhões de clientes ativos em 2015
Mais complexo para definir o modelo.
Menos processamento, considerando que há mais clientes do que produtos.
Menor esparcidade pois geralmente um produto vai ter mais clientes que um cliente vai ter de produtos. Cada item geralmente tem um ou mais clientes que compraram.
Netflix tem 60000 produtos, spotify são 20 bilhões de produtos.
Porque netflix não usa essa? Perfil impacta mais pra Netflix do que na Amazon. Na amazona produtos comprados juntos podem melhorar a venda. Resposta mais a frente em hibrida.
Recomenda itens baseados no histórico do usuário. Por exemplo, avaliando os atributos dos itens já consumidos para sugerir algo com as mesmas características.
Recomenda itens baseados na pesquisa.
Pesquisar por: DE + AMIGOS – sugere amigos primeiro pois tem maior peso.
Ao pesquisar por humor
Atributos dos itens: diretor, atores,
Google AdSense usa baseado em conteúdo por exemplo no Gmail, baseado no conteúdo do email ou da pesquisa que está fazendo ou de um post em um blog.
TF-IDF
Term-frequency : qto mais o termo aparece maior a relevancia
Inverse-Document-Frequency: qto mais aparicoes em outros documentos menor é a relevancia
Recomenda itens baseados no histórico do usuário. Por exemplo, avaliando os atributos dos itens já consumidos para sugerir algo com as mesmas características.
Recomenda itens baseados na pesquisa.
Pesquisar por: DE + AMIGOS – sugere amigos primeiro pois tem maior peso.
Ao pesquisar por humor
Atributos dos itens: diretor, atores,
Google AdSense usa baseado em conteúdo por exemplo no Gmail, baseado no conteúdo do email ou da pesquisa que está fazendo ou de um post em um blog.
TF-IDF
Term-frequency : qto mais o termo aparece maior a relevancia
Inverse-Document-Frequency: qto mais aparicoes em outros documentos menor é a relevancia
Novos usuários – até consumir ou pesquisar um primeiro produto.
Todos eles acabam usando mais de uma técnica em algum momento.
Média ponderada é dado um peso para cada um.
Quantos itens diferentes (variedade) é recomendado nas Top-10 para os usuários?
Variedade – não recomendar dois itens muito similares, colocar outro no lugar.
MAE - Erro médio absoluto
MSE - Erro Médio Quadrático
RMSE - Raiz do Erro Médio Quadrático
RMSE:
Puv – avaliação recomendada para o item
Ruv – avaliação real do usuário para o item
N – quantidade de previsões feitas
Machine Learning as a Service
Outros, como taxa de churn, recomendação de musica, etc.