SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
ESTUDO COMPARATIVO DE APLICAÇÕES EM
MINERAÇÃO DE DADOS APLICADA A SISTEMAS
DE RECOMENDAÇÃO
CÁSSIO ALAN GARCIA - cassioalangarcia@gmail.com
UNIVERSIDADE DE SANTA CRUZ DO SUL - UNISC
REJANE FROZZA - frozza@unisc.br
UNIVERSIDADE DE SANTA CRUZ DO SUL - UNISC
Resumo:

NOS SISTEMAS DE RECOMENDAÇÃO, A MINERAÇÃO DE DADOS
CONTRIBUI DE FORMA A IDENTIFICAR O PERFIL DO USUÁRIO,
INDICANDO QUAL CONTEÚDO PROVAVELMENTE É RELEVANTE, COM
BASE NOS SEUS INTERESSES E NECESSIDADES. POSSÍVEIS ÁREAS A
SEREM MAIS PROFUNDAMEENTE EXPLORADAS SÃO AS DE
RECOMENDAÇÃO DE PRODUTOS (E-COMMERCES), RECOMENDAÇÃO
DE PESSOAS (POR EXEMPLO, EM AMBIENTES DE APRENDIZADO
COLABORATIVO, OU ENTÃO NA ÁREA DE RECURSOS HUMANOS),
RECOMENDAÇÃO DE SERVIÇOS, ENTRE OUTRAS. ESTE ARTIGO
APRESENTA UM ESTUDO SOBRE MINERAÇÃO DE DADOS E SISTEMAS
DE RECOMENDAÇÃO, ABORDANDO SEUS CONCEITOS E DEFINIÇÕES,
SEGUIDO DE UMA PESQUISA DE TRABALHOS RELACIONADOS ÀS
ÁREAS. A FIM DE RESSALTAR CARACTERÍSTICAS DESTAS TÉCNICAS,
COM O OBJETIVO DE DESENVOLVER UMA ARQUITETURA HÍBRIDA
FUNDAMENTADA EM UM SISTEMA DE RECOMENDAÇÃO APOIADO
POR TÉCNICAS DA MINERAÇÃO DE DADOS, ELABOROU-SE QUADROS
COMPARATIVOS DOS TRABALHOS RELACIONADOS PARA ANÁLISE
DESTAS CARACTERÍSTICAS.

Palavras-chaves: MINERAÇÃO DE DADOS; SISTEMA DE RECOMENDAÇÃO;
COMÉRCIO ELETRÔNICO
Área:
8 - GESTÃO DO CONHECIMENTO ORGANIZACIONAL
Sub-Área: 8.2 - GESTÃO DA TECNOLOGIA
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

COMPARATIVE STUDY OF APPLICATIONS IN DATA
MINING APPLIED TO RECOMMENDATION
SYSTEMS
Abstract: DATA MINING HELPS TO IDENTIFY THE USER´S PROFILE IN
RECOMMENDATION SYSTEMS, INDICATING WHAT CONTENT IS
RELEVANT, BASED ON THEIR INTERESTS AND NEEDS. POSSIBLE
AREAS TO BE EXPLORED ARE THE PRODUCT RECOMMENDATION (ECOMMERCES), RECOMMENDATIONN OF PEOPLE (FOR EXAMPLE, IN
COLLABORATIVE LEARNING ENVIRONMENTS, OR IN THE AREA OF
HUMAN RESOURCES), RECOMMENDATION OF SERVICES, AMONG
OTHER. THIS PAPER PRESENTS A STUDY ABOUT DATA MINING AND
RECOMMENDATION SYSTEMS, COVERING ITS CONCEPTS AND
DEFINITIONS, FOLLOWED BY RESEARCH OF RELATED WORK.
COMPARATIVE TABLES WERE DEVELOPED AIMING TO HIGHLIGHT
CHARACTERISTICS OF THIS TECHNIQUES. THE OBJECTIVE IS
DEVELOPING A HYBRID ARCHITECTURE USING RECOMMENDATION
SYSTEM AND DATA MINING.
Keyword: DATA MINING; RECOMMENDATION SYSTEM; ELETRONIC COMMERCE

2
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

1 Introdução
Sistema de Recomendação, de modo geral, caracteriza-se por indicar serviços
(produtos, itens, livros, investimentos, entre outros) a usuários, conforme perfil determinado
através de informações coletadas diretamente com o usuário ou por meio de monitoramento
das interações.
Um sistema de recomendação pode ter um grande aliado, possibilitando utilizar, de
forma mais eficiente, os dados coletados do usuário. Trata-se da Mineração de Dados.
Processo esse que trata de uma extração de informações de forma inteligente, não sendo
possível realizá-la por meio de consultas simples em bancos de dados.
Em ambientes de busca, devido ao grande volume de informações na Internet, os
Sistemas de Recomendação podem ajudar a refinar os resultados e minimizar o tempo de
busca, fornecendo um retorno de pesquisa de forma individualizada e ágil, apresentando
retornos realmente relevantes ao usuário (JESUS; ESCOBAR, 2011).
A Mineração de Dados, além de auxiliar, se torna uma necessidade, devido ao grande
volume de informações que são geradas diariamente nas organizações.
O artigo está organizado da seguinte forma: a seção 2 aborda a fundamentação teórica
sobre mineração de dados e sistemas de recomendação; na seção 3 é apresentada a
metodologia do trabalho com a análise dos trabalhos relacionados. Por fim, são apresentadas
as considerações finais.
2 Fundamentação Teórica
Os principais assuntos envolvidos nesta pesquisa são descritos nas seções a seguir.
2.1 Mineração de Dados
A Mineração de Dados mesmo sendo considerada sinônimo de KDD (Knowledge
Discovery in Databases) – Descoberta (ou Extração) de Conhecimento em Bases de Dados é, especificamente, uma etapa deste grande processo.
Segundo Fayad et al (1996), “Extração de Conhecimento em Base de Dados é o
processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis
embutidos nos dados”. Para isso são utilizadas técnicas de diversas áreas do conhecimento,
como estatística, matemática, bancos de dados, inteligência artificial, visualização de dados e
reconhecimento de padrões (CASTANHEIRA, 2008).
Os principais termos envolvidos neste processo são descritos por Rezende (2003)
como:
 Dados: Conjunto de fatos ou casos em uma base de dados.
 Padrões: Abstrações de um conjunto de dados em uma linguagem descritiva de conceitos.
 Processo: Busca de padrões e avaliação do conhecimento, sendo dividida em várias
etapas.
 Válidos: Resultados devem satisfazer restrições/testes pré-definidos.
 Novos: Os padrões encontrados devem ter certo grau de novidade.
 Compreensíveis: Deve haver uma forma de análise mais profunda dos dados e padrões
descobertos.
 Conhecimento: Fortemente relacionado com medidas de utilidade, originalidade e
compreensão.

3
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

Ao ser explorada a área de Descoberta de Conhecimento, remete-se aos níveis
hierárquicos da informação (MORESI, 2000) que são descritos a seguir:
 Dados: Classe mais baixa da informação, constituindo representações de fotos, textos,
gráficos imagens, sons, entre outros. Ou seja, dados são sinais que não foram processados,
integrados, avaliados ou interpretados, constituindo assim a matéria-prima para a produção de
informação.
 Informação: A informação são os dados que passaram por um processamento e que
podem, desta forma, ser compreensíveis às pessoas. Podem ser classificados como informação
a exibição de um arquivo textual ou gráfico, uma fotografia revelada, entre outros. Através da
interpretação e integração de vários dados e informações, obtém-se o conhecimento.
 Conhecimento: São informações analisadas e avaliadas, sendo confiáveis, relevantes e
importantes. É fruto da combinação de informações, sendo por meio deste que pessoas
responsáveis por tomadas de decisões buscam uma compreensão mais efetiva da situação do
problema.
 Inteligência: É o conhecimento que foi sintetizado e aplicado a uma determinada situação
para entendê-la melhor, ou seja, a informação sintetizada e relevante ao contexto do
problema.
Considerando tais níveis da informação, a mineração de dados atua sobre os dados
armazenados nas bases, buscando por padrões úteis e compreensíveis para que seja gerado o
conhecimento.
O processo de KDD é composto pelas seguintes etapas (REZENDE, 2003):
Identificação do problema, Pré-Processamento, Extração de Padrões, Pós-Processamento,
conforme Figura 1.

Figura 1 - Etapas do processo de KDD. Fonte: (REZENDE, 2003)

Na Identificação do Problema, são determinados os objetivos e metas a serem
alcançados no processo de Data Mining através do estudo do domínio da aplicação,
mostrando-se necessário o pleno conhecimento deste (REZENDE, 2003).
Na segunda etapa, chamada Pré-Processamento, trata-se da limpeza dos dados e
redução de volume, para que seja reduzido o tempo de processamento e a utilização de
memória feita pelos algoritmos de mineração (REZENDE, 2003).
A Extração de Padrões é a fase de Mineração de Dados propriamente dita. Nesta fase
é escolhida a tarefa e definido o algoritmo a ser utilizado, podendo ser executado mais de uma
4
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

vez, já que esta etapa é um processo iterativo, para que haja a extração de padrões
(REZENDE, 2003).
O Pós-Processamento é o momento em que os conhecimentos são interpretados e
utilizados em processos de tomada de decisão ou em Sistemas Inteligentes, sendo possível
retornar a qualquer etapa anterior.
As medidas de desempenho (precisão, velocidades, entre outras) também são
executadas nesta fase, podendo, caso necessário, ajustar parâmetros e voltar a alguma etapa
anterior para ser executada novamente.
2.1.1 Tarefas de Mineração de Dados
Em função do objetivo a ser alcançado é feita a escolha da tarefa, que pode ser
classificada em preditiva ou descritiva (REZENDE, 2003), para aplicação sobre a base de
dados.
Nas tarefas preditivas, a abordagem é botton-up, ou seja, a pesquisa é feita de forma
a encontrar padrões frequentes, tendências e generalizações, a fim de encontrar informações
implícitas nos dados (SANTOS e AZEVEDO, 2005).
As tarefas descritivas possuem abordagem top-down, onde existem hipóteses
previamente formuladas que são testadas para a verificação da sua veracidade. Esta
abordagem busca encontrar respostas que confirmem ou neguem as hipóteses, enquanto que a
anterior revela informações que não haviam sido imaginadas, gerando as próprias hipóteses
(SANTOS e AZEVEDO, 2005).
A escolha da(s) tarefas(s) a ser(em) utilizada(s) na etapa de Mineração de Dados é
feita em função dos objetivos a serem alcançados, por isso não há como definir uma tarefa
que seja mais eficiente em qualquer situação. Uma vez definida a tarefa, escolhe-se a técnica a
ser empregada.
A seguir, são descritas algumas tarefas comumente utilizadas:
 Classificação (tarefa de predição)
A tarefa de Classificação mapeia dados de entrada em um número finito de classes,
de forma a criar uma relação de cada exemplo com certa classe. Utiliza-se destas relações
para predizer a classe de um novo e desconhecido exemplo (REZENDE, 2003).
Fayyad (1996) cita o exemplo de classificação de clientes de um banco,
classificando-os em possíveis bons pagadores ou maus pagadores, podendo, com isso,
determinar se deve conceder crédito ao cliente ou não.
 Regressão (tarefa de predição)
Esta tarefa é bastante semelhante à anterior, diferenciando-se apenas no fato de que o
atributo a ser predito é contínuo em vez de discreto (REZENDE, 2003).
Castanheira (2008) define o objetivo da tarefa de regressão que é “encontrar a
relação entre um conjunto de atributos de entrada e um atributo-meta contínuo”. Ainda cita o
seguinte exemplo: sendo o atributo de entrada X = {x1, x2, ..., xn}, e y o atributo-meta, a
tarefa de regressão procura buscar um mapeamento y = f(x1, x2, ..., xn}.
 Clustering ou Agrupamento (tarefa de descrição)
Busca detectar a existência de diferentes grupos, ou clusters, dentro de um
determinado conjunto de dados, baseando-se em medidas de similaridade ou modelos

5
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

probabilísticos, determinando quais são estes grupos, caso existam, dividindo grupos
heterogêneos em sub grupos homogêneos. Dados com atributos (ou um subconjunto de
atributos escolhidos) parecidos são agrupados/segmentados no mesmo cluster, podendo ainda
um dado estar classificado em mais de um cluster (SFERRA e CORRÊA, 2003) (REZENDE,
2003).
 Regras de associação ( tarefa de descrição)
Esta tarefa faz o levantamento de quanto um conjunto de atributos contribui para a
presença de outro conjunto. Na área de marketing é também conhecida como “análise de
cestas de venda”, havendo um estudo de como os itens estão relacionados. Pode ser aplicada
em estudos de preferências, tentando descobrir afinidades entre itens, para, por exemplo, criar
pacotes de vendas para os consumidores. Esta atividade serve como exemplo para a teoria de
que a presença de um item em uma transação implica na presença de outro, sendo que o banco
de dados é visto como uma coleção de transações em que cada uma envolve um conjunto de
itens (CORTES et al, 2002).
A regra de associação possui dois lados, o direito e o esquerdo (X  Y) que significa
que se X existe em alguma transação, há uma determinada possibilidade de Y existir também
(REZENDE, 2003).
 Sumarização (tarefa de descrição)
Segundo Rezende (2003), “a Sumarização envolve métodos para encontrar uma
descrição compacta para um subconjunto de dados”. Tal descrição identifica e apresenta de
forma concisa e compreensível as principais características dos dados em um conjunto de
dados. A técnica de visualização é uma função de Sumarização que é necessária para se obter
um entendimento intuitivo do conjunto de dados, fazendo uso de diagramas, baseados em
proporção e dispersão, histogramas, entre outros (SFERRA e CORRÊA, 2003).
Com tarefas como as supracitadas, os Sistemas de Recomendação fornecem uma
alternativa às interfaces das tecnologias de filtragem e recuperação de informações,
diferenciando-se pela predição dos conteúdos interessantes e úteis ao usuário (LOPES, 2007).
2.2 Sistema de Recomendação
Um Sistema de Recomendação (SR) busca criar um ambiente personalizado para
cada usuário. O caso mais conhecido é o de comércio eletrônico (e-commerce), com base nas
informações absorvidas pelo sistema de forma explícita e/ou implícita, sendo que a primeira
se dá através de, por exemplo, um cadastro de usuário, em que ele define seus gostos e
preferências. Já a segunda forma se dá através de análise de comportamento do usuário, como
produtos adquiridos anteriormente, caminhos (links) percorridos pelo usuário dentro do site
(logs), rating de produtos, entre outros. Com o uso destes dados, SR podem recomendar
produtos, informações, serviços ou pessoas.
Os SR podem ser classificados, quanto a sua forma, em dois grupos: Baseados em
Conteúdo, que recomendam itens semelhantes àqueles relacionados com um usuário alvo,
recomendando itens individualmente e partindo do princípio de que usuários tendem a se
interessar por itens similares aos que demonstraram interesse anteriormente; e Colaborativos
que se relacionam com usuários que possuem interesses em comum com o usuário em
questão, efetuando a recomendação a grupos de usuários semelhantes, levando em conta que é
comum pessoas recomendarem ou pedir recomendação de itens de qualquer natureza, ficando,
assim, a encargo do SR fazer o processo “boca-a-boca” (SERRANO, 2003), (LICHTNOW,
2006).
6
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

2.3 Coleta de dados implícita e explícita
A busca de informações sobre o usuário ocorrer de forma explícita e/ou implícita.
Na primeira forma, o usuário preenche um formulário ao se cadastrar referente a
dados pessoais, preferências, interesses, ou de alguma forma indica espontaneamente o que
lhe interessa. Este processo demanda tempo do usuário, sem falar na inexistência de confiança
no sistema por parte do usuário para que forneça informações pessoais.
Já na coleta de informações implícita, é interpretado, por exemplo, o comportamento
(navegação) do usuário dentro do sistema, obtendo-se assim informações sobre suas
necessidades e preferências. Isto sem a interferência do usuário e sem a implicação de ter de
estar preenchendo formulários para que sejam feitas as recomendações (CAZELLA et al,
2010).
2.4 Tipos de Sistemas de Recomendação (ou Técnicas de Filtragem)
Sistemas de Recomendação, na área comercial, buscam a fidelidade dos clientes para
assim aumentar a lucratividade das empresas. Sendo assim, criaram-se estratégias de
recomendação para se alcançar esses objetivos. De forma ampla, podem-se ser citadas as
estratégias de listas de recomendação, em que são criadas listas de itens sem a análise mais
profunda dos dados, recomendado listas de itens mais vendidos, por exemplo, tendo como
principal vantagem a simplicidade de implementação e por outro lado a desvantagem de que
são listas fixas para todos os clientes; as avaliações de usuário são outro tipo de estratégia em
que os usuários avaliam e comentam itens; outra forma de recomendação é a criação de uma
página exclusiva para isto (CAZELLA; REATEGUI, 2005).
2.4.1 Filtragem baseada em conteúdo
A filtragem baseada em conteúdo tem esse nome pelo fato de os sistemas que a
utilizam realizam uma filtragem baseada em análises dos conteúdos dos itens que podem ser
recomendados com base no perfil do usuário (LOPES, 2007). O perfil dos itens é composto
por alguns atributos que o descrevem e é utilizado para ser aplicada uma função de
similaridade e, com base nisso, recomendar conteúdo ao usuário.
Esta metodologia é amplamente aplicada nas áreas de recomendação de textos, sendo
que são geradas de forma automática descrições dos itens para serem comparados com os
interesses do usuário, a fim de verificar a relevância deste item.
A filtragem baseada em conteúdo é mais indicada para a recomendação de textos
(artigos, páginas da web), pois é possível verificar a similaridade com os interesses do usuário
ao identificar termos comuns entre o texto e estes interesses. Já a aplicação desta filtragem na
recomendação de produtos já se torna mais difícil, pois deve-se avaliar atributos
(características como cor, peso, preço, marca) destes produtos para serem recomendados
(CAZELLA et al, 2010). Isto tudo, considerando-se que os usuários tendem a se interessar por
itens semelhantes aos que já procuraram anteriormente.
2.4.2 Filtragem Colaborativa
A Filtragem Colaborativa foi desenvolvida para suprimir os pontos fracos da
filtragem baseada em conteúdo, por não exigir nenhum tipo de descrição dos itens, mas sim se

7
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

baseando na troca de experiências entre as pessoas que possuem interesse em comum, sendo
os itens filtrados de acordo com avaliações dos demais usuários (CAZELLA et al, 2010).
Figueira Filho et al (2008) explica que o principal fator que difere um sistema de
recomendação colaborativo de outro é a forma como é calculada a similaridade entre
usuários. Como a Filtragem Colaborativa se dá através de avaliações explícitas de itens feitas
pelos usuários, os que avaliam de forma semelhante os mesmos conteúdos são considerados
usuários com preferências similares, ficando claro então que o conteúdo que um usuário do
grupo X gostou, será também do gosto dos demais usuários pertencentes a este grupo. Neste
caso trata-se de um sistema personalizado.
A Tabela 1 faz uma breve comparação entre as filtragens estudadas, relacionando
suas vantagens e desvantagens.
Tabela 1: Vantagens e desvantagens dos dois principais tipos de Filtragens

SISTEMAS DE RECOMENDAÇÃO
FILTRAGEM

Colaborativa

DESVANTAGENS

- Bons resultados para usuários
incomuns
- Independe do número de usuários para
haver boa recomendação

- Baixo desempenho devido a falta de
informações no momento inicial do
sistema
- Não há relacionamento entre usuários

- A qualidade das recomendações
melhora com o tempo

Baseada em
Conteúdo

VANTAGENS

- Dificuldade para mapear arquivos
multimídia, bom como texto com
sinônimos

- Relacionamento entre usuários
- Baixo desempenho devido a falta de
- Recomendação de itens com base no
informações no momento inicial do
histórico de outros usuários relacionados sistema
- Baixo desempenho se o usuário não
tiver uma quantidade considerável de
relacionamentos
- Quando um item é adicionado ao
sistema e ainda não foi classificado por
nenhum usuário, não é recomendado

Fonte: dos autores

3 Trabalhos Relacionados
Trabalhos relacionados aos temas de Sistemas de Recomendação e de Mineração de
Dados foram pesquisados e estudados, a fim de se construir uma tabela comparativa, a partir
de critérios definidos.
Os critérios julgados mais relevantes são quanto à forma de coleta de informações
dos usuários (implícita/explícita), tipo de filtragem utilizado no sistema (colaborativa, baseada
em conteúdo, outra), estratégia de recomendação, técnica utilizada (relacionada às tarefas de
mineração de dados: regras de associação, agrupamentos, classificação, outra).
Em Rocha (2003) são citados seis projetos, envolvendo sistemas de recomendação
(SR): o GroupLeans, Ringo, Fab, MovieLens, TeamWorks e QuickStep.

8
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

O GroupLeans destina-se a indicar se artigos são ou não interessantes a um
determinado usuário, buscando diminuir o tempo gasto ao procurar uma notícia em fóruns
pela qual o usuário tenha interesse. Seu funcionamento se dá através da atribuição de notas (15) a artigos, com base no interesse em ler o material. À medida que novos artigos são
adicionados, o sistema prediz se é interessante ao usuário, com base nas avaliações feitas por
outros usuários, que costumam realizar avaliações semelhantes. Este sistema se utiliza da
filtragem colaborativa.
O SR Ringo indica artistas com base em semelhanças entre usuários, sendo que em
um primeiro momento de utilização do sistema, o usuário recebe uma lista de artistas para
avaliar de acordo com seu interesse para atenuar o problema de startup característico dos
sistemas de recomendação. O usuário ainda define quais tipos de recomendações deseja: itens
de interesse, itens rejeitados e nota atribuída a um determinado item.
O SR Fab foi desenvolvido visando recomendar páginas da Web, que utiliza-se de
filtragem colaborativa e baseada em conteúdo, sendo que o algoritmo é executado em duas
etapas: primeiramente, é realizada a filtragem colaborativa e, posteriormente, a filtragem
baseada em conteúdo remove itens irrelevantes com base em avaliações prévias do usuário.
São utilizados agentes para a busca na Web e para descartar itens já lidos.
MovieLens é um recomendador de filmes que solicita, no momento do cadastro no
sistema, que o usuário avalie alguns filmes devido ao já abordado problema de startup. A
recomendação é feita em uma lista de cinco melhores itens, com suas respectivas notas
médias.
O projeto TeamWorks busca eliminar documentos irrelevantes que pessoas
recomendam diretamente umas às outras com base no fluxo de informações entre grupos de
trabalhos cooperativos.
QuickStep recomenda publicações científicas online, com filtragem híbrida (baseada
em conteúdo e colaboração), utiliza um algoritmo de classificação de documentos junto a uma
ontologia que fornece as preferências do usuário.
Além desses sistemas, Rocha (2003) ainda menciona os sistemas de recomendações
de e-commerce das lojas Amazon.com e CDNow.com.
Na Amazon.com, além do usuário dar nota a um item, ele indica se tal item é para
fazer parte da base para geração de recomendação. Há diferentes formas de recomendação:
em uma delas (Customers who bought), ao selecionar um item, são recomendados itens que
foram adquiridos por usuários que compraram o item selecionado; da outra forma (Your
recomendations), a recomendação é feita com base em compras e avaliações do usuário; e o
método Eyes encaminha uma lista de novos itens que foram adicionados ao catálogo, cabendo
ao usuário filtrar previamente os gêneros de produtos que são de seu interesse. Outra forma de
se obter recomendação seria através de leitura de comentários de outros usuários a respeito de
determinado item, podendo ainda avaliar um comentário como útil ou não.
Na loja CDNow.com, existe a forma de recomendação Customers who bought
semelhante à Amazon.com; Related artists que recomenda artistas semelhantes a um
determinado item; e em My CDNOW o usuário aprova ou rejeita um certo número de CDs e
com base nisto são previstos 6 itens que podem ser de interesse do usuário.
O Sistema de Recomendação proposto por Rocha (2003), o RecDoc, é um
recomendador de documentos de uma biblioteca digital virtual na Web, fazendo isto com base
na similaridade entre documentos ou entre usuários. A coleta de dados é em parte explícita,
pois o usuário cadastra áreas de interesse, bem como é implícita pelo fato de armazenar dados

9
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

de pesquisa do usuário. O sistema utiliza-se de filtragem baseada em conteúdo no momento
da pesquisa por um artigo, utilizando os dados cadastrados no perfil do usuário juntamente
com o que foi especificado no campo de pesquisa; a filtragem colaborativa é aplicada em offline, executada pelo administrador do sistema e busca pré-selecionar documentos que poderão
ser recomendados.
Em Borges e Oliveira (2010) são estudados três sistemas de recomendação em lojas
virtuais, são elas: Saraiva, Submarino e Amazon.
A Livraria Saraiva utiliza-se de coleta explícita de dados, pois possui uma página
específica para o usuário definir suas áreas de interesse e avaliar produtos. Quanto à filtragem,
pode-se dizer que é colaborativa, pois é feita uma coleta de informações dos usuários,
observando-se avaliações de produtos e popularidade.
Foram implementadas estratégias de informação do tipo Lista de Recomendação, em
que são mostrados os produtos mais vendidos; Avaliações e Comentários; Itens Semelhantes,
em que ao consultar um produto, são exibidos produtos semelhantes; Associação por
Conteúdo, onde são relacionadas características dos produtos para ser gerada a recomendação.
Já a Submarino possui coleta de informações explícita e implícita, sendo a primeira,
via avaliações feitas pelos usuários, indicando se já possui o produto, entre outros; na
segunda, analisam-se as interações do usuário com o site (páginas visitadas, consultas,
compras). Utiliza-se disto para a filtragem de recomendação, e faz uso também de listagem de
produtos mais vendidos, mostrando avaliações e comentários dos outros usuários sobre os
itens.
Além de utilizar todas as estratégias já mencionadas sobre a Livraria Saraiva
(havendo apenas alguma diferença na forma da utilização destas), a Submarino ainda envia
emails de ofertas, lançamentos ou se algum itens que estava indisponível voltou a estar
disponível.
Complementando o que foi abordado por Rocha (2003) sobre a Amazon.com, Borges
e Oliveira (2010) explicam que as estratégias de recomendação são as mesmas que as
utilizadas pela Submarino.
A Tabela 2 apresenta um quadro comparativo dos trabalhos relacionados, abordando
o conjunto de critérios definido.
Tabela 2: Comparativo entre os Trabalhos Relacionados a Sistemas de Recomendação

Projeto

Coleta de Dados

Tipo de
Filtragem

Estratégia de recomendação

GroupLeans

Explícita

Colaborativa

Correlação entre usuário com
mesmas atribuições de notas

Ringo

Explícita

Colaborativa

Correlação entre usuário com
mesmas atribuições de notas

Explícita (notas)

Híbrida

Várias etapas de filtragens

Implícita (itens
lidos)

(Colab + Cont)

Fab

e
Agentes

MovieLens

Explícita

Colaborativa

Lista dos cinco melhores filmes

10
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

TeamWorks

Filtragem de documentos
irrelevantes

Implícita

Híbrida

Ontologia para capturar
preferências de usuários

Explícita e

Híbrida

Lista de Recomendação

Implícita

Amazon.com

Colaborativa

(Colab + Cont)

QuickStep

Implícita (no fluxo
de informações)

(Colab + Cont)

Avaliações e Comentários
Itens Semelhantes
Associação por conteúdo
Email

CDNow.com

(Colab + Cont)

Explícita e
Implícita

Híbrida
(Colab + Cont)

Recomendação baseada em
conteúdo no momento da consulta;
Recomendação colaborativa em offline

Explícita

Híbrida

Lista de Recomendação

(Colab + Cont)

Saraiva

Híbrida

Implícita
RecDoc

Explícita e

Várias formas de recomendação

Avaliações e Comentários
Itens Semelhantes
Associação por conteúdo

Submarino

Explícita e
Implícita

Híbrida

Lista de Recomendação

(Colab + Cont)

Avaliações e Comentários
Itens Semelhantes
Associação por conteúdo
Email

Fonte: dos autores

A seguir, são apresentados os trabalhos relacionados à mineração de dados.
Em Azarias (2009), foi desenvolvido um sistema baseado em Mineração de Dados
junto com práticas de gestão de conhecimento, em busca da descoberta, retenção,
disseminação, compartilhamento e aplicação do conhecimento gerado. Foi utilizada a tarefa
de Classificação para identificar se o cliente de uma empresa tem seu crédito aprovado ou
reprovado, sendo escolhida para executar esta tarefa a técnica de árvores de decisão.
Queiroga (2005) desenvolveu um sistema para detecção de fraudes em energia
elétrica, fazendo uso de Data Mining, devido a ocorrências de queda de faturamento da
empresa, muitas vezes devido a fraudes no sistema, como ligações clandestinas. O objetivo do
trabalho foi melhorar o processo de seleção de consumidores de energia suspeitos de fraudes,
sendo aplicadas técnicas de mineração de dados visando à obtenção de padrões que
identificassem estes clientes.

11
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

O modelo de mineração de dados utilizado neste sistema foi o mesmo citado no
trabalho anterior: tarefa de Classificação, técnica de árvores de decisão, aplicado na base de
dados.
O sistema proposto por Adeodato et al (2005) visou sanar o problema de não
comparecimento de clientes a consultas médicas, aplicando mineração de dados sobre as
informações do funcionamento rotineiro dos serviços médicos.
O algoritmo utilizado foi o A Priori, da técnica de árvores de decisão, para a
definição das regras a serem aplicadas a um algoritmo de redes neurais backpropagation, que
por sua vez teve a função de prever o nível de não comparecimento por parte dos clientes às
consultas.
Sidney (2010), em seu trabalho de conclusão de curso, estudou formas de aplicar
mineração de dados na base do Zoneamento Ecológico de Minas Gerais em busca de extração
de características espaciais importantes. A tarefa de mineração de dados escolhida pela autora
foi a de Regras de Associação, aplicada sobre resultados de pesquisas espaciais feitas com o
SGBD PostgreSQL. Trabalho que resultou no software denominado ZEE-MG Mining.
A Tabela 3 apresenta um quadro comparativo dos trabalhos relacionados, abordando
o conjunto de critérios definido: abordagem e tarefa utilizada, técnica e algoritmo de data
minig.
Tabela 3: Comparativo entre os Trabalhos Relacionados à Mineração de Dados

Projeto

Abordagem

Tarefa Utilizada

Técnica

Algoritmo

Azarias (2009)

Preditiva

Classificação

Árvores de
Decisão

-

Queiroga (2005)

Preditiva

Classificação

Árvores de
Decisão

-

Adeodato et al
(2005)

Preditiva

Classificação

Árvores de
Decisão

A Priori
+
RNA
Backpropagation

ZEE-MG

Preditiva

Regra de
Associação

-

A Priori

(-) não localizado
Fonte: dos autores

3.1 Análise dos trabalhos relacionados
A partir dos estudos feitos dos trabalhos relacionados apresentados neste capítulo
pode-se destacar que, na área de sistemas de recomendação, o tipo de filtragem mais adotado
foi o Colaborativo. Nos casos em que a filtragem Baseada em Conteúdo foi utilizada, também
se utilizou a Colaborativa, resultando em uma filtragem Híbrida. Quanto às coletas de
informações, utilizou-se geralmente a Implícita, sendo acompanhada muitas vezes da
Explícita, como suporte ao startup do sistema.

12
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

No que se refere aos trabalhos relacionados à Mineração de Dados, a abordagem foi
em sua totalidade a preditiva; a tarefa, em sua grande maioria, foi a de Classificação de
objetos alvos e predominou o uso da técnica de árvores de decisão e algoritmo A priori.
4 Considerações Finais
Com base nos estudos sobre Mineração de Dados e Sistemas de Recomendação
realizados, verificou-se que recomendações altamente personalizadas trazem benefícios para o
comércio eletrônico, tendo um melhor uso das informações coletadas dos usuários, fazendo
com que estes tenham a seu dispor um ambiente que atenda suas preferências.
Pretende-se com a proposta apresentada, atingir bons resultados nas gerações de
recomendações, utilizando Clustering para a criação de grupos de usuários com interesse em
comum e, mediante solicitação de recomendação, a aplicação de Regras de Associação para a
geração da recomendação. Esta técnica será aplicada somente com base no grupo em que um
usuário alvo da recomendação se encontra, refinando assim, os resultados. Também pretendese verificar se o desenvolvimento de sistemas com técnicas híbridas traz vantagens para a
área, neste caso, em sistemas de recomendação com o uso de algoritmos da mineração de
dados.
Referências
ADEODATO, P. J. L. et al. Uma Aplicação de Mineração de Dados à Previsão de No-Show no Agendamento de
Serviços Médicos. XXV Congresso da Sociedade Brasileira de Computação. São Leopoldo, 2005.
AZARIAS, P.; MATOS, S. N.; SCANDELARI L. Aplicação de Mineração de Dados para a geração de
conhecimento: Um experimento prático. V Congresso Nacional de Excelência em Gestão. Rio de Janeiro, 2009.
BORGES, D. M.; OLIVEIRA, F. L. Análise e comparação dos sistemas de recomendação de produtos
existentes em três empresas de comércio eletrônico (CE): Saraiva, Submarino e Amazon. Palmas: Curso de
Sistemas de Informaçao – Centro Universitário Luterano do Brasil, 2010.
CASTANHAEIRA, L. G. Aplicação de Técnicas de Mineração de Dados em Problemasde Classificação de
Padrões.
UFMG,
Belo
Horizonte,
2008.
(Dissertação).
Disponível
em:
<http://cpdee.ufmg.br/defesas/349M.PDF>, acessado em 15 de abril de 2012.
CAZELLA, Sílvio C.; NUNES, Maria A. S. N.; REATEGUI, Eliseo B. A Ciência da Opinião: Estado da arte
em Sistemas de Recomendação. JAI: Jornada de Atualização em Informática da SBC. Rio de Janeiro: Editora da
PUC Rio, 2010. Disponível em: < http://www.dcomp.ufs.br/~gutanunes/hp/publications/JAI4.pdf>, acessado em
15 de abril de 2012.
CAZELLA, S. C.; REATEGUI, E. B. Sistemas de Recomendação. XXV Congresso da Sociedade Brasileira de
Computação.
Unisinos:
São
Leopoldo,
2005.
Disponível
em:
<
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.92.2811&rep=rep1&type=pdf >, acessado em 15 de
abril de 2012.
CORTES, S. C.; PORCARO, R. M.; LIFSCHITZ S. Mineração de Dados – Funcionalidades, Técnicas e
Abordagens.
PUC-RioInfMCC10/02,
2002.
Disponível
em:
<ftp://139.82.16.194/pub/docs/techreports/02_10_cortes.pdf>, acessado em 15 de abril de 2012.
FAYYAD, Usana M. (Coord.). Advances in knowledge discovery and data mining. Cambridge: MIT, 1996.
FIGUEIRA FILHO, F.M., GEUS, P.L, ALBUQUERQUE, J.P. Sistemas de recomendação e interação na Web
Social. In: I Workshop de Aspectos da Interacao Humano-Computador na Web Social, Porto Alegre, 2008.
Disponível em: <http://www.ic.unicamp.br/~fmarques/papers/websocial_ihc08.pdf>. Acesso em: 21 de abril de
2012.
JESUS, R. P.; ESCOBAR, M. Desenvolvimento de um Sistema de Recomendação de eventos com uso de
Geolocalização. Ulbra: Canoas, 2011. (Projeto)

13
XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO

Sustentabilidade Na Cadeia De Suprimentos

Bauru, SP, Brasil, 5 a 7 de novembro de 2012

LICHTNOW D. et al. O Uso de Técnicas de Recomendação em um Sistema para Apoio à Aprendizagem
Colaborativa. Revista Brasileira de informática na educação (RBIE), 14(3):49–59, 2006. Disponível em:
<http://ceie-sbc.educacao.ws/pub/index.php/rbie/article/view/46>, acessado em 15 de abril de 2012.
LOPES, G. R. Sistema de Recomendação para Bibliotecas Digitais sob a Perspectiva da Web Semântica. Porto
Alegre:
Programa
de
Pós-Graduação
em
Computação,
2007.
Disponível
em:
<http://www.lume.ufrgs.br/handle/10183/10747>, acessado em 24 de abril de 2012.
MORESI, E. A., Delineando o valor do sistema de informação de uma organização. Ciência da Informação, v.
29, n. 1, p. 14-27, jan/abr. 2000.
QUEIROGA, Rodrigo Mendonça. Uso de técnicas da Data Mining para detecção de fraudes em energia
elétrica. Programa de pós-graduação em informativ. Universidade Federal do Espírito Santo, 2005.
REZENDE, S. O. Sistemas Inteligentes – Fundamentos e Aplicações. Barueri: Editora Manole, 2003.
ROCHA, CATARINA C. RecDoc: um sistema de recomendação para biblioteca digital na Web. Rio de Janeiro:
Universidade Federal do Rio de Janeiro (2003). Tese de Mestrado.
SANTOS, M. F.; AZEVEDO, C. Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa:
Editora FCA, 2005.
SERRANO, Maurício. Um Sistema de Recomendação para Mídias Baseado em Conteúdo Nebuloso. UFSCar,
São
Paulo,
2003.
Dissertação
(Mestrado)
Disponível
em:
<http://www.bdtd.ufscar.br/htdocs/tedeSimplificado/tde_arquivos/3/TDE-2006-11-24T14:22:04Z1269/Publico/DissMS.pdf>, acessado em 15 de abril de 2012.
SFERRA, H. H.; CORRÊA, A. M. C. J. Conceitos e Aplicações de Data Mining. Revista de Ciência e
Tecnologia, v.11, n. 22, p. 19-34., 2003.
SIDNEY, C. F. Aplicação de Mineração de Dados no Banco de Dados do Zoneamento Ecológico Econômico de
Minas Gerais. Lavras: Universidade Federal de Lavras, 2010. Trabalho de Conclusão de Curso.

14

Mais conteúdo relacionado

Mais procurados

2011: Mineração de Dados - Conceitos Básicos e Aplicações
2011: Mineração de Dados - Conceitos Básicos e Aplicações2011: Mineração de Dados - Conceitos Básicos e Aplicações
2011: Mineração de Dados - Conceitos Básicos e AplicaçõesLeandro de Castro
 
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....Renan Levy
 
Banco de Dados Conceitos
Banco de Dados ConceitosBanco de Dados Conceitos
Banco de Dados ConceitosCleber Ramos
 
Material Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukMaterial Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukHebert Alquimim
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)Andre Sidou
 
Apostila principios-de-sistemas-de-informacao
Apostila principios-de-sistemas-de-informacaoApostila principios-de-sistemas-de-informacao
Apostila principios-de-sistemas-de-informacaoMarcia Abrahim
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosRafael Albani
 
Conceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de SistemasConceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de SistemasClayton de Almeida Souza
 
Universidade federal do amazonas Banco de Dados - Apresentação final
Universidade federal do amazonas   Banco de Dados - Apresentação finalUniversidade federal do amazonas   Banco de Dados - Apresentação final
Universidade federal do amazonas Banco de Dados - Apresentação finalRenan Levy
 
Livro banco de_dados_volume_02
Livro banco de_dados_volume_02Livro banco de_dados_volume_02
Livro banco de_dados_volume_02CLEAN LOURENÇO
 
Caderno de info(banco de dados).
Caderno de info(banco de dados).Caderno de info(banco de dados).
Caderno de info(banco de dados).Ajudar Pessoas
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS Antonio Pedro
 

Mais procurados (20)

2011: Mineração de Dados - Conceitos Básicos e Aplicações
2011: Mineração de Dados - Conceitos Básicos e Aplicações2011: Mineração de Dados - Conceitos Básicos e Aplicações
2011: Mineração de Dados - Conceitos Básicos e Aplicações
 
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Apostila banco de dados
Apostila banco de dadosApostila banco de dados
Apostila banco de dados
 
6932 adm sistinf
6932 adm sistinf6932 adm sistinf
6932 adm sistinf
 
01 aula s. i.
01   aula s. i.01   aula s. i.
01 aula s. i.
 
Banco de Dados Conceitos
Banco de Dados ConceitosBanco de Dados Conceitos
Banco de Dados Conceitos
 
Banco De Dados
Banco De DadosBanco De Dados
Banco De Dados
 
Material Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos AlexandrukMaterial Modelagem - Prof. Marcos Alexandruk
Material Modelagem - Prof. Marcos Alexandruk
 
Banco de Dados
Banco de DadosBanco de Dados
Banco de Dados
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)
 
Apostila principios-de-sistemas-de-informacao
Apostila principios-de-sistemas-de-informacaoApostila principios-de-sistemas-de-informacao
Apostila principios-de-sistemas-de-informacao
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de Dados
 
Conceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de SistemasConceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de Sistemas
 
Universidade federal do amazonas Banco de Dados - Apresentação final
Universidade federal do amazonas   Banco de Dados - Apresentação finalUniversidade federal do amazonas   Banco de Dados - Apresentação final
Universidade federal do amazonas Banco de Dados - Apresentação final
 
Livro banco de_dados_volume_02
Livro banco de_dados_volume_02Livro banco de_dados_volume_02
Livro banco de_dados_volume_02
 
Caderno de info(banco de dados).
Caderno de info(banco de dados).Caderno de info(banco de dados).
Caderno de info(banco de dados).
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Fundamentos de banco dados
Fundamentos de banco dadosFundamentos de banco dados
Fundamentos de banco dados
 
BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS BANCO DE DADOS RELACIONAIS
BANCO DE DADOS RELACIONAIS
 

Destaque

2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample ApplicationsLeandro de Castro
 
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os ClientesLeandro de Castro
 
2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)Leandro de Castro
 
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...Dalton Martins
 
2010: Computação Natural - Uma Jornada Ilustrada
2010: Computação Natural - Uma Jornada Ilustrada2010: Computação Natural - Uma Jornada Ilustrada
2010: Computação Natural - Uma Jornada IlustradaLeandro de Castro
 
Aula 01 introdução e conceitos básicos sobre gestão
Aula 01   introdução e conceitos básicos sobre gestãoAula 01   introdução e conceitos básicos sobre gestão
Aula 01 introdução e conceitos básicos sobre gestãoDalton Martins
 
2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune SystemsLeandro de Castro
 
2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações2010: Computação Natural e Aplicações
2010: Computação Natural e AplicaçõesLeandro de Castro
 
2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications
2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications
2008: Natural Computing: The Virtual Laboratory and Two Real-World ApplicationsLeandro de Castro
 
2005: Natural Computing - Concepts and Applications
2005: Natural Computing - Concepts and Applications2005: Natural Computing - Concepts and Applications
2005: Natural Computing - Concepts and ApplicationsLeandro de Castro
 
2012: Computação Natural - Slides do Curso
2012: Computação Natural - Slides do Curso2012: Computação Natural - Slides do Curso
2012: Computação Natural - Slides do CursoLeandro de Castro
 
2012: O Processo de Checkout em E-commerce
2012: O Processo de Checkout em E-commerce2012: O Processo de Checkout em E-commerce
2012: O Processo de Checkout em E-commerceLeandro de Castro
 
2016: Notas sobre Liderança
2016: Notas sobre Liderança2016: Notas sobre Liderança
2016: Notas sobre LiderançaLeandro de Castro
 
2016: Applying AI Innovation in Business
2016: Applying AI Innovation in Business2016: Applying AI Innovation in Business
2016: Applying AI Innovation in BusinessLeandro de Castro
 
2010: Agrupamento Evolutivo de Dados
2010: Agrupamento Evolutivo de Dados2010: Agrupamento Evolutivo de Dados
2010: Agrupamento Evolutivo de DadosLeandro de Castro
 
2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerceLeandro de Castro
 
2012: The Grand Challenges in Natural Computing Research
2012: The Grand Challenges in Natural Computing Research2012: The Grand Challenges in Natural Computing Research
2012: The Grand Challenges in Natural Computing ResearchLeandro de Castro
 
2012: Natural Computing - The Grand Challenges and Two Case Studies
2012: Natural Computing - The Grand Challenges and Two Case Studies2012: Natural Computing - The Grand Challenges and Two Case Studies
2012: Natural Computing - The Grand Challenges and Two Case StudiesLeandro de Castro
 
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...Leandro de Castro
 
Processos colaborativos de produção de ontologias - I Fórum Nacional de Sist...
Processos colaborativos de produção de ontologias  - I Fórum Nacional de Sist...Processos colaborativos de produção de ontologias  - I Fórum Nacional de Sist...
Processos colaborativos de produção de ontologias - I Fórum Nacional de Sist...Dalton Martins
 

Destaque (20)

2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
 
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
 
2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)
 
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...
Análise de Redes Sociais para educação à distância na plataforma ELGG para o ...
 
2010: Computação Natural - Uma Jornada Ilustrada
2010: Computação Natural - Uma Jornada Ilustrada2010: Computação Natural - Uma Jornada Ilustrada
2010: Computação Natural - Uma Jornada Ilustrada
 
Aula 01 introdução e conceitos básicos sobre gestão
Aula 01   introdução e conceitos básicos sobre gestãoAula 01   introdução e conceitos básicos sobre gestão
Aula 01 introdução e conceitos básicos sobre gestão
 
2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems
 
2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações
 
2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications
2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications
2008: Natural Computing: The Virtual Laboratory and Two Real-World Applications
 
2005: Natural Computing - Concepts and Applications
2005: Natural Computing - Concepts and Applications2005: Natural Computing - Concepts and Applications
2005: Natural Computing - Concepts and Applications
 
2012: Computação Natural - Slides do Curso
2012: Computação Natural - Slides do Curso2012: Computação Natural - Slides do Curso
2012: Computação Natural - Slides do Curso
 
2012: O Processo de Checkout em E-commerce
2012: O Processo de Checkout em E-commerce2012: O Processo de Checkout em E-commerce
2012: O Processo de Checkout em E-commerce
 
2016: Notas sobre Liderança
2016: Notas sobre Liderança2016: Notas sobre Liderança
2016: Notas sobre Liderança
 
2016: Applying AI Innovation in Business
2016: Applying AI Innovation in Business2016: Applying AI Innovation in Business
2016: Applying AI Innovation in Business
 
2010: Agrupamento Evolutivo de Dados
2010: Agrupamento Evolutivo de Dados2010: Agrupamento Evolutivo de Dados
2010: Agrupamento Evolutivo de Dados
 
2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce
 
2012: The Grand Challenges in Natural Computing Research
2012: The Grand Challenges in Natural Computing Research2012: The Grand Challenges in Natural Computing Research
2012: The Grand Challenges in Natural Computing Research
 
2012: Natural Computing - The Grand Challenges and Two Case Studies
2012: Natural Computing - The Grand Challenges and Two Case Studies2012: Natural Computing - The Grand Challenges and Two Case Studies
2012: Natural Computing - The Grand Challenges and Two Case Studies
 
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...
2016: A Tríade da Persona Virtual - O Que as Mídias Sociais Podem Revelar sob...
 
Processos colaborativos de produção de ontologias - I Fórum Nacional de Sist...
Processos colaborativos de produção de ontologias  - I Fórum Nacional de Sist...Processos colaborativos de produção de ontologias  - I Fórum Nacional de Sist...
Processos colaborativos de produção de ontologias - I Fórum Nacional de Sist...
 

Semelhante a Comparative study of data mining applications in recommendation systems

Mineração de dados
Mineração de dadosMineração de dados
Mineração de dadosTalita Lima
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSVivaldo Jose Breternitz
 
Mineração de Dados
Mineração de DadosMineração de Dados
Mineração de DadosRenata Nunes
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisNatalia Fernandes
 
Papel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webPapel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webmarco.dantas
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonLuiz Eduardo Le Masson
 
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...Felipe J. R. Vieira
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTalita Lima
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - BrazilMarcos Vinicius Fidelis
 
Mineração_de_Dados.pptx
Mineração_de_Dados.pptxMineração_de_Dados.pptx
Mineração_de_Dados.pptxadrian990162
 
Fontes De Informação Para Negócios
Fontes De Informação Para NegóciosFontes De Informação Para Negócios
Fontes De Informação Para NegóciosLeonardo Moraes
 
Curso | Monitoramento e Métricas em Mídias Sociais
Curso | Monitoramento e Métricas em Mídias SociaisCurso | Monitoramento e Métricas em Mídias Sociais
Curso | Monitoramento e Métricas em Mídias SociaisPriscila Muniz
 

Semelhante a Comparative study of data mining applications in recommendation systems (20)

Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
 
Mineração de Dados
Mineração de DadosMineração de Dados
Mineração de Dados
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neurais
 
Curadoria de dados de pesquisa
Curadoria de dados de pesquisaCuradoria de dados de pesquisa
Curadoria de dados de pesquisa
 
Data Mining
Data Mining Data Mining
Data Mining
 
Dataminig
DataminigDataminig
Dataminig
 
Dataminig
DataminigDataminig
Dataminig
 
Papel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na webPapel dos vocabulários no acesso e reuso de recursos digitais na web
Papel dos vocabulários no acesso e reuso de recursos digitais na web
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...
Utilização da Gestão do Conhecimento nas Metodologias Ageis para Melhoria da ...
 
Gestão de dados de pesquisa
Gestão de dados de pesquisaGestão de dados de pesquisa
Gestão de dados de pesquisa
 
Conhecendo mineração de dados
Conhecendo mineração de dadosConhecendo mineração de dados
Conhecendo mineração de dados
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literatura
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
Mineração_de_Dados.pptx
Mineração_de_Dados.pptxMineração_de_Dados.pptx
Mineração_de_Dados.pptx
 
Fontes De Informação Para Negócios
Fontes De Informação Para NegóciosFontes De Informação Para Negócios
Fontes De Informação Para Negócios
 
Curso | Monitoramento e Métricas em Mídias Sociais
Curso | Monitoramento e Métricas em Mídias SociaisCurso | Monitoramento e Métricas em Mídias Sociais
Curso | Monitoramento e Métricas em Mídias Sociais
 

Comparative study of data mining applications in recommendation systems

  • 1. ESTUDO COMPARATIVO DE APLICAÇÕES EM MINERAÇÃO DE DADOS APLICADA A SISTEMAS DE RECOMENDAÇÃO CÁSSIO ALAN GARCIA - cassioalangarcia@gmail.com UNIVERSIDADE DE SANTA CRUZ DO SUL - UNISC REJANE FROZZA - frozza@unisc.br UNIVERSIDADE DE SANTA CRUZ DO SUL - UNISC Resumo: NOS SISTEMAS DE RECOMENDAÇÃO, A MINERAÇÃO DE DADOS CONTRIBUI DE FORMA A IDENTIFICAR O PERFIL DO USUÁRIO, INDICANDO QUAL CONTEÚDO PROVAVELMENTE É RELEVANTE, COM BASE NOS SEUS INTERESSES E NECESSIDADES. POSSÍVEIS ÁREAS A SEREM MAIS PROFUNDAMEENTE EXPLORADAS SÃO AS DE RECOMENDAÇÃO DE PRODUTOS (E-COMMERCES), RECOMENDAÇÃO DE PESSOAS (POR EXEMPLO, EM AMBIENTES DE APRENDIZADO COLABORATIVO, OU ENTÃO NA ÁREA DE RECURSOS HUMANOS), RECOMENDAÇÃO DE SERVIÇOS, ENTRE OUTRAS. ESTE ARTIGO APRESENTA UM ESTUDO SOBRE MINERAÇÃO DE DADOS E SISTEMAS DE RECOMENDAÇÃO, ABORDANDO SEUS CONCEITOS E DEFINIÇÕES, SEGUIDO DE UMA PESQUISA DE TRABALHOS RELACIONADOS ÀS ÁREAS. A FIM DE RESSALTAR CARACTERÍSTICAS DESTAS TÉCNICAS, COM O OBJETIVO DE DESENVOLVER UMA ARQUITETURA HÍBRIDA FUNDAMENTADA EM UM SISTEMA DE RECOMENDAÇÃO APOIADO POR TÉCNICAS DA MINERAÇÃO DE DADOS, ELABOROU-SE QUADROS COMPARATIVOS DOS TRABALHOS RELACIONADOS PARA ANÁLISE DESTAS CARACTERÍSTICAS. Palavras-chaves: MINERAÇÃO DE DADOS; SISTEMA DE RECOMENDAÇÃO; COMÉRCIO ELETRÔNICO Área: 8 - GESTÃO DO CONHECIMENTO ORGANIZACIONAL Sub-Área: 8.2 - GESTÃO DA TECNOLOGIA
  • 2. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 COMPARATIVE STUDY OF APPLICATIONS IN DATA MINING APPLIED TO RECOMMENDATION SYSTEMS Abstract: DATA MINING HELPS TO IDENTIFY THE USER´S PROFILE IN RECOMMENDATION SYSTEMS, INDICATING WHAT CONTENT IS RELEVANT, BASED ON THEIR INTERESTS AND NEEDS. POSSIBLE AREAS TO BE EXPLORED ARE THE PRODUCT RECOMMENDATION (ECOMMERCES), RECOMMENDATIONN OF PEOPLE (FOR EXAMPLE, IN COLLABORATIVE LEARNING ENVIRONMENTS, OR IN THE AREA OF HUMAN RESOURCES), RECOMMENDATION OF SERVICES, AMONG OTHER. THIS PAPER PRESENTS A STUDY ABOUT DATA MINING AND RECOMMENDATION SYSTEMS, COVERING ITS CONCEPTS AND DEFINITIONS, FOLLOWED BY RESEARCH OF RELATED WORK. COMPARATIVE TABLES WERE DEVELOPED AIMING TO HIGHLIGHT CHARACTERISTICS OF THIS TECHNIQUES. THE OBJECTIVE IS DEVELOPING A HYBRID ARCHITECTURE USING RECOMMENDATION SYSTEM AND DATA MINING. Keyword: DATA MINING; RECOMMENDATION SYSTEM; ELETRONIC COMMERCE 2
  • 3. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 1 Introdução Sistema de Recomendação, de modo geral, caracteriza-se por indicar serviços (produtos, itens, livros, investimentos, entre outros) a usuários, conforme perfil determinado através de informações coletadas diretamente com o usuário ou por meio de monitoramento das interações. Um sistema de recomendação pode ter um grande aliado, possibilitando utilizar, de forma mais eficiente, os dados coletados do usuário. Trata-se da Mineração de Dados. Processo esse que trata de uma extração de informações de forma inteligente, não sendo possível realizá-la por meio de consultas simples em bancos de dados. Em ambientes de busca, devido ao grande volume de informações na Internet, os Sistemas de Recomendação podem ajudar a refinar os resultados e minimizar o tempo de busca, fornecendo um retorno de pesquisa de forma individualizada e ágil, apresentando retornos realmente relevantes ao usuário (JESUS; ESCOBAR, 2011). A Mineração de Dados, além de auxiliar, se torna uma necessidade, devido ao grande volume de informações que são geradas diariamente nas organizações. O artigo está organizado da seguinte forma: a seção 2 aborda a fundamentação teórica sobre mineração de dados e sistemas de recomendação; na seção 3 é apresentada a metodologia do trabalho com a análise dos trabalhos relacionados. Por fim, são apresentadas as considerações finais. 2 Fundamentação Teórica Os principais assuntos envolvidos nesta pesquisa são descritos nas seções a seguir. 2.1 Mineração de Dados A Mineração de Dados mesmo sendo considerada sinônimo de KDD (Knowledge Discovery in Databases) – Descoberta (ou Extração) de Conhecimento em Bases de Dados é, especificamente, uma etapa deste grande processo. Segundo Fayad et al (1996), “Extração de Conhecimento em Base de Dados é o processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis embutidos nos dados”. Para isso são utilizadas técnicas de diversas áreas do conhecimento, como estatística, matemática, bancos de dados, inteligência artificial, visualização de dados e reconhecimento de padrões (CASTANHEIRA, 2008). Os principais termos envolvidos neste processo são descritos por Rezende (2003) como:  Dados: Conjunto de fatos ou casos em uma base de dados.  Padrões: Abstrações de um conjunto de dados em uma linguagem descritiva de conceitos.  Processo: Busca de padrões e avaliação do conhecimento, sendo dividida em várias etapas.  Válidos: Resultados devem satisfazer restrições/testes pré-definidos.  Novos: Os padrões encontrados devem ter certo grau de novidade.  Compreensíveis: Deve haver uma forma de análise mais profunda dos dados e padrões descobertos.  Conhecimento: Fortemente relacionado com medidas de utilidade, originalidade e compreensão. 3
  • 4. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 Ao ser explorada a área de Descoberta de Conhecimento, remete-se aos níveis hierárquicos da informação (MORESI, 2000) que são descritos a seguir:  Dados: Classe mais baixa da informação, constituindo representações de fotos, textos, gráficos imagens, sons, entre outros. Ou seja, dados são sinais que não foram processados, integrados, avaliados ou interpretados, constituindo assim a matéria-prima para a produção de informação.  Informação: A informação são os dados que passaram por um processamento e que podem, desta forma, ser compreensíveis às pessoas. Podem ser classificados como informação a exibição de um arquivo textual ou gráfico, uma fotografia revelada, entre outros. Através da interpretação e integração de vários dados e informações, obtém-se o conhecimento.  Conhecimento: São informações analisadas e avaliadas, sendo confiáveis, relevantes e importantes. É fruto da combinação de informações, sendo por meio deste que pessoas responsáveis por tomadas de decisões buscam uma compreensão mais efetiva da situação do problema.  Inteligência: É o conhecimento que foi sintetizado e aplicado a uma determinada situação para entendê-la melhor, ou seja, a informação sintetizada e relevante ao contexto do problema. Considerando tais níveis da informação, a mineração de dados atua sobre os dados armazenados nas bases, buscando por padrões úteis e compreensíveis para que seja gerado o conhecimento. O processo de KDD é composto pelas seguintes etapas (REZENDE, 2003): Identificação do problema, Pré-Processamento, Extração de Padrões, Pós-Processamento, conforme Figura 1. Figura 1 - Etapas do processo de KDD. Fonte: (REZENDE, 2003) Na Identificação do Problema, são determinados os objetivos e metas a serem alcançados no processo de Data Mining através do estudo do domínio da aplicação, mostrando-se necessário o pleno conhecimento deste (REZENDE, 2003). Na segunda etapa, chamada Pré-Processamento, trata-se da limpeza dos dados e redução de volume, para que seja reduzido o tempo de processamento e a utilização de memória feita pelos algoritmos de mineração (REZENDE, 2003). A Extração de Padrões é a fase de Mineração de Dados propriamente dita. Nesta fase é escolhida a tarefa e definido o algoritmo a ser utilizado, podendo ser executado mais de uma 4
  • 5. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 vez, já que esta etapa é um processo iterativo, para que haja a extração de padrões (REZENDE, 2003). O Pós-Processamento é o momento em que os conhecimentos são interpretados e utilizados em processos de tomada de decisão ou em Sistemas Inteligentes, sendo possível retornar a qualquer etapa anterior. As medidas de desempenho (precisão, velocidades, entre outras) também são executadas nesta fase, podendo, caso necessário, ajustar parâmetros e voltar a alguma etapa anterior para ser executada novamente. 2.1.1 Tarefas de Mineração de Dados Em função do objetivo a ser alcançado é feita a escolha da tarefa, que pode ser classificada em preditiva ou descritiva (REZENDE, 2003), para aplicação sobre a base de dados. Nas tarefas preditivas, a abordagem é botton-up, ou seja, a pesquisa é feita de forma a encontrar padrões frequentes, tendências e generalizações, a fim de encontrar informações implícitas nos dados (SANTOS e AZEVEDO, 2005). As tarefas descritivas possuem abordagem top-down, onde existem hipóteses previamente formuladas que são testadas para a verificação da sua veracidade. Esta abordagem busca encontrar respostas que confirmem ou neguem as hipóteses, enquanto que a anterior revela informações que não haviam sido imaginadas, gerando as próprias hipóteses (SANTOS e AZEVEDO, 2005). A escolha da(s) tarefas(s) a ser(em) utilizada(s) na etapa de Mineração de Dados é feita em função dos objetivos a serem alcançados, por isso não há como definir uma tarefa que seja mais eficiente em qualquer situação. Uma vez definida a tarefa, escolhe-se a técnica a ser empregada. A seguir, são descritas algumas tarefas comumente utilizadas:  Classificação (tarefa de predição) A tarefa de Classificação mapeia dados de entrada em um número finito de classes, de forma a criar uma relação de cada exemplo com certa classe. Utiliza-se destas relações para predizer a classe de um novo e desconhecido exemplo (REZENDE, 2003). Fayyad (1996) cita o exemplo de classificação de clientes de um banco, classificando-os em possíveis bons pagadores ou maus pagadores, podendo, com isso, determinar se deve conceder crédito ao cliente ou não.  Regressão (tarefa de predição) Esta tarefa é bastante semelhante à anterior, diferenciando-se apenas no fato de que o atributo a ser predito é contínuo em vez de discreto (REZENDE, 2003). Castanheira (2008) define o objetivo da tarefa de regressão que é “encontrar a relação entre um conjunto de atributos de entrada e um atributo-meta contínuo”. Ainda cita o seguinte exemplo: sendo o atributo de entrada X = {x1, x2, ..., xn}, e y o atributo-meta, a tarefa de regressão procura buscar um mapeamento y = f(x1, x2, ..., xn}.  Clustering ou Agrupamento (tarefa de descrição) Busca detectar a existência de diferentes grupos, ou clusters, dentro de um determinado conjunto de dados, baseando-se em medidas de similaridade ou modelos 5
  • 6. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 probabilísticos, determinando quais são estes grupos, caso existam, dividindo grupos heterogêneos em sub grupos homogêneos. Dados com atributos (ou um subconjunto de atributos escolhidos) parecidos são agrupados/segmentados no mesmo cluster, podendo ainda um dado estar classificado em mais de um cluster (SFERRA e CORRÊA, 2003) (REZENDE, 2003).  Regras de associação ( tarefa de descrição) Esta tarefa faz o levantamento de quanto um conjunto de atributos contribui para a presença de outro conjunto. Na área de marketing é também conhecida como “análise de cestas de venda”, havendo um estudo de como os itens estão relacionados. Pode ser aplicada em estudos de preferências, tentando descobrir afinidades entre itens, para, por exemplo, criar pacotes de vendas para os consumidores. Esta atividade serve como exemplo para a teoria de que a presença de um item em uma transação implica na presença de outro, sendo que o banco de dados é visto como uma coleção de transações em que cada uma envolve um conjunto de itens (CORTES et al, 2002). A regra de associação possui dois lados, o direito e o esquerdo (X  Y) que significa que se X existe em alguma transação, há uma determinada possibilidade de Y existir também (REZENDE, 2003).  Sumarização (tarefa de descrição) Segundo Rezende (2003), “a Sumarização envolve métodos para encontrar uma descrição compacta para um subconjunto de dados”. Tal descrição identifica e apresenta de forma concisa e compreensível as principais características dos dados em um conjunto de dados. A técnica de visualização é uma função de Sumarização que é necessária para se obter um entendimento intuitivo do conjunto de dados, fazendo uso de diagramas, baseados em proporção e dispersão, histogramas, entre outros (SFERRA e CORRÊA, 2003). Com tarefas como as supracitadas, os Sistemas de Recomendação fornecem uma alternativa às interfaces das tecnologias de filtragem e recuperação de informações, diferenciando-se pela predição dos conteúdos interessantes e úteis ao usuário (LOPES, 2007). 2.2 Sistema de Recomendação Um Sistema de Recomendação (SR) busca criar um ambiente personalizado para cada usuário. O caso mais conhecido é o de comércio eletrônico (e-commerce), com base nas informações absorvidas pelo sistema de forma explícita e/ou implícita, sendo que a primeira se dá através de, por exemplo, um cadastro de usuário, em que ele define seus gostos e preferências. Já a segunda forma se dá através de análise de comportamento do usuário, como produtos adquiridos anteriormente, caminhos (links) percorridos pelo usuário dentro do site (logs), rating de produtos, entre outros. Com o uso destes dados, SR podem recomendar produtos, informações, serviços ou pessoas. Os SR podem ser classificados, quanto a sua forma, em dois grupos: Baseados em Conteúdo, que recomendam itens semelhantes àqueles relacionados com um usuário alvo, recomendando itens individualmente e partindo do princípio de que usuários tendem a se interessar por itens similares aos que demonstraram interesse anteriormente; e Colaborativos que se relacionam com usuários que possuem interesses em comum com o usuário em questão, efetuando a recomendação a grupos de usuários semelhantes, levando em conta que é comum pessoas recomendarem ou pedir recomendação de itens de qualquer natureza, ficando, assim, a encargo do SR fazer o processo “boca-a-boca” (SERRANO, 2003), (LICHTNOW, 2006). 6
  • 7. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 2.3 Coleta de dados implícita e explícita A busca de informações sobre o usuário ocorrer de forma explícita e/ou implícita. Na primeira forma, o usuário preenche um formulário ao se cadastrar referente a dados pessoais, preferências, interesses, ou de alguma forma indica espontaneamente o que lhe interessa. Este processo demanda tempo do usuário, sem falar na inexistência de confiança no sistema por parte do usuário para que forneça informações pessoais. Já na coleta de informações implícita, é interpretado, por exemplo, o comportamento (navegação) do usuário dentro do sistema, obtendo-se assim informações sobre suas necessidades e preferências. Isto sem a interferência do usuário e sem a implicação de ter de estar preenchendo formulários para que sejam feitas as recomendações (CAZELLA et al, 2010). 2.4 Tipos de Sistemas de Recomendação (ou Técnicas de Filtragem) Sistemas de Recomendação, na área comercial, buscam a fidelidade dos clientes para assim aumentar a lucratividade das empresas. Sendo assim, criaram-se estratégias de recomendação para se alcançar esses objetivos. De forma ampla, podem-se ser citadas as estratégias de listas de recomendação, em que são criadas listas de itens sem a análise mais profunda dos dados, recomendado listas de itens mais vendidos, por exemplo, tendo como principal vantagem a simplicidade de implementação e por outro lado a desvantagem de que são listas fixas para todos os clientes; as avaliações de usuário são outro tipo de estratégia em que os usuários avaliam e comentam itens; outra forma de recomendação é a criação de uma página exclusiva para isto (CAZELLA; REATEGUI, 2005). 2.4.1 Filtragem baseada em conteúdo A filtragem baseada em conteúdo tem esse nome pelo fato de os sistemas que a utilizam realizam uma filtragem baseada em análises dos conteúdos dos itens que podem ser recomendados com base no perfil do usuário (LOPES, 2007). O perfil dos itens é composto por alguns atributos que o descrevem e é utilizado para ser aplicada uma função de similaridade e, com base nisso, recomendar conteúdo ao usuário. Esta metodologia é amplamente aplicada nas áreas de recomendação de textos, sendo que são geradas de forma automática descrições dos itens para serem comparados com os interesses do usuário, a fim de verificar a relevância deste item. A filtragem baseada em conteúdo é mais indicada para a recomendação de textos (artigos, páginas da web), pois é possível verificar a similaridade com os interesses do usuário ao identificar termos comuns entre o texto e estes interesses. Já a aplicação desta filtragem na recomendação de produtos já se torna mais difícil, pois deve-se avaliar atributos (características como cor, peso, preço, marca) destes produtos para serem recomendados (CAZELLA et al, 2010). Isto tudo, considerando-se que os usuários tendem a se interessar por itens semelhantes aos que já procuraram anteriormente. 2.4.2 Filtragem Colaborativa A Filtragem Colaborativa foi desenvolvida para suprimir os pontos fracos da filtragem baseada em conteúdo, por não exigir nenhum tipo de descrição dos itens, mas sim se 7
  • 8. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 baseando na troca de experiências entre as pessoas que possuem interesse em comum, sendo os itens filtrados de acordo com avaliações dos demais usuários (CAZELLA et al, 2010). Figueira Filho et al (2008) explica que o principal fator que difere um sistema de recomendação colaborativo de outro é a forma como é calculada a similaridade entre usuários. Como a Filtragem Colaborativa se dá através de avaliações explícitas de itens feitas pelos usuários, os que avaliam de forma semelhante os mesmos conteúdos são considerados usuários com preferências similares, ficando claro então que o conteúdo que um usuário do grupo X gostou, será também do gosto dos demais usuários pertencentes a este grupo. Neste caso trata-se de um sistema personalizado. A Tabela 1 faz uma breve comparação entre as filtragens estudadas, relacionando suas vantagens e desvantagens. Tabela 1: Vantagens e desvantagens dos dois principais tipos de Filtragens SISTEMAS DE RECOMENDAÇÃO FILTRAGEM Colaborativa DESVANTAGENS - Bons resultados para usuários incomuns - Independe do número de usuários para haver boa recomendação - Baixo desempenho devido a falta de informações no momento inicial do sistema - Não há relacionamento entre usuários - A qualidade das recomendações melhora com o tempo Baseada em Conteúdo VANTAGENS - Dificuldade para mapear arquivos multimídia, bom como texto com sinônimos - Relacionamento entre usuários - Baixo desempenho devido a falta de - Recomendação de itens com base no informações no momento inicial do histórico de outros usuários relacionados sistema - Baixo desempenho se o usuário não tiver uma quantidade considerável de relacionamentos - Quando um item é adicionado ao sistema e ainda não foi classificado por nenhum usuário, não é recomendado Fonte: dos autores 3 Trabalhos Relacionados Trabalhos relacionados aos temas de Sistemas de Recomendação e de Mineração de Dados foram pesquisados e estudados, a fim de se construir uma tabela comparativa, a partir de critérios definidos. Os critérios julgados mais relevantes são quanto à forma de coleta de informações dos usuários (implícita/explícita), tipo de filtragem utilizado no sistema (colaborativa, baseada em conteúdo, outra), estratégia de recomendação, técnica utilizada (relacionada às tarefas de mineração de dados: regras de associação, agrupamentos, classificação, outra). Em Rocha (2003) são citados seis projetos, envolvendo sistemas de recomendação (SR): o GroupLeans, Ringo, Fab, MovieLens, TeamWorks e QuickStep. 8
  • 9. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 O GroupLeans destina-se a indicar se artigos são ou não interessantes a um determinado usuário, buscando diminuir o tempo gasto ao procurar uma notícia em fóruns pela qual o usuário tenha interesse. Seu funcionamento se dá através da atribuição de notas (15) a artigos, com base no interesse em ler o material. À medida que novos artigos são adicionados, o sistema prediz se é interessante ao usuário, com base nas avaliações feitas por outros usuários, que costumam realizar avaliações semelhantes. Este sistema se utiliza da filtragem colaborativa. O SR Ringo indica artistas com base em semelhanças entre usuários, sendo que em um primeiro momento de utilização do sistema, o usuário recebe uma lista de artistas para avaliar de acordo com seu interesse para atenuar o problema de startup característico dos sistemas de recomendação. O usuário ainda define quais tipos de recomendações deseja: itens de interesse, itens rejeitados e nota atribuída a um determinado item. O SR Fab foi desenvolvido visando recomendar páginas da Web, que utiliza-se de filtragem colaborativa e baseada em conteúdo, sendo que o algoritmo é executado em duas etapas: primeiramente, é realizada a filtragem colaborativa e, posteriormente, a filtragem baseada em conteúdo remove itens irrelevantes com base em avaliações prévias do usuário. São utilizados agentes para a busca na Web e para descartar itens já lidos. MovieLens é um recomendador de filmes que solicita, no momento do cadastro no sistema, que o usuário avalie alguns filmes devido ao já abordado problema de startup. A recomendação é feita em uma lista de cinco melhores itens, com suas respectivas notas médias. O projeto TeamWorks busca eliminar documentos irrelevantes que pessoas recomendam diretamente umas às outras com base no fluxo de informações entre grupos de trabalhos cooperativos. QuickStep recomenda publicações científicas online, com filtragem híbrida (baseada em conteúdo e colaboração), utiliza um algoritmo de classificação de documentos junto a uma ontologia que fornece as preferências do usuário. Além desses sistemas, Rocha (2003) ainda menciona os sistemas de recomendações de e-commerce das lojas Amazon.com e CDNow.com. Na Amazon.com, além do usuário dar nota a um item, ele indica se tal item é para fazer parte da base para geração de recomendação. Há diferentes formas de recomendação: em uma delas (Customers who bought), ao selecionar um item, são recomendados itens que foram adquiridos por usuários que compraram o item selecionado; da outra forma (Your recomendations), a recomendação é feita com base em compras e avaliações do usuário; e o método Eyes encaminha uma lista de novos itens que foram adicionados ao catálogo, cabendo ao usuário filtrar previamente os gêneros de produtos que são de seu interesse. Outra forma de se obter recomendação seria através de leitura de comentários de outros usuários a respeito de determinado item, podendo ainda avaliar um comentário como útil ou não. Na loja CDNow.com, existe a forma de recomendação Customers who bought semelhante à Amazon.com; Related artists que recomenda artistas semelhantes a um determinado item; e em My CDNOW o usuário aprova ou rejeita um certo número de CDs e com base nisto são previstos 6 itens que podem ser de interesse do usuário. O Sistema de Recomendação proposto por Rocha (2003), o RecDoc, é um recomendador de documentos de uma biblioteca digital virtual na Web, fazendo isto com base na similaridade entre documentos ou entre usuários. A coleta de dados é em parte explícita, pois o usuário cadastra áreas de interesse, bem como é implícita pelo fato de armazenar dados 9
  • 10. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 de pesquisa do usuário. O sistema utiliza-se de filtragem baseada em conteúdo no momento da pesquisa por um artigo, utilizando os dados cadastrados no perfil do usuário juntamente com o que foi especificado no campo de pesquisa; a filtragem colaborativa é aplicada em offline, executada pelo administrador do sistema e busca pré-selecionar documentos que poderão ser recomendados. Em Borges e Oliveira (2010) são estudados três sistemas de recomendação em lojas virtuais, são elas: Saraiva, Submarino e Amazon. A Livraria Saraiva utiliza-se de coleta explícita de dados, pois possui uma página específica para o usuário definir suas áreas de interesse e avaliar produtos. Quanto à filtragem, pode-se dizer que é colaborativa, pois é feita uma coleta de informações dos usuários, observando-se avaliações de produtos e popularidade. Foram implementadas estratégias de informação do tipo Lista de Recomendação, em que são mostrados os produtos mais vendidos; Avaliações e Comentários; Itens Semelhantes, em que ao consultar um produto, são exibidos produtos semelhantes; Associação por Conteúdo, onde são relacionadas características dos produtos para ser gerada a recomendação. Já a Submarino possui coleta de informações explícita e implícita, sendo a primeira, via avaliações feitas pelos usuários, indicando se já possui o produto, entre outros; na segunda, analisam-se as interações do usuário com o site (páginas visitadas, consultas, compras). Utiliza-se disto para a filtragem de recomendação, e faz uso também de listagem de produtos mais vendidos, mostrando avaliações e comentários dos outros usuários sobre os itens. Além de utilizar todas as estratégias já mencionadas sobre a Livraria Saraiva (havendo apenas alguma diferença na forma da utilização destas), a Submarino ainda envia emails de ofertas, lançamentos ou se algum itens que estava indisponível voltou a estar disponível. Complementando o que foi abordado por Rocha (2003) sobre a Amazon.com, Borges e Oliveira (2010) explicam que as estratégias de recomendação são as mesmas que as utilizadas pela Submarino. A Tabela 2 apresenta um quadro comparativo dos trabalhos relacionados, abordando o conjunto de critérios definido. Tabela 2: Comparativo entre os Trabalhos Relacionados a Sistemas de Recomendação Projeto Coleta de Dados Tipo de Filtragem Estratégia de recomendação GroupLeans Explícita Colaborativa Correlação entre usuário com mesmas atribuições de notas Ringo Explícita Colaborativa Correlação entre usuário com mesmas atribuições de notas Explícita (notas) Híbrida Várias etapas de filtragens Implícita (itens lidos) (Colab + Cont) Fab e Agentes MovieLens Explícita Colaborativa Lista dos cinco melhores filmes 10
  • 11. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 TeamWorks Filtragem de documentos irrelevantes Implícita Híbrida Ontologia para capturar preferências de usuários Explícita e Híbrida Lista de Recomendação Implícita Amazon.com Colaborativa (Colab + Cont) QuickStep Implícita (no fluxo de informações) (Colab + Cont) Avaliações e Comentários Itens Semelhantes Associação por conteúdo Email CDNow.com (Colab + Cont) Explícita e Implícita Híbrida (Colab + Cont) Recomendação baseada em conteúdo no momento da consulta; Recomendação colaborativa em offline Explícita Híbrida Lista de Recomendação (Colab + Cont) Saraiva Híbrida Implícita RecDoc Explícita e Várias formas de recomendação Avaliações e Comentários Itens Semelhantes Associação por conteúdo Submarino Explícita e Implícita Híbrida Lista de Recomendação (Colab + Cont) Avaliações e Comentários Itens Semelhantes Associação por conteúdo Email Fonte: dos autores A seguir, são apresentados os trabalhos relacionados à mineração de dados. Em Azarias (2009), foi desenvolvido um sistema baseado em Mineração de Dados junto com práticas de gestão de conhecimento, em busca da descoberta, retenção, disseminação, compartilhamento e aplicação do conhecimento gerado. Foi utilizada a tarefa de Classificação para identificar se o cliente de uma empresa tem seu crédito aprovado ou reprovado, sendo escolhida para executar esta tarefa a técnica de árvores de decisão. Queiroga (2005) desenvolveu um sistema para detecção de fraudes em energia elétrica, fazendo uso de Data Mining, devido a ocorrências de queda de faturamento da empresa, muitas vezes devido a fraudes no sistema, como ligações clandestinas. O objetivo do trabalho foi melhorar o processo de seleção de consumidores de energia suspeitos de fraudes, sendo aplicadas técnicas de mineração de dados visando à obtenção de padrões que identificassem estes clientes. 11
  • 12. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 O modelo de mineração de dados utilizado neste sistema foi o mesmo citado no trabalho anterior: tarefa de Classificação, técnica de árvores de decisão, aplicado na base de dados. O sistema proposto por Adeodato et al (2005) visou sanar o problema de não comparecimento de clientes a consultas médicas, aplicando mineração de dados sobre as informações do funcionamento rotineiro dos serviços médicos. O algoritmo utilizado foi o A Priori, da técnica de árvores de decisão, para a definição das regras a serem aplicadas a um algoritmo de redes neurais backpropagation, que por sua vez teve a função de prever o nível de não comparecimento por parte dos clientes às consultas. Sidney (2010), em seu trabalho de conclusão de curso, estudou formas de aplicar mineração de dados na base do Zoneamento Ecológico de Minas Gerais em busca de extração de características espaciais importantes. A tarefa de mineração de dados escolhida pela autora foi a de Regras de Associação, aplicada sobre resultados de pesquisas espaciais feitas com o SGBD PostgreSQL. Trabalho que resultou no software denominado ZEE-MG Mining. A Tabela 3 apresenta um quadro comparativo dos trabalhos relacionados, abordando o conjunto de critérios definido: abordagem e tarefa utilizada, técnica e algoritmo de data minig. Tabela 3: Comparativo entre os Trabalhos Relacionados à Mineração de Dados Projeto Abordagem Tarefa Utilizada Técnica Algoritmo Azarias (2009) Preditiva Classificação Árvores de Decisão - Queiroga (2005) Preditiva Classificação Árvores de Decisão - Adeodato et al (2005) Preditiva Classificação Árvores de Decisão A Priori + RNA Backpropagation ZEE-MG Preditiva Regra de Associação - A Priori (-) não localizado Fonte: dos autores 3.1 Análise dos trabalhos relacionados A partir dos estudos feitos dos trabalhos relacionados apresentados neste capítulo pode-se destacar que, na área de sistemas de recomendação, o tipo de filtragem mais adotado foi o Colaborativo. Nos casos em que a filtragem Baseada em Conteúdo foi utilizada, também se utilizou a Colaborativa, resultando em uma filtragem Híbrida. Quanto às coletas de informações, utilizou-se geralmente a Implícita, sendo acompanhada muitas vezes da Explícita, como suporte ao startup do sistema. 12
  • 13. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 No que se refere aos trabalhos relacionados à Mineração de Dados, a abordagem foi em sua totalidade a preditiva; a tarefa, em sua grande maioria, foi a de Classificação de objetos alvos e predominou o uso da técnica de árvores de decisão e algoritmo A priori. 4 Considerações Finais Com base nos estudos sobre Mineração de Dados e Sistemas de Recomendação realizados, verificou-se que recomendações altamente personalizadas trazem benefícios para o comércio eletrônico, tendo um melhor uso das informações coletadas dos usuários, fazendo com que estes tenham a seu dispor um ambiente que atenda suas preferências. Pretende-se com a proposta apresentada, atingir bons resultados nas gerações de recomendações, utilizando Clustering para a criação de grupos de usuários com interesse em comum e, mediante solicitação de recomendação, a aplicação de Regras de Associação para a geração da recomendação. Esta técnica será aplicada somente com base no grupo em que um usuário alvo da recomendação se encontra, refinando assim, os resultados. Também pretendese verificar se o desenvolvimento de sistemas com técnicas híbridas traz vantagens para a área, neste caso, em sistemas de recomendação com o uso de algoritmos da mineração de dados. Referências ADEODATO, P. J. L. et al. Uma Aplicação de Mineração de Dados à Previsão de No-Show no Agendamento de Serviços Médicos. XXV Congresso da Sociedade Brasileira de Computação. São Leopoldo, 2005. AZARIAS, P.; MATOS, S. N.; SCANDELARI L. Aplicação de Mineração de Dados para a geração de conhecimento: Um experimento prático. V Congresso Nacional de Excelência em Gestão. Rio de Janeiro, 2009. BORGES, D. M.; OLIVEIRA, F. L. Análise e comparação dos sistemas de recomendação de produtos existentes em três empresas de comércio eletrônico (CE): Saraiva, Submarino e Amazon. Palmas: Curso de Sistemas de Informaçao – Centro Universitário Luterano do Brasil, 2010. CASTANHAEIRA, L. G. Aplicação de Técnicas de Mineração de Dados em Problemasde Classificação de Padrões. UFMG, Belo Horizonte, 2008. (Dissertação). Disponível em: <http://cpdee.ufmg.br/defesas/349M.PDF>, acessado em 15 de abril de 2012. CAZELLA, Sílvio C.; NUNES, Maria A. S. N.; REATEGUI, Eliseo B. A Ciência da Opinião: Estado da arte em Sistemas de Recomendação. JAI: Jornada de Atualização em Informática da SBC. Rio de Janeiro: Editora da PUC Rio, 2010. Disponível em: < http://www.dcomp.ufs.br/~gutanunes/hp/publications/JAI4.pdf>, acessado em 15 de abril de 2012. CAZELLA, S. C.; REATEGUI, E. B. Sistemas de Recomendação. XXV Congresso da Sociedade Brasileira de Computação. Unisinos: São Leopoldo, 2005. Disponível em: < http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.92.2811&rep=rep1&type=pdf >, acessado em 15 de abril de 2012. CORTES, S. C.; PORCARO, R. M.; LIFSCHITZ S. Mineração de Dados – Funcionalidades, Técnicas e Abordagens. PUC-RioInfMCC10/02, 2002. Disponível em: <ftp://139.82.16.194/pub/docs/techreports/02_10_cortes.pdf>, acessado em 15 de abril de 2012. FAYYAD, Usana M. (Coord.). Advances in knowledge discovery and data mining. Cambridge: MIT, 1996. FIGUEIRA FILHO, F.M., GEUS, P.L, ALBUQUERQUE, J.P. Sistemas de recomendação e interação na Web Social. In: I Workshop de Aspectos da Interacao Humano-Computador na Web Social, Porto Alegre, 2008. Disponível em: <http://www.ic.unicamp.br/~fmarques/papers/websocial_ihc08.pdf>. Acesso em: 21 de abril de 2012. JESUS, R. P.; ESCOBAR, M. Desenvolvimento de um Sistema de Recomendação de eventos com uso de Geolocalização. Ulbra: Canoas, 2011. (Projeto) 13
  • 14. XIX SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO Sustentabilidade Na Cadeia De Suprimentos Bauru, SP, Brasil, 5 a 7 de novembro de 2012 LICHTNOW D. et al. O Uso de Técnicas de Recomendação em um Sistema para Apoio à Aprendizagem Colaborativa. Revista Brasileira de informática na educação (RBIE), 14(3):49–59, 2006. Disponível em: <http://ceie-sbc.educacao.ws/pub/index.php/rbie/article/view/46>, acessado em 15 de abril de 2012. LOPES, G. R. Sistema de Recomendação para Bibliotecas Digitais sob a Perspectiva da Web Semântica. Porto Alegre: Programa de Pós-Graduação em Computação, 2007. Disponível em: <http://www.lume.ufrgs.br/handle/10183/10747>, acessado em 24 de abril de 2012. MORESI, E. A., Delineando o valor do sistema de informação de uma organização. Ciência da Informação, v. 29, n. 1, p. 14-27, jan/abr. 2000. QUEIROGA, Rodrigo Mendonça. Uso de técnicas da Data Mining para detecção de fraudes em energia elétrica. Programa de pós-graduação em informativ. Universidade Federal do Espírito Santo, 2005. REZENDE, S. O. Sistemas Inteligentes – Fundamentos e Aplicações. Barueri: Editora Manole, 2003. ROCHA, CATARINA C. RecDoc: um sistema de recomendação para biblioteca digital na Web. Rio de Janeiro: Universidade Federal do Rio de Janeiro (2003). Tese de Mestrado. SANTOS, M. F.; AZEVEDO, C. Data Mining: Descoberta de Conhecimento em Bases de Dados. Lisboa: Editora FCA, 2005. SERRANO, Maurício. Um Sistema de Recomendação para Mídias Baseado em Conteúdo Nebuloso. UFSCar, São Paulo, 2003. Dissertação (Mestrado) Disponível em: <http://www.bdtd.ufscar.br/htdocs/tedeSimplificado/tde_arquivos/3/TDE-2006-11-24T14:22:04Z1269/Publico/DissMS.pdf>, acessado em 15 de abril de 2012. SFERRA, H. H.; CORRÊA, A. M. C. J. Conceitos e Aplicações de Data Mining. Revista de Ciência e Tecnologia, v.11, n. 22, p. 19-34., 2003. SIDNEY, C. F. Aplicação de Mineração de Dados no Banco de Dados do Zoneamento Ecológico Econômico de Minas Gerais. Lavras: Universidade Federal de Lavras, 2010. Trabalho de Conclusão de Curso. 14