SlideShare uma empresa Scribd logo
1 de 16
Baixar para ler offline
Web Data mining com R:
aprendizagem de m´quina
a
Fabr´ Jailson Barth
ıcio
Faculdade BandTec e VAGAS Tecnologia

Junho de 2013
Sum´rio
a
• O que ´ Aprendizagem de M´quina?
e
a
• Hierarquia de aprendizado.
• Exemplos de aprendizagem supervisionada (modelos
preditivos).
• Exemplos de aprendizagem n˜o supervisionada
a
(modelos descritivos).
• Referˆncias e exerc´
e
ıcios.

Web Data mining com R: aprendizagem de m´quina —
a

Sum´rio
a

2
Contexto e exemplos
• Data Mining: grandes bases de dados tˆm crescido
e
com a automatiza¸˜o de alguns processos e com o
ca
advento da Web, por exemplo: web click data,
registros m´dicos, dados biol´gicos, dados capturados
e
o
a partir de sensores.
• Aplica¸˜es que n˜o podem ser programadas “na
co
a
m˜o”: por exemplo, helicopteros autˆnomos,
a
o
reconhecedor de escrita, processadores de linguagem
natural e sistemas de vis˜o computacional.
a
• Aplica¸˜es personaliz´veis: Amazon, Netflix.
co
a
• Compreens˜o do aprendizado humano.
a
Web Data mining com R: aprendizagem de m´quina —
a

Contexto e exemplos

3
O que ´ Aprendizagem de M´quina?
e
a
´
• Area de estudo que fornece aos computadores a
habilidade de aprender sem serem explicitamente
programados [Arthur Samuel (1959)].
• Defini¸˜o bem formada: A computer program is said
ca
to learn from experience A with respect to some task
T and some performance measure P, if its performance
on T, as measured by P, improves with experience E
[Tom Mitchell (1998)].

Web Data mining com R: aprendizagem de m´quina —
a

O que ´ Aprendizagem de M´quina?
e
a

4
Exerc´
ıcio
O que cada uma das senten¸as abaixo descreve segundo a
c
defini¸˜o do Tom Mitchell?
ca
• Classificar e-mails como spam ou n˜o spam.
a
• Verificar quais e-mails o usu´rio classifica como spam.
a
• O n´mero (ou fra¸˜o) de e-mails corretamente
u
ca
classificados como spam ou n˜o spam.
a

Web Data mining com R: aprendizagem de m´quina —
a

Exerc´
ıcio

5
Hierarquia de aprendizado
Aprendizagem

Supervisionada
Modelos preditivos

Classificação

Regressão

Web Data mining com R: aprendizagem de m´quina —
a

Não supervisionada
Modelos descritivos

Sumarização

Associação

Hierarquia de aprendizado

Agrupamento

6
Exemplos de aprendizagem supervisionada
• Estimar o pre¸o de uma casa.
c
atributos: tamanho, posi¸˜o geogr´fica, material.
ca
a
classe: pre¸o (regress˜o).
c
a
• Determinar se uma pessoa tem cˆncer benigno ou
a
maligno.
atributos: tamanho do tumor, formato do tumor,
idade do paciente.
classe: tumor benigno ou tumor maligno
(classifica¸˜o).
ca

Web Data mining com R: aprendizagem de m´quina —
a

Exemplos de aprendizagem supervisionada

7
• Determinar se ´ um texto publicado em uma rede
e
social ´ inadequado ou n˜o.
e
a
atributos: quantidade de palavras encontradas no
texto, quantidade de palavras proibidas
encontradas no texto, quantidade de textos j´
a
criados pelo usu´rio, idade do usu´rio no sistema,
a
a
quantidade de textos criados pelo usu´rio e
a
moderados, ...
classe: texto adequado ou n˜o (classifica¸˜o).
a
ca
classes: texto adequado, texto inadequado, texto
com propaganda (classifica¸˜o com m´ltiplas
ca
u
classes).

Web Data mining com R: aprendizagem de m´quina —
a

Exemplos de aprendizagem supervisionada

8
Exemplo de dataset com classe
Idade

Miopia

Astigmat.

Lacrimej.

Lentes

jovem

m´
ıope

n˜o
a

reduzido

nenhuma

jovem

m´
ıope

n˜o
a

normal

fraca

jovem

m´
ıope

sim

reduzido

nenhuma

jovem

m´
ıope

sim

normal

forte

···

···

···

···

···

adulto

m´
ıope

n˜o
a

reduzido

nenhuma

Web Data mining com R: aprendizagem de m´quina —
a

Exemplo de dataset com classe

9
Exerc´
ıcios
Que problema deve ser tratado como problema de
regress˜o e que problema deve ser tratado como problema
a
de classifica¸˜o?
ca
• A sua empresa possui 1.000 itens idˆnticos em
e
estoque. Vocˆ quer predizer quantos destes itens ser˜o
e
a
vendidos nos pr´ximos trˆs meses.
o
e
• Vocˆ quer examinar clientes seus e para cada um
e
decidir se ele ir´ pagar todo o financiamento ou n˜o.
a
a

Web Data mining com R: aprendizagem de m´quina —
a

Exerc´
ıcios

10
Exemplos de aprendizagem n˜o
a
supervisionada
• Dado conjuntos de itens adquiridos na mesma compra,
identificar padr˜es de compra.
o
• Identificar padr˜es de navega¸˜o em sites.
o
ca
• Agrupar not´
ıcias semelhantes publicadas por v´rias
a
fontes de informa¸˜o.
ca
• Numa rede social, identificar sub-grupo de pessoas.

Web Data mining com R: aprendizagem de m´quina —
a

Exemplos de aprendizagem n˜o supervisionada
a

11
Exemplos de aprendizagem n˜o
a
supervisionada
Table 1: Exemplo de tabela com as transa¸˜es dos usu´rios
co
a
usu´rio
a

categoria1

categoria2

categoria3

···

categoriam

user1

0

2

0

···

1

user2

1

1

0

···

0

user3

2

0

1

···

0

user4

0

1

0

···

0

···

···

···

···

···

···

usern

1

1

0

···

1

Web Data mining com R: aprendizagem de m´quina —
a

Exemplos de aprendizagem n˜o supervisionada
a

12
Exemplo de identifica¸˜o de grupos em
ca
redes sociais

Web Data mining com R: aprendizagem de m´quina —
a

Exemplo de identifica¸˜o de grupos em redes sociais
ca

13
Exerc´
ıcios
Quais dos problemas abaixo vocˆ iria resolver com uma
e
abordagem n˜o supervisionada de aprendizagem?
a
• Dado e-mails rotulados como spam e n˜o spam,
a
desenvolver um filtro de spam.
• Dado um conjunto de not´
ıcias encontradas na
Internet, agrup´-las em conjunto de not´
a
ıcias que
tratam do mesmo assunto.

Web Data mining com R: aprendizagem de m´quina —
a

Exerc´
ıcios

14
• Dado uma base de clientes, descobrir segmentos de
clientes.
• Dado uma base de pacientes diagnosticados com
diabetes ou n˜o, aprender a classificar novos pacientes
a
com diabetes ou n˜o.
a

Web Data mining com R: aprendizagem de m´quina —
a

Exerc´
ıcios

15
Material de consulta
• Tom Mitchell. Machine Learning, 1997.
• Iah H. Witteh and Eibe Frank. Data Mining: Practical
Machine Learning Tools and Techniques (Third
Edition), 2011.
• Andrew Ng. http://www.ml-class.org
• Faceli, Lorena, Gama, Carvalho. Inteligˆncia Artificial:
e
uma abordagem de aprendizado de m´quina, 2011.
a

Web Data mining com R: aprendizagem de m´quina —
a

Material de consulta

16

Mais conteúdo relacionado

Semelhante a Web Data Mining com r: aprendizagem de máquina

Boas Práticas para Publicação de Dados na Web
Boas Práticas para Publicação de Dados na WebBoas Práticas para Publicação de Dados na Web
Boas Práticas para Publicação de Dados na WebCentro Web
 
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...Ahirton Lopes
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceLuca Bastos
 
Web Data Mining com R: design de projetos para criação de modelos preditivos
Web Data Mining com R: design de projetos para criação de modelos preditivosWeb Data Mining com R: design de projetos para criação de modelos preditivos
Web Data Mining com R: design de projetos para criação de modelos preditivosFabrício Barth
 
O que é Analytics?
O que é Analytics?O que é Analytics?
O que é Analytics?Bruno Michel
 
Uma introdução à mineração de informações na era do Big Data
Uma introdução à mineração de informações na era do Big DataUma introdução à mineração de informações na era do Big Data
Uma introdução à mineração de informações na era do Big DataFabrício Barth
 
Iniciativas em Big Data no VAGAS.com
Iniciativas em Big Data no VAGAS.comIniciativas em Big Data no VAGAS.com
Iniciativas em Big Data no VAGAS.comFabrício Barth
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosCentro Web
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdMauro Risonho de Paula Assumpcao
 
Data Mining (mineração de dados)
Data Mining (mineração de dados)Data Mining (mineração de dados)
Data Mining (mineração de dados)Jéssica Góis Scala
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dadoscardoso80
 
Aula Sistemas De Marketing
Aula Sistemas De MarketingAula Sistemas De Marketing
Aula Sistemas De Marketingeloychaves
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Avelino Ferreira Gomes Filho
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Case Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonCase Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonArthur Fortes
 

Semelhante a Web Data Mining com r: aprendizagem de máquina (20)

Boas Práticas para Publicação de Dados na Web
Boas Práticas para Publicação de Dados na WebBoas Práticas para Publicação de Dados na Web
Boas Práticas para Publicação de Dados na Web
 
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...
[José Ahirton Lopes] Minicurso - Mineração Textual e Processamento de Linguag...
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Web Data Mining com R: design de projetos para criação de modelos preditivos
Web Data Mining com R: design de projetos para criação de modelos preditivosWeb Data Mining com R: design de projetos para criação de modelos preditivos
Web Data Mining com R: design de projetos para criação de modelos preditivos
 
O que é Analytics?
O que é Analytics?O que é Analytics?
O que é Analytics?
 
Web Data Mining com R
Web Data Mining com RWeb Data Mining com R
Web Data Mining com R
 
Uma introdução à mineração de informações na era do Big Data
Uma introdução à mineração de informações na era do Big DataUma introdução à mineração de informações na era do Big Data
Uma introdução à mineração de informações na era do Big Data
 
Iniciativas em Big Data no VAGAS.com
Iniciativas em Big Data no VAGAS.comIniciativas em Big Data no VAGAS.com
Iniciativas em Big Data no VAGAS.com
 
Apresentação data mining
Apresentação data miningApresentação data mining
Apresentação data mining
 
Boas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e BenefíciosBoas Práticas para Dados na Web: Desafios e Benefícios
Boas Práticas para Dados na Web: Desafios e Benefícios
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
 
Data Mining (mineração de dados)
Data Mining (mineração de dados)Data Mining (mineração de dados)
Data Mining (mineração de dados)
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Aula Sistemas De Marketing
Aula Sistemas De MarketingAula Sistemas De Marketing
Aula Sistemas De Marketing
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...
 
Mineração
MineraçãoMineração
Mineração
 
GICAula3.ppt
GICAula3.pptGICAula3.ppt
GICAula3.ppt
 
Data mining
Data miningData mining
Data mining
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Case Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonCase Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em Python
 

Mais de Fabrício Barth

Mineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataMineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataFabrício Barth
 
Redução de dimensionalidade - Pós Graduação em Big Data
Redução de dimensionalidade - Pós Graduação em Big DataRedução de dimensionalidade - Pós Graduação em Big Data
Redução de dimensionalidade - Pós Graduação em Big DataFabrício Barth
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Pré-processamento [no R] e Análise Exploratória - Curso de Big Data
Pré-processamento [no R] e Análise Exploratória - Curso de Big DataPré-processamento [no R] e Análise Exploratória - Curso de Big Data
Pré-processamento [no R] e Análise Exploratória - Curso de Big DataFabrício Barth
 
Algoritmos de Agrupamento - Aprendizado não supervisionado
Algoritmos de Agrupamento - Aprendizado não supervisionadoAlgoritmos de Agrupamento - Aprendizado não supervisionado
Algoritmos de Agrupamento - Aprendizado não supervisionadoFabrício Barth
 
Human Activity Recognition
Human Activity RecognitionHuman Activity Recognition
Human Activity RecognitionFabrício Barth
 
Oficina: construção de modelos descritivos e preditivos utilizando R
Oficina: construção de modelos descritivos e preditivos utilizando ROficina: construção de modelos descritivos e preditivos utilizando R
Oficina: construção de modelos descritivos e preditivos utilizando RFabrício Barth
 
Web Data Mining com R: identificação de spam utilizando Random Forest
Web Data Mining com R: identificação de spam utilizando Random ForestWeb Data Mining com R: identificação de spam utilizando Random Forest
Web Data Mining com R: identificação de spam utilizando Random ForestFabrício Barth
 
Web Data Mining em R: agrupamento de mensagens do twitter
Web Data Mining em R: agrupamento de mensagens do twitterWeb Data Mining em R: agrupamento de mensagens do twitter
Web Data Mining em R: agrupamento de mensagens do twitterFabrício Barth
 
Web Data Mining com R: criação de regras de associação a partir da navegação ...
Web Data Mining com R: criação de regras de associação a partir da navegação ...Web Data Mining com R: criação de regras de associação a partir da navegação ...
Web Data Mining com R: criação de regras de associação a partir da navegação ...Fabrício Barth
 
Web Data Mining com R: pré-processamento de dados [no R]
Web Data Mining com R: pré-processamento de dados [no R]Web Data Mining com R: pré-processamento de dados [no R]
Web Data Mining com R: pré-processamento de dados [no R]Fabrício Barth
 
Data Science, Machine Learning and Big Data
Data Science, Machine Learning and Big DataData Science, Machine Learning and Big Data
Data Science, Machine Learning and Big DataFabrício Barth
 
Uma introdução à mineração de informações
Uma introdução à mineração de informaçõesUma introdução à mineração de informações
Uma introdução à mineração de informaçõesFabrício Barth
 
Data, Text and Web Mining
Data, Text and Web MiningData, Text and Web Mining
Data, Text and Web MiningFabrício Barth
 
Ferramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFerramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFabrício Barth
 
Atena: um sistema para suporte ao planejamento na área de Gestão de Projeto
Atena: um sistema para suporte ao planejamento na área de Gestão de ProjetoAtena: um sistema para suporte ao planejamento na área de Gestão de Projeto
Atena: um sistema para suporte ao planejamento na área de Gestão de ProjetoFabrício Barth
 

Mais de Fabrício Barth (17)

Mineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataMineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big Data
 
Redução de dimensionalidade - Pós Graduação em Big Data
Redução de dimensionalidade - Pós Graduação em Big DataRedução de dimensionalidade - Pós Graduação em Big Data
Redução de dimensionalidade - Pós Graduação em Big Data
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Pré-processamento [no R] e Análise Exploratória - Curso de Big Data
Pré-processamento [no R] e Análise Exploratória - Curso de Big DataPré-processamento [no R] e Análise Exploratória - Curso de Big Data
Pré-processamento [no R] e Análise Exploratória - Curso de Big Data
 
Algoritmos de Agrupamento - Aprendizado não supervisionado
Algoritmos de Agrupamento - Aprendizado não supervisionadoAlgoritmos de Agrupamento - Aprendizado não supervisionado
Algoritmos de Agrupamento - Aprendizado não supervisionado
 
Human Activity Recognition
Human Activity RecognitionHuman Activity Recognition
Human Activity Recognition
 
Oficina: construção de modelos descritivos e preditivos utilizando R
Oficina: construção de modelos descritivos e preditivos utilizando ROficina: construção de modelos descritivos e preditivos utilizando R
Oficina: construção de modelos descritivos e preditivos utilizando R
 
Web Data Mining com R: identificação de spam utilizando Random Forest
Web Data Mining com R: identificação de spam utilizando Random ForestWeb Data Mining com R: identificação de spam utilizando Random Forest
Web Data Mining com R: identificação de spam utilizando Random Forest
 
Web Data Mining em R: agrupamento de mensagens do twitter
Web Data Mining em R: agrupamento de mensagens do twitterWeb Data Mining em R: agrupamento de mensagens do twitter
Web Data Mining em R: agrupamento de mensagens do twitter
 
Web Data Mining com R: criação de regras de associação a partir da navegação ...
Web Data Mining com R: criação de regras de associação a partir da navegação ...Web Data Mining com R: criação de regras de associação a partir da navegação ...
Web Data Mining com R: criação de regras de associação a partir da navegação ...
 
Web Data Mining com R: pré-processamento de dados [no R]
Web Data Mining com R: pré-processamento de dados [no R]Web Data Mining com R: pré-processamento de dados [no R]
Web Data Mining com R: pré-processamento de dados [no R]
 
Data Science, Machine Learning and Big Data
Data Science, Machine Learning and Big DataData Science, Machine Learning and Big Data
Data Science, Machine Learning and Big Data
 
Projeto Simple Maps
Projeto Simple MapsProjeto Simple Maps
Projeto Simple Maps
 
Uma introdução à mineração de informações
Uma introdução à mineração de informaçõesUma introdução à mineração de informações
Uma introdução à mineração de informações
 
Data, Text and Web Mining
Data, Text and Web MiningData, Text and Web Mining
Data, Text and Web Mining
 
Ferramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de InformaçõesFerramentas Java para Recuperação e Mineração de Informações
Ferramentas Java para Recuperação e Mineração de Informações
 
Atena: um sistema para suporte ao planejamento na área de Gestão de Projeto
Atena: um sistema para suporte ao planejamento na área de Gestão de ProjetoAtena: um sistema para suporte ao planejamento na área de Gestão de Projeto
Atena: um sistema para suporte ao planejamento na área de Gestão de Projeto
 

Web Data Mining com r: aprendizagem de máquina

  • 1. Web Data mining com R: aprendizagem de m´quina a Fabr´ Jailson Barth ıcio Faculdade BandTec e VAGAS Tecnologia Junho de 2013
  • 2. Sum´rio a • O que ´ Aprendizagem de M´quina? e a • Hierarquia de aprendizado. • Exemplos de aprendizagem supervisionada (modelos preditivos). • Exemplos de aprendizagem n˜o supervisionada a (modelos descritivos). • Referˆncias e exerc´ e ıcios. Web Data mining com R: aprendizagem de m´quina — a Sum´rio a 2
  • 3. Contexto e exemplos • Data Mining: grandes bases de dados tˆm crescido e com a automatiza¸˜o de alguns processos e com o ca advento da Web, por exemplo: web click data, registros m´dicos, dados biol´gicos, dados capturados e o a partir de sensores. • Aplica¸˜es que n˜o podem ser programadas “na co a m˜o”: por exemplo, helicopteros autˆnomos, a o reconhecedor de escrita, processadores de linguagem natural e sistemas de vis˜o computacional. a • Aplica¸˜es personaliz´veis: Amazon, Netflix. co a • Compreens˜o do aprendizado humano. a Web Data mining com R: aprendizagem de m´quina — a Contexto e exemplos 3
  • 4. O que ´ Aprendizagem de M´quina? e a ´ • Area de estudo que fornece aos computadores a habilidade de aprender sem serem explicitamente programados [Arthur Samuel (1959)]. • Defini¸˜o bem formada: A computer program is said ca to learn from experience A with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E [Tom Mitchell (1998)]. Web Data mining com R: aprendizagem de m´quina — a O que ´ Aprendizagem de M´quina? e a 4
  • 5. Exerc´ ıcio O que cada uma das senten¸as abaixo descreve segundo a c defini¸˜o do Tom Mitchell? ca • Classificar e-mails como spam ou n˜o spam. a • Verificar quais e-mails o usu´rio classifica como spam. a • O n´mero (ou fra¸˜o) de e-mails corretamente u ca classificados como spam ou n˜o spam. a Web Data mining com R: aprendizagem de m´quina — a Exerc´ ıcio 5
  • 6. Hierarquia de aprendizado Aprendizagem Supervisionada Modelos preditivos Classificação Regressão Web Data mining com R: aprendizagem de m´quina — a Não supervisionada Modelos descritivos Sumarização Associação Hierarquia de aprendizado Agrupamento 6
  • 7. Exemplos de aprendizagem supervisionada • Estimar o pre¸o de uma casa. c atributos: tamanho, posi¸˜o geogr´fica, material. ca a classe: pre¸o (regress˜o). c a • Determinar se uma pessoa tem cˆncer benigno ou a maligno. atributos: tamanho do tumor, formato do tumor, idade do paciente. classe: tumor benigno ou tumor maligno (classifica¸˜o). ca Web Data mining com R: aprendizagem de m´quina — a Exemplos de aprendizagem supervisionada 7
  • 8. • Determinar se ´ um texto publicado em uma rede e social ´ inadequado ou n˜o. e a atributos: quantidade de palavras encontradas no texto, quantidade de palavras proibidas encontradas no texto, quantidade de textos j´ a criados pelo usu´rio, idade do usu´rio no sistema, a a quantidade de textos criados pelo usu´rio e a moderados, ... classe: texto adequado ou n˜o (classifica¸˜o). a ca classes: texto adequado, texto inadequado, texto com propaganda (classifica¸˜o com m´ltiplas ca u classes). Web Data mining com R: aprendizagem de m´quina — a Exemplos de aprendizagem supervisionada 8
  • 9. Exemplo de dataset com classe Idade Miopia Astigmat. Lacrimej. Lentes jovem m´ ıope n˜o a reduzido nenhuma jovem m´ ıope n˜o a normal fraca jovem m´ ıope sim reduzido nenhuma jovem m´ ıope sim normal forte ··· ··· ··· ··· ··· adulto m´ ıope n˜o a reduzido nenhuma Web Data mining com R: aprendizagem de m´quina — a Exemplo de dataset com classe 9
  • 10. Exerc´ ıcios Que problema deve ser tratado como problema de regress˜o e que problema deve ser tratado como problema a de classifica¸˜o? ca • A sua empresa possui 1.000 itens idˆnticos em e estoque. Vocˆ quer predizer quantos destes itens ser˜o e a vendidos nos pr´ximos trˆs meses. o e • Vocˆ quer examinar clientes seus e para cada um e decidir se ele ir´ pagar todo o financiamento ou n˜o. a a Web Data mining com R: aprendizagem de m´quina — a Exerc´ ıcios 10
  • 11. Exemplos de aprendizagem n˜o a supervisionada • Dado conjuntos de itens adquiridos na mesma compra, identificar padr˜es de compra. o • Identificar padr˜es de navega¸˜o em sites. o ca • Agrupar not´ ıcias semelhantes publicadas por v´rias a fontes de informa¸˜o. ca • Numa rede social, identificar sub-grupo de pessoas. Web Data mining com R: aprendizagem de m´quina — a Exemplos de aprendizagem n˜o supervisionada a 11
  • 12. Exemplos de aprendizagem n˜o a supervisionada Table 1: Exemplo de tabela com as transa¸˜es dos usu´rios co a usu´rio a categoria1 categoria2 categoria3 ··· categoriam user1 0 2 0 ··· 1 user2 1 1 0 ··· 0 user3 2 0 1 ··· 0 user4 0 1 0 ··· 0 ··· ··· ··· ··· ··· ··· usern 1 1 0 ··· 1 Web Data mining com R: aprendizagem de m´quina — a Exemplos de aprendizagem n˜o supervisionada a 12
  • 13. Exemplo de identifica¸˜o de grupos em ca redes sociais Web Data mining com R: aprendizagem de m´quina — a Exemplo de identifica¸˜o de grupos em redes sociais ca 13
  • 14. Exerc´ ıcios Quais dos problemas abaixo vocˆ iria resolver com uma e abordagem n˜o supervisionada de aprendizagem? a • Dado e-mails rotulados como spam e n˜o spam, a desenvolver um filtro de spam. • Dado um conjunto de not´ ıcias encontradas na Internet, agrup´-las em conjunto de not´ a ıcias que tratam do mesmo assunto. Web Data mining com R: aprendizagem de m´quina — a Exerc´ ıcios 14
  • 15. • Dado uma base de clientes, descobrir segmentos de clientes. • Dado uma base de pacientes diagnosticados com diabetes ou n˜o, aprender a classificar novos pacientes a com diabetes ou n˜o. a Web Data mining com R: aprendizagem de m´quina — a Exerc´ ıcios 15
  • 16. Material de consulta • Tom Mitchell. Machine Learning, 1997. • Iah H. Witteh and Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), 2011. • Andrew Ng. http://www.ml-class.org • Faceli, Lorena, Gama, Carvalho. Inteligˆncia Artificial: e uma abordagem de aprendizado de m´quina, 2011. a Web Data mining com R: aprendizagem de m´quina — a Material de consulta 16