shestech.org
shestech.org
Como descobrir e
classificar "coisas"
usando o aprendizado de
máquina sem complicação!
Elaine Cecília Gatto
Cissa
1. Definição deClassificação
2. Classificação Binária
3. Classificação MultiClasse
4. Classificação Multirrótulo
5. Classificação Hierárquica Multirrótulo
6. Conclusão
Agenda
• Ação ou efeito de classificar;
• Distribuição sistemática de pessoas ou coisas
em classes ou categorias, de acordo com
critérios estabelecidos;
• Distribuição por classes.
Definição
Um Problema de Classificação de Dados consiste
em determinar um rótulo, para um objeto,
baseado em um conhecimento prévio. Um rótulo é
um nome dado a determinado objeto.
Definição
Classificação Binária
Classificação Binária
Coleção de Vídeos
• É ou não é
• Pertence ou não pertence
• Não pode pertencer à outra
classe
• Assistiu ou não assistiu
• Gostou ou não gostou
• Um ou zero
• Etc.
• Classe positiva
• Classe negativa
• Rótulos
Classificação Binária
Vídeos marcados com GOSTEI
Vídeos marcados com NÃO GOSTEI
Vídeos não classificados!
Classificação Binária
Dados não rotulados
Conjunto de Treino
Conjunto de Teste
Classificação Binária
Modelo de
Classificação
Treinamento do
Modelo
Fase de
Aprendizagem
Modelo
Aprendido
Conjunto de Treino
Classificação Binária
Modelo
Aprendido
Conjunto de Teste Saída do Algoritmo
Rótulos Preditos
Comparar com os reais
Classificação Binária
Modelo
Aprendido
Saída do Algoritmo
Dados rotulados
Dados não rotulados
Classificação Binária
Id Título Gênero Diretor Ano Data Estúdio ... Gostei
1 1
2 0
3 1
4 0
5 0
6 0
... ...
Rótulo
Classificação MultiClasse
Classificação Multiclasse
Coleção de
Fotos de
Animais
• Pertence ou não pertence a
uma classe específica
• Não pode pertencer a várias
classes ao mesmo tempo
• Uma classe positiva e duas
ou mais classes negativas
Classificação Multiclasse
Animal Marinho
Animal Voador
Animal Doméstico
Não Classificado
Coleção de
Fotos de
Animais
Classificação Multiclasse
Dados não rotulados
Conjunto de Treino
Conjunto de Teste
Classificação Multiclasse
Modelo de
Classificação
Treinamento do
Modelo
Fase de
Aprendizagem
Modelo
Aprendido
Conjunto de Treino
Classificação Multiclasse
Modelo
Aprendido
Saída do Algoritmo
Rótulos Preditos
Comparar com os reais
Conjunto de Teste
Classificação Multiclasse
Modelo
Aprendido
Saída do Algoritmo
Dados rotulados
Dados não rotulados
Classificação Multiclasse
versicolor
virginica
setosa
Classificação Multiclasse
Classificação Multirrótulo
Classificação Multirrótulo
• Pode pertencer a uma ou
várias classes ao mesmo
tempo, assim como pode
não pertencer a nenhuma
das classes do problema
• Classes positivas e
negativas: nenhuma, uma ou
várias
Classificação Multirrótulo
Classificação Multirrótulo
1 classe ou rótulo
2 classes ou rótulos
3 classes ou rótulos
Nenhuma classe ou
classes preditas erradas ou
objetos rotulados errados
Todas as classes
Classificação Multirrótulo
Classificação Multirrótulo
Modelo de
Classificação
Treinamento
do Modelo
Fase de
Aprendizagem
Modelo
Aprendido
Classificação Multirrótulo
Modelo
Aprendido
Refinar modelo constantemente!
Classificação Multirrótulo
Modelo
Aprendido
Classificação Multirrótulo
Modelo
Aprendido
Refinar modelo constantemente!
Classificação Multirrótulo
Id Título Diretor .... Suspense Ficção
Científica
Ação Comédia ....
1 1 0 0 0 ...
2 1 1 0 0 ...
3 1 1 1 0 ...
4 1 1 1 1 ...
5 0 0 0 0 ...
6 0 0 1 1 ...
7 0 1 1 0 ...
8 0 1 0 1 ...
... ... ... ... ... ... ... ... ...
Classificação Multirrótulo
https://cometa.ujaen.es/datasets/emotions
Classificação Hierárquica Multirrótulo
https://assets.digitalocean.com/articles/understanding_relational_dbs/hierarchical_diagram_final.p
ng
Classificação Hierárquica Multirrótulo
https://www.researchgate.net/profile/Jayme-Barbedo/publication/26620180/figure/fig1/AS:668991131496465@1536511323588/Musical-genre-taxonomy.png
Classificação Hierárquica Multirrótulo
https://dtai.cs.kuleuven.be/clus/hmcdatasets/
• Agronomia;
• Biotecnologia;
• Setor Financeiro;
• Setor Elétrico;
• Saúde em geral
• Indústrias em geral;
• Psicologia;
• Qualquer área!
Domínios de Aplicação
• Análisar Sentimentos;
• Detectar spam de e-mail;
• Diagnósticar de doenças;
• Classificar documentos, textos,
imagens, áudios, vídeos,
música, filmes, etc.
• Sistemas de recomendação
em geral;
Exemplos
• Detectar fraudes em cartões de crédito;
• Descobrir funções de proteínas;
• Monitorar temperaturas em sensores;
• Previsão do comportamento do cliente;
• Previsão da taxa de cliques do anúncio;
• Classificação de malware;
• Etc.
Exemplos
shestech.org
Obrigada!
@elainececiliagatto
@cissagatto

Como descobrir e classificar coisas usando machine learning sem compilcação