SlideShare uma empresa Scribd logo
1 de 23
LARGE-SCALE MACHINE
LEARNING
Mirla Braga
mirlabraga@gmail.com
05/07/2013
Conteúdo – O que vamos ver
• SVM
– Pequena revisão
– Introdução
– SVM
– SVM Generalização
2
... o que aconteceu
• Vários Algoritmos Classificados como “machine
learning”;
• extrair informações a partir de data;
• Todos os algoritmos de análise de dados são
projetados para produzir um resumo útil dos dados,
a partir da qual são feitas as decisões;
3
e ainda...
• os algoritmos classificados como aprendizado de
máquina tem um determinado objetivo, eles são
projetados para classificar os dados que serão vistos no
futuro
• Conjunto de treinamento é o conjunto definido para
analise;
• O resultado do algoritmo é chamado de classificador;
• inclui informações sobre a maneira correta de classificar um
subconjunto dos dados, chamada o conjunto de treino.
4
Algoritmos ML
• Árvore de Decisão;
Perceptrons;
• Redes Neurais;
Aprendizagem baseada em instância;
• Máquinas de suporte vetorial.
5
SVM
• Máquina de Vetores de Suporte
– Analisam os dados e reconhecem padrões;
– Usado para classificação e análise de regressão
6
Aplicações
• Em visão artificial para o reconhecimento de
caracteres, rostos, placas e objetos;
• Na medicina, para a classificação de exames
radiológicos, tomografia computadorizada, e
outros para a diagnóstico do tecido humano.
• Em Genética de Previsão Gene
7
Modelagem 3D usando SVM
8
Aplicações
• Classificação de documentos
• Na simulação, para modelagem de sólidos
• Em interfaces humano-computador
• Em Identificação de pessoas
• Na previsão de economia
9
Evolução - Melhorias
Perceptron
SVM
10
Introdução - Problema
O Problema de classificação
para alguma data
11
Solução
• O padrão de cada
objeto identificado é
comparado às classes
de padrões já
conhecidas com o
intuito de decidir à qual
grupo ele pertence
12
13
Figura 1: Um SVM seleciona o hiperplano com a maior margem possível γ entre o
hiperplana e os pontos de formação
Solução
A mecânica de um SVM
Selecionar um hyperplano w.x + b = 0¹ que
maximiza a distância γ entre o hyperplano e
os pontos do training set
14
Solução
• SVM procura hiperplana que separa os
pontos de outra classe de forma ótima;
• Muitas fronteiras de decisão;
• Todas as fronteiras são boas.
15
Solução – Selecionando a Melhor
fronteira
16
• O SVM encontra o
hiperplano que
maximiza a distância
(ou intervalo), com
pontos que estão mais
perto de si mesmo, e é
por isso que eles
também são conhecidos
por SVM como
classificador de margem
máxima.
Solução - Matematicamente
• Dado um conjunto de treinamento
• Maximize γ (variando w e b) sujeito à
restrição de que para todos
• Onde
y = {+1,-1}
17
Solução – Matematicamente
Normalizando o Hiperplano
• O vetor w é a normal ao
hiperplana.
• A distância do
hiperplano a origem é
• A normal do vetor w
• A distância entre x1
para x2
18
Solução
Agora, o problema torna-se um problema de
otimização, como a encontrar as classes
hiperplano melhor separação deve maximizar
a margem entre x1 ex2
19
Generalizando
20
Generalizando
21
PERGUNTAS?
22
OBRIGADA!
23

Mais conteúdo relacionado

Semelhante a Apresentacao -aula_14

[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive BayesAhirton Lopes
 
Analytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisaoAnalytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisaoVitor Nunes
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaWalter Hugo Lopez Pinaya
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosDiego Negretto
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...Tchelinux
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Douglas Mendes
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaFernando Palma
 
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...Minitab, LLC
 
Meta-aprendizado para otimização de parâmetros de redes neurais
Meta-aprendizado para otimização de parâmetros de redes neuraisMeta-aprendizado para otimização de parâmetros de redes neurais
Meta-aprendizado para otimização de parâmetros de redes neuraisOrlando Junior
 
Machine Learning com Python e Scikit-learn
Machine Learning com Python e Scikit-learnMachine Learning com Python e Scikit-learn
Machine Learning com Python e Scikit-learnChristian Perone
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na PráticaEiti Kimura
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidadeCarlos Augusto Oeiras
 
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisão
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de DecisãoAHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisão
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisãogutobiker
 
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Os Fantasmas !
 

Semelhante a Apresentacao -aula_14 (20)

[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
[José Ahirton Lopes] Treinamento - Árvores de Decisão, SVM e Naive Bayes
 
Analytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisaoAnalytics - Data Science - Arvores de decisao
Analytics - Data Science - Arvores de decisao
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociência
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de Dados
 
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
Data Mining e Machine Learning com Python - Mateus Grellert - Tchelinux Pelot...
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de Máquina
 
160277 redes neurais artificiais
160277 redes neurais artificiais160277 redes neurais artificiais
160277 redes neurais artificiais
 
Tsg web mining
Tsg web miningTsg web mining
Tsg web mining
 
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...
Melhore seu conhecimento sobre analise de dados com a versao mais recente do ...
 
Meta-aprendizado para otimização de parâmetros de redes neurais
Meta-aprendizado para otimização de parâmetros de redes neuraisMeta-aprendizado para otimização de parâmetros de redes neurais
Meta-aprendizado para otimização de parâmetros de redes neurais
 
Machine Learning com Python e Scikit-learn
Machine Learning com Python e Scikit-learnMachine Learning com Python e Scikit-learn
Machine Learning com Python e Scikit-learn
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
 
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade
 
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisão
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de DecisãoAHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisão
AHP - Analytic Hierarchy Process / Um Método de Auxílio à Tomada de Decisão
 
Cluster analysis TDC POA 2017
Cluster analysis  TDC POA 2017Cluster analysis  TDC POA 2017
Cluster analysis TDC POA 2017
 
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 02 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
 
AHP - Analytic Hierarchy Process
AHP - Analytic Hierarchy ProcessAHP - Analytic Hierarchy Process
AHP - Analytic Hierarchy Process
 
Modelos de previsão de Ocorrências
Modelos de previsão de OcorrênciasModelos de previsão de Ocorrências
Modelos de previsão de Ocorrências
 

Apresentacao -aula_14

  • 2. Conteúdo – O que vamos ver • SVM – Pequena revisão – Introdução – SVM – SVM Generalização 2
  • 3. ... o que aconteceu • Vários Algoritmos Classificados como “machine learning”; • extrair informações a partir de data; • Todos os algoritmos de análise de dados são projetados para produzir um resumo útil dos dados, a partir da qual são feitas as decisões; 3
  • 4. e ainda... • os algoritmos classificados como aprendizado de máquina tem um determinado objetivo, eles são projetados para classificar os dados que serão vistos no futuro • Conjunto de treinamento é o conjunto definido para analise; • O resultado do algoritmo é chamado de classificador; • inclui informações sobre a maneira correta de classificar um subconjunto dos dados, chamada o conjunto de treino. 4
  • 5. Algoritmos ML • Árvore de Decisão; Perceptrons; • Redes Neurais; Aprendizagem baseada em instância; • Máquinas de suporte vetorial. 5
  • 6. SVM • Máquina de Vetores de Suporte – Analisam os dados e reconhecem padrões; – Usado para classificação e análise de regressão 6
  • 7. Aplicações • Em visão artificial para o reconhecimento de caracteres, rostos, placas e objetos; • Na medicina, para a classificação de exames radiológicos, tomografia computadorizada, e outros para a diagnóstico do tecido humano. • Em Genética de Previsão Gene 7
  • 9. Aplicações • Classificação de documentos • Na simulação, para modelagem de sólidos • Em interfaces humano-computador • Em Identificação de pessoas • Na previsão de economia 9
  • 11. Introdução - Problema O Problema de classificação para alguma data 11
  • 12. Solução • O padrão de cada objeto identificado é comparado às classes de padrões já conhecidas com o intuito de decidir à qual grupo ele pertence 12
  • 13. 13 Figura 1: Um SVM seleciona o hiperplano com a maior margem possível γ entre o hiperplana e os pontos de formação Solução
  • 14. A mecânica de um SVM Selecionar um hyperplano w.x + b = 0¹ que maximiza a distância γ entre o hyperplano e os pontos do training set 14
  • 15. Solução • SVM procura hiperplana que separa os pontos de outra classe de forma ótima; • Muitas fronteiras de decisão; • Todas as fronteiras são boas. 15
  • 16. Solução – Selecionando a Melhor fronteira 16 • O SVM encontra o hiperplano que maximiza a distância (ou intervalo), com pontos que estão mais perto de si mesmo, e é por isso que eles também são conhecidos por SVM como classificador de margem máxima.
  • 17. Solução - Matematicamente • Dado um conjunto de treinamento • Maximize γ (variando w e b) sujeito à restrição de que para todos • Onde y = {+1,-1} 17
  • 18. Solução – Matematicamente Normalizando o Hiperplano • O vetor w é a normal ao hiperplana. • A distância do hiperplano a origem é • A normal do vetor w • A distância entre x1 para x2 18
  • 19. Solução Agora, o problema torna-se um problema de otimização, como a encontrar as classes hiperplano melhor separação deve maximizar a margem entre x1 ex2 19

Notas do Editor

  1. Este modelo pode ser usado como arquivo de partida para apresentar materiais de treinamento em um cenário em grupo. Seções Clique com o botão direito em um slide para adicionar seções. Seções podem ajudar a organizar slides ou a facilitar a colaboração entre vários autores. Anotações Use a seção Anotações para anotações da apresentação ou para fornecer detalhes adicionais ao público. Exiba essas anotações no Modo de Exibição de Apresentação durante a sua apresentação. Considere o tamanho da fonte (importante para acessibilidade, visibilidade, gravação em vídeo e produção online) Cores coordenadas Preste atenção especial aos gráficos, tabelas e caixas de texto. Leve em consideração que os participantes irão imprimir em preto-e-branco ou escala de cinza. Execute uma impressão de teste para ter certeza de que as suas cores irão funcionar quando forem impressas em preto-e-branco puros e escala de cinza. Elementos gráficos, tabelas e gráficos Mantenha a simplicidade: se possível, use estilos e cores consistentes e não confusos. Rotule todos os gráficos e tabelas.
  2. Todos os algoritmos de análise de dados são projetados para produzir um resumo útil dos dados, a partir da qual são feitas as decisões;
  3. Aquisição, Pré-processamento (eliminação de ruídos), Segmentação - imagem é dividida em regiões que constituem os diversos objetos que nela são representados. A identificação de um objeto se baseia na detecção de descontinui-dades ou similaridades na imagem, gerando uma representação abstrata de seu contorno ou da região que ocupa .. Representação por Regiões (busca-se atribuir a cada objeto os pontos da imagem que possuam as mesmas propriedades de cor, intensidade e textura, ou seja, que apresentem similaridades segundo um critério pré-estabelecido) e Representação por Contornos (Métodos de detec-ção de bordas, busca em Grafos, Programação Dinâmica)
  4. Confidencial da Microsoft
  5. Confidencial da Microsoft