O documento discute classificação de máquina e algoritmos de aprendizado de máquina, com foco nos máquinas de vetores de suporte (SVM). O SVM é descrito como um algoritmo de aprendizado de máquina usado para classificação e regressão que analisa dados e reconhece padrões, encontrando o hiperplano que maximiza a distância entre classes de dados. Exemplos de aplicações do SVM incluem reconhecimento de imagens, diagnóstico médico e previsão econômica.
2. Conteúdo – O que vamos ver
• SVM
– Pequena revisão
– Introdução
– SVM
– SVM Generalização
2
3. ... o que aconteceu
• Vários Algoritmos Classificados como “machine
learning”;
• extrair informações a partir de data;
• Todos os algoritmos de análise de dados são
projetados para produzir um resumo útil dos dados,
a partir da qual são feitas as decisões;
3
4. e ainda...
• os algoritmos classificados como aprendizado de
máquina tem um determinado objetivo, eles são
projetados para classificar os dados que serão vistos no
futuro
• Conjunto de treinamento é o conjunto definido para
analise;
• O resultado do algoritmo é chamado de classificador;
• inclui informações sobre a maneira correta de classificar um
subconjunto dos dados, chamada o conjunto de treino.
4
5. Algoritmos ML
• Árvore de Decisão;
Perceptrons;
• Redes Neurais;
Aprendizagem baseada em instância;
• Máquinas de suporte vetorial.
5
6. SVM
• Máquina de Vetores de Suporte
– Analisam os dados e reconhecem padrões;
– Usado para classificação e análise de regressão
6
7. Aplicações
• Em visão artificial para o reconhecimento de
caracteres, rostos, placas e objetos;
• Na medicina, para a classificação de exames
radiológicos, tomografia computadorizada, e
outros para a diagnóstico do tecido humano.
• Em Genética de Previsão Gene
7
9. Aplicações
• Classificação de documentos
• Na simulação, para modelagem de sólidos
• Em interfaces humano-computador
• Em Identificação de pessoas
• Na previsão de economia
9
12. Solução
• O padrão de cada
objeto identificado é
comparado às classes
de padrões já
conhecidas com o
intuito de decidir à qual
grupo ele pertence
12
13. 13
Figura 1: Um SVM seleciona o hiperplano com a maior margem possível γ entre o
hiperplana e os pontos de formação
Solução
14. A mecânica de um SVM
Selecionar um hyperplano w.x + b = 0¹ que
maximiza a distância γ entre o hyperplano e
os pontos do training set
14
15. Solução
• SVM procura hiperplana que separa os
pontos de outra classe de forma ótima;
• Muitas fronteiras de decisão;
• Todas as fronteiras são boas.
15
16. Solução – Selecionando a Melhor
fronteira
16
• O SVM encontra o
hiperplano que
maximiza a distância
(ou intervalo), com
pontos que estão mais
perto de si mesmo, e é
por isso que eles
também são conhecidos
por SVM como
classificador de margem
máxima.
17. Solução - Matematicamente
• Dado um conjunto de treinamento
• Maximize γ (variando w e b) sujeito à
restrição de que para todos
• Onde
y = {+1,-1}
17
18. Solução – Matematicamente
Normalizando o Hiperplano
• O vetor w é a normal ao
hiperplana.
• A distância do
hiperplano a origem é
• A normal do vetor w
• A distância entre x1
para x2
18
19. Solução
Agora, o problema torna-se um problema de
otimização, como a encontrar as classes
hiperplano melhor separação deve maximizar
a margem entre x1 ex2
19
Este modelo pode ser usado como arquivo de partida para apresentar materiais de treinamento em um cenário em grupo.
Seções
Clique com o botão direito em um slide para adicionar seções. Seções podem ajudar a organizar slides ou a facilitar a colaboração entre vários autores.
Anotações
Use a seção Anotações para anotações da apresentação ou para fornecer detalhes adicionais ao público. Exiba essas anotações no Modo de Exibição de Apresentação durante a sua apresentação.
Considere o tamanho da fonte (importante para acessibilidade, visibilidade, gravação em vídeo e produção online)
Cores coordenadas
Preste atenção especial aos gráficos, tabelas e caixas de texto.
Leve em consideração que os participantes irão imprimir em preto-e-branco ou escala de cinza. Execute uma impressão de teste para ter certeza de que as suas cores irão funcionar quando forem impressas em preto-e-branco puros e escala de cinza.
Elementos gráficos, tabelas e gráficos
Mantenha a simplicidade: se possível, use estilos e cores consistentes e não confusos.
Rotule todos os gráficos e tabelas.
Todos os algoritmos de análise de dados são projetados para produzir um resumo útil dos dados, a partir da qual são feitas as decisões;
Aquisição, Pré-processamento (eliminação de ruídos), Segmentação - imagem é dividida em regiões que constituem os diversos objetos que
nela são representados. A identificação de um objeto se baseia na detecção de descontinui-dades ou similaridades na imagem, gerando uma representação abstrata de seu contorno ou
da região que ocupa .. Representação por Regiões (busca-se atribuir a cada objeto os pontos da
imagem que possuam as mesmas propriedades de cor, intensidade e textura, ou seja,
que apresentem similaridades segundo um critério pré-estabelecido) e Representação por Contornos (Métodos de detec-ção de bordas, busca em Grafos, Programação Dinâmica)