Este documento apresenta uma introdução ao reconhecimento de padrões, discutindo: 1) como os seres humanos reconhecem padrões; 2) a definição formal de reconhecimento de padrões; 3) a importância de atributos e sua transformação numérica para análise computacional; 4) o conceito de distância para medir similaridade entre padrões.
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
Inteligência Artificial - Data Mining
1. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
2. cadores Elementares Contatos
Introduc~ao ao Reconhecimento de Padr~oes
(Aprendizagem de Maquina / Data Mining)
Exemplos em Python
Prof. Ronaldo F. Ramos, Dr
1 de junho de 2014
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
3. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
5. cadores Elementares
7 Contatos
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
6. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
7. cadores Elementares Contatos
Seres Humanos e Padr~oes
Os sentidos humanos enviam informac~oes ao cerebro que
reconhece alguns aspectos da realidade.
Sons
Imagens
Sensac~ao Tatil
Odores
Permitem tambem a identi
8. cac~ao de padr~oes logico-matematicos
(o que exige um pouco mais do cerebro ;-) ).
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
9. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
11. car um objeto fsico ou
logico como pertencente ou n~ao a uma predeterminada categoria.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
12. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
13. cadores Elementares Contatos
Conceito Intuitivo
Dadas as categorias abaixo:
(a) Laranjas (b) Mac~as
A qual delas pertencem os objetos abaixo?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
14. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
15. cadores Elementares Contatos
Conceito Intuitivo - Novo Grupo
(c) Laranjas (d) Mac~as (e) Tangerinas
A qual delas pertence o objeto abaixo?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
16. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
17. cadores Elementares Contatos
Similaridade
Seu cerebro fez uma analise de
similaridade.
Pode-se fazer esta mesma analise no
computador?
O que precisaremos para tal?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
18. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
20. nic~ao quase formal de RP
Um problema de RP e composto de ...
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
21. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
22. cadores Elementares Contatos
Um Conjunto de K Classes
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
23. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
24. cadores Elementares Contatos
Um Conjunto de objetos Ni por Classes Ki
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
25. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
26. cadores Elementares Contatos
Um Conjunto de atributos nj por objeto Ni
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
27. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
28. cadores Elementares Contatos
Mecanismo de Memoria e Aprendizagem
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
29. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
30. cadores Elementares Contatos
Regra de Decis~ao para Calcular Novos Objetos
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
31. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
33. cador
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
34. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
35. cadores Elementares Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
36. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
37. cadores Elementares Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Ctrica
Sim/N~ao Sim
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
38. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
39. cadores Elementares Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Ctrica
Sim/N~ao Sim
Cor
Laranja????Alaranjado
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
40. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
41. cadores Elementares Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Ctrica
Sim/N~ao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
42. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
43. cadores Elementares Contatos
Que atributos descrevem bem uma tangerina?
Formato
Esferico ou Oval? Esferico
Fruta Ctrica
Sim/N~ao Sim
Cor
Laranja????Alaranjado
Rugosidade da Casca
Lisa ou Rugosa?Rugosa
Cheiro
Ativo/Fraco? Ativo
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
44. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
46. nir os atributos de um objeto?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
47. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
48. cadores Elementares Contatos
Sobre os Atributos
Nem sempre.
Nem sempre.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
49. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
50. cadores Elementares Contatos
Transformac~ao de Atributos
Atributos devem ser expressos na forma de numeros.
Desta forma o conjunto de atributos da tangerina [Formato, Fruta
Ctrica, Cor, Rugosidade da Casca, Cheiro] devem ser expressos
como um vetor de atributos tais como:
X = [0; 1; 2; 1; 1] 1
1A forma de numeralizar pode fazer muita diferenca no uso do modelo
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
51. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
52. cadores Elementares Contatos
Adotando as seguintes convenc~oes:
Atributo Valores Textuais Numericos
Formato Esferico,Oval,Alongado 0,1,2
Fruta Ctrica N~ao,Sim 0,1
Cor Amarelo,Vermelho,Alaranjado,Verde 0,1,2,3
Rugosidade lisa,rugosa 0,1
Cheiro N~ao,Sim 0,1
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
53. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
54. cadores Elementares Contatos
Teramos as seguintes representac~oes para as frutas
Objeto Laranja (X) [0, 1, 2, 1, 0]
Objeto Mac~a (Y) [0, 0, 1, 0, 0]
Objeto Tangerina (Z)[0, 1, 2, 1, 1]
O Objeto tangerina (Z) se assemelha mais a
laranja(X) ou a Mac~a(Y)?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
55. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
56. cadores Elementares Contatos
Conceito de Dist^ancia
Uma forma de medir a similaridade entre dois padr~oes e
calcular a dist^ancia entre eles.
Dist^ancia city-block, quarteir~ao ou manhattan.
Dq(X;Y) = jX1 Y1j + jX2 Y2j + ::: + jXn Ynj
Dist^ancia Euclidiana.
De(X;Y) =
p
(X1 Y1)2 + (X2 Y2)2 + ::: + (Xn Yn)2
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
57. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
58. cadores Elementares Contatos
Comparac~ao entre Euclidiana e Quarteir~ao
Z
Z
Z
Z
Z
Z
3 5
Z
Z
Z
Z
ZZ
A
C B
4
Dq(A;B) = 3 + 4 = 7
De(A;B) =
p
32 + 42 = 5
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
59. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
60. cadores Elementares Contatos
Agora e so fazer as contas
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
61. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
63. cadores Elementares
Agora voc^e sabe que uma tangerina e mais parecida com uma
laranja do que com uma mac~a..;-).
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
64. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
66. cadores Elementares
Agora vamos estudar as
ores....
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
67. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
68. cadores Elementares Contatos
Morfologia das Flores
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
69. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
71. m do nosso amor .....
Iris Setosa Iris Virgnica Iris Versicolor
Estudo feito por Sir Ronald Fischer em 1936
(Analise Discriminante).
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
72. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
73. cadores Elementares Contatos
Base de Dados de Iris I
Na WIKIPEDIA e em outros lugares encontraremos a base de
dados de Fischer.
SL=Comprimento da Sepala SW=Largura da Sepala
PL=Comprimento da Petala PW = Largura da Petala
SL SW PL PW Species
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa
4.6 3.4 1.4 0.3 setosa
5.0 3.4 1.5 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
74. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
75. cadores Elementares Contatos
Base de Dados de Iris II
4.4 2.9 1.4 0.2 setosa
4.9 3.1 1.5 0.1 setosa
5.4 3.7 1.5 0.2 setosa
4.8 3.4 1.6 0.2 setosa
4.8 3.0 1.4 0.1 setosa
4.3 3.0 1.1 0.1 setosa
5.8 4.0 1.2 0.2 setosa
5.7 4.4 1.5 0.4 setosa
5.4 3.9 1.3 0.4 setosa
5.1 3.5 1.4 0.3 setosa
5.7 3.8 1.7 0.3 setosa
5.1 3.8 1.5 0.3 setosa
5.4 3.4 1.7 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
76. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
77. cadores Elementares Contatos
Base de Dados de Iris III
5.1 3.7 1.5 0.4 setosa
4.6 3.6 1.0 0.2 setosa
5.1 3.3 1.7 0.5 setosa
4.8 3.4 1.9 0.2 setosa
5.0 3.0 1.6 0.2 setosa
5.0 3.4 1.6 0.4 setosa
5.2 3.5 1.5 0.2 setosa
5.2 3.4 1.4 0.2 setosa
4.7 3.2 1.6 0.2 setosa
4.8 3.1 1.6 0.2 setosa
5.4 3.4 1.5 0.4 setosa
5.2 4.1 1.5 0.1 setosa
5.5 4.2 1.4 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
78. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
79. cadores Elementares Contatos
Base de Dados de Iris IV
4.9 3.1 1.5 0.2 setosa
5.0 3.2 1.2 0.2 setosa
5.5 3.5 1.3 0.2 setosa
4.9 3.6 1.4 0.1 setosa
4.4 3.0 1.3 0.2 setosa
5.1 3.4 1.5 0.2 setosa
5.0 3.5 1.3 0.3 setosa
4.5 2.3 1.3 0.3 setosa
4.4 3.2 1.3 0.2 setosa
5.0 3.5 1.6 0.6 setosa
5.1 3.8 1.9 0.4 setosa
4.8 3.0 1.4 0.3 setosa
5.1 3.8 1.6 0.2 setosa
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
80. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
81. cadores Elementares Contatos
Base de Dados de Iris V
4.6 3.2 1.4 0.2 setosa
5.3 3.7 1.5 0.2 setosa
5.0 3.3 1.4 0.2 setosa
7.0 3.2 4.7 1.4 versicolor
6.4 3.2 4.5 1.5 versicolor
6.9 3.1 4.9 1.5 versicolor
5.5 2.3 4.0 1.3 versicolor
6.5 2.8 4.6 1.5 versicolor
5.7 2.8 4.5 1.3 versicolor
6.3 3.3 4.7 1.6 versicolor
4.9 2.4 3.3 1.0 versicolor
6.6 2.9 4.6 1.3 versicolor
5.2 2.7 3.9 1.4 versicolor
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
82. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
83. cadores Elementares Contatos
Base de Dados de Iris VI
5.0 2.0 3.5 1.0 versicolor
5.9 3.0 4.2 1.5 versicolor
6.0 2.2 4.0 1.0 versicolor
6.1 2.9 4.7 1.4 versicolor
5.6 2.9 3.6 1.3 versicolor
6.7 3.1 4.4 1.4 versicolor
5.6 3.0 4.5 1.5 versicolor
5.8 2.7 4.1 1.0 versicolor
6.2 2.2 4.5 1.5 versicolor
5.6 2.5 3.9 1.1 versicolor
5.9 3.2 4.8 1.8 versicolor
6.1 2.8 4.0 1.3 versicolor
6.3 2.5 4.9 1.5 versicolor
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
84. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
85. cadores Elementares Contatos
Base de Dados de Iris VII
6.1 2.8 4.7 1.2 versicolor
6.4 2.9 4.3 1.3 versicolor
6.6 3.0 4.4 1.4 versicolor
6.8 2.8 4.8 1.4 versicolor
6.7 3.0 5.0 1.7 versicolor
6.0 2.9 4.5 1.5 versicolor
5.7 2.6 3.5 1.0 versicolor
5.5 2.4 3.8 1.1 versicolor
5.5 2.4 3.7 1.0 versicolor
5.8 2.7 3.9 1.2 versicolor
6.0 2.7 5.1 1.6 versicolor
5.4 3.0 4.5 1.5 versicolor
6.0 3.4 4.5 1.6 versicolor
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
86. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
87. cadores Elementares Contatos
Base de Dados de Iris VIII
6.7 3.1 4.7 1.5 versicolor
6.3 2.3 4.4 1.3 versicolor
5.6 3.0 4.1 1.3 versicolor
5.5 2.5 4.0 1.3 versicolor
5.5 2.6 4.4 1.2 versicolor
6.1 3.0 4.6 1.4 versicolor
5.8 2.6 4.0 1.2 versicolor
5.0 2.3 3.3 1.0 versicolor
5.6 2.7 4.2 1.3 versicolor
5.7 3.0 4.2 1.2 versicolor
5.7 2.9 4.2 1.3 versicolor
6.2 2.9 4.3 1.3 versicolor
5.1 2.5 3.0 1.1 versicolor
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
88. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
89. cadores Elementares Contatos
Base de Dados de Iris IX
5.7 2.8 4.1 1.3 versicolor
6.3 3.3 6.0 2.5 virginica
5.8 2.7 5.1 1.9 virginica
7.1 3.0 5.9 2.1 virginica
6.3 2.9 5.6 1.8 virginica
6.5 3.0 5.8 2.2 virginica
7.6 3.0 6.6 2.1 virginica
4.9 2.5 4.5 1.7 virginica
7.3 2.9 6.3 1.8 virginica
6.7 2.5 5.8 1.8 virginica
7.2 3.6 6.1 2.5 virginica
6.5 3.2 5.1 2.0 virginica
6.4 2.7 5.3 1.9 virginica
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
90. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
91. cadores Elementares Contatos
Base de Dados de Iris X
6.8 3.0 5.5 2.1 virginica
5.7 2.5 5.0 2.0 virginica
5.8 2.8 5.1 2.4 virginica
6.4 3.2 5.3 2.3 virginica
6.5 3.0 5.5 1.8 virginica
7.7 3.8 6.7 2.2 virginica
7.7 2.6 6.9 2.3 virginica
6.0 2.2 5.0 1.5 virginica
6.9 3.2 5.7 2.3 virginica
5.6 2.8 4.9 2.0 virginica
7.7 2.8 6.7 2.0 virginica
6.3 2.7 4.9 1.8 virginica
6.7 3.3 5.7 2.1 virginica
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
92. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
93. cadores Elementares Contatos
Base de Dados de Iris XI
7.2 3.2 6.0 1.8 virginica
6.2 2.8 4.8 1.8 virginica
6.1 3.0 4.9 1.8 virginica
6.4 2.8 5.6 2.1 virginica
7.2 3.0 5.8 1.6 virginica
7.4 2.8 6.1 1.9 virginica
7.9 3.8 6.4 2.0 virginica
6.4 2.8 5.6 2.2 virginica
6.3 2.8 5.1 1.5 virginica
6.1 2.6 5.6 1.4 virginica
7.7 3.0 6.1 2.3 virginica
6.3 3.4 5.6 2.4 virginica
6.4 3.1 5.5 1.8 virginica
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
94. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
95. cadores Elementares Contatos
Base de Dados de Iris XII
6.0 3.0 4.8 1.8 virginica
6.9 3.1 5.4 2.1 virginica
6.7 3.1 5.6 2.4 virginica
6.9 3.1 5.1 2.3 virginica
5.8 2.7 5.1 1.9 virginica
6.8 3.2 5.9 2.3 virginica
6.7 3.3 5.7 2.5 virginica
6.7 3.0 5.2 2.3 virginica
6.3 2.5 5.0 1.9 virginica
6.5 3.0 5.2 2.0 virginica
6.2 3.4 5.4 2.3 virginica
5.9 3.0 5.1 1.8 virginica
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
96. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
97. cadores Elementares Contatos
Algoritmo do Vizinho Mais Proximo - Neareast Neighbor
1 Seja Xnew um vetor cuja classe e desconhecida.
2 Procurar na tabela o vetor armazenado mais proximo de
Xnew.
3 Chamar de Xnear o vetor mais proximo de Xnew
4 Atribuir a Xnew a mesma classe de Xnear
5 Se a classi
98. cac~ao for correta incluir Xnew na tabela.
M~ao a obra, ou melhor ao codigo ...
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
99. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
100. cadores Elementares Contatos
Qual o problema com o Vizinho Mais Proximo?
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
101. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
102. cadores Elementares Contatos
Uma Soluc~ao
KNN - K Vizinhos Mais Proximos
(K=Numero Impar Inteiro)
O Padr~ao e classi
103. cado de acordo com a maioria dos vizinhos.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
104. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
105. cadores Elementares Contatos
Algoritmo dos K Vizinhos Mais Proximos - K Neareast
Neighbors
1 Armazenar os exemplos em uma tabela.
2 seja Xnew um vetor de classe desconhecida.
3 Encontrar na tabela os K vetores mais proximos de Xnew
4 Seja Ck a classe a que pertence a maioria dos vetores.
5 Atribuir Classe(Xnew) = Ck
6 Se a classi
106. cac~ao for correta incluir Xnew na tabela.
Bom, vamos ao codigo ...
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
107. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
108. cadores Elementares Contatos
Vantagens e Desvantagens do KNN
Vantagens
Simplicidade de Implementac~ao.
Ideal para tabelas pequenas ou medias.
N~ao requer treinamento.
Desvantagens
Alto custo computacional para tabelas grandes.
A constante K e obtida por tentativa e erro.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
109. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
110. cadores Elementares Contatos
Dist^ancia Mnima ao Centroide
Cada classe passa a ter um unico vetor que a representa
chamado de centroide.
Apos o treinamenton~ao sera necessario armazenar os
exemplos. Apenas os centroides permanecem na memoria.
O centroide e o vetor medio, ou seja, a media dos exemplos
da classe.
O centroide e o representante de sua classe.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
111. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
112. cadores Elementares Contatos
Dist^ancia Mnima ao Centroide
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
113. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
114. cadores Elementares Contatos
Atualizando o Centroide
Como foi visto o centroide representa a classe, portanto,
descoberto um novo indivduo da classe, o centroide deve/pode ser
atualizado.
Mj (nj + 1) = (1 a)Mj (nj ) + a(Xnew)
Onde:
a = 1=(nj + 1) e o fator de aprendizagem
nj e o total de exemplos utilizados antes da chegada do Xnew
Mj (nj ) e o centroide antes da chegada do Xnew
Mj (nj + 1) e o novo centroide com Xnew incorporado.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
115. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
119. cadas = 2 + 3 + 0 + 0 + 2 + 1 = 8
Total de Inst^ancias = 27
Taxa de Acerto = 19/27 (70,4 % )
Taxa de Erro = 8/27 (29,6 % )
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
120. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
121. cadores Elementares Contatos
Matriz de Confus~ao por Classe - Tabela de Confus~ao -
Binario
TP = True Positives. Verdadeiros Positivos. Classi
123. cados como gatos que s~ao outra coisa
FN = False Negatives. Falsos Negativos. Classi
124. cados como outra coisa, mas s~ao realmente gatos.
TN = True Negatives. Classi
125. cados como outra coisa e realmente n~ao s~ao gatos.
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
126. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
128. city) SPC = TN / (FP + TN)
Positive Predictive Value (Precision) PPV = TP / (TP + FP)
Negative Predictive Value (NPV) NPV = TN / (TN + FN)
False Positive Rate (fall-out) FPR = FP /( FP + TN)
False Discovery Rate (FDR) FDR = FP /(FP + TP) = 1 -
PPV
False Negative Rate (Miss Rate) FNR = FN / ( FN + TP)
etc etc etc
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
129. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
130. cadores Elementares Contatos
Metricas Curva ROC - Receiver Operating Characteritics
Area Sob a curva. Acima de 0.9 (excelente). Entre 0.8 e 0.9
(bom). Entre 0.7 e 0.8 (medio). Entre 0.6 e 0.7 (fraco).Abaixo de
0.6 (ine
131. caz).
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
132. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
133. cadores Elementares Contatos
Continua ...
Isso e so o comeco ....
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)
134. Seres Humanos e Padr~oes Conceito Intuitivo Formalizando Na Pratica Dist^ancias Classi
135. cadores Elementares Contatos
Contatos
Prof. Ronaldo F. Ramos
Doutor em Systemes Informatiques (Informatica)- Universidade de Evry - Franca.
Pos Doutorado - UFC - DETI
Mestre em Engenharia de Produc~ao/Intelig^encia Aplicada - Universidade Federal de
Santa Catarina
Engenheiro Mec^anico - Universidade Federal do Ceara
30 Anos de experi^encia em Projetos de Engenharia e Sistemas Informatizados.
ronaldo.ramos@gmail.com
Prof. Guilherme de Alencar Barreto
Doutor em Engenharia Eletrica - Universidade de S~ao Paulo - USP - S~ao Carlos /
Universidade de Bielefeld, UB, Alemanha
Mestre em Engenharia Eletrica - Universidade de S~ao Paulo - USP - S~ao Carlos
Engenheiro de Teleinformatica - Universidade Federal do Ceara
Bolsista CNPQ Nvel 2
http://lattes.cnpq.br/8902002461422112
Prof. Ronaldo F. Ramos, Dr
Introduc~ao ao Reconhecimento de Padr~oes (Aprendizagem de Maquina / Data Mining)