SlideShare uma empresa Scribd logo
1 de 24
Aprendizado de Máquinas com Azure Machine
Learning e R
Apresentação
Diego é Autor dos livros “Do Banco de Dados Relacional à Tomada de Decisão“ e
“SQL Server além do Conceito: Blog post Collection”. Líder do grupo de usuários
Codificando .NET, Microsoft Most Valuable Professional [MVP] em SQL Server desde
2008. Junto ao PASS (Professional Association for SQL Server) é voluntário como
Regional Mentor, é Chapter Leader em São Paulo e Board Advisor para a região da
América Latina. Trabalhou no time de SQL Server na Microsoft, no Brasil, engajado
no lançamento do SQL Server 2012. É palestrante em eventos oficiais da Microsoft,
Codificando .NET, INETA BR e PASS, mantém o site: www.diegonogare.net
Email: nogare@ngrsolutions.com.br
Skype: DiegoNogare
Linkedin profile: https://www.linkedin.com/in/diegonogare
Blog: http://www.diegonogare.net
Twitter: @DiegoNogare
Aprendizado de Máquinas com Azure Machine Learning e R
 Aprendizado de Máquinas
o Supervisionado (Usando Azure Machine Learning)
o Não Supervisionado (Usando R)
SUPERVISIONADO
Classificação Binária
Classificadores Binários
ACURACY (ACURÁCIA):
Quantidade classificada como Positivos e Negativos corretamente
(True Positive + True Negative) /
((True Positive + False Negative) +(False Positive + True Negative))
Com nossos números: (16 + 54) / ((16+0) + (5+54)) => 70 / 75 = 0.9333
Classificadores Binários
Classificadores Binários
PRECISION (PRECISÃO):
Quantidade classificada corretamente
True Positive / (True Positive + False Positive)
Com nossos números: (16) / (16 + 5) => 16 / 21 = 0.7619
Classificadores Binários
RECALL:
Quantidade classificada como Positivo corretamente
True Positive / (True Positive + False Negative)
Com nossos números: 16 / (16+0) => 16 / 16 = 1
Classificadores Binários
F1 SCORE:
Média harmônica entre Precisão e Recall
Precisão: True Positive / (True Positive + False Positive)
Recall: True Positive / (True Positive + False Negative)
(2* True Positive) / (2* True Positive + False Positive + False Negative)
Com nossos números: (2*16) / (2*16 + 5 + 0) => 32 / 37 = 0.8648
2* Precision*Recall / (Precision + Recall)
Com nossos números: 2*(0,76*1)/(0,76+1) => 1,52 / 1,76 = 0.8636
Classificadores Binários
30times
2
conferências
25jogadoers
US$ 3,5
Bilhões em
contratos
64Jogares
1 All Star
Game
http://deadspin.com/2014-payrolls-and-salaries-for-every-mlb-team-1551868969
NÃO SUPERVISIONADO
Cluster
K-Means Cluster
Todos os dados são plotados no gráfico
Os pontos representam os indivíduos analisados, mas não estão separados em
grupos, todos fazem parte do mesmo grupo. Ao informar a quantidade de
centróides, as interções começam até o momento de convergir e encontrar os K
grupos.
Os pontos representam os dados de treinos, neste caso o dataset
K-Means Cluster
Centróides iniciais em posições aleatórias
Ao iniciar o algoritmo, os K pontos (chamados de centróides) são plotados
aleatoriamente no plano e possuem um ponto de partida para iniciar o algoritmo.
K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Os centróides são re-calculados a cada interação, calculando a média da distância
entre cada ponto e a posição do centróide. Então, com base neste resultado o
centróide muda de lugar ficando mais ao centro de seus pontos (elementos).
K-Means Cluster
Alteração dos pontos e centros
Enquanto a distância for recalculada e elementos mudarem de centro, o algoritmo
continua executando.
Reparem que os elementos marcados mudaram de centro.
K-Means Cluster
Posição final depois de uma interação.
K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Mais uma interação e re-calculo das distâncias, e com isso, mais uma vez a
movimentação dos centróides.
Posição inicial (amarelo) do centróide seguindo para uma próxima posição
(vermelho e azul).
K-Means Cluster
Quando parar?
No momento que os centróides não recebem nenhum elemento novo em seu grupo
significa que eles convergiram para uma posição satisfatória, e criou os grupos
necessários.
K-Means Cluster
Ponto satisfatório
Ao encontrar o ponto satisfatório, o algoritmo para de executar e mantém os
elementos conectados com seus centróides.
Depois da interação não houve mudança de elementos.
K-Means Cluster
K-Means Cluster
Referências
 Coursera
o Machine Learning: https://www.coursera.org/learn/machine-learning
o Data Science Specialization: https://www.coursera.org/specializations/jhudatascience
 K-Means em Stanford: http://stanford.edu/~cpiech/cs221/handouts/kmeans.html
 UCI Machine Learning Repository: http://archive.ics.uci.edu/ml/datasets.html
 Blog: http://www.diegonogare.net
Diego Nogare
@DiegoNogare
http://www.DiegoNogare.net
Obrigado:)

Mais conteúdo relacionado

Destaque

Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...
Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...
Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...Diego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Diego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...Diego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...Diego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Diego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataMini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataDiego Nogare
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...Diego Nogare
 
Colocando o Azure Machine Learning no seu Cotidiano
Colocando o Azure Machine Learning no seu Cotidiano Colocando o Azure Machine Learning no seu Cotidiano
Colocando o Azure Machine Learning no seu Cotidiano Diego Nogare
 

Destaque (8)

Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...
Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...
Mini-Curso: Introdução à Big Data e Data Science - Aula 3 - Ferramentas para ...
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big DataMini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
Mini-Curso: Introdução à Big Data e Data Science - Aula 1 - O que é Big Data
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
 
Colocando o Azure Machine Learning no seu Cotidiano
Colocando o Azure Machine Learning no seu Cotidiano Colocando o Azure Machine Learning no seu Cotidiano
Colocando o Azure Machine Learning no seu Cotidiano
 

Semelhante a Aprendizado de Máquinas com Azure ML e R

Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningDiego Nogare
 
mod4-estruturas-dadosestaticas-ordenacao
mod4-estruturas-dadosestaticas-ordenacaomod4-estruturas-dadosestaticas-ordenacao
mod4-estruturas-dadosestaticas-ordenacaodiogoa21
 
Apresentaã§ã£o winner manager
Apresentaã§ã£o   winner managerApresentaã§ã£o   winner manager
Apresentaã§ã£o winner managerFlorisberto Marques
 
TDC2016 Boas Práticas SQL em Banco Relacional para Desenvolvedores
TDC2016 Boas Práticas SQL em Banco Relacional para DesenvolvedoresTDC2016 Boas Práticas SQL em Banco Relacional para Desenvolvedores
TDC2016 Boas Práticas SQL em Banco Relacional para DesenvolvedoresFernando Franquini
 
Inteligência Artificial - Aula5 - PageRank
Inteligência Artificial - Aula5  - PageRankInteligência Artificial - Aula5  - PageRank
Inteligência Artificial - Aula5 - PageRankRafael Pinto
 
Excel 2010 avançado marcos paulo furlan
Excel 2010 avançado   marcos paulo furlanExcel 2010 avançado   marcos paulo furlan
Excel 2010 avançado marcos paulo furlangisa_legal
 
Desafio de Robótica - Católica de Santa Catarina - Joinville
Desafio de Robótica - Católica de Santa Catarina - JoinvilleDesafio de Robótica - Católica de Santa Catarina - Joinville
Desafio de Robótica - Católica de Santa Catarina - JoinvilleNatã Barbosa
 
FirstClass Apresentação
FirstClass ApresentaçãoFirstClass Apresentação
FirstClass ApresentaçãoFirstClass Mmn
 
Apresentacao first class Internationalfirstclass ID SERGIOCJ
Apresentacao first class Internationalfirstclass  ID  SERGIOCJApresentacao first class Internationalfirstclass  ID  SERGIOCJ
Apresentacao first class Internationalfirstclass ID SERGIOCJsergiocjunior
 
Andrè apresentação winner manager 2013
Andrè apresentação winner manager 2013Andrè apresentação winner manager 2013
Andrè apresentação winner manager 2013Adrian Matos
 
Apresentação Winner
Apresentação WinnerApresentação Winner
Apresentação Winnersekuelah
 
Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonGabriel Schade Cardoso
 
Apresentação oficial janeiro 2013
Apresentação oficial janeiro 2013Apresentação oficial janeiro 2013
Apresentação oficial janeiro 2013Christina Oliveira
 

Semelhante a Aprendizado de Máquinas com Azure ML e R (20)

Classificação de Documentos
Classificação de DocumentosClassificação de Documentos
Classificação de Documentos
 
Resolucao trabalho euromilhoes
Resolucao trabalho euromilhoesResolucao trabalho euromilhoes
Resolucao trabalho euromilhoes
 
Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine Learning
 
mod4-estruturas-dadosestaticas-ordenacao
mod4-estruturas-dadosestaticas-ordenacaomod4-estruturas-dadosestaticas-ordenacao
mod4-estruturas-dadosestaticas-ordenacao
 
Apresentaã§ã£o winner manager
Apresentaã§ã£o   winner managerApresentaã§ã£o   winner manager
Apresentaã§ã£o winner manager
 
TDC2016 Boas Práticas SQL em Banco Relacional para Desenvolvedores
TDC2016 Boas Práticas SQL em Banco Relacional para DesenvolvedoresTDC2016 Boas Práticas SQL em Banco Relacional para Desenvolvedores
TDC2016 Boas Práticas SQL em Banco Relacional para Desenvolvedores
 
Inteligência Artificial - Aula5 - PageRank
Inteligência Artificial - Aula5  - PageRankInteligência Artificial - Aula5  - PageRank
Inteligência Artificial - Aula5 - PageRank
 
Excel 2010 avancado
Excel 2010 avancadoExcel 2010 avancado
Excel 2010 avancado
 
Excel 2010 avançado marcos paulo furlan
Excel 2010 avançado   marcos paulo furlanExcel 2010 avançado   marcos paulo furlan
Excel 2010 avançado marcos paulo furlan
 
Desafio de Robótica - Católica de Santa Catarina - Joinville
Desafio de Robótica - Católica de Santa Catarina - JoinvilleDesafio de Robótica - Católica de Santa Catarina - Joinville
Desafio de Robótica - Católica de Santa Catarina - Joinville
 
Excel 2010 avancado
Excel 2010 avancadoExcel 2010 avancado
Excel 2010 avancado
 
FirstClass Apresentação
FirstClass ApresentaçãoFirstClass Apresentação
FirstClass Apresentação
 
Apresentacao first class Internationalfirstclass ID SERGIOCJ
Apresentacao first class Internationalfirstclass  ID  SERGIOCJApresentacao first class Internationalfirstclass  ID  SERGIOCJ
Apresentacao first class Internationalfirstclass ID SERGIOCJ
 
Excel2010 avancado
Excel2010 avancadoExcel2010 avancado
Excel2010 avancado
 
Andrè apresentação winner manager 2013
Andrè apresentação winner manager 2013Andrè apresentação winner manager 2013
Andrè apresentação winner manager 2013
 
Apresenta winner
Apresenta winnerApresenta winner
Apresenta winner
 
Apresentação Winner
Apresentação WinnerApresentação Winner
Apresentação Winner
 
Excel - Aula 05.pptx
Excel - Aula 05.pptxExcel - Aula 05.pptx
Excel - Aula 05.pptx
 
Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & Python
 
Apresentação oficial janeiro 2013
Apresentação oficial janeiro 2013Apresentação oficial janeiro 2013
Apresentação oficial janeiro 2013
 

Mais de Diego Nogare

Build your first spark big data environment in azure
Build your first spark big data environment in azureBuild your first spark big data environment in azure
Build your first spark big data environment in azureDiego Nogare
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasDiego Nogare
 
Real Time Analytics - do Machine Learning ao Power BI
Real Time Analytics - do Machine Learning ao Power BIReal Time Analytics - do Machine Learning ao Power BI
Real Time Analytics - do Machine Learning ao Power BIDiego Nogare
 
Real Time Analytics in Industry 4.0
Real Time Analytics in Industry 4.0Real Time Analytics in Industry 4.0
Real Time Analytics in Industry 4.0Diego Nogare
 
Real Time Analytics e Machine Learning
Real Time Analytics e Machine Learning Real Time Analytics e Machine Learning
Real Time Analytics e Machine Learning Diego Nogare
 
Análise preditiva com consumo de dados em tempo real
Análise preditiva com consumo de dados em tempo realAnálise preditiva com consumo de dados em tempo real
Análise preditiva com consumo de dados em tempo realDiego Nogare
 
The Art of Machine Learning & Predictive Intelligence
The Art of Machine Learning & Predictive IntelligenceThe Art of Machine Learning & Predictive Intelligence
The Art of Machine Learning & Predictive IntelligenceDiego Nogare
 
Real Time Analytics na Industria 4.0
Real Time Analytics na Industria 4.0Real Time Analytics na Industria 4.0
Real Time Analytics na Industria 4.0Diego Nogare
 
Big Data: Tomando Decisões
Big Data: Tomando DecisõesBig Data: Tomando Decisões
Big Data: Tomando DecisõesDiego Nogare
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaDiego Nogare
 
Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningDiego Nogare
 
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business Intelligence
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business IntelligenceTechEd Brasil 2015 - Novidades do SQL Server 2016 para Business Intelligence
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business IntelligenceDiego Nogare
 
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...Diego Nogare
 

Mais de Diego Nogare (13)

Build your first spark big data environment in azure
Build your first spark big data environment in azureBuild your first spark big data environment in azure
Build your first spark big data environment in azure
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de Máquinas
 
Real Time Analytics - do Machine Learning ao Power BI
Real Time Analytics - do Machine Learning ao Power BIReal Time Analytics - do Machine Learning ao Power BI
Real Time Analytics - do Machine Learning ao Power BI
 
Real Time Analytics in Industry 4.0
Real Time Analytics in Industry 4.0Real Time Analytics in Industry 4.0
Real Time Analytics in Industry 4.0
 
Real Time Analytics e Machine Learning
Real Time Analytics e Machine Learning Real Time Analytics e Machine Learning
Real Time Analytics e Machine Learning
 
Análise preditiva com consumo de dados em tempo real
Análise preditiva com consumo de dados em tempo realAnálise preditiva com consumo de dados em tempo real
Análise preditiva com consumo de dados em tempo real
 
The Art of Machine Learning & Predictive Intelligence
The Art of Machine Learning & Predictive IntelligenceThe Art of Machine Learning & Predictive Intelligence
The Art of Machine Learning & Predictive Intelligence
 
Real Time Analytics na Industria 4.0
Real Time Analytics na Industria 4.0Real Time Analytics na Industria 4.0
Real Time Analytics na Industria 4.0
 
Big Data: Tomando Decisões
Big Data: Tomando DecisõesBig Data: Tomando Decisões
Big Data: Tomando Decisões
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na prática
 
Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine Learning
 
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business Intelligence
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business IntelligenceTechEd Brasil 2015 - Novidades do SQL Server 2016 para Business Intelligence
TechEd Brasil 2015 - Novidades do SQL Server 2016 para Business Intelligence
 
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
Codificando Night Week - Benefícios de Conhecer Business Intelligence com SQL...
 

Aprendizado de Máquinas com Azure ML e R

  • 1. Aprendizado de Máquinas com Azure Machine Learning e R
  • 2. Apresentação Diego é Autor dos livros “Do Banco de Dados Relacional à Tomada de Decisão“ e “SQL Server além do Conceito: Blog post Collection”. Líder do grupo de usuários Codificando .NET, Microsoft Most Valuable Professional [MVP] em SQL Server desde 2008. Junto ao PASS (Professional Association for SQL Server) é voluntário como Regional Mentor, é Chapter Leader em São Paulo e Board Advisor para a região da América Latina. Trabalhou no time de SQL Server na Microsoft, no Brasil, engajado no lançamento do SQL Server 2012. É palestrante em eventos oficiais da Microsoft, Codificando .NET, INETA BR e PASS, mantém o site: www.diegonogare.net Email: nogare@ngrsolutions.com.br Skype: DiegoNogare Linkedin profile: https://www.linkedin.com/in/diegonogare Blog: http://www.diegonogare.net Twitter: @DiegoNogare
  • 3. Aprendizado de Máquinas com Azure Machine Learning e R  Aprendizado de Máquinas o Supervisionado (Usando Azure Machine Learning) o Não Supervisionado (Usando R)
  • 6. ACURACY (ACURÁCIA): Quantidade classificada como Positivos e Negativos corretamente (True Positive + True Negative) / ((True Positive + False Negative) +(False Positive + True Negative)) Com nossos números: (16 + 54) / ((16+0) + (5+54)) => 70 / 75 = 0.9333 Classificadores Binários
  • 7. Classificadores Binários PRECISION (PRECISÃO): Quantidade classificada corretamente True Positive / (True Positive + False Positive) Com nossos números: (16) / (16 + 5) => 16 / 21 = 0.7619
  • 8. Classificadores Binários RECALL: Quantidade classificada como Positivo corretamente True Positive / (True Positive + False Negative) Com nossos números: 16 / (16+0) => 16 / 16 = 1
  • 9. Classificadores Binários F1 SCORE: Média harmônica entre Precisão e Recall Precisão: True Positive / (True Positive + False Positive) Recall: True Positive / (True Positive + False Negative) (2* True Positive) / (2* True Positive + False Positive + False Negative) Com nossos números: (2*16) / (2*16 + 5 + 0) => 32 / 37 = 0.8648 2* Precision*Recall / (Precision + Recall) Com nossos números: 2*(0,76*1)/(0,76+1) => 1,52 / 1,76 = 0.8636
  • 11. 30times 2 conferências 25jogadoers US$ 3,5 Bilhões em contratos 64Jogares 1 All Star Game http://deadspin.com/2014-payrolls-and-salaries-for-every-mlb-team-1551868969
  • 13. K-Means Cluster Todos os dados são plotados no gráfico Os pontos representam os indivíduos analisados, mas não estão separados em grupos, todos fazem parte do mesmo grupo. Ao informar a quantidade de centróides, as interções começam até o momento de convergir e encontrar os K grupos. Os pontos representam os dados de treinos, neste caso o dataset
  • 14. K-Means Cluster Centróides iniciais em posições aleatórias Ao iniciar o algoritmo, os K pontos (chamados de centróides) são plotados aleatoriamente no plano e possuem um ponto de partida para iniciar o algoritmo.
  • 15. K-Means Cluster Com base nos pontos e centros, inicia-se o algoritmo Os centróides são re-calculados a cada interação, calculando a média da distância entre cada ponto e a posição do centróide. Então, com base neste resultado o centróide muda de lugar ficando mais ao centro de seus pontos (elementos).
  • 16. K-Means Cluster Alteração dos pontos e centros Enquanto a distância for recalculada e elementos mudarem de centro, o algoritmo continua executando. Reparem que os elementos marcados mudaram de centro.
  • 17. K-Means Cluster Posição final depois de uma interação.
  • 18. K-Means Cluster Com base nos pontos e centros, inicia-se o algoritmo Mais uma interação e re-calculo das distâncias, e com isso, mais uma vez a movimentação dos centróides. Posição inicial (amarelo) do centróide seguindo para uma próxima posição (vermelho e azul).
  • 19. K-Means Cluster Quando parar? No momento que os centróides não recebem nenhum elemento novo em seu grupo significa que eles convergiram para uma posição satisfatória, e criou os grupos necessários.
  • 20. K-Means Cluster Ponto satisfatório Ao encontrar o ponto satisfatório, o algoritmo para de executar e mantém os elementos conectados com seus centróides. Depois da interação não houve mudança de elementos.
  • 23. Referências  Coursera o Machine Learning: https://www.coursera.org/learn/machine-learning o Data Science Specialization: https://www.coursera.org/specializations/jhudatascience  K-Means em Stanford: http://stanford.edu/~cpiech/cs221/handouts/kmeans.html  UCI Machine Learning Repository: http://archive.ics.uci.edu/ml/datasets.html  Blog: http://www.diegonogare.net