SlideShare uma empresa Scribd logo
Introdução a Machine
Learning na prática
Construindo um classificador Naive Bayes
Introdução a Machine
Learning na prática
Construindo um classificador Naive Bayes
O que é Machine Learn ?
Teorema de Bayes
O que é Machine Learning ?
Criação de modelos que são aprendidos através de dados.
Usar dados existentes para construir modelos que podem ser usados para prever saídas para novos
dados.
Teorema de Bayes
Qual a probabilidade de um evento A ocorrer, dado que um evento B já ocorreu ? P(Professor | Mulher) =
12 / 60 = 0.2.
Homem Mulher Total
Professor 8 12 20
Aluno 32 48 80
Total 40 60 100
Teorema de Bayes
P(E|F) = P(E)/[P(F|E)P(E) + P(F|Ẽ)P(Ẽ)]
P(F|E), a probabilidade de que alguém com a doença obtenha um resultado positivo, é 0,99.
P(E), a probabilidade de que qualquer pessoa tenha doença é 1/10.000 = 0.0001.
P(F| Ẽ), a probabilidade de que alguém sem a doença obtenha um teste positivo é 0,01.
P(Ẽ), a probabilidade de que qualquer pessoa não tenha a doença é 0,9999.
Teorema de Bayes
Substituindo esses número no teorema de Bayes encontraremos,
P(E|F) = 0,98%
obs.: Isso presume que as pessoas fazem o teste de forma aleatória. Se apenas as pessoas que possuíssem
alguns sintomas fizesse o teste, teríamos como condição o evento “teste positivos e sintomas” e o número
teria a possibilidade de ser bem maior.
Teorema de Bayes
Imagine que uma determinada doença afeta 1 a cada 10.000 pessoas. E imagine que haja um teste para
essa doença que mostra o resultado correto 99% das vezes.
O que significa um teste positivo? vamos usar F para o “seu teste é positivo” e E para “você tem a doença”.
Classificador Naive Bayes
Naive Bayes
Algoritmo de machine learn probabilístico;
É baseado no teorema Bayes;
Trata cada variável de forma condicionalmente independentes uma da outra;
Podem ser extremamente rápidos, se comparados a outros métodos mais sofisticados;
Muito usado em processamento de linguagem natural.
Fórmula matemática:

Introdução a Machine Learning na Prática
Introdução a Machine Learning na Prática
Calculando a probabilidade de cada classe
P(Y=Banana) = 500 / 1000 = 0.50
P(Y=Orange) = 300 / 1000 = 0.30
P(Y=Other) = 200 / 1000 = 0.20
Calculando a probabilidade de cada feature
P(x1=Long) = 500 / 1000 = 0.50
P(x2=Sweet) = 650 / 1000 = 0.65
P(x3=Yellow) = 800 / 1000 = 0.80
Calculando a probabilidade de cada feature,
por classe
P(x1=Long | Y=Banana) = 400 / 500 = 0.80
P(x2=Sweet | Y=Banana) = 350 / 500 = 0.70
P(x3=Yellow | Y=Banana) = 450 / 500 = 0.90
Introdução a Machine Learning na Prática
Naive Bayes
No exemplo dado, a probabilidade para a fruta ser laranja foi zero, porque não há laranjas longas nos
dados de treino.
Ao trabalhar com modelos com muitas features isso pode se tornar um problema, porque o valor zero de
feature faz toda a probabilidade se tornar zero.
Para evitar isso, aumentamos a contagem da variável com zero para um valor pequeno (geralmente 1) no
numerador, para que a probabilidade geral não se torne zero.
Gaussian Naive Bayes
E quando X for uma variável contínua ? Para isso usamos a distribuição gaussiana (ou distribuição
normal).
Implementando o classificador
Naive Bayes
Introdução a Machine
Learning na prática
Construindo um classificador Naive Bayes

Mais conteúdo relacionado

Mais de Cloves da Rocha

Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
Cloves da Rocha
 
Aula 04 - Estudo de Caso Atacadão
Aula 04 - Estudo de Caso AtacadãoAula 04 - Estudo de Caso Atacadão
Aula 04 - Estudo de Caso Atacadão
Cloves da Rocha
 
Café com André Menelau
Café com André MenelauCafé com André Menelau
Café com André Menelau
Cloves da Rocha
 
Engenharia de Requisitos
Engenharia de RequisitosEngenharia de Requisitos
Engenharia de Requisitos
Cloves da Rocha
 
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves RochaAPRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
Cloves da Rocha
 
Principais Certificações em TIC - ITIL
Principais Certificações em TIC - ITILPrincipais Certificações em TIC - ITIL
Principais Certificações em TIC - ITIL
Cloves da Rocha
 
Principais Certificações em TIC
Principais Certificações em TIC Principais Certificações em TIC
Principais Certificações em TIC
Cloves da Rocha
 
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
Cloves da Rocha
 
XII Café e CODE - Provocações do Mestre
XII Café e CODE - Provocações do MestreXII Café e CODE - Provocações do Mestre
XII Café e CODE - Provocações do Mestre
Cloves da Rocha
 
Padrões de Projeto de Software Orientado a Objetos
Padrões de Projeto de Software Orientado a ObjetosPadrões de Projeto de Software Orientado a Objetos
Padrões de Projeto de Software Orientado a Objetos
Cloves da Rocha
 
XI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do MestreXI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do Mestre
Cloves da Rocha
 
Introdução à Qualidade de Software
Introdução à Qualidade de SoftwareIntrodução à Qualidade de Software
Introdução à Qualidade de Software
Cloves da Rocha
 
Árvore de Decisão | IA
Árvore de Decisão | IA Árvore de Decisão | IA
Árvore de Decisão | IA
Cloves da Rocha
 
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWAREDESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
Cloves da Rocha
 
Desafio unidade I - ITG
Desafio unidade I - ITGDesafio unidade I - ITG
Desafio unidade I - ITG
Cloves da Rocha
 
Aula UML - Unified Modeling Language
Aula UML - Unified Modeling LanguageAula UML - Unified Modeling Language
Aula UML - Unified Modeling Language
Cloves da Rocha
 
Aula IA - Redes Neurais Artificiais | PML e SOM
Aula IA - Redes Neurais Artificiais  | PML e SOMAula IA - Redes Neurais Artificiais  | PML e SOM
Aula IA - Redes Neurais Artificiais | PML e SOM
Cloves da Rocha
 
Aula Algoritmo e Programação - cap2
Aula Algoritmo e Programação - cap2Aula Algoritmo e Programação - cap2
Aula Algoritmo e Programação - cap2
Cloves da Rocha
 
MINIAULA - Disciplina Fundamentos da Computação - SENAC
MINIAULA - Disciplina Fundamentos da Computação - SENACMINIAULA - Disciplina Fundamentos da Computação - SENAC
MINIAULA - Disciplina Fundamentos da Computação - SENAC
Cloves da Rocha
 
Aula Lógica de Programação - cap1
Aula Lógica de Programação - cap1 Aula Lógica de Programação - cap1
Aula Lógica de Programação - cap1
Cloves da Rocha
 

Mais de Cloves da Rocha (20)

Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
Utilização de Ferramenta Para Monitoração de Desempenho Baseada em Métodos Ág...
 
Aula 04 - Estudo de Caso Atacadão
Aula 04 - Estudo de Caso AtacadãoAula 04 - Estudo de Caso Atacadão
Aula 04 - Estudo de Caso Atacadão
 
Café com André Menelau
Café com André MenelauCafé com André Menelau
Café com André Menelau
 
Engenharia de Requisitos
Engenharia de RequisitosEngenharia de Requisitos
Engenharia de Requisitos
 
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves RochaAPRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
APRESENTAÇÃO DO PROFESSOR - By Prof. Cloves Rocha
 
Principais Certificações em TIC - ITIL
Principais Certificações em TIC - ITILPrincipais Certificações em TIC - ITIL
Principais Certificações em TIC - ITIL
 
Principais Certificações em TIC
Principais Certificações em TIC Principais Certificações em TIC
Principais Certificações em TIC
 
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
I Café ETE PORTO DIGITAL | EDUCAÇÃO PARA O SÉCULO 21
 
XII Café e CODE - Provocações do Mestre
XII Café e CODE - Provocações do MestreXII Café e CODE - Provocações do Mestre
XII Café e CODE - Provocações do Mestre
 
Padrões de Projeto de Software Orientado a Objetos
Padrões de Projeto de Software Orientado a ObjetosPadrões de Projeto de Software Orientado a Objetos
Padrões de Projeto de Software Orientado a Objetos
 
XI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do MestreXI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do Mestre
 
Introdução à Qualidade de Software
Introdução à Qualidade de SoftwareIntrodução à Qualidade de Software
Introdução à Qualidade de Software
 
Árvore de Decisão | IA
Árvore de Decisão | IA Árvore de Decisão | IA
Árvore de Decisão | IA
 
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWAREDESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
DESENVOLVIMENTO E GERENCIAMENTO ÁGIL DE PROJETOS DE SOFTWARE
 
Desafio unidade I - ITG
Desafio unidade I - ITGDesafio unidade I - ITG
Desafio unidade I - ITG
 
Aula UML - Unified Modeling Language
Aula UML - Unified Modeling LanguageAula UML - Unified Modeling Language
Aula UML - Unified Modeling Language
 
Aula IA - Redes Neurais Artificiais | PML e SOM
Aula IA - Redes Neurais Artificiais  | PML e SOMAula IA - Redes Neurais Artificiais  | PML e SOM
Aula IA - Redes Neurais Artificiais | PML e SOM
 
Aula Algoritmo e Programação - cap2
Aula Algoritmo e Programação - cap2Aula Algoritmo e Programação - cap2
Aula Algoritmo e Programação - cap2
 
MINIAULA - Disciplina Fundamentos da Computação - SENAC
MINIAULA - Disciplina Fundamentos da Computação - SENACMINIAULA - Disciplina Fundamentos da Computação - SENAC
MINIAULA - Disciplina Fundamentos da Computação - SENAC
 
Aula Lógica de Programação - cap1
Aula Lógica de Programação - cap1 Aula Lógica de Programação - cap1
Aula Lógica de Programação - cap1
 

Último

Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
marcos oliveira
 
oficia de construção de recursos para aluno DI.pdf
oficia de construção de recursos para aluno DI.pdfoficia de construção de recursos para aluno DI.pdf
oficia de construção de recursos para aluno DI.pdf
marcos oliveira
 
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
Falcão Brasil
 
apresentação metodologia terapia ocupacional
apresentação metodologia terapia ocupacionalapresentação metodologia terapia ocupacional
apresentação metodologia terapia ocupacional
shirleisousa9166
 
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptxSlides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
LuizHenriquedeAlmeid6
 
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
Sandra Pratas
 
Mini livro sanfona - Minha Escola Tem História.
Mini livro  sanfona - Minha Escola Tem História. Mini livro  sanfona - Minha Escola Tem História.
Mini livro sanfona - Minha Escola Tem História.
Mary Alvarenga
 
Caça-palavras e cruzadinha - Encontros consonantais.
Caça-palavras e cruzadinha -  Encontros consonantais.Caça-palavras e cruzadinha -  Encontros consonantais.
Caça-palavras e cruzadinha - Encontros consonantais.
Mary Alvarenga
 
Desafio matemático - multiplicação e divisão.
Desafio matemático -  multiplicação e divisão.Desafio matemático -  multiplicação e divisão.
Desafio matemático - multiplicação e divisão.
Mary Alvarenga
 
responder de alfabetização e questoe.pdf
responder de alfabetização e questoe.pdfresponder de alfabetização e questoe.pdf
responder de alfabetização e questoe.pdf
marcos oliveira
 
Temática – Projeto para Empreendedores Locais
Temática – Projeto para Empreendedores LocaisTemática – Projeto para Empreendedores Locais
Temática – Projeto para Empreendedores Locais
Colaborar Educacional
 
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
Sandra Pratas
 
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
Sandra Pratas
 
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
principeandregalli
 
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdfA Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
Falcão Brasil
 
Trabalho Colaborativo na educação especial.pdf
Trabalho Colaborativo na educação especial.pdfTrabalho Colaborativo na educação especial.pdf
Trabalho Colaborativo na educação especial.pdf
marcos oliveira
 
Caça-palavras - multiplicação
Caça-palavras  -  multiplicaçãoCaça-palavras  -  multiplicação
Caça-palavras - multiplicação
Mary Alvarenga
 
Os Profetas do Velho Testamento: Cronologia
Os Profetas do Velho Testamento: CronologiaOs Profetas do Velho Testamento: Cronologia
Os Profetas do Velho Testamento: Cronologia
Renato Henriques
 
Licao de adultos Topico 1 CPAD edit.pptx
Licao de adultos Topico 1 CPAD edit.pptxLicao de adultos Topico 1 CPAD edit.pptx
Licao de adultos Topico 1 CPAD edit.pptx
jetroescola
 

Último (20)

Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
Folha de Atividades (Virei Super-Herói! Projeto de Edição de Fotos) com Grade...
 
RECORDANDO BONS MOMENTOS! _
RECORDANDO BONS MOMENTOS!               _RECORDANDO BONS MOMENTOS!               _
RECORDANDO BONS MOMENTOS! _
 
oficia de construção de recursos para aluno DI.pdf
oficia de construção de recursos para aluno DI.pdfoficia de construção de recursos para aluno DI.pdf
oficia de construção de recursos para aluno DI.pdf
 
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
Apresentação Institucional do Centro Gestor e Operacional do Sistema de Prote...
 
apresentação metodologia terapia ocupacional
apresentação metodologia terapia ocupacionalapresentação metodologia terapia ocupacional
apresentação metodologia terapia ocupacional
 
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptxSlides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
Slides Lição 3, CPAD, Rute e Noemi, Entrelaçadas pelo Amor.pptx
 
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
EBOOK_HORA DO CONTO_O SONHO DO EVARISTO_RITA E CLÁUDIA_22_23
 
Mini livro sanfona - Minha Escola Tem História.
Mini livro  sanfona - Minha Escola Tem História. Mini livro  sanfona - Minha Escola Tem História.
Mini livro sanfona - Minha Escola Tem História.
 
Caça-palavras e cruzadinha - Encontros consonantais.
Caça-palavras e cruzadinha -  Encontros consonantais.Caça-palavras e cruzadinha -  Encontros consonantais.
Caça-palavras e cruzadinha - Encontros consonantais.
 
Desafio matemático - multiplicação e divisão.
Desafio matemático -  multiplicação e divisão.Desafio matemático -  multiplicação e divisão.
Desafio matemático - multiplicação e divisão.
 
responder de alfabetização e questoe.pdf
responder de alfabetização e questoe.pdfresponder de alfabetização e questoe.pdf
responder de alfabetização e questoe.pdf
 
Temática – Projeto para Empreendedores Locais
Temática – Projeto para Empreendedores LocaisTemática – Projeto para Empreendedores Locais
Temática – Projeto para Empreendedores Locais
 
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
EBOOK_HORA DO CONTO_O MONSTRO DAS CORES_ANGELINA & MÓNICA_22_23
 
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
FILMES DE ABRIL_BECRE D. CARLOS I_2023_24
 
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
Guia Genealógico da Principesca e Ducal Casa de Mesolcina, 2024
 
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdfA Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
A Industria Brasileira de Defesa - Situação Atual e Perspectivas de Evolução.pdf
 
Trabalho Colaborativo na educação especial.pdf
Trabalho Colaborativo na educação especial.pdfTrabalho Colaborativo na educação especial.pdf
Trabalho Colaborativo na educação especial.pdf
 
Caça-palavras - multiplicação
Caça-palavras  -  multiplicaçãoCaça-palavras  -  multiplicação
Caça-palavras - multiplicação
 
Os Profetas do Velho Testamento: Cronologia
Os Profetas do Velho Testamento: CronologiaOs Profetas do Velho Testamento: Cronologia
Os Profetas do Velho Testamento: Cronologia
 
Licao de adultos Topico 1 CPAD edit.pptx
Licao de adultos Topico 1 CPAD edit.pptxLicao de adultos Topico 1 CPAD edit.pptx
Licao de adultos Topico 1 CPAD edit.pptx
 

Introdução a Machine Learning na Prática

  • 1. Introdução a Machine Learning na prática Construindo um classificador Naive Bayes
  • 2. Introdução a Machine Learning na prática Construindo um classificador Naive Bayes
  • 3. O que é Machine Learn ?
  • 5. O que é Machine Learning ? Criação de modelos que são aprendidos através de dados. Usar dados existentes para construir modelos que podem ser usados para prever saídas para novos dados.
  • 6. Teorema de Bayes Qual a probabilidade de um evento A ocorrer, dado que um evento B já ocorreu ? P(Professor | Mulher) = 12 / 60 = 0.2. Homem Mulher Total Professor 8 12 20 Aluno 32 48 80 Total 40 60 100
  • 7. Teorema de Bayes P(E|F) = P(E)/[P(F|E)P(E) + P(F|Ẽ)P(Ẽ)] P(F|E), a probabilidade de que alguém com a doença obtenha um resultado positivo, é 0,99. P(E), a probabilidade de que qualquer pessoa tenha doença é 1/10.000 = 0.0001. P(F| Ẽ), a probabilidade de que alguém sem a doença obtenha um teste positivo é 0,01. P(Ẽ), a probabilidade de que qualquer pessoa não tenha a doença é 0,9999.
  • 8. Teorema de Bayes Substituindo esses número no teorema de Bayes encontraremos, P(E|F) = 0,98% obs.: Isso presume que as pessoas fazem o teste de forma aleatória. Se apenas as pessoas que possuíssem alguns sintomas fizesse o teste, teríamos como condição o evento “teste positivos e sintomas” e o número teria a possibilidade de ser bem maior.
  • 9. Teorema de Bayes Imagine que uma determinada doença afeta 1 a cada 10.000 pessoas. E imagine que haja um teste para essa doença que mostra o resultado correto 99% das vezes. O que significa um teste positivo? vamos usar F para o “seu teste é positivo” e E para “você tem a doença”.
  • 11. Naive Bayes Algoritmo de machine learn probabilístico; É baseado no teorema Bayes; Trata cada variável de forma condicionalmente independentes uma da outra; Podem ser extremamente rápidos, se comparados a outros métodos mais sofisticados; Muito usado em processamento de linguagem natural.
  • 13.
  • 16. Calculando a probabilidade de cada classe P(Y=Banana) = 500 / 1000 = 0.50 P(Y=Orange) = 300 / 1000 = 0.30 P(Y=Other) = 200 / 1000 = 0.20
  • 17. Calculando a probabilidade de cada feature P(x1=Long) = 500 / 1000 = 0.50 P(x2=Sweet) = 650 / 1000 = 0.65 P(x3=Yellow) = 800 / 1000 = 0.80
  • 18. Calculando a probabilidade de cada feature, por classe P(x1=Long | Y=Banana) = 400 / 500 = 0.80 P(x2=Sweet | Y=Banana) = 350 / 500 = 0.70 P(x3=Yellow | Y=Banana) = 450 / 500 = 0.90
  • 20. Naive Bayes No exemplo dado, a probabilidade para a fruta ser laranja foi zero, porque não há laranjas longas nos dados de treino. Ao trabalhar com modelos com muitas features isso pode se tornar um problema, porque o valor zero de feature faz toda a probabilidade se tornar zero. Para evitar isso, aumentamos a contagem da variável com zero para um valor pequeno (geralmente 1) no numerador, para que a probabilidade geral não se torne zero.
  • 21. Gaussian Naive Bayes E quando X for uma variável contínua ? Para isso usamos a distribuição gaussiana (ou distribuição normal).
  • 23. Introdução a Machine Learning na prática Construindo um classificador Naive Bayes