SlideShare uma empresa Scribd logo
1 de 51
Baixar para ler offline
Curso de Ciência de Dados e Analytics
Estatística Computacional
Semana 2 - Aula 2 – Modelo de Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
rodrigo.linsrodrigues@ufrpe.br
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
...O que seria a
Regressão Logística?
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• É utilizada para prever a probabilidade de
um evento binário ocorrer.
• Segue a mesma lógica do modelo de
regressão linear com a particularidade da
variável alvo ser binária;
• É uma técnica muito utilizada quando não se
tem bases de dados muito grandes;
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Não tem muitas exigências de pressupostos;
• Há uma infinidade de eventos de interesse
que podem ser modelados pela regressão
logística;
• Uma das grandes vantagens é a flexibilidade
de seus pressupostos, o que amplia sua
aplicabilidade.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Deriva seu nome da transformação logit usada como variável
dependente;
• Um modelo é definido como logístico se a função segue a
seguinte equação:
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln
𝑝𝑖
1 − 𝑝𝑖
= 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Um modelo é definido como logístico se a função segue a
seguinte equação:
• Em que 𝑝𝑖 indica a probabilidade de ocorrência, 𝑥1, … , 𝑥 𝑛
representa o vetor de variáveis explicativas (ou independentes) e
β0 e β 𝑥 indicam os coeficientes do modelo.
𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln
𝑝𝑖
1 − 𝑝𝑖
= 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Os coeficientes logísticos são difíceis de interpretar em sua
forma original, pois são expressos em termos de logaritmos
quando usamos a função logit;
• E possível aplicar a transformação de anti-logaritmo por meio
da exponenciação dos coeficientes originais, gerando a razão de
desigualdades:
𝑅𝑎𝑧ã𝑜 𝑑𝑒 𝐷𝑒𝑠𝑖𝑔𝑢𝑎𝑙𝑑𝑎𝑑𝑒𝑠𝑖 (𝑜𝑑𝑑𝑠) = 𝑒 𝛽0+𝛽1 𝑥1+⋯+𝛽 𝑛 𝑥 𝑛
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Para cada observação, é previsto um valor de probabilidade
entre 0 e 1;
• Os valores previstos para todos os valores da variável
independente gera a curva logística:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística
• Se a probabilidade prevista é maior do que 0,50, então a
previsão é de que o resultado seja 1 (evento ocorreu);
• Caso a probabilidade prevista seja menor do que 0,50, então a
previsão é de que o resultado seja 0 (evento não ocorreu);
• Esse corte pode ser ajustado e faz parte das configurações de
parâmetros para melhorar o modelo.
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
de Regressão Logística
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
• A construção de um classificador por regressão logística pode ser
representado de forma simplificada por:
• Conjunto com n dados, onde cada observação 𝑥𝑖 possui m atributos e as
variáveis 𝑦𝑖 representam as classes ou rótulos.
Prof. Dr. Rodrigo Lins Rodrigues
Construção do modelo
• A tarefa de classificação pode ser dividida em duas categorias, a
classificação binária e a classificação multiclasses.
Regressão Logística Binária;
Regressão Logística Multimodal;
• Diversos algoritmos vêm sendo desenvolvidos ao longo de
pesquisas;
• A Regressão Logística é um algoritmo criado pela estatística.
Prof. Dr. Rodrigo Lins Rodrigues
• Construção de um classificador de forma computacional através
do software R:
Tabela de Análise
70%
30%
Treinamento
Teste
Algoritmos de Classificação
Métricas de Validação
Comparação de
classificadores
Modelagem Validação
Construção do modelo
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo
Logístico
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
Para entender os erros gerados por um classificador é possível
visualizar por meio da construção da uma matriz de erros
denominada matriz de confusão;
A partir da matriz é possível obter métricas de qualidade para a
avaliação do desempenho de um classificador;
Resume o número de instâncias previstas corretas ou incorretas
por um modelo de classificação.
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
Representação da matriz de confusão:
Matriz de Confusão
Classe Atual
Negativa (-) Positiva (+)
Classe
Prevista
Negativa (-) 𝑓 − − (𝑇𝑁) 𝑓 + − (𝐹𝑁)
Positiva (+) 𝑓 − + (𝐹𝑃) 𝑓 + + (𝑇𝑃)
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• As seguinte terminologias são usadas para o entendimento da
matriz de confusão:
Positivo verdadeiro (TP): é relacionado ao número de instâncias
positivas previstas corretamente pelo classificador;
Negativo falso (FN): é o número de instâncias previstas
erroneamente como negativos pelo classificador;
Positivo falso (FP): é o número de exemplos negativos previstos
erroneamente como positivos pelo classificador;
Falso verdadeiro (TN): é o número de exemplos negativos previstos
corretamente pelo classificador.Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Uma das maneiras mais comuns de avaliar modelos é por meio da
derivação de medidas que, tentam medir a “qualidade” do
modelo;
• Essas medidas geralmente podem ser obtidas a partir da matriz de
confusão:
A acurácia é definida como sendo o número de instâncias
corretas divididas pelo número total de instâncias;
𝐴𝑐𝑢𝑟á𝑐𝑖𝑎 =
𝑇𝑃 + 𝑇𝑁
(𝑇𝑃 + 𝑇𝑁 + 𝐹𝑁 + 𝐹𝑃)
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• A precisão determina o percentual de registros que são positivos
no grupo que o classificador previu como classe positiva.
𝑃𝑟𝑒𝑐𝑖𝑠ã𝑜 =
𝑇𝑃
𝑇𝑃 + 𝐹𝑃
• A lembrança (Recall) mede o percentual de instâncias positivas
previstas corretamente pelo classificador.
𝑅𝑒𝑐𝑎𝑙𝑙 =
𝑇𝑃
𝑇𝑃 + 𝐹𝑁Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Área da curva ROC:
Representação gráfica para descrever
o desempenho de um sistema
classificador binário;
É baseada na taxa de verdadeiros
positivos 𝑇𝑃𝑅, e na taxa de falsos
positivos 𝐹𝑃𝑅;
Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Área da curva ROC:
É muito utilizada quando queremos
comprar a performance entre diversos
classificadores;
Seus valores variam entre zero e um;
Muito utilizada quando se tem classe
desbalanceada. Prof. Dr. Rodrigo Lins Rodrigues
Avaliação do Modelo Logístico
• Utilização de métricas conjuntamente:
É comum encontrar situações em que um modelo aparenta ser
melhor que outro para algumas das métricas, mas pior com relação
a outras;
Nesses casos, utilizar uma única medida pode dar a falsa impressão
de que o desempenho pode ser avaliado utilizando-se apenas essa
medida;
Para uma avaliação mais precisa é ideal que seja utilizado um
conjunto de métricas levando em consideração o objetivo da
pesquisa.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão
Logística em R
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Vamos continuar com exemplo relacionado a deslocamento de
alunos;
Agora temos o interesse em investigar se as variáveis explicativas
influenciam a probabilidade de um aluno chegar atrasado na
aula;
O fenômeno em estudo agora apresenta somente duas
categorias (atrasado e não atrasado);
O evento de interesse refere-se a chegar atrasado.
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Para realizar esse experimento fizemos uma pesquisa com 100 de uma
escola específica;
O aluno deveria informar se no dia da pesquisa chegou ou não atrasado;
Outras variáveis coletadas foram:
oDistância percorrida no trajeto (em quilómetros);
oNúmero de semáforos pelos quais o aluno passou;
oPeríodo de realização do trajeto (manhã ou tarde);
oE como cada aluno considera-se no volante (calmo, moderado ou agressivo);
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Tabela com as respostas de 100 alunos;
Estudante
Chegou atrasado à
escola (𝒀𝒊)
Distância percorrida
(𝑿 𝟏𝒊)
Quantidade de
semáforos (𝑿 𝟐𝒊)
Período do dia
(𝑿 𝟑𝒊)
Perfil ao volante
(𝑿 𝟒𝒊)
Gabriela Não 12.5 7 manhã calmo
Patrícia Não 13.3 10 manhã calmo
Gustavo Não 13.4 8 manhã moderado
Letícia Não 23.5 7 manhã calmo
Luiz Ovídio Não 9.5 8 manhã calmo
Leonor Não 13.5 10 manhã calmo
Dalila Não 13.5 10 manhã calmo
Antônio Não 15.4 10 manhã calmo
Júlia Não 14.7 10 manhã calmo
... ... ... ... ... ...
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Foi necessário aplicar algumas transformações nas variáveis;
A variável alvo (Chegou atrasado) recebeu valores de 0 para não
chegou e 1 para chegou atrasado;
Período do dia ficou: 0 para manhã, e 1 para tarde;
A variável (Perfil ao volante) foi transformada em variável binária:
0 calmo e 1 moderado;
Criou-se uma nova variável binária informando se o condutor se
considera agressivo ou não (1 ou 0);
Foi retirado espaços (renomeado) os nomes das variáveis.Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
A nova tabela de dados ficou da seguinte forma;
Estudante chegou_atrasado distancia
quantidade_semaf
oros periodo perfil_volante2
Gabriela 0 12.5 7 1 0
Patrícia 0 13.3 10 1 0
Gustavo 0 13.4 8 1 1
Letícia 0 23.5 7 1 0
Luiz Ovídio 0 9.5 8 1 0
Leonor 0 13.5 10 1 0
Dalila 0 13.5 10 1 0
Antônio 0 15.4 10 1 0
Júlia 0 14.7 10 1 0
... ... ... ... ... ...
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Vamos abrir o script “scriptRegressaoLogistica.R”;
 Abrir a Base “atrasado.CSV”
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Regressão Logística em R
• Exemplo:
Prof. Dr. Rodrigo Lins Rodrigues
Agora é com vocês !
• Qual a diferença entre a Regressão Linear Múltipla e a
Regressão Logística ?
• Quais as formas de validar um modelo logístico ?
• Diga alguns fenômenos que podemos modelar através da
regressão logística ?
Prof. Dr. Rodrigo Lins Rodrigues
Dúvidas
o Contatos:
Email: rodrigo.linsrodrigues@ufrpe.br
Facebook: /rodrigomuribec
Prof. Dr. Rodrigo Lins Rodrigues
Curso de Ciência de Dados e Analytics
Estatística Computacional
Semana 2 - Aula 3 – Prática Computacional de Modelos de Regressão
Prof. Dr. Rodrigo Lins Rodrigues
rodrigo.linsrodrigues@ufrpe.br
Prof. Dr. Rodrigo Lins Rodrigues
Como será esta aula?
 Avaliação prática em laboratório;
 Deve ser realizada em grupos de 4 alunos;
 Serei o “mentor” na execução da avaliação
prática.
Prof. Dr. Rodrigo Lins Rodrigues
O que você aprenderá ?
Colocará em prática todo o
conhecimento adquirido sobre modelos
de regressão
Prof. Dr. Rodrigo Lins Rodrigues
Base de dados utilizada
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Plataformas de aprendizagem online e EAD.
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Comportamento de alunos em sistema de EAD.
Logs de acessos diários de alunos;
Interações com colegas;
Acesso a recursos e materiais;
Tempos de permanência na plataformas;
Desempenho dos alunos;
...
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre a base de dados:
Foi realizada a junção das bases de dados referente a
um período de sete anos;
Dados armazenados em bases de dados relacionais;
Construção de 37 scripts SQL;
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre as variáveis comportamentais:
Prof. Dr. Rodrigo Lins Rodrigues
Bases de Dados
• Sobre as variáveis comportamentais:
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
Prof. Dr. Rodrigo Lins Rodrigues
• Proposta do projeto prático.
Construir um modelo de regressão, baseado em
dados comportamentais, capaz de predizer o
desempenho dos alunos;
Cada grupo deverá utilizar o máximo de
conhecimentos de pré-processamento para
otimizar o modelo.
Projeto prático
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
• Fase de pré-processamento:
Quando necessário categorizar variáveis;
Retirar variáveis quando necessário;
Verificar variáveis que tem uma grande quantidade de
zeros e decidir o que fazer;
Verificar a presença de outliers;
...
Prof. Dr. Rodrigo Lins Rodrigues
Projeto prático
• Quais análises deverão ser feitas?
Inicialmente algumas análises descritivas;
Separar a base em treinamento e teste;
Construir o modelo de regressão logística;
Avaliar o modelo com as principais métricas;
Construir a matriz de confusão;
Construir a curva ROC;
Otimizar o modelo para o melhor valor de acurácia e ROC.
Prof. Dr. Rodrigo Lins Rodrigues
Dúvidas
o Contatos:
Email: rodrigo.linsrodrigues@ufrpe.br
Facebook: /rodrigomuribec
Prof. Dr. Rodrigo Lins Rodrigues

Mais conteúdo relacionado

Mais procurados

Geoprocessamento Parte1
Geoprocessamento Parte1Geoprocessamento Parte1
Geoprocessamento Parte1INPE
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritivaRodrigo Rodrigues
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04Rodrigo de Sá
 
Testes parametricos e nao parametricos
Testes parametricos e nao parametricosTestes parametricos e nao parametricos
Testes parametricos e nao parametricosRosario Cação
 

Mais procurados (20)

Tópico 4 regressão linear simples 01
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01
 
Autocorrelação espacial
Autocorrelação espacialAutocorrelação espacial
Autocorrelação espacial
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Econometria
EconometriaEconometria
Econometria
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Análise exploratória de dados no SPSS
Análise exploratória de dados no SPSSAnálise exploratória de dados no SPSS
Análise exploratória de dados no SPSS
 
Analise fatorial spss
Analise fatorial spssAnalise fatorial spss
Analise fatorial spss
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Exerc anova 03 071
Exerc anova 03 071Exerc anova 03 071
Exerc anova 03 071
 
Geoprocessamento Parte1
Geoprocessamento Parte1Geoprocessamento Parte1
Geoprocessamento Parte1
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
Correlação
CorrelaçãoCorrelação
Correlação
 
Estatistica Basica para Saude Aula 1
Estatistica Basica para Saude Aula 1Estatistica Basica para Saude Aula 1
Estatistica Basica para Saude Aula 1
 
econometria
 econometria econometria
econometria
 
03 tópico 2 - regressão multipla
03   tópico 2 - regressão multipla03   tópico 2 - regressão multipla
03 tópico 2 - regressão multipla
 
Aula 8
Aula   8Aula   8
Aula 8
 
Regressão - aula 03/04
Regressão - aula 03/04Regressão - aula 03/04
Regressão - aula 03/04
 
Testes hipoteses introducao
Testes hipoteses introducaoTestes hipoteses introducao
Testes hipoteses introducao
 
Correlação Estatística
Correlação EstatísticaCorrelação Estatística
Correlação Estatística
 
Testes parametricos e nao parametricos
Testes parametricos e nao parametricosTestes parametricos e nao parametricos
Testes parametricos e nao parametricos
 

Semelhante a Aula 5 modelo de regressão loística

Aula 6 análise de conglomerados
Aula 6  análise de conglomeradosAula 6  análise de conglomerados
Aula 6 análise de conglomeradosRodrigo Rodrigues
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisRodrigo Rodrigues
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoHelder Lopes
 
Pmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPeter Mello
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Práticatdc-globalcode
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na PráticaEiti Kimura
 
Além do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementAlém do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementPeter Mello
 
Aula 2 prática computacional de estatística descritiva
Aula 2   prática computacional de estatística descritivaAula 2   prática computacional de estatística descritiva
Aula 2 prática computacional de estatística descritivaRodrigo Rodrigues
 
sap-hr-recursos-humanos
  sap-hr-recursos-humanos  sap-hr-recursos-humanos
sap-hr-recursos-humanosDenner Andrade
 
Seminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirSeminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirPeter Mello
 
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesPractice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesRogerio P C do Nascimento
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Douglas Mendes
 
vitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcovitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcoMarco Coghi
 
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaVi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaPeter Mello
 
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoGestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoANGRAD
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Adriano Figueiredo
 

Semelhante a Aula 5 modelo de regressão loística (20)

Aula 6 análise de conglomerados
Aula 6  análise de conglomeradosAula 6  análise de conglomerados
Aula 6 análise de conglomerados
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionais
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de Informação
 
Pmi Global 2008 Portfolio
Pmi Global 2008 PortfolioPmi Global 2008 Portfolio
Pmi Global 2008 Portfolio
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Prática
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
 
Além do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project ManagementAlém do Método do Caminho Crítico: Success Driven Project Management
Além do Método do Caminho Crítico: Success Driven Project Management
 
Aula 2 prática computacional de estatística descritiva
Aula 2   prática computacional de estatística descritivaAula 2   prática computacional de estatística descritiva
Aula 2 prática computacional de estatística descritiva
 
sap-hr-recursos-humanos
  sap-hr-recursos-humanos  sap-hr-recursos-humanos
sap-hr-recursos-humanos
 
Slideshow - Metodologias ágeis
Slideshow - Metodologias ágeisSlideshow - Metodologias ágeis
Slideshow - Metodologias ágeis
 
Seminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - VladimirSeminario Riscos 2006 - Vladimir
Seminario Riscos 2006 - Vladimir
 
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e PlanificaçõesPractice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
Practice 4 :: Gestão de Projetos de SW OO :: Métricas, Estimação e Planificações
 
Plano do Projeto
Plano do ProjetoPlano do Projeto
Plano do Projeto
 
Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023Treinamento MLOps Databricks 2023
Treinamento MLOps Databricks 2023
 
vitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupcovitoriadaconquista-gp2-pmo-olinadgroupco
vitoriadaconquista-gp2-pmo-olinadgroupco
 
Metricas lean
Metricas leanMetricas lean
Metricas lean
 
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente CriticaVi Seminario Pmi (SP): Portfolio e Corrente Critica
Vi Seminario Pmi (SP): Portfolio e Corrente Critica
 
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivoGestão da evasão na EAD: discussão a partir de um modelo preditivo
Gestão da evasão na EAD: discussão a partir de um modelo preditivo
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1
 
Plano de Projeto SGS
Plano de Projeto SGSPlano de Projeto SGS
Plano de Projeto SGS
 

Mais de Rodrigo Rodrigues

Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Rodrigo Rodrigues
 
Pesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisPesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisRodrigo Rodrigues
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Rodrigo Rodrigues
 
Jogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisJogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisRodrigo Rodrigues
 
Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento webRodrigo Rodrigues
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional Rodrigo Rodrigues
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoRodrigo Rodrigues
 
Revsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRevsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRodrigo Rodrigues
 
As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo Rodrigo Rodrigues
 
Introdução sobre desenvolvimento de games
Introdução sobre desenvolvimento de gamesIntrodução sobre desenvolvimento de games
Introdução sobre desenvolvimento de gamesRodrigo Rodrigues
 

Mais de Rodrigo Rodrigues (19)

Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
Desenvolvimento de um Assistente Virtual Integrado ao Moodle para Suporte a A...
 
Pesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionaisPesquisa Quantitativa: aspectos teóricos e computacionais
Pesquisa Quantitativa: aspectos teóricos e computacionais
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
Modelo de Regressão Linear aplicado à previsão de desempenho de estudantes em...
 
Jogos Educativos - Nativos Digitais
Jogos Educativos - Nativos DigitaisJogos Educativos - Nativos Digitais
Jogos Educativos - Nativos Digitais
 
Introdução sobre desenvolvimento web
Introdução sobre desenvolvimento webIntrodução sobre desenvolvimento web
Introdução sobre desenvolvimento web
 
Gerência de dispositivos
Gerência de dispositivosGerência de dispositivos
Gerência de dispositivos
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Memória virtual
Memória virtualMemória virtual
Memória virtual
 
Gerenciamento de memória
Gerenciamento de memóriaGerenciamento de memória
Gerenciamento de memória
 
Aula revisão ok
Aula revisão       okAula revisão       ok
Aula revisão ok
 
Gerência de memória
Gerência de memóriaGerência de memória
Gerência de memória
 
Escalonamento de processos
Escalonamento de processosEscalonamento de processos
Escalonamento de processos
 
Componentes do Sistema operacional
Componentes do Sistema operacional Componentes do Sistema operacional
Componentes do Sistema operacional
 
Infraestrutura de Software - Introdução
Infraestrutura de Software - IntroduçãoInfraestrutura de Software - Introdução
Infraestrutura de Software - Introdução
 
Revsão sobre sistemas operacionais
Revsão sobre sistemas operacionaisRevsão sobre sistemas operacionais
Revsão sobre sistemas operacionais
 
Introdução a IHC
Introdução a IHCIntrodução a IHC
Introdução a IHC
 
As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo As novas perspectivas para informática na educação e o paradigma colaborativo
As novas perspectivas para informática na educação e o paradigma colaborativo
 
Introdução sobre desenvolvimento de games
Introdução sobre desenvolvimento de gamesIntrodução sobre desenvolvimento de games
Introdução sobre desenvolvimento de games
 

Último

11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxLuizHenriquedeAlmeid6
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfjanainadfsilva
 
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumGÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumAugusto Costa
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManuais Formação
 
Slide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxSlide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxssuserf54fa01
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBAline Santana
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometriajucelio7
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...Rosalina Simão Nunes
 
RedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfRedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfAlissonMiranda22
 
interfaces entre psicologia e neurologia.pdf
interfaces entre psicologia e neurologia.pdfinterfaces entre psicologia e neurologia.pdf
interfaces entre psicologia e neurologia.pdfIvoneSantos45
 
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreCIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreElianeElika
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxkarinedarozabatista
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptMaiteFerreira4
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Mary Alvarenga
 
historia Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppthistoria Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.pptErnandesLinhares1
 

Último (20)

11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
 
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumGÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envio
 
Slide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxSlide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptx
 
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASBCRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
CRÔNICAS DE UMA TURMA - TURMA DE 9ºANO - EASB
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometria
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
 
RedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdfRedacoesComentadasModeloAnalisarFazer.pdf
RedacoesComentadasModeloAnalisarFazer.pdf
 
interfaces entre psicologia e neurologia.pdf
interfaces entre psicologia e neurologia.pdfinterfaces entre psicologia e neurologia.pdf
interfaces entre psicologia e neurologia.pdf
 
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreCIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptxAD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
AD2 DIDÁTICA.KARINEROZA.SHAYANNE.BINC.ROBERTA.pptx
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.ppt
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
 
historia Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppthistoria Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppt
 

Aula 5 modelo de regressão loística

  • 1. Curso de Ciência de Dados e Analytics Estatística Computacional Semana 2 - Aula 2 – Modelo de Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues rodrigo.linsrodrigues@ufrpe.br Prof. Dr. Rodrigo Lins Rodrigues
  • 2. Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues
  • 3. Regressão Logística ...O que seria a Regressão Logística? Prof. Dr. Rodrigo Lins Rodrigues
  • 4. Regressão Logística • É utilizada para prever a probabilidade de um evento binário ocorrer. • Segue a mesma lógica do modelo de regressão linear com a particularidade da variável alvo ser binária; • É uma técnica muito utilizada quando não se tem bases de dados muito grandes; Prof. Dr. Rodrigo Lins Rodrigues
  • 5. Regressão Logística • Não tem muitas exigências de pressupostos; • Há uma infinidade de eventos de interesse que podem ser modelados pela regressão logística; • Uma das grandes vantagens é a flexibilidade de seus pressupostos, o que amplia sua aplicabilidade. Prof. Dr. Rodrigo Lins Rodrigues
  • 6. Regressão Logística • Deriva seu nome da transformação logit usada como variável dependente; • Um modelo é definido como logístico se a função segue a seguinte equação: 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖 1 − 𝑝𝑖 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 7. Regressão Logística • Um modelo é definido como logístico se a função segue a seguinte equação: • Em que 𝑝𝑖 indica a probabilidade de ocorrência, 𝑥1, … , 𝑥 𝑛 representa o vetor de variáveis explicativas (ou independentes) e β0 e β 𝑥 indicam os coeficientes do modelo. 𝑙𝑜𝑔𝑖𝑡 𝑝𝑖 = ln 𝑝𝑖 1 − 𝑝𝑖 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 8. Regressão Logística • Os coeficientes logísticos são difíceis de interpretar em sua forma original, pois são expressos em termos de logaritmos quando usamos a função logit; • E possível aplicar a transformação de anti-logaritmo por meio da exponenciação dos coeficientes originais, gerando a razão de desigualdades: 𝑅𝑎𝑧ã𝑜 𝑑𝑒 𝐷𝑒𝑠𝑖𝑔𝑢𝑎𝑙𝑑𝑎𝑑𝑒𝑠𝑖 (𝑜𝑑𝑑𝑠) = 𝑒 𝛽0+𝛽1 𝑥1+⋯+𝛽 𝑛 𝑥 𝑛 Prof. Dr. Rodrigo Lins Rodrigues
  • 9. Regressão Logística • Para cada observação, é previsto um valor de probabilidade entre 0 e 1; • Os valores previstos para todos os valores da variável independente gera a curva logística: Prof. Dr. Rodrigo Lins Rodrigues
  • 10. Regressão Logística • Se a probabilidade prevista é maior do que 0,50, então a previsão é de que o resultado seja 1 (evento ocorreu); • Caso a probabilidade prevista seja menor do que 0,50, então a previsão é de que o resultado seja 0 (evento não ocorreu); • Esse corte pode ser ajustado e faz parte das configurações de parâmetros para melhorar o modelo. Prof. Dr. Rodrigo Lins Rodrigues
  • 11. Construção do modelo de Regressão Logística Prof. Dr. Rodrigo Lins Rodrigues
  • 12. Construção do modelo • A construção de um classificador por regressão logística pode ser representado de forma simplificada por: • Conjunto com n dados, onde cada observação 𝑥𝑖 possui m atributos e as variáveis 𝑦𝑖 representam as classes ou rótulos. Prof. Dr. Rodrigo Lins Rodrigues
  • 13. Construção do modelo • A tarefa de classificação pode ser dividida em duas categorias, a classificação binária e a classificação multiclasses. Regressão Logística Binária; Regressão Logística Multimodal; • Diversos algoritmos vêm sendo desenvolvidos ao longo de pesquisas; • A Regressão Logística é um algoritmo criado pela estatística. Prof. Dr. Rodrigo Lins Rodrigues
  • 14. • Construção de um classificador de forma computacional através do software R: Tabela de Análise 70% 30% Treinamento Teste Algoritmos de Classificação Métricas de Validação Comparação de classificadores Modelagem Validação Construção do modelo Prof. Dr. Rodrigo Lins Rodrigues
  • 15. Avaliação do Modelo Logístico Prof. Dr. Rodrigo Lins Rodrigues
  • 16. Avaliação do Modelo Logístico Para entender os erros gerados por um classificador é possível visualizar por meio da construção da uma matriz de erros denominada matriz de confusão; A partir da matriz é possível obter métricas de qualidade para a avaliação do desempenho de um classificador; Resume o número de instâncias previstas corretas ou incorretas por um modelo de classificação. Prof. Dr. Rodrigo Lins Rodrigues
  • 17. Avaliação do Modelo Logístico Representação da matriz de confusão: Matriz de Confusão Classe Atual Negativa (-) Positiva (+) Classe Prevista Negativa (-) 𝑓 − − (𝑇𝑁) 𝑓 + − (𝐹𝑁) Positiva (+) 𝑓 − + (𝐹𝑃) 𝑓 + + (𝑇𝑃) Prof. Dr. Rodrigo Lins Rodrigues
  • 18. Avaliação do Modelo Logístico • As seguinte terminologias são usadas para o entendimento da matriz de confusão: Positivo verdadeiro (TP): é relacionado ao número de instâncias positivas previstas corretamente pelo classificador; Negativo falso (FN): é o número de instâncias previstas erroneamente como negativos pelo classificador; Positivo falso (FP): é o número de exemplos negativos previstos erroneamente como positivos pelo classificador; Falso verdadeiro (TN): é o número de exemplos negativos previstos corretamente pelo classificador.Prof. Dr. Rodrigo Lins Rodrigues
  • 19. Avaliação do Modelo Logístico • Uma das maneiras mais comuns de avaliar modelos é por meio da derivação de medidas que, tentam medir a “qualidade” do modelo; • Essas medidas geralmente podem ser obtidas a partir da matriz de confusão: A acurácia é definida como sendo o número de instâncias corretas divididas pelo número total de instâncias; 𝐴𝑐𝑢𝑟á𝑐𝑖𝑎 = 𝑇𝑃 + 𝑇𝑁 (𝑇𝑃 + 𝑇𝑁 + 𝐹𝑁 + 𝐹𝑃) Prof. Dr. Rodrigo Lins Rodrigues
  • 20. Avaliação do Modelo Logístico • A precisão determina o percentual de registros que são positivos no grupo que o classificador previu como classe positiva. 𝑃𝑟𝑒𝑐𝑖𝑠ã𝑜 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑃 • A lembrança (Recall) mede o percentual de instâncias positivas previstas corretamente pelo classificador. 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁Prof. Dr. Rodrigo Lins Rodrigues
  • 21. Avaliação do Modelo Logístico • Área da curva ROC: Representação gráfica para descrever o desempenho de um sistema classificador binário; É baseada na taxa de verdadeiros positivos 𝑇𝑃𝑅, e na taxa de falsos positivos 𝐹𝑃𝑅; Prof. Dr. Rodrigo Lins Rodrigues
  • 22. Avaliação do Modelo Logístico • Área da curva ROC: É muito utilizada quando queremos comprar a performance entre diversos classificadores; Seus valores variam entre zero e um; Muito utilizada quando se tem classe desbalanceada. Prof. Dr. Rodrigo Lins Rodrigues
  • 23. Avaliação do Modelo Logístico • Utilização de métricas conjuntamente: É comum encontrar situações em que um modelo aparenta ser melhor que outro para algumas das métricas, mas pior com relação a outras; Nesses casos, utilizar uma única medida pode dar a falsa impressão de que o desempenho pode ser avaliado utilizando-se apenas essa medida; Para uma avaliação mais precisa é ideal que seja utilizado um conjunto de métricas levando em consideração o objetivo da pesquisa. Prof. Dr. Rodrigo Lins Rodrigues
  • 24. Regressão Logística em R Prof. Dr. Rodrigo Lins Rodrigues
  • 25. Regressão Logística em R • Exemplo: Vamos continuar com exemplo relacionado a deslocamento de alunos; Agora temos o interesse em investigar se as variáveis explicativas influenciam a probabilidade de um aluno chegar atrasado na aula; O fenômeno em estudo agora apresenta somente duas categorias (atrasado e não atrasado); O evento de interesse refere-se a chegar atrasado. Prof. Dr. Rodrigo Lins Rodrigues
  • 26. Regressão Logística em R • Exemplo: Para realizar esse experimento fizemos uma pesquisa com 100 de uma escola específica; O aluno deveria informar se no dia da pesquisa chegou ou não atrasado; Outras variáveis coletadas foram: oDistância percorrida no trajeto (em quilómetros); oNúmero de semáforos pelos quais o aluno passou; oPeríodo de realização do trajeto (manhã ou tarde); oE como cada aluno considera-se no volante (calmo, moderado ou agressivo); Prof. Dr. Rodrigo Lins Rodrigues
  • 27. Regressão Logística em R • Exemplo: Tabela com as respostas de 100 alunos; Estudante Chegou atrasado à escola (𝒀𝒊) Distância percorrida (𝑿 𝟏𝒊) Quantidade de semáforos (𝑿 𝟐𝒊) Período do dia (𝑿 𝟑𝒊) Perfil ao volante (𝑿 𝟒𝒊) Gabriela Não 12.5 7 manhã calmo Patrícia Não 13.3 10 manhã calmo Gustavo Não 13.4 8 manhã moderado Letícia Não 23.5 7 manhã calmo Luiz Ovídio Não 9.5 8 manhã calmo Leonor Não 13.5 10 manhã calmo Dalila Não 13.5 10 manhã calmo Antônio Não 15.4 10 manhã calmo Júlia Não 14.7 10 manhã calmo ... ... ... ... ... ... Prof. Dr. Rodrigo Lins Rodrigues
  • 28. Regressão Logística em R • Exemplo: Foi necessário aplicar algumas transformações nas variáveis; A variável alvo (Chegou atrasado) recebeu valores de 0 para não chegou e 1 para chegou atrasado; Período do dia ficou: 0 para manhã, e 1 para tarde; A variável (Perfil ao volante) foi transformada em variável binária: 0 calmo e 1 moderado; Criou-se uma nova variável binária informando se o condutor se considera agressivo ou não (1 ou 0); Foi retirado espaços (renomeado) os nomes das variáveis.Prof. Dr. Rodrigo Lins Rodrigues
  • 29. Regressão Logística em R • Exemplo: A nova tabela de dados ficou da seguinte forma; Estudante chegou_atrasado distancia quantidade_semaf oros periodo perfil_volante2 Gabriela 0 12.5 7 1 0 Patrícia 0 13.3 10 1 0 Gustavo 0 13.4 8 1 1 Letícia 0 23.5 7 1 0 Luiz Ovídio 0 9.5 8 1 0 Leonor 0 13.5 10 1 0 Dalila 0 13.5 10 1 0 Antônio 0 15.4 10 1 0 Júlia 0 14.7 10 1 0 ... ... ... ... ... ... Prof. Dr. Rodrigo Lins Rodrigues
  • 30. Regressão Logística em R • Exemplo: Vamos abrir o script “scriptRegressaoLogistica.R”;  Abrir a Base “atrasado.CSV” Prof. Dr. Rodrigo Lins Rodrigues
  • 31. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 32. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 33. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 34. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 35. Regressão Logística em R • Exemplo: Prof. Dr. Rodrigo Lins Rodrigues
  • 36. Agora é com vocês ! • Qual a diferença entre a Regressão Linear Múltipla e a Regressão Logística ? • Quais as formas de validar um modelo logístico ? • Diga alguns fenômenos que podemos modelar através da regressão logística ? Prof. Dr. Rodrigo Lins Rodrigues
  • 37. Dúvidas o Contatos: Email: rodrigo.linsrodrigues@ufrpe.br Facebook: /rodrigomuribec Prof. Dr. Rodrigo Lins Rodrigues
  • 38. Curso de Ciência de Dados e Analytics Estatística Computacional Semana 2 - Aula 3 – Prática Computacional de Modelos de Regressão Prof. Dr. Rodrigo Lins Rodrigues rodrigo.linsrodrigues@ufrpe.br Prof. Dr. Rodrigo Lins Rodrigues
  • 39. Como será esta aula?  Avaliação prática em laboratório;  Deve ser realizada em grupos de 4 alunos;  Serei o “mentor” na execução da avaliação prática. Prof. Dr. Rodrigo Lins Rodrigues
  • 40. O que você aprenderá ? Colocará em prática todo o conhecimento adquirido sobre modelos de regressão Prof. Dr. Rodrigo Lins Rodrigues
  • 41. Base de dados utilizada Prof. Dr. Rodrigo Lins Rodrigues
  • 42. Bases de Dados • Plataformas de aprendizagem online e EAD. Prof. Dr. Rodrigo Lins Rodrigues
  • 43. Bases de Dados • Comportamento de alunos em sistema de EAD. Logs de acessos diários de alunos; Interações com colegas; Acesso a recursos e materiais; Tempos de permanência na plataformas; Desempenho dos alunos; ... Prof. Dr. Rodrigo Lins Rodrigues
  • 44. Bases de Dados • Sobre a base de dados: Foi realizada a junção das bases de dados referente a um período de sete anos; Dados armazenados em bases de dados relacionais; Construção de 37 scripts SQL; Prof. Dr. Rodrigo Lins Rodrigues
  • 45. Bases de Dados • Sobre as variáveis comportamentais: Prof. Dr. Rodrigo Lins Rodrigues
  • 46. Bases de Dados • Sobre as variáveis comportamentais: Prof. Dr. Rodrigo Lins Rodrigues
  • 47. Projeto prático Prof. Dr. Rodrigo Lins Rodrigues
  • 48. • Proposta do projeto prático. Construir um modelo de regressão, baseado em dados comportamentais, capaz de predizer o desempenho dos alunos; Cada grupo deverá utilizar o máximo de conhecimentos de pré-processamento para otimizar o modelo. Projeto prático Prof. Dr. Rodrigo Lins Rodrigues
  • 49. Projeto prático • Fase de pré-processamento: Quando necessário categorizar variáveis; Retirar variáveis quando necessário; Verificar variáveis que tem uma grande quantidade de zeros e decidir o que fazer; Verificar a presença de outliers; ... Prof. Dr. Rodrigo Lins Rodrigues
  • 50. Projeto prático • Quais análises deverão ser feitas? Inicialmente algumas análises descritivas; Separar a base em treinamento e teste; Construir o modelo de regressão logística; Avaliar o modelo com as principais métricas; Construir a matriz de confusão; Construir a curva ROC; Otimizar o modelo para o melhor valor de acurácia e ROC. Prof. Dr. Rodrigo Lins Rodrigues
  • 51. Dúvidas o Contatos: Email: rodrigo.linsrodrigues@ufrpe.br Facebook: /rodrigomuribec Prof. Dr. Rodrigo Lins Rodrigues