SlideShare uma empresa Scribd logo
1 de 34
Baixar para ler offline
SUMARIZAÇÃO ESTATÍSTICA (2D) 
Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
AGENDA 
• Scatter Plot 
• Regressão Linear 
• Correlação e Coeficientes de Determinação 
• Correlação e Regressão: Estudos de Caso
SCATTERPLOT
SCATTERPLOT
REGRESSÃO LINEAR 
• Francis Galton 
(1822-1911), obcecado 
pela idéia de que o 
talento era uma 
característica herdada, 
acaba descobrindo que a 
altura de um milhões 
remete (regressa) à 
média da altura dos pais 
(1855).
PÉTALAS DA IRIS 
Como expressar de forma linear a largura de 
uma pétala em relação ao seu comprimento? PeWi = a*PeLe + b
PÉTALAS DA IRIS 
PeWi = a*PeLe + b 
! 
• O que significam a e b ? 
! 
• a = O quanto PeWi muda 
quando PeLe aumenta ou 
diminui em 1. (inclinação) 
! 
• b = Valor esperado para 
PeWi quando PeLe é igual 
a 0. (interseção) 
• Requer um pouco de 
imaginação! :-) 
!
REGRESSÃO LINEAR 
Como expressão y = ax + b com 
erro mínimo? 
! 
Seja i = 1, 2, …, N uma entidade. 
Temos a equação yi = axi + b + ei 
onde ei é o erro residual. 
! 
Problema: encontrar a e b com erro 
residual ei mínimo.
REGRESSÃO LINEAR 
• Problema: Encontrar a e b que minimizem o quadrado do erro residual 
(critério dos mínimos quadrados) 
NΣ 
푵 
풊=ퟏ(풚풊−풂풙풊−풃)ퟐ 
• 푳(풂,풃) =Σ 
• L(a,b) é uma parábola em a,b: 
• Portanto, a condição de otimalidade de primeira ordem do cálculo deve valer 
NΣ 
• 흏푳/흏풂 =ퟐΣ 
푵 
풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) 
• 흏푳/흏b =ퟐΣ 
푵 
풊=ퟏ(풚풊−풂풙풊−풃)(-1) = ퟎ (**) 
∂L 
∂a 
= 2 (yi − axi − b)(−xi ) = 0 
i=1 
(*) 
∂L 
∂b 
NΣ 
= 2 (yi − axi − b)(−1) = 0 
i=1 
(**) 
L(a, b) = (yi − axi − b) 
i=1 
2
REGRESSÃO LINEAR 
∂L 
∂a 
NΣ 
= 2 (yi − axi − b)(−xi ) = 0 
• ퟐΣ푵 
풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) 
• ퟐΣ푵 
i=1 
NΣ 
풊=ퟏ(풚풊−풂풙풊−풃)(-1) = ퟎ (**) 
• Dividindo (**) por -2 e transferindo b para a direita 
• Σ푵 
NΣ 
NΣ 
풊=ퟏ풚풊 − 풂Σ푵 
풊=ퟏ풙풊 = 푵풃, 
• Portanto 
• b = ym - axm, 
(*) 
∂L 
∂b 
= 2 (yi − axi − b)(−1) = 0 
i=1 
(**) 
yi − a xi 
i=1 
i=1 
= Nb 
b = y − ax
REGRESSÃO LINEAR 
• Agora temos 
• ퟐΣ푵 
NΣ 
풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) 
• b = ym - axm (**) 
• Precisamos agora encontrar a em (*) 
• Dividindo por -2 e substituindo o b, temos 
NΣ 
• Σ푵 
풊=ퟏ(풚풊−풂풙풊−풚m+풂풙m)(풙풊)=ퟎ 
∂L 
∂a 
= 2 (yi − axi − b)(−xi ) = 0 
i=1 
(*) 
b = y − ax (**) 
(yi − axi − y + ax )(xi ) = 0 
i=1
REGRESSÃO LINEAR 
NΣ 
• Σ푵 
풊=ퟏ(풚풊−풂풙풊−풚m+풂풙m)(풙풊)=ퟎ 
• Separando a na esquerda e o resto na direita, temos: 
NΣ a = 
• aΣ푵 
NΣ 
풊=ퟏ(xi - xm)xi = Σ푵 
풊=ퟏ(yi - ym)xi 
• Portanto 
• a = (Σ푵 
NΣ 
풊=ퟏ(yi - ym)xi) / (Σ푵 
풊=ퟏ(xi - xm)xi) 
(yi − axi − y + ax )(xi ) = 0 
i=1 
a (xi − x )xi = (yi − y)xi 
i=1 
i=1 
(yi − y)xi 
i=1 
(xi − x )xi 
NΣ 
i=1
REGRESSÃO LINEAR 
! 
NΣ 
NΣ 
• a = (Σ푵 
풊=ퟏ(yi - ym)xi) / (Σ푵 
풊=ퟏ(xi - xm)xi) (*) 
• b = ym - axm (**) 
• Note que Σ푵 
NΣ 
NΣ 
풊=ퟏ(xi - xm) = Σ푵 
풊=ퟏ(yi - ym) = 0 
• Portanto 
• a = (Σ푵 
NΣ 
풊=ퟏ(yi - ym)(xi-xm)/N) / (Σ푵 
풊=ퟏ(xi - xm)(xi-xm)/N) 
a = 
(yi − y)xi 
i=1 
(xi − x )xi 
i=1 
(*) 
b = y − ax (**) 
(xi 
i=1 
− x ) = (yi − y) = 0 
i=1 
a = 
(yi − y)(xi − x ) 
i=1 
/ N 
(xi − x )(xi − x ) / N 
NΣ 
i=1
REGRESSÃO LINEAR 
NΣ 
• a = (Σ푵 
풊=ퟏ(yi - ym)(xi-xm)/N) / (Σ푵 
풊=ퟏ(xi - xm)(xi-xm)/N) (*) 
NΣ 
• b = ym - axm (**) 
! 
• Note que o denominador de (*) é a variança de x, σ2(x) 
• Vamos introduzir agora uma nova expressão denominada Coeficiente de Correlação, 
• ρ= (Σ 푵 
NΣ 
풊 = ퟏ ( 풚 풊 − 풚m) ( 풙 풊 − 풙m) / 푵) / σ(x)σ(y) 
a = 
(yi − y)(xi − x ) 
i=1 
/ N 
(xi − x )(xi − x ) / N 
i=1 
(*) 
b = y − ax (**) 
ρ = 
(yi − y)(xi − x ) 
i=1 
/ N 
σ (x)σ (y)
REGRESSÃO LINEAR 
a = 
! 
! 
(yi − y)(xi − x ) 
NΣ 
i=1 
/ N 
(xi − x )(xi − x ) / N 
NΣ 
i=1 
(*) 
b = y − ax (**) 
• Usando o Coeficiente de Correlação, 
! 
! 
ρ = 
(yi − y)(xi − x ) 
NΣ 
i=1 
• Podemos re-escrever (*) como 
/ N 
σ (x)σ (y) 
σ (y) 
σ (x) 
a = ρ
REGRESSÃO LINEAR 
σ (y) 
σ (x) 
a = ρ 
• Onde 
(*) 
b = y − ax (**) 
ρ = 
(yi − y)(xi − x ) 
NΣ 
i=1 
/ N 
σ (x)σ (y)
REGRESSÃO LINEAR 
• Falta agora encontrar o valor mínimo para L(a,b) 
• Para isso devemos substituir a e b por (*) e (**) na 
expressão 
• Com isso, chegaremos a 
NΣ 
L(a, b) = (yi − axi − b) 
i=1 
2 
L(a, b) = Nσ 2 (y)(1−ρ 2 )
REGRESSÃO LINEAR: 
FINALMENTE 
σ (y) 
σ (x) 
a = ρ 
(*) 
b = y − ax (**) 
• Com valor mínimo em 
L(a, b) = Nσ 2 (y)(1−ρ 2 ) (***)
E daí?
CORRELAÇÃO E COEFICIENTES 
DE DETERMINAÇÃO 
L(a, b) = Nσ 2 (y)(1−ρ 2 ) (***) 
• A equação (***) nos diz que ρ2, o coeficiente de 
determinação, é a proporção da variança σ2(y) que é 
considerada na regressão linear de y em x. 
• O coeficiente de determinação é uma medida de ajustamento a 
um modelo linear e indica o quão bem a variável dependente 
pode ser explicada pelos regressores presentes no modelo.
CORRELAÇÃO E COEFICIENTES 
DE DETERMINAÇÃO 
• O coeficiente de determinação, ρ2, varia no intervalo [0,1] 
• O coeficiente de correlação, ρ, varia no intervalo [-1,1] 
• O coeficiente ρ é 1 ou -1 apenas quando a equação de regressão y = ax + 
b é válida para todo i = 1,2,…, N, sem erros 
• O coeficiente ρ é 0 se e somente se a inclinação a = 0 
• O sinal de ρ indica a direção da inclinação, portanto, x e y são positivamente 
relacionados se ρ > 0 e negativamente relacionados se ρ < 0
CORRELAÇÃO E COEFICIENTES 
DE DETERMINAÇÃO 
• O coeficiente ρ é 0 se e somente se a inclinação a = 
0, o que pode ocorrer por diferentes razões
Isto indica que o coeficiente de correlação ρ é uma 
medida do grau de uma relação linear entre x e y
CORRELAÇÃO E REGRESSÃO: 
PÉTALAS DA IRIS
CORRELAÇÃO E REGRESSÃO: 
PÉTALAS DA IRIS 
• Relação entre a largura 
de uma pétala de iris e 
o seu comprimento 
σ (y) 
σ (x) 
a = ρ 
(*) 
b = y − ax (**)
CORRELAÇÃO E REGRESSÃO: 
PÉTALAS DA IRIS 
• ρ = 0.9629 
• Mesmo tendo pontos que 
não estão exatamente sobre 
a reta, o coeficiente de 
determinação, ρ2, vale 0.9271 
• Inclinação: 0.4158 
• Interseção = -0.3631 
σ (y) 
σ (x) 
a = ρ 
(*) 
b = y − ax (**)
CORRELAÇÃO E REGRESSÃO: 
PÉTALAS DA IRIS 
• Comprimento da Pétala = 0.4158 * Largura da Pétala - 0.3631 
• ρ2 vale 0.9271. Extremamente alto! 
• Mas a previsão do comprimento da pétala no nosso modelo ainda 
apresenta imprecisão!
CORRELAÇÃO E REGRESSÃO: 
PÉTALAS DA IRIS 
• Testar por erros na previsão 
n x y y previsto erro % 
23 1.4 0.1 0.22 119.0 
51 4.5 1.5 1.51 0.5 
86 4.3 1.3 1.42 9.6 
138 5.0 1.9 1.72 9.7 
142 5.7 2.5 2.01 19.7 
Erro médio: 20.6%
CORRELAÇÃO E REGRESSÃO: 
SÉPALAS DA IRIS
CORRELAÇÃO E REGRESSÃO: 
SÉPALAS DA IRIS 
• Coeficiente de 
correlação = -0.1176! 
• Isto não parece estar 
certo! 
• A largura da pétala 
deveria crescer quando o 
comprimento da pétala 
cresce e não diminuir!
CORRELAÇÃO E REGRESSÃO: 
SÉPALAS DA IRIS
CORRELAÇÃO E REGRESSÃO: 
SÉPALAS DA IRIS 
• Correlação positiva 
entre indivíduos de 
uma mesma espécie! 
• 0.74 
• 0.53 
• 0.46
CORRELAÇÃO E REGRESSÃO: 
SÉPALAS DA IRIS 
• Correlação negativa falsa devido a combinação de 
de dados pertencentes a diferentes agrupamentos! 
• Um tipo de manipulação de dados que, as vezes de 
forma não-intencional, pode dar suporte a 
afirmações do tipo: 
• Existem mentiras, mentiras cabeludas e Estatística!
CORRELAÇÃO != CAUSALIDADE

Mais conteúdo relacionado

Mais procurados (20)

Semana 7
Semana 7Semana 7
Semana 7
 
Semana 7
Semana 7Semana 7
Semana 7
 
Inf.Ed.Ii Maria Helena Loth
Inf.Ed.Ii   Maria Helena LothInf.Ed.Ii   Maria Helena Loth
Inf.Ed.Ii Maria Helena Loth
 
Semana 7 2
Semana 7 2Semana 7 2
Semana 7 2
 
Semana 7 2
Semana 7 2Semana 7 2
Semana 7 2
 
Semana 7 2
Semana 7 2Semana 7 2
Semana 7 2
 
Semana 7 2
Semana 7 2Semana 7 2
Semana 7 2
 
Semana 7 2
Semana 7 2Semana 7 2
Semana 7 2
 
Geometria analitica equacao da reta
Geometria analitica equacao da retaGeometria analitica equacao da reta
Geometria analitica equacao da reta
 
GEOMETRIA ANALÍTICA cap 05
GEOMETRIA ANALÍTICA cap  05GEOMETRIA ANALÍTICA cap  05
GEOMETRIA ANALÍTICA cap 05
 
GEOMETRIA ANALÍTICA cap 09
GEOMETRIA ANALÍTICA cap 09GEOMETRIA ANALÍTICA cap 09
GEOMETRIA ANALÍTICA cap 09
 
Ppt geometria analitica
Ppt geometria analiticaPpt geometria analitica
Ppt geometria analitica
 
Resumo do 7º,8º e 9º anos para t.i
Resumo do 7º,8º e 9º anos para t.iResumo do 7º,8º e 9º anos para t.i
Resumo do 7º,8º e 9º anos para t.i
 
Aula 18 estudo da reta
Aula 18   estudo da retaAula 18   estudo da reta
Aula 18 estudo da reta
 
GEOMETRIA ANALÍTICA cap 08
GEOMETRIA ANALÍTICA cap  08GEOMETRIA ANALÍTICA cap  08
GEOMETRIA ANALÍTICA cap 08
 
Funções 10 - novo programa
Funções 10 - novo programaFunções 10 - novo programa
Funções 10 - novo programa
 
Aula transformações de coordenadas
Aula  transformações de coordenadasAula  transformações de coordenadas
Aula transformações de coordenadas
 
GEOMETRIA ANALÍTICA cap 04
GEOMETRIA ANALÍTICA cap  04GEOMETRIA ANALÍTICA cap  04
GEOMETRIA ANALÍTICA cap 04
 
GEOMETRIA ANALÍTICA cap 07
GEOMETRIA ANALÍTICA cap  07GEOMETRIA ANALÍTICA cap  07
GEOMETRIA ANALÍTICA cap 07
 
GEOMETRIA ANALÍTICA cap 06
GEOMETRIA ANALÍTICA cap  06GEOMETRIA ANALÍTICA cap  06
GEOMETRIA ANALÍTICA cap 06
 

Destaque

Introdução à análise estatística2222
Introdução à análise estatística2222Introdução à análise estatística2222
Introdução à análise estatística2222Roberta Faccin Ferreira
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de DadosAlexandre Duarte
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1DAlexandre Duarte
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosAlexandre Duarte
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Alexandre Duarte
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoAmbiente Livre
 
Business Intelligence: definição e exemplos Open Source
Business Intelligence: definição e exemplos Open SourceBusiness Intelligence: definição e exemplos Open Source
Business Intelligence: definição e exemplos Open SourceStratebi
 
Introdução à Análise Estatística Multivariada
Introdução à Análise Estatística MultivariadaIntrodução à Análise Estatística Multivariada
Introdução à Análise Estatística MultivariadaCélia M. D. Sales
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligencenesi
 

Destaque (20)

Análise de dados
Análise de dadosAnálise de dados
Análise de dados
 
Introdução à análise estatística2222
Introdução à análise estatística2222Introdução à análise estatística2222
Introdução à análise estatística2222
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de Dados
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Técnicas de análise de negócio
Técnicas de análise de negócioTécnicas de análise de negócio
Técnicas de análise de negócio
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Causalidade e Abdução
Causalidade e AbduçãoCausalidade e Abdução
Causalidade e Abdução
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Carreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI PentahoCarreira Profissional e Certificação de um Analista de BI Pentaho
Carreira Profissional e Certificação de um Analista de BI Pentaho
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Clustering (Agrupamento)
Clustering (Agrupamento)Clustering (Agrupamento)
Clustering (Agrupamento)
 
Cálculo de Score
Cálculo de ScoreCálculo de Score
Cálculo de Score
 
Business Intelligence: definição e exemplos Open Source
Business Intelligence: definição e exemplos Open SourceBusiness Intelligence: definição e exemplos Open Source
Business Intelligence: definição e exemplos Open Source
 
Introdução à Análise Estatística Multivariada
Introdução à Análise Estatística MultivariadaIntrodução à Análise Estatística Multivariada
Introdução à Análise Estatística Multivariada
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Projeto de Experimentos
Projeto de ExperimentosProjeto de Experimentos
Projeto de Experimentos
 

Semelhante a Sumarização Estatística 2D

Apresentação geometria analítica
Apresentação geometria analíticaApresentação geometria analítica
Apresentação geometria analíticaprofluizgustavo
 
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIA
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIASISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIA
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIACarlos Campani
 
Função trigonometrica
Função trigonometricaFunção trigonometrica
Função trigonometricamyri2000
 
Aula 7 - Funções Logarítmicas, Exponenciais e Trigonometricas
Aula 7 - Funções Logarítmicas, Exponenciais e TrigonometricasAula 7 - Funções Logarítmicas, Exponenciais e Trigonometricas
Aula 7 - Funções Logarítmicas, Exponenciais e TrigonometricasTurma1NC
 
Função trigonometrica
Função trigonometricaFunção trigonometrica
Função trigonometricamyri2000
 
Circunferência - posições relativas
Circunferência - posições relativasCircunferência - posições relativas
Circunferência - posições relativasGabriela Maretti
 
Geometria analitica-gaia
Geometria analitica-gaiaGeometria analitica-gaia
Geometria analitica-gaiaslidericardinho
 
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdf
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdfRAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdf
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdfRoseildoNunesDACruz1
 
Funções, Equações e Inequações Trigonométricas
Funções, Equações e Inequações TrigonométricasFunções, Equações e Inequações Trigonométricas
Funções, Equações e Inequações TrigonométricasEverton Moraes
 
4 - Vetores no Espaço Tratamento algébrico.pdf
4 - Vetores no Espaço Tratamento algébrico.pdf4 - Vetores no Espaço Tratamento algébrico.pdf
4 - Vetores no Espaço Tratamento algébrico.pdfIndiaAndreiaCostaSiq
 
Estrutura atômica 2014 II
Estrutura atômica 2014 IIEstrutura atômica 2014 II
Estrutura atômica 2014 IIiqscquimica
 
Trabalho de geometria analítica - SUPERIOR
Trabalho de geometria analítica - SUPERIORTrabalho de geometria analítica - SUPERIOR
Trabalho de geometria analítica - SUPERIORPamella Rayely
 

Semelhante a Sumarização Estatística 2D (20)

Apresentação geometria analítica
Apresentação geometria analíticaApresentação geometria analítica
Apresentação geometria analítica
 
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIA
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIASISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIA
SISTEMA DE COORDENADAS CARTESIANAS RETANGULARES E A EQUAÇÃO DA CIRCUNFERÊNCIA
 
Geometria analitica
Geometria analiticaGeometria analitica
Geometria analitica
 
Função trigonometrica
Função trigonometricaFunção trigonometrica
Função trigonometrica
 
Geometria anatica retas exercicios by gledson
Geometria anatica retas exercicios by gledsonGeometria anatica retas exercicios by gledson
Geometria anatica retas exercicios by gledson
 
Aula 7 - Funções Logarítmicas, Exponenciais e Trigonometricas
Aula 7 - Funções Logarítmicas, Exponenciais e TrigonometricasAula 7 - Funções Logarítmicas, Exponenciais e Trigonometricas
Aula 7 - Funções Logarítmicas, Exponenciais e Trigonometricas
 
Função trigonometrica
Função trigonometricaFunção trigonometrica
Função trigonometrica
 
3º Ano FunçãO
3º Ano  FunçãO3º Ano  FunçãO
3º Ano FunçãO
 
Circunferência - posições relativas
Circunferência - posições relativasCircunferência - posições relativas
Circunferência - posições relativas
 
Trigonometria básica
Trigonometria básicaTrigonometria básica
Trigonometria básica
 
Trigonometria
TrigonometriaTrigonometria
Trigonometria
 
Trigonometria
TrigonometriaTrigonometria
Trigonometria
 
Geometria analitica-gaia
Geometria analitica-gaiaGeometria analitica-gaia
Geometria analitica-gaia
 
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdf
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdfRAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdf
RAZÕES TRIGONOMÉTRICAS NA CIRCUNFERÊNCIAxxxxxxx.pdf
 
Funções, Equações e Inequações Trigonométricas
Funções, Equações e Inequações TrigonométricasFunções, Equações e Inequações Trigonométricas
Funções, Equações e Inequações Trigonométricas
 
4 - Vetores no Espaço Tratamento algébrico.pdf
4 - Vetores no Espaço Tratamento algébrico.pdf4 - Vetores no Espaço Tratamento algébrico.pdf
4 - Vetores no Espaço Tratamento algébrico.pdf
 
Estrutura atômica 2014 II
Estrutura atômica 2014 IIEstrutura atômica 2014 II
Estrutura atômica 2014 II
 
Trabalho de geometria analítica - SUPERIOR
Trabalho de geometria analítica - SUPERIORTrabalho de geometria analítica - SUPERIOR
Trabalho de geometria analítica - SUPERIOR
 
exercicios de calculo
exercicios de calculoexercicios de calculo
exercicios de calculo
 
Aula de Trigonometria.ppt
Aula de Trigonometria.pptAula de Trigonometria.ppt
Aula de Trigonometria.ppt
 

Mais de Alexandre Duarte

Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosAlexandre Duarte
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Alexandre Duarte
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaAlexandre Duarte
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como CiênciaAlexandre Duarte
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: IntroduçãoAlexandre Duarte
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerAlexandre Duarte
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBAlexandre Duarte
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisAlexandre Duarte
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosAlexandre Duarte
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de SurveysAlexandre Duarte
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Alexandre Duarte
 
Análise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAnálise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAlexandre Duarte
 
Dicas para calouros na Universidade
Dicas para calouros na UniversidadeDicas para calouros na Universidade
Dicas para calouros na UniversidadeAlexandre Duarte
 
Unidade 0: Projeto de Experimentos
Unidade 0: Projeto de ExperimentosUnidade 0: Projeto de Experimentos
Unidade 0: Projeto de ExperimentosAlexandre Duarte
 
Unidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoUnidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoAlexandre Duarte
 
Gerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaGerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaAlexandre Duarte
 
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaGerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaAlexandre Duarte
 
Gerência de Armazenamento: Implementação do Sistema de Arquivos
Gerência de Armazenamento: Implementação do Sistema de ArquivosGerência de Armazenamento: Implementação do Sistema de Arquivos
Gerência de Armazenamento: Implementação do Sistema de ArquivosAlexandre Duarte
 
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...Alexandre Duarte
 

Mais de Alexandre Duarte (20)

Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de Experimentos
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Atividades Científica
Atividades CientíficaAtividades Científica
Atividades Científica
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como Ciência
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de Experimentos
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 
Análise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAnálise de Redes Sociais: Introdução
Análise de Redes Sociais: Introdução
 
Dicas para calouros na Universidade
Dicas para calouros na UniversidadeDicas para calouros na Universidade
Dicas para calouros na Universidade
 
Unidade 0: Projeto de Experimentos
Unidade 0: Projeto de ExperimentosUnidade 0: Projeto de Experimentos
Unidade 0: Projeto de Experimentos
 
Unidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoUnidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científico
 
Gerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaGerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e Saída
 
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaGerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
 
Gerência de Armazenamento: Implementação do Sistema de Arquivos
Gerência de Armazenamento: Implementação do Sistema de ArquivosGerência de Armazenamento: Implementação do Sistema de Arquivos
Gerência de Armazenamento: Implementação do Sistema de Arquivos
 
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...
Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos - Par...
 

Sumarização Estatística 2D

  • 1. SUMARIZAÇÃO ESTATÍSTICA (2D) Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
  • 2. AGENDA • Scatter Plot • Regressão Linear • Correlação e Coeficientes de Determinação • Correlação e Regressão: Estudos de Caso
  • 5. REGRESSÃO LINEAR • Francis Galton (1822-1911), obcecado pela idéia de que o talento era uma característica herdada, acaba descobrindo que a altura de um milhões remete (regressa) à média da altura dos pais (1855).
  • 6. PÉTALAS DA IRIS Como expressar de forma linear a largura de uma pétala em relação ao seu comprimento? PeWi = a*PeLe + b
  • 7. PÉTALAS DA IRIS PeWi = a*PeLe + b ! • O que significam a e b ? ! • a = O quanto PeWi muda quando PeLe aumenta ou diminui em 1. (inclinação) ! • b = Valor esperado para PeWi quando PeLe é igual a 0. (interseção) • Requer um pouco de imaginação! :-) !
  • 8. REGRESSÃO LINEAR Como expressão y = ax + b com erro mínimo? ! Seja i = 1, 2, …, N uma entidade. Temos a equação yi = axi + b + ei onde ei é o erro residual. ! Problema: encontrar a e b com erro residual ei mínimo.
  • 9. REGRESSÃO LINEAR • Problema: Encontrar a e b que minimizem o quadrado do erro residual (critério dos mínimos quadrados) NΣ 푵 풊=ퟏ(풚풊−풂풙풊−풃)ퟐ • 푳(풂,풃) =Σ • L(a,b) é uma parábola em a,b: • Portanto, a condição de otimalidade de primeira ordem do cálculo deve valer NΣ • 흏푳/흏풂 =ퟐΣ 푵 풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) • 흏푳/흏b =ퟐΣ 푵 풊=ퟏ(풚풊−풂풙풊−풃)(-1) = ퟎ (**) ∂L ∂a = 2 (yi − axi − b)(−xi ) = 0 i=1 (*) ∂L ∂b NΣ = 2 (yi − axi − b)(−1) = 0 i=1 (**) L(a, b) = (yi − axi − b) i=1 2
  • 10. REGRESSÃO LINEAR ∂L ∂a NΣ = 2 (yi − axi − b)(−xi ) = 0 • ퟐΣ푵 풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) • ퟐΣ푵 i=1 NΣ 풊=ퟏ(풚풊−풂풙풊−풃)(-1) = ퟎ (**) • Dividindo (**) por -2 e transferindo b para a direita • Σ푵 NΣ NΣ 풊=ퟏ풚풊 − 풂Σ푵 풊=ퟏ풙풊 = 푵풃, • Portanto • b = ym - axm, (*) ∂L ∂b = 2 (yi − axi − b)(−1) = 0 i=1 (**) yi − a xi i=1 i=1 = Nb b = y − ax
  • 11. REGRESSÃO LINEAR • Agora temos • ퟐΣ푵 NΣ 풊=ퟏ(풚풊−풂풙풊−풃)(−풙풊) = ퟎ (*) • b = ym - axm (**) • Precisamos agora encontrar a em (*) • Dividindo por -2 e substituindo o b, temos NΣ • Σ푵 풊=ퟏ(풚풊−풂풙풊−풚m+풂풙m)(풙풊)=ퟎ ∂L ∂a = 2 (yi − axi − b)(−xi ) = 0 i=1 (*) b = y − ax (**) (yi − axi − y + ax )(xi ) = 0 i=1
  • 12. REGRESSÃO LINEAR NΣ • Σ푵 풊=ퟏ(풚풊−풂풙풊−풚m+풂풙m)(풙풊)=ퟎ • Separando a na esquerda e o resto na direita, temos: NΣ a = • aΣ푵 NΣ 풊=ퟏ(xi - xm)xi = Σ푵 풊=ퟏ(yi - ym)xi • Portanto • a = (Σ푵 NΣ 풊=ퟏ(yi - ym)xi) / (Σ푵 풊=ퟏ(xi - xm)xi) (yi − axi − y + ax )(xi ) = 0 i=1 a (xi − x )xi = (yi − y)xi i=1 i=1 (yi − y)xi i=1 (xi − x )xi NΣ i=1
  • 13. REGRESSÃO LINEAR ! NΣ NΣ • a = (Σ푵 풊=ퟏ(yi - ym)xi) / (Σ푵 풊=ퟏ(xi - xm)xi) (*) • b = ym - axm (**) • Note que Σ푵 NΣ NΣ 풊=ퟏ(xi - xm) = Σ푵 풊=ퟏ(yi - ym) = 0 • Portanto • a = (Σ푵 NΣ 풊=ퟏ(yi - ym)(xi-xm)/N) / (Σ푵 풊=ퟏ(xi - xm)(xi-xm)/N) a = (yi − y)xi i=1 (xi − x )xi i=1 (*) b = y − ax (**) (xi i=1 − x ) = (yi − y) = 0 i=1 a = (yi − y)(xi − x ) i=1 / N (xi − x )(xi − x ) / N NΣ i=1
  • 14. REGRESSÃO LINEAR NΣ • a = (Σ푵 풊=ퟏ(yi - ym)(xi-xm)/N) / (Σ푵 풊=ퟏ(xi - xm)(xi-xm)/N) (*) NΣ • b = ym - axm (**) ! • Note que o denominador de (*) é a variança de x, σ2(x) • Vamos introduzir agora uma nova expressão denominada Coeficiente de Correlação, • ρ= (Σ 푵 NΣ 풊 = ퟏ ( 풚 풊 − 풚m) ( 풙 풊 − 풙m) / 푵) / σ(x)σ(y) a = (yi − y)(xi − x ) i=1 / N (xi − x )(xi − x ) / N i=1 (*) b = y − ax (**) ρ = (yi − y)(xi − x ) i=1 / N σ (x)σ (y)
  • 15. REGRESSÃO LINEAR a = ! ! (yi − y)(xi − x ) NΣ i=1 / N (xi − x )(xi − x ) / N NΣ i=1 (*) b = y − ax (**) • Usando o Coeficiente de Correlação, ! ! ρ = (yi − y)(xi − x ) NΣ i=1 • Podemos re-escrever (*) como / N σ (x)σ (y) σ (y) σ (x) a = ρ
  • 16. REGRESSÃO LINEAR σ (y) σ (x) a = ρ • Onde (*) b = y − ax (**) ρ = (yi − y)(xi − x ) NΣ i=1 / N σ (x)σ (y)
  • 17. REGRESSÃO LINEAR • Falta agora encontrar o valor mínimo para L(a,b) • Para isso devemos substituir a e b por (*) e (**) na expressão • Com isso, chegaremos a NΣ L(a, b) = (yi − axi − b) i=1 2 L(a, b) = Nσ 2 (y)(1−ρ 2 )
  • 18. REGRESSÃO LINEAR: FINALMENTE σ (y) σ (x) a = ρ (*) b = y − ax (**) • Com valor mínimo em L(a, b) = Nσ 2 (y)(1−ρ 2 ) (***)
  • 20. CORRELAÇÃO E COEFICIENTES DE DETERMINAÇÃO L(a, b) = Nσ 2 (y)(1−ρ 2 ) (***) • A equação (***) nos diz que ρ2, o coeficiente de determinação, é a proporção da variança σ2(y) que é considerada na regressão linear de y em x. • O coeficiente de determinação é uma medida de ajustamento a um modelo linear e indica o quão bem a variável dependente pode ser explicada pelos regressores presentes no modelo.
  • 21. CORRELAÇÃO E COEFICIENTES DE DETERMINAÇÃO • O coeficiente de determinação, ρ2, varia no intervalo [0,1] • O coeficiente de correlação, ρ, varia no intervalo [-1,1] • O coeficiente ρ é 1 ou -1 apenas quando a equação de regressão y = ax + b é válida para todo i = 1,2,…, N, sem erros • O coeficiente ρ é 0 se e somente se a inclinação a = 0 • O sinal de ρ indica a direção da inclinação, portanto, x e y são positivamente relacionados se ρ > 0 e negativamente relacionados se ρ < 0
  • 22. CORRELAÇÃO E COEFICIENTES DE DETERMINAÇÃO • O coeficiente ρ é 0 se e somente se a inclinação a = 0, o que pode ocorrer por diferentes razões
  • 23. Isto indica que o coeficiente de correlação ρ é uma medida do grau de uma relação linear entre x e y
  • 24. CORRELAÇÃO E REGRESSÃO: PÉTALAS DA IRIS
  • 25. CORRELAÇÃO E REGRESSÃO: PÉTALAS DA IRIS • Relação entre a largura de uma pétala de iris e o seu comprimento σ (y) σ (x) a = ρ (*) b = y − ax (**)
  • 26. CORRELAÇÃO E REGRESSÃO: PÉTALAS DA IRIS • ρ = 0.9629 • Mesmo tendo pontos que não estão exatamente sobre a reta, o coeficiente de determinação, ρ2, vale 0.9271 • Inclinação: 0.4158 • Interseção = -0.3631 σ (y) σ (x) a = ρ (*) b = y − ax (**)
  • 27. CORRELAÇÃO E REGRESSÃO: PÉTALAS DA IRIS • Comprimento da Pétala = 0.4158 * Largura da Pétala - 0.3631 • ρ2 vale 0.9271. Extremamente alto! • Mas a previsão do comprimento da pétala no nosso modelo ainda apresenta imprecisão!
  • 28. CORRELAÇÃO E REGRESSÃO: PÉTALAS DA IRIS • Testar por erros na previsão n x y y previsto erro % 23 1.4 0.1 0.22 119.0 51 4.5 1.5 1.51 0.5 86 4.3 1.3 1.42 9.6 138 5.0 1.9 1.72 9.7 142 5.7 2.5 2.01 19.7 Erro médio: 20.6%
  • 29. CORRELAÇÃO E REGRESSÃO: SÉPALAS DA IRIS
  • 30. CORRELAÇÃO E REGRESSÃO: SÉPALAS DA IRIS • Coeficiente de correlação = -0.1176! • Isto não parece estar certo! • A largura da pétala deveria crescer quando o comprimento da pétala cresce e não diminuir!
  • 31. CORRELAÇÃO E REGRESSÃO: SÉPALAS DA IRIS
  • 32. CORRELAÇÃO E REGRESSÃO: SÉPALAS DA IRIS • Correlação positiva entre indivíduos de uma mesma espécie! • 0.74 • 0.53 • 0.46
  • 33. CORRELAÇÃO E REGRESSÃO: SÉPALAS DA IRIS • Correlação negativa falsa devido a combinação de de dados pertencentes a diferentes agrupamentos! • Um tipo de manipulação de dados que, as vezes de forma não-intencional, pode dar suporte a afirmações do tipo: • Existem mentiras, mentiras cabeludas e Estatística!