SlideShare uma empresa Scribd logo
1 de 10
Baixar para ler offline
INSTITUTO DE EDUCAÇÃO SUPERIOR DE BRASÍLIA
PROGRAMA DE PÓS-GRADUAÇÃO LATO SENSU EM LOGÍSTICA
EMPRESARIAL
Apostila 03: Análise de Regressão
Disciplina: Estatística e modelos de otimização
aplicados à logística
Prof. Rafael José Rorato
VERSÃO PRELIMINAR - INCOMPLETA
Brasília, abril de 08
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
2
c2008
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Campus Jovanina Rimoli
SGAN Quadra 609 – Módulo D – Avenida L2 Norte
Brasília – DF CEP:70850-090
Este exemplar é de propriedade do Instituto de Educação de Brasília, que poderá incluí-lo em
base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de
arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas deste
trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado,
para ensino, comentários e citações, desde que sem finalidade comercial e que seja feita a
referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do autor.
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
3
ÍNDICE
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
4
1) Análise de Regressão
Origem histórica: o termo regressão foi introduzido por Francis Galton (1886).
Em um ensaio, Galton verificou que embora houvesse tendência de pais altos
terem filhos altos e de pais baixos terem filhos baixoa a altura média dos filhos de
pais de uma dada altura tendia a se deslocar ou “regredir” até a altura média da
população como um todo. Assim, a altura de filhos de pais muito altos ou baixos
tende a se mover para a altura mpedia da população.
A lei de regressão universal de Galton foi confirmada por Karl Pearson (1903) em
experimentação que envolveu a coleta de mas de mil registros das alturas dos
menbros de famílias. A conclusão obtida por Pearson foi que a altura média dos
filhos de um grupo de pais altos era inferior à altura de seus pais, e que a altura
média dos filhos de um grupo de pais baixos era superior à altura de seus pais.
Inferia-se a conclusão que filhos altos como baixo “regrediam” em direção à altura
média de todos os homens.
Interpretação moderna (definição): A Análise de Regressão ocupa-se do estudo
da dependência de uma variável, a variável dependente, em relação a uma ou
mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a
média (da população) ou o valor médio da dependente em termos dos valores
conhecidos ou fixos (em amostragem repetida) das explicativas.
Relações estatísticas versus deterministicas: em Análise de Regressão o
objetivo concentra-se no conhecimento da dependência estatística entre as
variáveis investigadas (e não funcional ou determinista), tais como na física
clássica. Nas relações estatísticas focam-se em variáveis aleatórias ou
estocásticas, que têm distribuições de probabilidade.
Regressão versus causação: embora a Análise de Regressão lide com a
dependência de uma variável em relação a outras, ela não implica em causação.
Uma relação estatística, por mais forte e sugestiva que seja, jamais pode
estabelecer uma relação causal: as idéias sobre causação devem vir de fora da
estatística, enfim, de outra teoria.
Regressão versus correlação: intimamente relacionada, porém conceitualmente
diferente da Análise de Regressão, a Análise de Correlação apresenta com o
objetivo em medir a intensidade ou o grau de associação linear entre duas
variáveis. Menciona-se algumas diferenças fundamentais entre regressão e
correlação. Na Análise de Regressão há uma assimetria na forma como as
variáveis dependente e explicativa são tratadas. Supõe-se que a variável
dependente seja estatística, aleatória, com distribuição de probabilidade. E as
variáveis explicativas tenham valores fixados (o valor de Xi é assumido
igualmente para várias amostras de Yi). Na Análise de Correlação tratam-se duas
variáveis simetricamente, sendo que não há distinção entre as variáveis
dependente e explicativas (a correlação entre X e Y é igual a correlação de Y e
X). Também é suposto na Análise de Correlação que tanto as variáveis X e Y são
aleatórias.
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
5
80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 162 191
Total 325 462 445 707 678 750 685 1043 966 1211
Renda
Consumo
Y  X
80 100 120 140 160 180 200 220 240 260
0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14
0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14
0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14
0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14
0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14
0.17 0.14 0.17 0.17 0.14 0.17 0.14
0.14 0.14 0.14
Média
Condicional Y 65 77 89 101 113 125 137 149 161 173
Consumo
P(Y|Xi)  X
Renda
Função de Regressão Populacional: Vamos considerar o exemplo de um bairro
hipotético de Brasília que apresente uma população de 60 famílias (N=60).
Estamos intressados em entender a relação de despesa de consumo familiar
semanal (variável depentende Y) e renda familiar semanal (variável explicativa X).
Segentou-se as famílias em 10 grupos com valores identicos de renda, conforme
mostrado na Tabela 1.
Tabela 1: Tabela de agrupamento de Renda e Consumo de 60 famílias em Brasília
A Tabela 1 corresponde a distribuição condicional de Y, consumo, sobre os
valores de consumo X. Dessa tabela pode-se calcular as probabilidades
condicionais de Y, p(Y|X), isto é, a probabilidade de Y para um dado valor de X.
Assim para o cada valor de consumo X para o perfil de renda Y = 80 existe uma
probabilidade condicional de 1/5. A Tabela 2 representa as probabilidades
condiconais para o exemplo dado.
Tabela 2: Tabela probabilidade condicional da Renda e Consumo
Para cada uma das distribuições de probabilidade condicional Y pode ser
calculado o valor médio, determinado como média condicional ou a expectativa
condicional, conhecido como o valor esperado de Y dado que X assuma o valor
específico de X: E(Y|X = Xi). A última linha da Tabela 2 representa as médias
condicionais de Y.
Uma reta de regressão é ajustada geometricamente por uma reta passando pelas
médias ou expectativas condicionais das variáveis dependentes para os valores
fixados da variável explicativas. Isso pode ser verficado na Figura 1 nos pontos no
círculo vermelho.
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
6
Figura 1: Reta de regressão linear para as variáveis Renda e Consumo
Neste contexto a Função de Regressão Populacional (FRP) é determinada como
a expecitativa condicional E(Y|Xi), definida como:
)()|( xfXYE i = Equação 1
Sendo,
ii XXYE 21)|( ββ += Equação 2
Os termos β1 e β2 são chamados de coeficientes de regressão. β1 é conhecido
como intercepto e β2 conhecido como coeficiente de inclinação. A Equação 2
como função de regressão linear da população.
A linearidade de uma equação de regressão é atingida quando ocorre a
linearidade das variáveis Xi e pelos parâmetos β1 e β2 .Isto significa que as
variáveis e parâmetros não podem ser elevados a função potência, raiz ou fração
(ex.: ii XXYE 21)|( ββ += , 3
21)|( ii XXYE ββ += )
Perturbação estocástica (ui): também conhecida como termo de erro
estocástico é uma variável aleatória não-observável que consiste no erro entre o
valor assumido por Yi e a estimativa de cada categoria Xi verificado em E(Y|Xi).
Assim temos que a perturbação estocástica, com terminologia conhecida como ui,
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
7
é um substituto de todas as variáveis omitidas do modelo mas que coletivamente
afetam Y. A não introdução de todas essas variáveis no modelo dá-se por:
Imprecisão da Teoria: a teoria que determina o comportamento de Y em
função de X geralmente é incompleta. (ex.: pode-se concluir que a renda
semanal X influencie o consumo Y, mas podemos ignorar ou não estarmos
seguros sobre outras variáveis que afetam Y.
Indisponibilidade de Dados: mesmo se soubermos quais são algumas
variáveis das variáveis excluidas ou não consideradas, e admitirmos uma
regressão múltipla em vez de uma regressão simples, podemos não
termos informações quantitativas suficientes sobre os Xs que afetam o Y.
Variáveis Essenciais versus Variáveis Periféricas: É possível que a
influência conjunta de variáveis periféricas seja tão pequena que por
questão prática e de custos não vale a pena introduzi-las no modelo. (ex.:
para o exemplo de Renda e Consumo, talvez itens como, número de
crianças na família, gênero, religião, grau de escolaridade, endereço de
residência, etc sejam aderentes ou não ao modelo preditivo).
Casualidade Intrínseca no Comportamento Humano: mesmo que se
consiga introduzir no modelo todas as variáveis relevantes, há uma certa
natureza aleatória intrínseca em cada Y que não podemos explicar. As
perturbações us podem muito bem refletir a aleatroriedade intrínseca.
Variáveis proxy fracas: a perturbação u pode representar erros de medida
entre as variáveis Y e X (não ocorrer relação entre elas), o que implica em
estimativas imprecisas dos coeficientes de regressão β.
Princípio da Parcimônia: deseja-se que o modelo seja o mais simples
possível. Assim, como o termo u pode-se mensurar a não necessidade de
introduzir mais variáveis Xs ao modelo.
Forma Funcional Errada: a relação entre :Y e X não se comporta com uma
função linear e sim por alguma outra função matemática.
Função de Regressão: Dizemos então, que as equações de Função de
Regressão Populacional e Amostral são escritas com as seguintes equações:
FRP: iii uXY ++= 21 ββ Equação 3
FRA: iii uXY ˆˆˆ
21 ++= ββ Equação 4
A geometria e componentes de uma Função de Regressão Linear simples
configura-se conforme a Figura 2 apresentada a seguir:
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
8
( )( )
( ) ∑
∑
∑
∑ =
−
−−
= 222
ˆ
i
ii
i
ii
x
yx
XX
YYXX
β
XY 21
ˆˆ ββ −=
Figura 2: Geometria e componentes de uma reta de regressão linear
Método dos Mínimos Quadrados: é o método utilizado para calcular a equação
de Regressão Linear, tendo como objetivo minimizar a perturbação estocástica
através do critério:
∑∑ −= 22
)ˆmin()ˆmin( iii YYu Equação 5
Os coeficientes de regressão β1 e β2, para uma equação de regressão linear, são
estimados através das seguintes equações:
Equação 6
Equação 7
A Figura 3 ilustra os erros minimizados ui para cada estimativa da variável y em
relação a variável x.
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
9
∑
= 2
2
2 )ˆvar(
ix
σ
β
2
2
2
1)ˆvar( σβ
∑
∑=
i
i
xn
X
Figura 3: Mínimos Quadrados Ordinários – estimativas de ui
Precisão e ajuste do modelo: para verificar o quão bom ou ruim encontra-se o
modelo estimado são realizados testes para verificar a precisão da estimativa dos
coeficientes de regressão β1 e β2 e o “nível” de ajuste da reta de regressão.
Para mensurar a precisão dos coeficientes de regressão β1 e β2 temos:
Variância:
Equação 8
Equação 9
Erro-padrão: desvio-padrão da distribuição da amostragem do estimador, e a
distribuição da amostragem de um estimador é simplesmente a disbribuição da
probabilidade ou freqüência do estimador. Isto é, a distribuição do conjunto de
valores do estimador obtida de todas as possíveis amostras de mesmo tamanho
de uma dada população. As distribuições da amostragem são usadas para fazer
inferências sobre os valores dos parâmetros da população, com base nos valores
dos estimadores calculados a partir de uma ou mais amostras.
INSTITUTO DE EDUCAÇÃO DE BRASÍLIA
Pós-graduação Lato Sensu em Logística Empresarial
Módulo: Estatística e modelos de otimização aplicados à logística
10
∑
=
22 )ˆ(
ix
ep
σ
β
σβ
∑
∑= 2
2
1)ˆ(
i
i
xn
X
ep
Equação 10
Equação 11
Teste F
Qui-quadrado

Mais conteúdo relacionado

Mais procurados

Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
Rodrigo Rodrigues
 
12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressão
Fernando Lucas
 

Mais procurados (12)

Correlação
CorrelaçãoCorrelação
Correlação
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
Estatística Para Engenharia - Correlação e Regressão Linear - Exercícios.
 
Coeficiente de correlação linear
Coeficiente de correlação linearCoeficiente de correlação linear
Coeficiente de correlação linear
 
Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Estrategia evolutiva
Estrategia evolutivaEstrategia evolutiva
Estrategia evolutiva
 
Teste t student
Teste t studentTeste t student
Teste t student
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Definicao estatistica
Definicao estatisticaDefinicao estatistica
Definicao estatistica
 
12 correlação e regressão
12   correlação e regressão12   correlação e regressão
12 correlação e regressão
 

Destaque

Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jbaHidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
Rafael José Rorato
 

Destaque (20)

Introdução a engenharia - aula 5 - recursos hidricos, barragens e sistemas de...
Introdução a engenharia - aula 5 - recursos hidricos, barragens e sistemas de...Introdução a engenharia - aula 5 - recursos hidricos, barragens e sistemas de...
Introdução a engenharia - aula 5 - recursos hidricos, barragens e sistemas de...
 
Introdução a engenharia - aula 6 -
Introdução a engenharia  - aula 6 -Introdução a engenharia  - aula 6 -
Introdução a engenharia - aula 6 -
 
IESB Logística Empresarial - Métodos Quantitativos - Volume II
IESB Logística Empresarial - Métodos Quantitativos - Volume IIIESB Logística Empresarial - Métodos Quantitativos - Volume II
IESB Logística Empresarial - Métodos Quantitativos - Volume II
 
IESB Logística Empresarial - Métodos Quantitativos - Volume I
IESB Logística Empresarial - Métodos Quantitativos - Volume IIESB Logística Empresarial - Métodos Quantitativos - Volume I
IESB Logística Empresarial - Métodos Quantitativos - Volume I
 
Aula 5 - Mensuração de Custos Operacionais
Aula 5 - Mensuração de Custos OperacionaisAula 5 - Mensuração de Custos Operacionais
Aula 5 - Mensuração de Custos Operacionais
 
Introdução a engenharia - aula 4 - planejamento e infraestrutura de transportes
Introdução a engenharia - aula 4 - planejamento e infraestrutura de transportesIntrodução a engenharia - aula 4 - planejamento e infraestrutura de transportes
Introdução a engenharia - aula 4 - planejamento e infraestrutura de transportes
 
Introdução a engenharia - aula 3 - geotecnia e obras de arte
Introdução a engenharia - aula 3 - geotecnia e obras de arteIntrodução a engenharia - aula 3 - geotecnia e obras de arte
Introdução a engenharia - aula 3 - geotecnia e obras de arte
 
Introdução a engenharia aula 2 - construção civil
Introdução a engenharia   aula 2 - construção civilIntrodução a engenharia   aula 2 - construção civil
Introdução a engenharia aula 2 - construção civil
 
Introdução a engenharia - aula 1
Introdução a engenharia - aula 1Introdução a engenharia - aula 1
Introdução a engenharia - aula 1
 
Calendario academico 2014
Calendario academico 2014Calendario academico 2014
Calendario academico 2014
 
Cinética química
Cinética químicaCinética química
Cinética química
 
Revitalização da Cabotagem Brasileira
Revitalização da Cabotagem Brasileira Revitalização da Cabotagem Brasileira
Revitalização da Cabotagem Brasileira
 
Aspectos estruturais dos modais de infraestrutura de transportes
Aspectos estruturais dos modais de infraestrutura de transportesAspectos estruturais dos modais de infraestrutura de transportes
Aspectos estruturais dos modais de infraestrutura de transportes
 
Zurich Risk Engineering Luis Vitiritti forum de navegacao 30 08 2011
Zurich Risk Engineering Luis Vitiritti forum de navegacao 30 08 2011Zurich Risk Engineering Luis Vitiritti forum de navegacao 30 08 2011
Zurich Risk Engineering Luis Vitiritti forum de navegacao 30 08 2011
 
Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jbaHidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 03 - tecnologias de transporte aéreo jba
 
4ª aula (parte final) / Introdução a engenharia
4ª aula (parte final) / Introdução a engenharia4ª aula (parte final) / Introdução a engenharia
4ª aula (parte final) / Introdução a engenharia
 
Aula 2 - Introdução
Aula 2 - IntroduçãoAula 2 - Introdução
Aula 2 - Introdução
 
trasnporte
trasnportetrasnporte
trasnporte
 
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
Segurança em Terminias de Carga Aérea, Aeroporto de Lisboa_Apresentação Parte 1
 
3 curvas horizontais
3   curvas horizontais3   curvas horizontais
3 curvas horizontais
 

Semelhante a IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)

Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
Wannessa Souza
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)
João Leal
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
Robson Odé
 
1-bioestatstica-140320051658-phpapp02.pdf
1-bioestatstica-140320051658-phpapp02.pdf1-bioestatstica-140320051658-phpapp02.pdf
1-bioestatstica-140320051658-phpapp02.pdf
LuizAntnioDosSantos3
 
tabelas e graficos 6 ano.pptxauladegeografia
tabelas e graficos 6 ano.pptxauladegeografiatabelas e graficos 6 ano.pptxauladegeografia
tabelas e graficos 6 ano.pptxauladegeografia
CarladeOliveira25
 

Semelhante a IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta) (20)

5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
 
Pesquisa Correlacional
Pesquisa CorrelacionalPesquisa Correlacional
Pesquisa Correlacional
 
Correlação Estatística
Correlação EstatísticaCorrelação Estatística
Correlação Estatística
 
Regressao
RegressaoRegressao
Regressao
 
Apostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
 
Linear regression model
Linear regression modelLinear regression model
Linear regression model
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Aula4 CENTROTEC.pptx
Aula4 CENTROTEC.pptxAula4 CENTROTEC.pptx
Aula4 CENTROTEC.pptx
 
Universidade_Federal_de_Sao_Paulo.pptx
Universidade_Federal_de_Sao_Paulo.pptxUniversidade_Federal_de_Sao_Paulo.pptx
Universidade_Federal_de_Sao_Paulo.pptx
 
Universidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdfUniversidade Privada de Angola bioestatistica.pdf
Universidade Privada de Angola bioestatistica.pdf
 
Correlacao
CorrelacaoCorrelacao
Correlacao
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Bioestatística
 Bioestatística Bioestatística
Bioestatística
 
1-bioestatstica-140320051658-phpapp02.pdf
1-bioestatstica-140320051658-phpapp02.pdf1-bioestatstica-140320051658-phpapp02.pdf
1-bioestatstica-140320051658-phpapp02.pdf
 
Aula06
Aula06Aula06
Aula06
 
tabelas e graficos 6 ano.pptxauladegeografia
tabelas e graficos 6 ano.pptxauladegeografiatabelas e graficos 6 ano.pptxauladegeografia
tabelas e graficos 6 ano.pptxauladegeografia
 
Aula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdfAula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdf
 

Mais de Rafael José Rorato

Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jbaHidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
Rafael José Rorato
 
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jbaHidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
Rafael José Rorato
 

Mais de Rafael José Rorato (9)

Aula 4 - Operação de Frotas
Aula 4 - Operação de FrotasAula 4 - Operação de Frotas
Aula 4 - Operação de Frotas
 
Aula 3 - Especificação de Veículos
Aula 3 - Especificação de VeículosAula 3 - Especificação de Veículos
Aula 3 - Especificação de Veículos
 
Aula 1 - Introdução
Aula 1 -  IntroduçãoAula 1 -  Introdução
Aula 1 - Introdução
 
Aula1 - estatística básica
Aula1 -  estatística básicaAula1 -  estatística básica
Aula1 - estatística básica
 
Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jbaHidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
Hidrovias, portos e aeroportos - aula 04 - pistas aeroportuárias geometria jba
 
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jbaHidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
Hidrovias, portos e aeroportos - aula 02 - sistema de transporte aéreo jba
 
Hidrovias, portos e aeroportos - aula 01 - apresentação jba
Hidrovias, portos e aeroportos - aula 01 - apresentação jbaHidrovias, portos e aeroportos - aula 01 - apresentação jba
Hidrovias, portos e aeroportos - aula 01 - apresentação jba
 
Defesa versao final ALTERNATIVAS DE TRANSPORTE RODO-MARÍTIMO NA DISTRIBUÇÃO D...
Defesa versao final ALTERNATIVAS DE TRANSPORTE RODO-MARÍTIMO NA DISTRIBUÇÃO D...Defesa versao final ALTERNATIVAS DE TRANSPORTE RODO-MARÍTIMO NA DISTRIBUÇÃO D...
Defesa versao final ALTERNATIVAS DE TRANSPORTE RODO-MARÍTIMO NA DISTRIBUÇÃO D...
 
Análise de sensibilidade cct cana crua
Análise de sensibilidade cct cana cruaAnálise de sensibilidade cct cana crua
Análise de sensibilidade cct cana crua
 

Último

O Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhosoO Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhoso
VALMIRARIBEIRO1
 
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptxSlide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
sfwsoficial
 
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
FLAVIA LEZAN
 
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
aulasgege
 
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdfHistoria-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
andreaLisboa7
 

Último (20)

O Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhosoO Reizinho Autista.pdf - livro maravilhoso
O Reizinho Autista.pdf - livro maravilhoso
 
Sistema de Acompanhamento - Diário Online 2021.pdf
Sistema de Acompanhamento - Diário Online 2021.pdfSistema de Acompanhamento - Diário Online 2021.pdf
Sistema de Acompanhamento - Diário Online 2021.pdf
 
MODELO Resumo esquemático de Relatório escolar
MODELO Resumo esquemático de Relatório escolarMODELO Resumo esquemático de Relatório escolar
MODELO Resumo esquemático de Relatório escolar
 
662938.pdf aula digital de educação básica
662938.pdf aula digital de educação básica662938.pdf aula digital de educação básica
662938.pdf aula digital de educação básica
 
"Nós Propomos! Mobilidade sustentável na Sertã"
"Nós Propomos! Mobilidade sustentável na Sertã""Nós Propomos! Mobilidade sustentável na Sertã"
"Nós Propomos! Mobilidade sustentável na Sertã"
 
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptxSlide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
Slide Licao 4 - 2T - 2024 - CPAD ADULTOS - Retangular.pptx
 
Testes de avaliação português 6º ano .pdf
Testes de avaliação português 6º ano .pdfTestes de avaliação português 6º ano .pdf
Testes de avaliação português 6º ano .pdf
 
O que é, de facto, a Educação de Infância
O que é, de facto, a Educação de InfânciaO que é, de facto, a Educação de Infância
O que é, de facto, a Educação de Infância
 
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
Slides Lição 7, Betel, Ordenança para uma vida de fidelidade e lealdade, 2Tr2...
 
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
TAMPINHAS Sílabas. Para fazer e trabalhar com as crianças.
 
Apresentação sobre Robots e processos educativos
Apresentação sobre Robots e processos educativosApresentação sobre Robots e processos educativos
Apresentação sobre Robots e processos educativos
 
Multiplicação - Caça-número
Multiplicação - Caça-número Multiplicação - Caça-número
Multiplicação - Caça-número
 
ROTINA DE ESTUDO-APOSTILA ESTUDO ORIENTADO.pdf
ROTINA DE ESTUDO-APOSTILA ESTUDO ORIENTADO.pdfROTINA DE ESTUDO-APOSTILA ESTUDO ORIENTADO.pdf
ROTINA DE ESTUDO-APOSTILA ESTUDO ORIENTADO.pdf
 
Insegurança nunca mais tem afeta pessoas
Insegurança nunca mais tem afeta pessoasInsegurança nunca mais tem afeta pessoas
Insegurança nunca mais tem afeta pessoas
 
Apostila-Letramento-e-alfabetização-2.pdf
Apostila-Letramento-e-alfabetização-2.pdfApostila-Letramento-e-alfabetização-2.pdf
Apostila-Letramento-e-alfabetização-2.pdf
 
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
1. Aula de sociologia - 1º Ano - Émile Durkheim.pdf
 
APH- Avaliação de cena , analise geral do ambiente e paciente.
APH- Avaliação de cena , analise geral do ambiente e paciente.APH- Avaliação de cena , analise geral do ambiente e paciente.
APH- Avaliação de cena , analise geral do ambiente e paciente.
 
ufcd_9649_Educação Inclusiva e Necessidades Educativas Especificas_índice.pdf
ufcd_9649_Educação Inclusiva e Necessidades Educativas Especificas_índice.pdfufcd_9649_Educação Inclusiva e Necessidades Educativas Especificas_índice.pdf
ufcd_9649_Educação Inclusiva e Necessidades Educativas Especificas_índice.pdf
 
livro para educação infantil conceitos sensorial
livro para educação infantil conceitos sensoriallivro para educação infantil conceitos sensorial
livro para educação infantil conceitos sensorial
 
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdfHistoria-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
Historia-em-cartaz-Lucas-o-menino-que-aprendeu-a-comer-saudavel- (1).pdf
 

IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)

  • 1. INSTITUTO DE EDUCAÇÃO SUPERIOR DE BRASÍLIA PROGRAMA DE PÓS-GRADUAÇÃO LATO SENSU EM LOGÍSTICA EMPRESARIAL Apostila 03: Análise de Regressão Disciplina: Estatística e modelos de otimização aplicados à logística Prof. Rafael José Rorato VERSÃO PRELIMINAR - INCOMPLETA Brasília, abril de 08
  • 2. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 2 c2008 INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Campus Jovanina Rimoli SGAN Quadra 609 – Módulo D – Avenida L2 Norte Brasília – DF CEP:70850-090 Este exemplar é de propriedade do Instituto de Educação de Brasília, que poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de arquivamento. É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado, para ensino, comentários e citações, desde que sem finalidade comercial e que seja feita a referência bibliográfica completa. Os conceitos expressos neste trabalho são de responsabilidade do autor.
  • 3. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 3 ÍNDICE
  • 4. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 4 1) Análise de Regressão Origem histórica: o termo regressão foi introduzido por Francis Galton (1886). Em um ensaio, Galton verificou que embora houvesse tendência de pais altos terem filhos altos e de pais baixos terem filhos baixoa a altura média dos filhos de pais de uma dada altura tendia a se deslocar ou “regredir” até a altura média da população como um todo. Assim, a altura de filhos de pais muito altos ou baixos tende a se mover para a altura mpedia da população. A lei de regressão universal de Galton foi confirmada por Karl Pearson (1903) em experimentação que envolveu a coleta de mas de mil registros das alturas dos menbros de famílias. A conclusão obtida por Pearson foi que a altura média dos filhos de um grupo de pais altos era inferior à altura de seus pais, e que a altura média dos filhos de um grupo de pais baixos era superior à altura de seus pais. Inferia-se a conclusão que filhos altos como baixo “regrediam” em direção à altura média de todos os homens. Interpretação moderna (definição): A Análise de Regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média (da população) ou o valor médio da dependente em termos dos valores conhecidos ou fixos (em amostragem repetida) das explicativas. Relações estatísticas versus deterministicas: em Análise de Regressão o objetivo concentra-se no conhecimento da dependência estatística entre as variáveis investigadas (e não funcional ou determinista), tais como na física clássica. Nas relações estatísticas focam-se em variáveis aleatórias ou estocásticas, que têm distribuições de probabilidade. Regressão versus causação: embora a Análise de Regressão lide com a dependência de uma variável em relação a outras, ela não implica em causação. Uma relação estatística, por mais forte e sugestiva que seja, jamais pode estabelecer uma relação causal: as idéias sobre causação devem vir de fora da estatística, enfim, de outra teoria. Regressão versus correlação: intimamente relacionada, porém conceitualmente diferente da Análise de Regressão, a Análise de Correlação apresenta com o objetivo em medir a intensidade ou o grau de associação linear entre duas variáveis. Menciona-se algumas diferenças fundamentais entre regressão e correlação. Na Análise de Regressão há uma assimetria na forma como as variáveis dependente e explicativa são tratadas. Supõe-se que a variável dependente seja estatística, aleatória, com distribuição de probabilidade. E as variáveis explicativas tenham valores fixados (o valor de Xi é assumido igualmente para várias amostras de Yi). Na Análise de Correlação tratam-se duas variáveis simetricamente, sendo que não há distinção entre as variáveis dependente e explicativas (a correlação entre X e Y é igual a correlação de Y e X). Também é suposto na Análise de Correlação que tanto as variáveis X e Y são aleatórias.
  • 5. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 5 80 100 120 140 160 180 200 220 240 260 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 162 191 Total 325 462 445 707 678 750 685 1043 966 1211 Renda Consumo Y X 80 100 120 140 160 180 200 220 240 260 0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14 0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14 0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14 0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14 0.20 0.17 0.20 0.14 0.17 0.17 0.20 0.14 0.17 0.14 0.17 0.14 0.17 0.17 0.14 0.17 0.14 0.14 0.14 0.14 Média Condicional Y 65 77 89 101 113 125 137 149 161 173 Consumo P(Y|Xi) X Renda Função de Regressão Populacional: Vamos considerar o exemplo de um bairro hipotético de Brasília que apresente uma população de 60 famílias (N=60). Estamos intressados em entender a relação de despesa de consumo familiar semanal (variável depentende Y) e renda familiar semanal (variável explicativa X). Segentou-se as famílias em 10 grupos com valores identicos de renda, conforme mostrado na Tabela 1. Tabela 1: Tabela de agrupamento de Renda e Consumo de 60 famílias em Brasília A Tabela 1 corresponde a distribuição condicional de Y, consumo, sobre os valores de consumo X. Dessa tabela pode-se calcular as probabilidades condicionais de Y, p(Y|X), isto é, a probabilidade de Y para um dado valor de X. Assim para o cada valor de consumo X para o perfil de renda Y = 80 existe uma probabilidade condicional de 1/5. A Tabela 2 representa as probabilidades condiconais para o exemplo dado. Tabela 2: Tabela probabilidade condicional da Renda e Consumo Para cada uma das distribuições de probabilidade condicional Y pode ser calculado o valor médio, determinado como média condicional ou a expectativa condicional, conhecido como o valor esperado de Y dado que X assuma o valor específico de X: E(Y|X = Xi). A última linha da Tabela 2 representa as médias condicionais de Y. Uma reta de regressão é ajustada geometricamente por uma reta passando pelas médias ou expectativas condicionais das variáveis dependentes para os valores fixados da variável explicativas. Isso pode ser verficado na Figura 1 nos pontos no círculo vermelho.
  • 6. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 6 Figura 1: Reta de regressão linear para as variáveis Renda e Consumo Neste contexto a Função de Regressão Populacional (FRP) é determinada como a expecitativa condicional E(Y|Xi), definida como: )()|( xfXYE i = Equação 1 Sendo, ii XXYE 21)|( ββ += Equação 2 Os termos β1 e β2 são chamados de coeficientes de regressão. β1 é conhecido como intercepto e β2 conhecido como coeficiente de inclinação. A Equação 2 como função de regressão linear da população. A linearidade de uma equação de regressão é atingida quando ocorre a linearidade das variáveis Xi e pelos parâmetos β1 e β2 .Isto significa que as variáveis e parâmetros não podem ser elevados a função potência, raiz ou fração (ex.: ii XXYE 21)|( ββ += , 3 21)|( ii XXYE ββ += ) Perturbação estocástica (ui): também conhecida como termo de erro estocástico é uma variável aleatória não-observável que consiste no erro entre o valor assumido por Yi e a estimativa de cada categoria Xi verificado em E(Y|Xi). Assim temos que a perturbação estocástica, com terminologia conhecida como ui,
  • 7. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 7 é um substituto de todas as variáveis omitidas do modelo mas que coletivamente afetam Y. A não introdução de todas essas variáveis no modelo dá-se por: Imprecisão da Teoria: a teoria que determina o comportamento de Y em função de X geralmente é incompleta. (ex.: pode-se concluir que a renda semanal X influencie o consumo Y, mas podemos ignorar ou não estarmos seguros sobre outras variáveis que afetam Y. Indisponibilidade de Dados: mesmo se soubermos quais são algumas variáveis das variáveis excluidas ou não consideradas, e admitirmos uma regressão múltipla em vez de uma regressão simples, podemos não termos informações quantitativas suficientes sobre os Xs que afetam o Y. Variáveis Essenciais versus Variáveis Periféricas: É possível que a influência conjunta de variáveis periféricas seja tão pequena que por questão prática e de custos não vale a pena introduzi-las no modelo. (ex.: para o exemplo de Renda e Consumo, talvez itens como, número de crianças na família, gênero, religião, grau de escolaridade, endereço de residência, etc sejam aderentes ou não ao modelo preditivo). Casualidade Intrínseca no Comportamento Humano: mesmo que se consiga introduzir no modelo todas as variáveis relevantes, há uma certa natureza aleatória intrínseca em cada Y que não podemos explicar. As perturbações us podem muito bem refletir a aleatroriedade intrínseca. Variáveis proxy fracas: a perturbação u pode representar erros de medida entre as variáveis Y e X (não ocorrer relação entre elas), o que implica em estimativas imprecisas dos coeficientes de regressão β. Princípio da Parcimônia: deseja-se que o modelo seja o mais simples possível. Assim, como o termo u pode-se mensurar a não necessidade de introduzir mais variáveis Xs ao modelo. Forma Funcional Errada: a relação entre :Y e X não se comporta com uma função linear e sim por alguma outra função matemática. Função de Regressão: Dizemos então, que as equações de Função de Regressão Populacional e Amostral são escritas com as seguintes equações: FRP: iii uXY ++= 21 ββ Equação 3 FRA: iii uXY ˆˆˆ 21 ++= ββ Equação 4 A geometria e componentes de uma Função de Regressão Linear simples configura-se conforme a Figura 2 apresentada a seguir:
  • 8. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 8 ( )( ) ( ) ∑ ∑ ∑ ∑ = − −− = 222 ˆ i ii i ii x yx XX YYXX β XY 21 ˆˆ ββ −= Figura 2: Geometria e componentes de uma reta de regressão linear Método dos Mínimos Quadrados: é o método utilizado para calcular a equação de Regressão Linear, tendo como objetivo minimizar a perturbação estocástica através do critério: ∑∑ −= 22 )ˆmin()ˆmin( iii YYu Equação 5 Os coeficientes de regressão β1 e β2, para uma equação de regressão linear, são estimados através das seguintes equações: Equação 6 Equação 7 A Figura 3 ilustra os erros minimizados ui para cada estimativa da variável y em relação a variável x.
  • 9. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 9 ∑ = 2 2 2 )ˆvar( ix σ β 2 2 2 1)ˆvar( σβ ∑ ∑= i i xn X Figura 3: Mínimos Quadrados Ordinários – estimativas de ui Precisão e ajuste do modelo: para verificar o quão bom ou ruim encontra-se o modelo estimado são realizados testes para verificar a precisão da estimativa dos coeficientes de regressão β1 e β2 e o “nível” de ajuste da reta de regressão. Para mensurar a precisão dos coeficientes de regressão β1 e β2 temos: Variância: Equação 8 Equação 9 Erro-padrão: desvio-padrão da distribuição da amostragem do estimador, e a distribuição da amostragem de um estimador é simplesmente a disbribuição da probabilidade ou freqüência do estimador. Isto é, a distribuição do conjunto de valores do estimador obtida de todas as possíveis amostras de mesmo tamanho de uma dada população. As distribuições da amostragem são usadas para fazer inferências sobre os valores dos parâmetros da população, com base nos valores dos estimadores calculados a partir de uma ou mais amostras.
  • 10. INSTITUTO DE EDUCAÇÃO DE BRASÍLIA Pós-graduação Lato Sensu em Logística Empresarial Módulo: Estatística e modelos de otimização aplicados à logística 10 ∑ = 22 )ˆ( ix ep σ β σβ ∑ ∑= 2 2 1)ˆ( i i xn X ep Equação 10 Equação 11 Teste F Qui-quadrado