SlideShare uma empresa Scribd logo
1 de 19
Baixar para ler offline
Índice
INTRODUCAO ........................................................................................................................ 2
Problema .................................................................................................................................. 2
Objetivo geral ........................................................................................................................... 2
Objetivos específicos ................................................................................................................ 2
Hipótese do estudo .................................................................................................................... 2
Metodologia.............................................................................................................................. 2
Revisão da literatura ................................................................................................................. 3
   Análise de regressão.............................................................................................................. 3
       Circunstâncias em que se aplica ......................................................................................... 4
       Modelo de Regressão Linear Múltipla ............................................................................... 4
       Pressupostos ...................................................................................................................... 4
Apresentação e Discussão dos Resultados ................................................................................. 4
       Teste dos coeficientes de regressão .................................................................................... 4
       Equação de regressão linear múltipla ................................................................................. 5
Analise Residual ....................................................................................................................... 5
Diagnóstico de linearidade ........................................................................................................ 5
Diagnóstico de Normalidade ..................................................................................................... 6
       Análise gráfica da normalidade.......................................................................................... 6
       Teste de Kolmogorov, Shapiro e Anderson-Darling para normalidade ............................... 6
Diagnóstico de Homoscedasticidade ......................................................................................... 7
       Gráfico dos Resíduos versus Valores Ajustados ................................................................. 7
       Teste de Breusch-Pagan .................................................................................................... 8
Diagnóstico de Independência ................................................................................................... 8
       Gráfico dos Resíduos versus a Ordem de recolha de dados ................................................ 8
       Teste de Durbin-Watson .................................................................................................... 9
Diagnóstico de Outlier .............................................................................................................. 9
       Outliers em X .................................................................................................................... 9
       Outliers em Y .................................................................................................................. 10
       Resíduos Padronizados .................................................................................................... 10
       Resíduos Studentizados ................................................................................................... 10
Análise da falta de ajuste do modelo ....................................................................................... 11
Pontos Influentes .................................................................................................................... 11
1


       DFFITS........................................................................................................................... 11
       DFBETA......................................................................................................................... 11
       Distância de Cook ........................................................................................................... 11
Análise de Colinearidade e Multicolinearidade ........................................................................ 12
       Colinearidade .................................................................................................................. 13
       Multicolinearidade .......................................................................................................... 13
Conclusão ............................................................................................................................... 14
Bibliografia............................................................................................................................. 15
Anexos ................................................................................................................................... 18




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
2


INTRODUCAO
Em muitos estudos estatísticos, o objetivo é estabelecer relações que possibilitem
predizer uma ou mais variáveis em termos de outras. Assim é que se fazem estudos para
predizer as vendas futuras de um produto em função do seu preço, a perda de peso de
uma pessoa em decorrer do número de dias que se submete a uma determinada dieta
eou tratamento.


Problema
Este trabalho se propõe a discutir se existe correlação entre a variação do peso dos
indivíduos com os diferentes fatores que estes estão expostos. Sendo assim o problema
de pesquisa pode ser entendido como: existe correlação entre a variação do peso e o
tratamento que este foi exposto e a existência da possível correlação entre o peso atual e
o anterior do individuo?


Objetivo geral
Para discutir o problema apresentado, este estudo tem como objetivo testar
empiricamente a relação entre a variação do peso com algumas variáveis do individuo.


Objetivos específicos
Os seguintes objetivos específicos foram delineados:
    Investigar o efeito do tratamento
    Fatores que possivelmente estão relacionados com esse efeito


Hipótese do estudo
A aplicação do tratamento para redução do peso tem um efeito significativo, isto é, com
a submissão a um dado tratamento de dieta tende se a perder o peso consideravelmente.


Metodologia
Os dados a serem usados provêm dum experimento inserido um programa dietético. A
amostra contém 150 indivíduos, do sexo masculino e feminino, randomizados em 3
grupos de tratamento (placebo, controle e tratamento). Todos os pacientes foram
observados no início do programa e após 6 meses, onde o seu peso foi medido. Diversas

Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
3


outras variáveis também foram medidas nas ocasiões de medição acima mencionados, a
fim de investigar sua relação com o efeito do tratamento.
Para as variáveis qualitativas procedeu se com a criação das suas dummys, sendo que
para a variável tipo de tratamento tomou se por referência o grupo de controlo e para
variável fumador foi referenciada categoria do não fumador.

Geralmente, tem-se o interesse em avaliar a relação de uma variável de interesse Y
(variável dependente ou variável resposta) em relação a k variáveis                 (variável
Independente), j = 1, 2,…, K. Portanto, um possível modelo para avaliar essa relação
pode ser dado por


                                               (1)


Em que, n é o número de indivíduos,       é a observação da variável dependente para o i-
ésimo indivíduo,       = (     ,    .     )′ é um vetor de observações das variáveis
independentes para o i-ésimo indivíduo, β=(                      ) é um vetor de coeficientes
de regressão (parâmetros) e "i é um componente de erro aleatório. Assume-se que esses
erros são independentes e seguem distribuição normal com média zero e variância
desconhecida     .


O modelo (1) é chamado de regressão linear múltipla, pois envolve mais de um
coeficiente de regressão. O adjetivo “linear” indica que o modelo é linear em relação
aos parâmetros β=(                  ), e não porque y é uma função linear dos x′s.


Para fazer a análise utilizou-se os dados dum experimento inserido num programa
dietético, como auxílio de softwares estatísticos como Action, pacote estatístico livre R
e M.Excell 2007. Como pressuposto de análise partiu-se da fundamentação teórica que
relata a relação entre os dois pesos e o efeito do tratamento.
Para mais pormenor apresentamos abaixo a discussão dos resultados e as conclusões
que estes nos propuseram.


Revisão da literatura
Análise de regressão
Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
4


A análise de regressão é aplicada para compreender a dependência estatística de uma
variável em relação a outras variáveis. A técnica pode mostrar que proporção de
variação entre variáveis se deve à variável dependente e que proporção se deve às
variáveis independentes. A relação entre as variáveis pode ser ilustrada graficamente ou,
na maioria dos casos, por via de uma equação matemática.

Circunstâncias em que se aplica
Esta técnica estatística é habitualmente usada na avaliação de programas no sentido de
estimar efeitos. Os efeitos líquidos do programa sob avaliação podem ser analisados
com base na análise de regressão, atribuindo parte das mudanças observadas a variáveis
explicativas, sendo os efeitos restantes atribuídos ao programa.

Modelo de Regressão Linear Múltipla
Um modelo de regressão linear múltiplo (MRLM) descreve uma relação entre varias
variáveis independentes (explicativas) X’s e uma variável dependente (resposta) Y, nos
termos seguintes:


Onde                      são constantes (parâmetros) desconhecidas e   é o erro aleatório.

Pressupostos
(i) Homoscedasticidade.
(ii) Os erros são não correlacionados (independência)
(iii)    ~iddN (0,   )
(iv) Modelo é linear
(v) Não existir outliers (pontos atípicos) influentes
(vi) Não existe Colinearidade e multicolinearidade entre as variáveis explicativas


Apresentação e Discussão dos Resultados
Teste dos coeficientes de regressão
                                  Coeficientes
   Preditor     Estimativa    Desvio Padrão      Estat. T    P-valor
 Intercepto     13,4765326      2,7351833        4,927104    2,28E-06
 PESO_ANTES     0,80652027      0,0354306        22,7634     2,14E-49
        SEXO    3,32862563      0,6270759        5,30817     4,13E-07
   Placebo      -1,0898718      0,6143492        -1,77403    0,078187
 Tratamento     -7,0188435      0,6360836        -11,0345    7,27E-21
        Fuma    -2,1077327      0,5948527        -3,54328    0,000534

Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
5


   Fumava     1,25189541         0,7446168      1,681261          0,094895



Interpretação a nível de significância de 5% pode afirmar-se que os coeficientes dos
fatores sexo, tratamento, peso_antes, fumador são significativamente diferentes de zero,
e os ex-fumadores não se diferem dos não fumadores, como também os que receberam
placebo não se diferem com os de controlo em termos da variação do peso.

Equação de regressão linear múltipla
PESO_DEPOIS=13,4765326+0,80652027* +3,32862563* -1,0898718* -
7,0188435* -2,1077327* +1,25189541*


PESO_ANTES=                             Sexo=


Placebo=                                        Tratamento=


Fuma=                                           Fumava=



 Desvio Padrão dos    Graus de
      Resíduos        Liberdade          R^2           R^2 Ajustado
    3,063344308            143        0,8995508            0,895336199



INTEREPRETAÇÃO: O coeficiente de determinação ajustado (R square) é igual a
0,89533, este valor indica que cerca 89,533% da variação do peso depois é explicada
através do modelo de regressão linear múltipla.


Analise Residual


Diagnóstico de linearidade




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
6


COMENTARIO Da figura acima podemos observar que a distribuição dos resíduos
não segue nenhum padrão, mas sim esta distribuído de forma aleatória, isto indica que o
pressuposto de linearidade não foi violado.


Diagnóstico de Normalidade
A normalidade dos resíduos é uma suposição essencial para que os resultados do ajuste
do modelo de regressão linear sejam confiáveis. Podemos verificar essa suposição por
meio do gráfico de Papel de Probabilidade e por meio de testes tais como Shapiro-Wilk,
Anderson-Darling e Kolmogorov-Smirnov.
Hipótese




Análise gráfica da normalidade




Fig. Histograma e o gráfico de Papel de Probabilidade para os resíduos do modelo linear


COMENTARIO Como os pontos seguem o comportamento da reta (não estão
distantes dela), temos indícios de que os erros são normalmente distribuídos e também o
histograma mostra uma distribuição simétrica.

Teste de Kolmogorov, Shapiro e Anderson-Darling para normalidade
     Teste de Normalidade
                                           Estatística                      P-Valor
       Anderson-Darling                    0,504754871                   0,200217776
             Shapiro                       0,989561491                   0,329712745
           Kolmogorov                      0,053635818                    0,36304377




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
7


Interpretações Os testes acima apresentados vêm complementar o resultado descrito
pela análise gráfica, com base nos três testes podemos com uma confiança de 95% dizer
que os resíduos seguem uma distribuição normal com media zero e variância constante.


Diagnóstico de Homoscedasticidade
Homoscedasticidade é o termo para designar variância constante dos erros para
observações diferentes. Caso a suposição de homoscedasticidade não seja válida,
podemos listar alguns efeitos no ajuste do modelo:
    Os erros padrões dos estimadores, obtidos pelo Método dos Mínimos
          Quadrados, são incorretos e portanto a inferência estatística não é válida.
    Não podemos mais dizer que os Estimadores de Mínimos Quadrados são os
          melhores estimadores de mínima variância para, embora ainda possam ser não
          viciados.
Vale      ressaltar   que   a    ausência    de   homoscedasticidade      é   chamada   de
heteroscedasticidade.

Gráfico dos Resíduos versus Valores Ajustados




COMENTARIO O gráfico dos resíduos versus valores ajustados (valores preditos) é
uma das principais técnicas utilizadas para verificar as suposições dos resíduos, este
pela forma que os pontos estão distribuídos (forma aleatória) em torno da linha central
mostra que não foi violado o pressuposto de homoscedasticidade. Além da deteção de
heteroscedasticidade, esse gráfico pode indicar que não existe uma relação linear entra
as variáveis explicativas com a variável resposta por meio de alguma tendência nos
pontos.


Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
8


Teste de Breusch-Pagan
Baseado no teste multiplicador de Lagrange, o teste de Breusch-Pagan é bastante
utilizado para testar a hipótese nula de que as variâncias dos erros são iguais
(homoscedasticidade) versus a hipótese alternativa de que as variâncias dos erros são
uma função multiplicativa de uma ou mais variáveis, sendo que esta(s) variável(eis)
pode(m) pertencer ou não ao modelo em questão. É indicado para grandes amostras e
quando a suposição de normalidade nos erros é assumida.
                                      Breusch Pagan
                    Qui-Quadrado                        DF              P-Valor
                    0,939774035                         1             0,332335961



INTERPRETAÇÃO Em conformidade com a análise gráfica, com base no p-valor
pode afirmar a nível de significância de 5% (p-valor=0,33> 0,05) que a variância dos
termos do erro é constante.


Diagnóstico de Independência
Para verificar se os resíduos são independentes, iremos utilizar técnicas gráficas e testes.
A seguir, temos o diagnóstico de independência por essas duas formas.

Gráfico dos Resíduos versus a Ordem de recolha de dados




COMENTARIO Uma análise gráfica para verificar a hipótese de independência dos
resíduos pode ser feita por meio do gráfico dos resíduos versus a ordem da recolha dos
dados. Se avaliarmos o gráfico, não há uma tendência dos pontos, ou seja, se os pontos
têm um comportamento aleatório, isto é, ano seguem nenhum padrão na sua distribuição
em torno da linha central.




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
9


Teste de Durbin-Watson
O teste de Durbin-Watson é utilizado para detetar a presença de auto-correlação
(dependência) nos resíduos de uma análise de regressão. Este teste é baseado na
suposição de que os erros no modelo de regressão são gerados por um processo
autorregressivo de primeira ordem, de acordo com                      em que     é o termo
do erro do modelo na i-ésima observação, e                               é o parâmetro de
auto-correlação. Testamos a presença de auto-correlação por meio das hipóteses



                            Teste de Independência
                  DW                                    P-Valor
              2,457609819                             0,996238551



INTERPRETAÇÃO A nível de significância de 5%, com base no valor p pode afirmar
que há independência entre os termos dos resíduos.


Diagnóstico de Outlier
Outlier é uma observação extrema, ou seja, é um ponto com comportamento diferente
dos demais. Além de diagnosticar heteroscedasticidade, o gráfico de resíduos versus
valores ajustados também auxilia na deteção de pontos atípicos.
Se um outlier for influente, ele interfere sobre a função de regressão ajustada (a inclusão
ou não do ponto modifica substancialmente os valores ajustados).
Mas uma observação ser considerada um outlier não quer dizer que consequentemente é
um ponto influente. Por isso, um ponto pode ser um outlier em relação a Y ou aos X, e
pode ou não ser um ponto influente.


A deteção de pontos atípicos tem por finalidade identificar:
    Outlier com relação a X;

    Outlier com relação a Y;

    Observações influentes

Outliers em X
Outliers em X são detetados por meio da matriz chapéu H. Assim,                é o i-ésimo
elemento da diagonal principal da matriz H e também é chamado de leverage da

Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
10


observação                                                                               i




Outliers em Y
Os resíduos brutos são definidos como                   . Entretanto, para uma melhor
deteção em outliers em Y, eles foram melhorados.

Resíduos Padronizados
Se os erros têm distribuição normal, então aproximadamente 95% dos resíduos
padronizados devem estar no intervalo de (-2,2). Resíduos fora desse intervalo podem
indicar a presença de outliers.

Resíduos Studentizados
Os resíduos studentizados tem variâncias constantes e igual a 1 o que consequentemente
torna muito prática a procura por outliers, que são observações distantes das demais.




                                  Teste de Outliers
           Observações                   T-Valor             P-valorBonferroni
               113                       2,789462               0,900709263



INTERPRETAÇÃO Com base no valor p a nível de significância 5% não rejeita a
hipótese nula de que existem outliers. Se assim há necessidade de verificar os pontos
influentes para suportar a decisão de retirada destes pontos na estimação do nosso
modelo.


Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
11


Análise da falta de ajuste do modelo
Não existem réplicas.


Pontos Influentes
Um ponto é influente se sua exclusão do ajuste da regressão causa uma mudança
substancial nos valores ajustados. Por isso, técnicas foram desenvolvidas para
identificar essas observações influentes.

DFFITS
DFFITS mede a influência que a observação i tem sobre seu próprio valor ajustado.
Assim, essa técnica mede o quanto a inclusão da observação i aumenta ou diminui seu
valor estimado.
Dizemos que um ponto outlier é influente segundo o DFFITS se
                        >1, para amostras pequenas ou médias.

                        >         , para amostras grandes.

DFBETA
DFBETA mede a influência da observação i sobre o coeficiente de
                         >1, para amostras pequenas.

                            >2        , para amostras grandes

Distância de Cook
A distância de Cook mede a influência da observação i sobre todos n valores ajustados




                                      DFFITS                                         D-COOK
          0.2 0.4




                                                                         0.04
                                                                D-COOK
 DFFITS

          -0.2




                                                                         0.02
          -0.6




                                                                         0.00




                    0            50         100       150                       0   50      100   150

                                 Observações                                        Observações




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
12




Fig. Gráficos com os valores de DFFITS, D-COOK e DFBETAS


INTERPRETAÇÃO Pelos resultados das Figuras verificamos que nenhum DFFITS,
D-COOK e DFBETAS é, em módulo, maior do que 1. Assim, concluímos que nenhuma
observação é um ponto influente. Sendo assim não havendo necessidade de
excluirmos os outliers.


Análise de Colinearidade e Multicolinearidade
Quando trabalhamos com mais de uma variável regressora, é muito importante verificar
se essas variáveis explicativas são correlacionadas. Desta forma, se não houver nenhum
relacionamento entre elas, dizemos que são ortogonais.
Se as variáveis forem muito correlacionadas, as inferências baseadas no modelo de
regressão podem ser errôneas ou pouco confiáveis.
Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
13


Por isso, é necessário verificar se as variáveis são altamente correlacionadas. Na
literatura, os termos Colinearidade (Multicolinearidade) são utilizados para indicar a
existência forte de correlação entre duas (ou mais) variáveis independentes. Entretanto,
alguns autores designam de Colinearidade a existência de relação linear entre duas
variável explicativa (matriz de correlação) e de Multicolinearidade a existência de
relação linear entre uma variável explicativa e as demais.



Colinearidade
                                          Colinearidade
                  PESO_ANTES      SEXO         Placebo      Tratamento     Fuma      Fumava
 PESO_ANTES           1         0,5873694      -0,10614      0,198399    -0,27139   0,168531
      SEXO        0,58736943        1          -0,14153      0,198148    -0,09288   0,001389
     Placebo      -0,1061392    -0,141535         1            -0,5       -0,066    -1,7E-21
 Tratamento       0,19839873    0,1981485        -0,5           1        0,160292   -0,07362
      Fuma        -0,271391     -0,092883       -0,066       0,160292       1       -0,47481
     Fumava       0,16853135    0,0013893      -1,7E-21      -0,07362    -0,47481      1



INTERPRETAÇAO Observando os valores da matriz acima apresentada em forma de
tabela verificamos a existência de correlação muito baixa entre as variáveis explicativa,
que nos leva a concluir que as variáveis não são relacionadas.

Multicolinearidade
A multicolinearidade é um problema no ajuste do modelo que pode causar impactos na
estimativa dos parâmetros. Vamos diagnosticar Multicolinearidade por meio do VIF
(Variance Inflation Factor).
                               Multicolinearidade
     PESO_ANTES       SEXO      Placebo        Tratamento       Fuma     Fumava
       1,706         1,569       1,341           1,437          1,414     1,308



INTERPRETAÇAO VIF mede a correlação da variável com todas as outras do
modelo, VIF> 5 ou VIF> 10 (depende dos autores) indicam problemas com estimação
de      devido à multicolinearidade, no entanto não se verifica um VIF superior a um
desses valores, que significa que não há multicolinearidade das variáveis explicativas.




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
14


Conclusão
Com o uso da técnica estatística (analise de regressão) conseguimos verificar e medir a
o grau de relação e o efeito da aplicação do tratamento na variação do peso dos
indivíduos.
Podemos afirmar a 5% de significância de que existe uma relação positiva entre o peso
antes e depois do tratamento, sendo a maior parte da variação do peso depois explicada,
pela            equação             de            regressão             que           é
PESO_DEPOIS=13,4765326+0,80652027* +3,32862563* -1,0898718* -
7,0188435* -2,1077327* +1,25189541*


, Onde 13,476 é o valor esperado de um individuo que tinha peso zero, do sexo
feminino que fez controlo e não fumador, 0,8065 é a taxa de variação media do peso
depois no mesmo sentido por variação unitária de peso antes mantendo outros fatores
constantes,
3,3286 Representa a diferença entre a resposta média do sexo masculino e a resposta
média da categoria referência ou do sexo feminino, isto é, os indivíduos do sexo
masculino tendem a ter maior peso que os do sexo feminino mantendo constante outros
fatores;


Se mantermos os outros fatores constantes a diferença media dos indivíduos que
tiveram placebo como tratamento em relação ao de controlo (referencia) é de -1,0897, o
sinal negativo indicando que esse tipo de tratamento influencia na perda de peso quando
os demais fatores forem constantes, mas com base no teste de hipótese dos coeficiente
feito a nível de significância 5% com base no valor p = 0,078 associado a este
coeficiente verifica-se que este em termos populacionais não é significativamente
diferente de zero, sendo assim podem, a este nível de significância afirmar que não
existe diferença entre os que receberam placebo e os de controlo (referencia);


Para os indivíduos que se submeteram ao tratamento como sua dieta apresentam uma
diferença media em relação aos de controlo (referencia) de -7,02 mantendo constante os
outros fatores, visto que estes tendem a perder mais peso em relação aos que receberam
placebo como sua dieta, estes chegando a perder cerca de 544,03% a mais, se os outros
fatores mantiverem se constantes.
Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
15




Os fumadores chegam a perder 2,107 kg a mais que os não fumadores (grupo de
controlo ou de referencia) mantendo constante os demais fatores, diferente dos
fumadores cessantes que este estaticamente a nível de significância 5% com base no
valor p=0,094 associado a coeficiente deste, não se diferem dos não fumadores (grupo
de controlo ou referencia).


Consoante nos dados acima apresentados concluímos que a submissão do tratamento
tem um efeito significativo para a redução do peso em relação ao grupo de referencia e
que os fumadores tendem a perder mais peso que os que não fumam e/ou fumavam.




Bibliografia
Gujarati D. (1988) Basic Econometrics 2nd edition, New York, London:McGraw-Hill
Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
16



Internet.




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
17




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582
18


Anexos
Passos a serem seguidos no suplemento Action+R no M.Excell 2007 para obtenção dos
outputs




Samuel orlando Nhantumbo
Correio electrónico: nhantumbos@live.com.pt
Cell: +258 84 52 18 145/ +258 82 93 07 582

Mais conteúdo relacionado

Semelhante a Análise da correlação entre a variação do peso e fatores associados em um programa dietético

Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...RaquelSilva604657
 
aula - diagnostico de situação.pptx
aula - diagnostico de situação.pptxaula - diagnostico de situação.pptx
aula - diagnostico de situação.pptxMayaraPereira87
 
Trabalho1 estatistica multivariada 2012-final
Trabalho1 estatistica multivariada 2012-finalTrabalho1 estatistica multivariada 2012-final
Trabalho1 estatistica multivariada 2012-finalSamuel Orlando Nhantumbo
 
Artigos de revisão e metanálise
Artigos de revisão e metanáliseArtigos de revisão e metanálise
Artigos de revisão e metanáliseESTeSC
 
Apresentação Questionários - Como analisar respostas
Apresentação Questionários - Como analisar respostasApresentação Questionários - Como analisar respostas
Apresentação Questionários - Como analisar respostasBianca Galvão
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Definir e classificar indicadores clí­nicos para a melhoria da qualidade
Definir e classificar indicadores clí­nicos para a melhoria da qualidadeDefinir e classificar indicadores clí­nicos para a melhoria da qualidade
Definir e classificar indicadores clí­nicos para a melhoria da qualidadeFernando Barroso
 
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...Caio Maximino
 
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2Jairon Jackson
 
modulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdfmodulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdffernando738866
 
M17 e39-comparacao dediferentesmetodosdeprevisaoe
M17 e39-comparacao dediferentesmetodosdeprevisaoeM17 e39-comparacao dediferentesmetodosdeprevisaoe
M17 e39-comparacao dediferentesmetodosdeprevisaoeGMBotbot
 
Avaliação na saúde Condriopoulos.pdf
Avaliação na saúde Condriopoulos.pdfAvaliação na saúde Condriopoulos.pdf
Avaliação na saúde Condriopoulos.pdfPaulWright495154
 

Semelhante a Análise da correlação entre a variação do peso e fatores associados em um programa dietético (20)

Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
 
aula - diagnostico de situação.pptx
aula - diagnostico de situação.pptxaula - diagnostico de situação.pptx
aula - diagnostico de situação.pptx
 
Trabalho1 estatistica multivariada 2012-final
Trabalho1 estatistica multivariada 2012-finalTrabalho1 estatistica multivariada 2012-final
Trabalho1 estatistica multivariada 2012-final
 
Artigos de revisão e metanálise
Artigos de revisão e metanáliseArtigos de revisão e metanálise
Artigos de revisão e metanálise
 
Metanálise
MetanáliseMetanálise
Metanálise
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Trabalho serie temporai sss
Trabalho serie temporai sssTrabalho serie temporai sss
Trabalho serie temporai sss
 
Apresentação Questionários - Como analisar respostas
Apresentação Questionários - Como analisar respostasApresentação Questionários - Como analisar respostas
Apresentação Questionários - Como analisar respostas
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Atps estatistica 2
Atps estatistica 2Atps estatistica 2
Atps estatistica 2
 
Definir e classificar indicadores clí­nicos para a melhoria da qualidade
Definir e classificar indicadores clí­nicos para a melhoria da qualidadeDefinir e classificar indicadores clí­nicos para a melhoria da qualidade
Definir e classificar indicadores clí­nicos para a melhoria da qualidade
 
23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando
 
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
 
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
 
modulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdfmodulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdf
 
M17 e39-comparacao dediferentesmetodosdeprevisaoe
M17 e39-comparacao dediferentesmetodosdeprevisaoeM17 e39-comparacao dediferentesmetodosdeprevisaoe
M17 e39-comparacao dediferentesmetodosdeprevisaoe
 
Atps estatatistica
Atps estatatisticaAtps estatatistica
Atps estatatistica
 
Avaliação na saúde Condriopoulos.pdf
Avaliação na saúde Condriopoulos.pdfAvaliação na saúde Condriopoulos.pdf
Avaliação na saúde Condriopoulos.pdf
 
MetQuantI_Aula1.pptx
MetQuantI_Aula1.pptxMetQuantI_Aula1.pptx
MetQuantI_Aula1.pptx
 

Mais de Samuel Orlando Nhantumbo

Mais de Samuel Orlando Nhantumbo (7)

Trabalho final de geoestatistica
Trabalho final de geoestatisticaTrabalho final de geoestatistica
Trabalho final de geoestatistica
 
Trabalho controlo estatistico de qualidade
Trabalho controlo estatistico de qualidadeTrabalho controlo estatistico de qualidade
Trabalho controlo estatistico de qualidade
 
A ética na pesquisa de marketing trab
A ética na pesquisa de marketing trabA ética na pesquisa de marketing trab
A ética na pesquisa de marketing trab
 
A informática está presente no quotidiano das pessoas
A informática está presente no quotidiano das pessoasA informática está presente no quotidiano das pessoas
A informática está presente no quotidiano das pessoas
 
éTica é um ramo da filosofia que estuda o comportamento moral do ser humano
éTica é um ramo da filosofia que estuda o comportamento moral do ser humanoéTica é um ramo da filosofia que estuda o comportamento moral do ser humano
éTica é um ramo da filosofia que estuda o comportamento moral do ser humano
 
Teste de hipoteses formulario1
Teste de hipoteses formulario1Teste de hipoteses formulario1
Teste de hipoteses formulario1
 
Nhantumbo’s
Nhantumbo’sNhantumbo’s
Nhantumbo’s
 

Último

Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptMaiteFerreira4
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Ficha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFicha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFtimaMoreira35
 
ATIVIDADE PARA ENTENDER -Pizzaria dos Descritores
ATIVIDADE PARA ENTENDER -Pizzaria dos DescritoresATIVIDADE PARA ENTENDER -Pizzaria dos Descritores
ATIVIDADE PARA ENTENDER -Pizzaria dos DescritoresAnaCarinaKucharski1
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxBeatrizLittig1
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfLeloIurk1
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESCOMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESEduardaReis50
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números Mary Alvarenga
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdfAna Lemos
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Ilda Bicacro
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfGEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfElianeElika
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfFernandaMota99
 
Revista-Palavra-Viva-Profetas-Menores (1).pdf
Revista-Palavra-Viva-Profetas-Menores (1).pdfRevista-Palavra-Viva-Profetas-Menores (1).pdf
Revista-Palavra-Viva-Profetas-Menores (1).pdfMárcio Azevedo
 
Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)ElliotFerreira
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Ilda Bicacro
 
VARIEDADES LINGUÍSTICAS - 1. pptx
VARIEDADES        LINGUÍSTICAS - 1. pptxVARIEDADES        LINGUÍSTICAS - 1. pptx
VARIEDADES LINGUÍSTICAS - 1. pptxMarlene Cunhada
 

Último (20)

Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.ppt
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
Ficha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdfFicha de trabalho com palavras- simples e complexas.pdf
Ficha de trabalho com palavras- simples e complexas.pdf
 
ATIVIDADE PARA ENTENDER -Pizzaria dos Descritores
ATIVIDADE PARA ENTENDER -Pizzaria dos DescritoresATIVIDADE PARA ENTENDER -Pizzaria dos Descritores
ATIVIDADE PARA ENTENDER -Pizzaria dos Descritores
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docx
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕESCOMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
COMPETÊNCIA 4 NO ENEM: O TEXTO E SUAS AMARRACÕES
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdf
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfGEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdf
 
Revista-Palavra-Viva-Profetas-Menores (1).pdf
Revista-Palavra-Viva-Profetas-Menores (1).pdfRevista-Palavra-Viva-Profetas-Menores (1).pdf
Revista-Palavra-Viva-Profetas-Menores (1).pdf
 
Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"
 
VARIEDADES LINGUÍSTICAS - 1. pptx
VARIEDADES        LINGUÍSTICAS - 1. pptxVARIEDADES        LINGUÍSTICAS - 1. pptx
VARIEDADES LINGUÍSTICAS - 1. pptx
 

Análise da correlação entre a variação do peso e fatores associados em um programa dietético

  • 1. Índice INTRODUCAO ........................................................................................................................ 2 Problema .................................................................................................................................. 2 Objetivo geral ........................................................................................................................... 2 Objetivos específicos ................................................................................................................ 2 Hipótese do estudo .................................................................................................................... 2 Metodologia.............................................................................................................................. 2 Revisão da literatura ................................................................................................................. 3 Análise de regressão.............................................................................................................. 3 Circunstâncias em que se aplica ......................................................................................... 4 Modelo de Regressão Linear Múltipla ............................................................................... 4 Pressupostos ...................................................................................................................... 4 Apresentação e Discussão dos Resultados ................................................................................. 4 Teste dos coeficientes de regressão .................................................................................... 4 Equação de regressão linear múltipla ................................................................................. 5 Analise Residual ....................................................................................................................... 5 Diagnóstico de linearidade ........................................................................................................ 5 Diagnóstico de Normalidade ..................................................................................................... 6 Análise gráfica da normalidade.......................................................................................... 6 Teste de Kolmogorov, Shapiro e Anderson-Darling para normalidade ............................... 6 Diagnóstico de Homoscedasticidade ......................................................................................... 7 Gráfico dos Resíduos versus Valores Ajustados ................................................................. 7 Teste de Breusch-Pagan .................................................................................................... 8 Diagnóstico de Independência ................................................................................................... 8 Gráfico dos Resíduos versus a Ordem de recolha de dados ................................................ 8 Teste de Durbin-Watson .................................................................................................... 9 Diagnóstico de Outlier .............................................................................................................. 9 Outliers em X .................................................................................................................... 9 Outliers em Y .................................................................................................................. 10 Resíduos Padronizados .................................................................................................... 10 Resíduos Studentizados ................................................................................................... 10 Análise da falta de ajuste do modelo ....................................................................................... 11 Pontos Influentes .................................................................................................................... 11
  • 2. 1 DFFITS........................................................................................................................... 11 DFBETA......................................................................................................................... 11 Distância de Cook ........................................................................................................... 11 Análise de Colinearidade e Multicolinearidade ........................................................................ 12 Colinearidade .................................................................................................................. 13 Multicolinearidade .......................................................................................................... 13 Conclusão ............................................................................................................................... 14 Bibliografia............................................................................................................................. 15 Anexos ................................................................................................................................... 18 Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 3. 2 INTRODUCAO Em muitos estudos estatísticos, o objetivo é estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outras. Assim é que se fazem estudos para predizer as vendas futuras de um produto em função do seu preço, a perda de peso de uma pessoa em decorrer do número de dias que se submete a uma determinada dieta eou tratamento. Problema Este trabalho se propõe a discutir se existe correlação entre a variação do peso dos indivíduos com os diferentes fatores que estes estão expostos. Sendo assim o problema de pesquisa pode ser entendido como: existe correlação entre a variação do peso e o tratamento que este foi exposto e a existência da possível correlação entre o peso atual e o anterior do individuo? Objetivo geral Para discutir o problema apresentado, este estudo tem como objetivo testar empiricamente a relação entre a variação do peso com algumas variáveis do individuo. Objetivos específicos Os seguintes objetivos específicos foram delineados:  Investigar o efeito do tratamento  Fatores que possivelmente estão relacionados com esse efeito Hipótese do estudo A aplicação do tratamento para redução do peso tem um efeito significativo, isto é, com a submissão a um dado tratamento de dieta tende se a perder o peso consideravelmente. Metodologia Os dados a serem usados provêm dum experimento inserido um programa dietético. A amostra contém 150 indivíduos, do sexo masculino e feminino, randomizados em 3 grupos de tratamento (placebo, controle e tratamento). Todos os pacientes foram observados no início do programa e após 6 meses, onde o seu peso foi medido. Diversas Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 4. 3 outras variáveis também foram medidas nas ocasiões de medição acima mencionados, a fim de investigar sua relação com o efeito do tratamento. Para as variáveis qualitativas procedeu se com a criação das suas dummys, sendo que para a variável tipo de tratamento tomou se por referência o grupo de controlo e para variável fumador foi referenciada categoria do não fumador. Geralmente, tem-se o interesse em avaliar a relação de uma variável de interesse Y (variável dependente ou variável resposta) em relação a k variáveis (variável Independente), j = 1, 2,…, K. Portanto, um possível modelo para avaliar essa relação pode ser dado por (1) Em que, n é o número de indivíduos, é a observação da variável dependente para o i- ésimo indivíduo, = ( , . )′ é um vetor de observações das variáveis independentes para o i-ésimo indivíduo, β=( ) é um vetor de coeficientes de regressão (parâmetros) e "i é um componente de erro aleatório. Assume-se que esses erros são independentes e seguem distribuição normal com média zero e variância desconhecida . O modelo (1) é chamado de regressão linear múltipla, pois envolve mais de um coeficiente de regressão. O adjetivo “linear” indica que o modelo é linear em relação aos parâmetros β=( ), e não porque y é uma função linear dos x′s. Para fazer a análise utilizou-se os dados dum experimento inserido num programa dietético, como auxílio de softwares estatísticos como Action, pacote estatístico livre R e M.Excell 2007. Como pressuposto de análise partiu-se da fundamentação teórica que relata a relação entre os dois pesos e o efeito do tratamento. Para mais pormenor apresentamos abaixo a discussão dos resultados e as conclusões que estes nos propuseram. Revisão da literatura Análise de regressão Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 5. 4 A análise de regressão é aplicada para compreender a dependência estatística de uma variável em relação a outras variáveis. A técnica pode mostrar que proporção de variação entre variáveis se deve à variável dependente e que proporção se deve às variáveis independentes. A relação entre as variáveis pode ser ilustrada graficamente ou, na maioria dos casos, por via de uma equação matemática. Circunstâncias em que se aplica Esta técnica estatística é habitualmente usada na avaliação de programas no sentido de estimar efeitos. Os efeitos líquidos do programa sob avaliação podem ser analisados com base na análise de regressão, atribuindo parte das mudanças observadas a variáveis explicativas, sendo os efeitos restantes atribuídos ao programa. Modelo de Regressão Linear Múltipla Um modelo de regressão linear múltiplo (MRLM) descreve uma relação entre varias variáveis independentes (explicativas) X’s e uma variável dependente (resposta) Y, nos termos seguintes: Onde são constantes (parâmetros) desconhecidas e é o erro aleatório. Pressupostos (i) Homoscedasticidade. (ii) Os erros são não correlacionados (independência) (iii) ~iddN (0, ) (iv) Modelo é linear (v) Não existir outliers (pontos atípicos) influentes (vi) Não existe Colinearidade e multicolinearidade entre as variáveis explicativas Apresentação e Discussão dos Resultados Teste dos coeficientes de regressão Coeficientes Preditor Estimativa Desvio Padrão Estat. T P-valor Intercepto 13,4765326 2,7351833 4,927104 2,28E-06 PESO_ANTES 0,80652027 0,0354306 22,7634 2,14E-49 SEXO 3,32862563 0,6270759 5,30817 4,13E-07 Placebo -1,0898718 0,6143492 -1,77403 0,078187 Tratamento -7,0188435 0,6360836 -11,0345 7,27E-21 Fuma -2,1077327 0,5948527 -3,54328 0,000534 Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 6. 5 Fumava 1,25189541 0,7446168 1,681261 0,094895 Interpretação a nível de significância de 5% pode afirmar-se que os coeficientes dos fatores sexo, tratamento, peso_antes, fumador são significativamente diferentes de zero, e os ex-fumadores não se diferem dos não fumadores, como também os que receberam placebo não se diferem com os de controlo em termos da variação do peso. Equação de regressão linear múltipla PESO_DEPOIS=13,4765326+0,80652027* +3,32862563* -1,0898718* - 7,0188435* -2,1077327* +1,25189541* PESO_ANTES= Sexo= Placebo= Tratamento= Fuma= Fumava= Desvio Padrão dos Graus de Resíduos Liberdade R^2 R^2 Ajustado 3,063344308 143 0,8995508 0,895336199 INTEREPRETAÇÃO: O coeficiente de determinação ajustado (R square) é igual a 0,89533, este valor indica que cerca 89,533% da variação do peso depois é explicada através do modelo de regressão linear múltipla. Analise Residual Diagnóstico de linearidade Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 7. 6 COMENTARIO Da figura acima podemos observar que a distribuição dos resíduos não segue nenhum padrão, mas sim esta distribuído de forma aleatória, isto indica que o pressuposto de linearidade não foi violado. Diagnóstico de Normalidade A normalidade dos resíduos é uma suposição essencial para que os resultados do ajuste do modelo de regressão linear sejam confiáveis. Podemos verificar essa suposição por meio do gráfico de Papel de Probabilidade e por meio de testes tais como Shapiro-Wilk, Anderson-Darling e Kolmogorov-Smirnov. Hipótese Análise gráfica da normalidade Fig. Histograma e o gráfico de Papel de Probabilidade para os resíduos do modelo linear COMENTARIO Como os pontos seguem o comportamento da reta (não estão distantes dela), temos indícios de que os erros são normalmente distribuídos e também o histograma mostra uma distribuição simétrica. Teste de Kolmogorov, Shapiro e Anderson-Darling para normalidade Teste de Normalidade Estatística P-Valor Anderson-Darling 0,504754871 0,200217776 Shapiro 0,989561491 0,329712745 Kolmogorov 0,053635818 0,36304377 Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 8. 7 Interpretações Os testes acima apresentados vêm complementar o resultado descrito pela análise gráfica, com base nos três testes podemos com uma confiança de 95% dizer que os resíduos seguem uma distribuição normal com media zero e variância constante. Diagnóstico de Homoscedasticidade Homoscedasticidade é o termo para designar variância constante dos erros para observações diferentes. Caso a suposição de homoscedasticidade não seja válida, podemos listar alguns efeitos no ajuste do modelo:  Os erros padrões dos estimadores, obtidos pelo Método dos Mínimos Quadrados, são incorretos e portanto a inferência estatística não é válida.  Não podemos mais dizer que os Estimadores de Mínimos Quadrados são os melhores estimadores de mínima variância para, embora ainda possam ser não viciados. Vale ressaltar que a ausência de homoscedasticidade é chamada de heteroscedasticidade. Gráfico dos Resíduos versus Valores Ajustados COMENTARIO O gráfico dos resíduos versus valores ajustados (valores preditos) é uma das principais técnicas utilizadas para verificar as suposições dos resíduos, este pela forma que os pontos estão distribuídos (forma aleatória) em torno da linha central mostra que não foi violado o pressuposto de homoscedasticidade. Além da deteção de heteroscedasticidade, esse gráfico pode indicar que não existe uma relação linear entra as variáveis explicativas com a variável resposta por meio de alguma tendência nos pontos. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 9. 8 Teste de Breusch-Pagan Baseado no teste multiplicador de Lagrange, o teste de Breusch-Pagan é bastante utilizado para testar a hipótese nula de que as variâncias dos erros são iguais (homoscedasticidade) versus a hipótese alternativa de que as variâncias dos erros são uma função multiplicativa de uma ou mais variáveis, sendo que esta(s) variável(eis) pode(m) pertencer ou não ao modelo em questão. É indicado para grandes amostras e quando a suposição de normalidade nos erros é assumida. Breusch Pagan Qui-Quadrado DF P-Valor 0,939774035 1 0,332335961 INTERPRETAÇÃO Em conformidade com a análise gráfica, com base no p-valor pode afirmar a nível de significância de 5% (p-valor=0,33> 0,05) que a variância dos termos do erro é constante. Diagnóstico de Independência Para verificar se os resíduos são independentes, iremos utilizar técnicas gráficas e testes. A seguir, temos o diagnóstico de independência por essas duas formas. Gráfico dos Resíduos versus a Ordem de recolha de dados COMENTARIO Uma análise gráfica para verificar a hipótese de independência dos resíduos pode ser feita por meio do gráfico dos resíduos versus a ordem da recolha dos dados. Se avaliarmos o gráfico, não há uma tendência dos pontos, ou seja, se os pontos têm um comportamento aleatório, isto é, ano seguem nenhum padrão na sua distribuição em torno da linha central. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 10. 9 Teste de Durbin-Watson O teste de Durbin-Watson é utilizado para detetar a presença de auto-correlação (dependência) nos resíduos de uma análise de regressão. Este teste é baseado na suposição de que os erros no modelo de regressão são gerados por um processo autorregressivo de primeira ordem, de acordo com em que é o termo do erro do modelo na i-ésima observação, e é o parâmetro de auto-correlação. Testamos a presença de auto-correlação por meio das hipóteses Teste de Independência DW P-Valor 2,457609819 0,996238551 INTERPRETAÇÃO A nível de significância de 5%, com base no valor p pode afirmar que há independência entre os termos dos resíduos. Diagnóstico de Outlier Outlier é uma observação extrema, ou seja, é um ponto com comportamento diferente dos demais. Além de diagnosticar heteroscedasticidade, o gráfico de resíduos versus valores ajustados também auxilia na deteção de pontos atípicos. Se um outlier for influente, ele interfere sobre a função de regressão ajustada (a inclusão ou não do ponto modifica substancialmente os valores ajustados). Mas uma observação ser considerada um outlier não quer dizer que consequentemente é um ponto influente. Por isso, um ponto pode ser um outlier em relação a Y ou aos X, e pode ou não ser um ponto influente. A deteção de pontos atípicos tem por finalidade identificar:  Outlier com relação a X;  Outlier com relação a Y;  Observações influentes Outliers em X Outliers em X são detetados por meio da matriz chapéu H. Assim, é o i-ésimo elemento da diagonal principal da matriz H e também é chamado de leverage da Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 11. 10 observação i Outliers em Y Os resíduos brutos são definidos como . Entretanto, para uma melhor deteção em outliers em Y, eles foram melhorados. Resíduos Padronizados Se os erros têm distribuição normal, então aproximadamente 95% dos resíduos padronizados devem estar no intervalo de (-2,2). Resíduos fora desse intervalo podem indicar a presença de outliers. Resíduos Studentizados Os resíduos studentizados tem variâncias constantes e igual a 1 o que consequentemente torna muito prática a procura por outliers, que são observações distantes das demais. Teste de Outliers Observações T-Valor P-valorBonferroni 113 2,789462 0,900709263 INTERPRETAÇÃO Com base no valor p a nível de significância 5% não rejeita a hipótese nula de que existem outliers. Se assim há necessidade de verificar os pontos influentes para suportar a decisão de retirada destes pontos na estimação do nosso modelo. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 12. 11 Análise da falta de ajuste do modelo Não existem réplicas. Pontos Influentes Um ponto é influente se sua exclusão do ajuste da regressão causa uma mudança substancial nos valores ajustados. Por isso, técnicas foram desenvolvidas para identificar essas observações influentes. DFFITS DFFITS mede a influência que a observação i tem sobre seu próprio valor ajustado. Assim, essa técnica mede o quanto a inclusão da observação i aumenta ou diminui seu valor estimado. Dizemos que um ponto outlier é influente segundo o DFFITS se >1, para amostras pequenas ou médias. > , para amostras grandes. DFBETA DFBETA mede a influência da observação i sobre o coeficiente de >1, para amostras pequenas. >2 , para amostras grandes Distância de Cook A distância de Cook mede a influência da observação i sobre todos n valores ajustados DFFITS D-COOK 0.2 0.4 0.04 D-COOK DFFITS -0.2 0.02 -0.6 0.00 0 50 100 150 0 50 100 150 Observações Observações Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 13. 12 Fig. Gráficos com os valores de DFFITS, D-COOK e DFBETAS INTERPRETAÇÃO Pelos resultados das Figuras verificamos que nenhum DFFITS, D-COOK e DFBETAS é, em módulo, maior do que 1. Assim, concluímos que nenhuma observação é um ponto influente. Sendo assim não havendo necessidade de excluirmos os outliers. Análise de Colinearidade e Multicolinearidade Quando trabalhamos com mais de uma variável regressora, é muito importante verificar se essas variáveis explicativas são correlacionadas. Desta forma, se não houver nenhum relacionamento entre elas, dizemos que são ortogonais. Se as variáveis forem muito correlacionadas, as inferências baseadas no modelo de regressão podem ser errôneas ou pouco confiáveis. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 14. 13 Por isso, é necessário verificar se as variáveis são altamente correlacionadas. Na literatura, os termos Colinearidade (Multicolinearidade) são utilizados para indicar a existência forte de correlação entre duas (ou mais) variáveis independentes. Entretanto, alguns autores designam de Colinearidade a existência de relação linear entre duas variável explicativa (matriz de correlação) e de Multicolinearidade a existência de relação linear entre uma variável explicativa e as demais. Colinearidade Colinearidade PESO_ANTES SEXO Placebo Tratamento Fuma Fumava PESO_ANTES 1 0,5873694 -0,10614 0,198399 -0,27139 0,168531 SEXO 0,58736943 1 -0,14153 0,198148 -0,09288 0,001389 Placebo -0,1061392 -0,141535 1 -0,5 -0,066 -1,7E-21 Tratamento 0,19839873 0,1981485 -0,5 1 0,160292 -0,07362 Fuma -0,271391 -0,092883 -0,066 0,160292 1 -0,47481 Fumava 0,16853135 0,0013893 -1,7E-21 -0,07362 -0,47481 1 INTERPRETAÇAO Observando os valores da matriz acima apresentada em forma de tabela verificamos a existência de correlação muito baixa entre as variáveis explicativa, que nos leva a concluir que as variáveis não são relacionadas. Multicolinearidade A multicolinearidade é um problema no ajuste do modelo que pode causar impactos na estimativa dos parâmetros. Vamos diagnosticar Multicolinearidade por meio do VIF (Variance Inflation Factor). Multicolinearidade PESO_ANTES SEXO Placebo Tratamento Fuma Fumava 1,706 1,569 1,341 1,437 1,414 1,308 INTERPRETAÇAO VIF mede a correlação da variável com todas as outras do modelo, VIF> 5 ou VIF> 10 (depende dos autores) indicam problemas com estimação de devido à multicolinearidade, no entanto não se verifica um VIF superior a um desses valores, que significa que não há multicolinearidade das variáveis explicativas. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 15. 14 Conclusão Com o uso da técnica estatística (analise de regressão) conseguimos verificar e medir a o grau de relação e o efeito da aplicação do tratamento na variação do peso dos indivíduos. Podemos afirmar a 5% de significância de que existe uma relação positiva entre o peso antes e depois do tratamento, sendo a maior parte da variação do peso depois explicada, pela equação de regressão que é PESO_DEPOIS=13,4765326+0,80652027* +3,32862563* -1,0898718* - 7,0188435* -2,1077327* +1,25189541* , Onde 13,476 é o valor esperado de um individuo que tinha peso zero, do sexo feminino que fez controlo e não fumador, 0,8065 é a taxa de variação media do peso depois no mesmo sentido por variação unitária de peso antes mantendo outros fatores constantes, 3,3286 Representa a diferença entre a resposta média do sexo masculino e a resposta média da categoria referência ou do sexo feminino, isto é, os indivíduos do sexo masculino tendem a ter maior peso que os do sexo feminino mantendo constante outros fatores; Se mantermos os outros fatores constantes a diferença media dos indivíduos que tiveram placebo como tratamento em relação ao de controlo (referencia) é de -1,0897, o sinal negativo indicando que esse tipo de tratamento influencia na perda de peso quando os demais fatores forem constantes, mas com base no teste de hipótese dos coeficiente feito a nível de significância 5% com base no valor p = 0,078 associado a este coeficiente verifica-se que este em termos populacionais não é significativamente diferente de zero, sendo assim podem, a este nível de significância afirmar que não existe diferença entre os que receberam placebo e os de controlo (referencia); Para os indivíduos que se submeteram ao tratamento como sua dieta apresentam uma diferença media em relação aos de controlo (referencia) de -7,02 mantendo constante os outros fatores, visto que estes tendem a perder mais peso em relação aos que receberam placebo como sua dieta, estes chegando a perder cerca de 544,03% a mais, se os outros fatores mantiverem se constantes. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 16. 15 Os fumadores chegam a perder 2,107 kg a mais que os não fumadores (grupo de controlo ou de referencia) mantendo constante os demais fatores, diferente dos fumadores cessantes que este estaticamente a nível de significância 5% com base no valor p=0,094 associado a coeficiente deste, não se diferem dos não fumadores (grupo de controlo ou referencia). Consoante nos dados acima apresentados concluímos que a submissão do tratamento tem um efeito significativo para a redução do peso em relação ao grupo de referencia e que os fumadores tendem a perder mais peso que os que não fumam e/ou fumavam. Bibliografia Gujarati D. (1988) Basic Econometrics 2nd edition, New York, London:McGraw-Hill Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 17. 16 Internet. Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 18. 17 Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582
  • 19. 18 Anexos Passos a serem seguidos no suplemento Action+R no M.Excell 2007 para obtenção dos outputs Samuel orlando Nhantumbo Correio electrónico: nhantumbos@live.com.pt Cell: +258 84 52 18 145/ +258 82 93 07 582