SlideShare uma empresa Scribd logo
1 de 42
PREVIS˜AO DE VENDAS COM MODELO
ARIMA BOX-JENKINS
Emanuel De Jesus Ramos Correia Borges∗
Jeremias Lopes Landim†
Praia
17 de agosto de 2018
∗
Licenciado em Estat´ıstica e Gest˜ao de Informa¸c˜ao, Universidade de Cabo Verde -
Uni-CV. Caixa Postal, CEP: 7400, Praia, Santiago, Cabo Verde. E-mail: emanuelra-
mos31@hotmail.com
†
Licenciado em Estat´ıstica e Gest˜ao de Informa¸c˜ao, Universidade de Cabo Verde
- Uni-CV, Caixa Postal, CEP: 7400, Praia, Santiago, Cabo Verde. E-mail: jeremi-
asl10@hotmail.com
1
PREVIS˜AO DE VENDAS COM MODELO ARIMA
BOX-JENKINS
Resumo
O prop´osito deste artigo consiste em captar o comportamento da
s´erie temporal e com base nesse comportamento realizar previs˜oes fu-
turas (vendas), utilizando a metodologia ARIMA (Auto-Regressivo
Integrado de M´edias M´oveis) de Box-Jenkins de previs˜ao de s´eries
temporais de forma univariada. Para a obten¸c˜ao do melhor modelo
para a previs˜ao das vendas levou-se em considera¸c˜ao os crit´erios de In-
forma¸c˜ao de Akaike (AIC), o Crit´erio Bayesiano de Schwartz (SIC) e o
Crit´erio de Erro Quadr´atico M´edio (EQM). Atrav´es do melhor modelo
foi feito a previs˜ao de vendas para os pr´oximos meses. A s´erie tem-
poral usada neste artigo ´e mensal e corresponde a per´ıodo de Janeiro
de 2000 a Dezembro 2014. A an´alise baseou-se em testes estat´ısticos,
atrav´es da qual da an´alises, conclui-se que o modelo ARIMA(4,1,1) ´e
o melhor dentre o conjunto de modelos testados.
Palavra Chaves:
1. Previs˜ao;
2. S´erie Temporais;
3. Modelo ARIMA de Box-Jenkins;
Sum´ario
1 Introdu¸c˜ao 5
2 Metodologia 6
3 Revis˜ao Bibliogr´afica 7
4 Referencial Te´orico 8
4.1 Metodologia de Box-Jenkins . . . . . . . . . . . . . . . . . . . 8
4.2 S´erie Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.3 Estacionariedade da S´erie Temporal . . . . . . . . . . . . . . . 10
4.3.1 Modelos lineares Estacion´arios . . . . . . . . . . . . . . 10
4.3.2 Modelo Auto-Regressivo - AR(p) . . . . . . . . . . . . 12
4.3.3 M´edias M´oveis - MA(q) . . . . . . . . . . . . . . . . . 12
4.3.4 Modelo Auto-Regressivo M´edias M´oveis - ARMA(q,p) . 13
4.4 Modelos lineares n˜ao Estacion´arios . . . . . . . . . . . . . . . 13
4.4.1 Modelo Auto-Regressivo Integrado M´edia M´oveis - ARIMA
(p,q,d) . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.5 Avalia¸c˜ao da estacionariedade . . . . . . . . . . . . . . . . . . 15
4.6 Fases na escolha do Melhor Modelo . . . . . . . . . . . . . . . 16
5 Resultado e discuss˜ao 20
5.1 Crit´erio de Escolha do melhor Modelo ARIMA . . . . . . . . . 30
5.2 Previs˜ao com Modelo ARIMA . . . . . . . . . . . . . . . . . . 34
6 Conclus˜ao 36
7 Anexo 40
Lista de Figuras
1 Comportamento da s´erie em Estudo . . . . . . . . . . . . . . . 21
2 Teste de Dickey-Fuller incluindo 11 desfasamentos . . . . . . . 22
3 Gr´afico QQ-Normal . . . . . . . . . . . . . . . . . . . . . . . . 23
4 Correlogramas das FAC (ACF) e FACP (PAFC) da s´erie Vendas 24
5 Primeira diferen¸ca da s´erie vendas . . . . . . . . . . . . . . . . 25
6 Teste de Dickey-Fuller para a primeira diferen¸ca . . . . . . . . 26
7 Teste de Normalidade para primeira diferen¸ca da s´erie . . . . . 26
8 QQ-Normal para Primeira diferen¸ca da s´erie . . . . . . . . . . 27
9 QQ-Normal da s´erie (sem diferen¸ca) . . . . . . . . . . . . . . . 27
10 QQ-Normal da primeira diferen¸ca da s´erie . . . . . . . . . . . 27
11 Correlogramas das FAC e FACP da s´erie vendas (primeira
diferen¸ca) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
12 Ajustamento do modelo ajustado a s´erie inicial . . . . . . . . . 35
13 Previs˜ao para do modelo ARIMA(4,1,1) . . . . . . . . . . . . 35
Lista de Tabelas
1 Estat´ıstica T tabelado para diferentes tamanhos de amostra . 15
2 Estat´ıstica descritiva da s´erie temporal em estudo . . . . . . . 21
3 Escolha de modelo a Previs˜ao . . . . . . . . . . . . . . . . . . 31
4 Compara¸c˜ao entre modelo ARIMA(4,1,1) e ARIMA(4,1,2) . . 31
5 Estat´ıstica do modelo ARIMA(4,1,1) . . . . . . . . . . . . . . 32
6 Estat´ıstica do modelo ARIMA(4,1,2) . . . . . . . . . . . . . . 33
7 IC para coeficientes do modelo ARIMA(4,1,1) . . . . . . . . . 34
1 Introdu¸c˜ao
O uso de m´etodo de previs˜ao de vendas ´e um grande aliado no planeamento
estrat´egico das empresas, pois permite saber a previs˜ao de vendas futuras, ao
mesmo tempo em que mant´em os n´ıveis do mesmo em patamares aceit´aveis.
Contudo, a dificuldade de utiliza¸c˜ao desses m´etodos, muitas vezes, passa pela
falta de conhecimento das t´ecnicas existentes ou at´e mesmo da qualidade de
base de dados.
Lustosa et al. (2008) asseguram que o resultado econ´omico de uma em-
presa ser´a diretamente impactado pela capacidade de prever bem, comparti-
lhado por Chopra (2003) que refere que duas previs˜oes de vendas diferentes,
com diferentes n´ıveis de erro, ter˜ao uma diferente pol´ıtica de gest˜ao, culmi-
nando em resultados melhores ou piores.
Os modelos de previs˜ao de Box-Jenkins s˜ao fundamentados em conceitos
e princ´ıpios estat´ısticos e s˜ao capazes de modelarem um amplo espectro do
comportamento de s´eries temporais. O intuito fundamental deste m´etodo
para previs˜ao de s´eries temporais ´e encontrar uma f´ormula adequada para
que os erros/res´ıduos sejam t˜ao pequenos quanto poss´ıvel (m´ınimos) e n˜ao
apresentem padr˜oes.
A an´alise de s´eries temporais ´e uma ´area de pesquisa pertinente em diver-
sos campos do conhecimento, especialmente na ´area econ´omica. A principal
motiva¸c˜ao para pesquisas sobre s´eries temporais ´e providenciar uma previs˜ao
quando o modelo matem´atico de um fen´omeno ´e complexo, desconhecido ou
incompleto.
Existe um grande n´umero de m´etodos de previs˜ao bem conhecidos que s˜ao
fundamentados apenas na an´alise de valores passados de uma sequˆencia de
tempo, isto ´e, m´etodos que empregam princ´ıpios utilizados, normalmente na
an´alise t´ecnica. Portanto a previs˜ao de s´eries temporais ´e um desafio da ´area
de Estat´ıstica. Pois, prever valores futuros, em fun¸c˜ao de valores passados,
tem-se tornado um assunto de especial interesse na engenharia, economia e
na ind´ustria, com aplica¸c˜oes em gest˜ao de produ¸c˜ao, mercado de a¸c˜oes, entre
outras ´areas.
2 Metodologia
O m´etodo cient´ıfico utilizado nesta pesquisa ´e indutivo, pois as generaliza¸c˜oes
ser˜ao de constata¸c˜oes particulares da realidade. A metodologia baseia-se
em revis˜ao bibliogr´afica de carater´ısticas e aplica¸c˜oes de diferentes m´etodos
de previs˜ao. Caraterizando-se como uma pesquisa aplicada, uma vez que
visa gerar conhecimento para aplica¸c˜oes pr´aticas na solu¸c˜ao de problemas
espec´ıficos.
Foi utilizado a metodologia de Box-Jenkins, que mostra a constru¸c˜ao dos
modelos ARIMA baseada em um ciclo iterativo, no qual a escolha do modelo
´e feita com base nos pr´oprios dados. Foi utilizado uma s´erie temporal de
vendas mensais no per´ıodo de Janeiro de 2000 a Dezembro de 2014, com o
prop´osito de aplicar o modelo ARIMA de Box-Jenkins para a previs˜ao.
Existe diversos m´etodos para auxiliar na tarefa de previs˜ao de s´eries tem-
porais, como por exemplo: modelos de Suaviza¸c˜ao Exponencial, Modelos
Auto-regressivos (AR), de M´edias M´oveis (MA) e Modelos ARIMA.
Em s´ıntese, foram feitos os seguintes procedimentos:
i) Teste de estacionaridade (ADF);
ii) An´alise de autocorrela¸c˜oes residuais (FAC e FACP);
iii) Testes de significˆancia para com o conjunto de modelos ARIMA encon-
trados;
iv) Aplica¸c˜ao dos crit´erios penalizadores (AIC);
v) Caso o modelo n˜ao seja adequado, o ciclo ´e repetido, voltando-se `a fase
de identifica¸c˜ao;
vi) Por fim, a verifica¸c˜ao da qualidade do modelo para realizar a previs˜ao
de vendas.
Os dados foram analisados com base em an´alise descritiva e m´etodos de
previs˜oes. Foram utilizados os seguintes software para a an´alise e previs˜ao:
R e Grelt.
3 Revis˜ao Bibliogr´afica
Ap´os d´ecadas de estudos na ´area de previs˜ao de vendas, v´arias t´ecnicas foram
desenvolvidas. De acordo com Lustosa et al. (2008), tais t´ecnicas podem ser
divididas em trˆes grupos: qualitativos, proje¸c˜oes hist´oricas e causais. As
suas principais diferen¸cas consistem na assertividade, na subjetividade e na
simplicidade.
Historicamente, os m´etodos de previs˜ao mais comuns baseiam-se em mo-
delos de regress˜ao m´ultipla e modelos auto-regressivos. Mas recentemente
com o avan¸co das pesquisas em Inteligˆencia Artificial (IA) come¸caram a sur-
gir pesquisas com aplica¸c˜ao de t´ecnicas de Inteligˆencia Artificial em modelos
de previs˜ao de consumo.
A partir da d´ecada de 90, Crommelynk et al. (1992), Stark et al. (2000),
Jain e Ormsebee (2002), Silva (2003), e Falkemberg et al. (2003) desenvol-
veram modelos de previs˜ao baseados em t´ecnicas de inteligˆencia artificial.
Falkemberg et al. (2003) desenvolveu modelos de Redes Neurais Artificiais
(RNA) e de Regress˜ao M´ultipla, para previs˜ao de consumo vinte e quatro
horas `a frente, considerando influˆencias do dia da semana, da hora do dia
e do consumo passado, recomendando modelos de previs˜ao m´ultiplos para
diferentes perfis de consumo e diferentes horas do dia.
De acordo com Makridakis (1986) diferentes estudos possibilitaram di-
ferentes conclus˜oes quanto ao desempenho dos m´etodos, n˜ao sendo poss´ıvel
concluir qual apresenta melhores resultados.
4 Referencial Te´orico
4.1 Metodologia de Box-Jenkins
De acordo com Archer (1980) o m´etodo de Box-Jenkins ´e um m´etodo de
previs˜ao que utiliza um algoritmo matem´atico complexo, com termos auto-
regressivos e de m´edia m´ovel, para identificar a forma do modelo matem´atico
mais adequado para a s´erie temporal analisada com n observa¸c˜oes. A previ-
s˜ao baseia-se no ajuste de modelos tentativo denominados ARIMA, a s´eries
temporais de valores observados de forma que a diferen¸ca entre os valores
gerados pelos modelos e os valores observados resulte em s´eries de res´ıduos
de comportamento aleat´orio em torno de zero.
Os modelos ARIMA (Auto-regressivos Integrados e de M´edias M´oveis)
s˜ao capazes de descrever os processos de gera¸c˜ao de uma variedade de s´e-
ries temporais para os previsores (que correspondem aos filtros) sem pre-
cisar levar em conta as rela¸c˜oes econ´omicas, por exemplo, que geraram as
s´eries. Portanto, descrevem tanto o comportamento estacion´ario como o
n˜ao-estacion´ario. Dessa forma, pode afirmar que essa ´e uma metodologia de
modelagem flex´ıvel, em que as previs˜oes com base nesses modelos s˜ao feitas
a partir dos valores correntes e passados dessas s´eries.
4.2 S´erie Temporal
Uma s´erie temporal ´e definida como um conjunto de observa¸c˜oes de uma dada
vari´avel, geralmente distribu´ıdas de maneira equidistante pelo fator tempo, e
que possuem como carater´ıstica central a presen¸ca de uma dependˆencia serial
entre elas (Morettin e Toloi, 2004). De forma objetiva uma s´erie temporal ´e
um conjunto de observa¸c˜oes discretas, realizadas em per´ıodos equidistantes
e que apresentam uma dependˆencia serial entre essas observa¸c˜oes. Se estas
observa¸c˜oes consecutivas s˜ao dependentes uma da outra, ent˜ao ´e poss´ıvel
conseguir-se uma previs˜ao ou identifica¸c˜ao do sistema.
Uma s´erie temporal pode ser apresentada de diversas formas, como por
exemplo: di´aria, mensal, semestral ou anual, no entanto, obrigatoriamente
toda a s´erie deve estar representada com a mesma periodicidade. Segundo
Pindyck e Rubinfeld (2004), “Dados que descrevem o movimento de uma
vari´avel ao longo do tempo s˜ao chamados s´eries temporais, as quais podem
ser di´arias, semanais, mensais, trimestrais ou anuais”.
Diante das dificuldades na utiliza¸c˜ao de modelos econom´etricos estrutu-
rados que utilizam vari´aveis explicativas, os modelos de s´eries temporais s˜ao
muito utilizados para previs˜ao de vari´aveis econ´omicas. Pindyck e Rubinfeld
(2004) classificam em dois tipos os modelos de previs˜oes de s´eries temporais,
modelos determin´ısticos e modelos estoc´asticos. Os dois modelos utilizam o
comportamento passado da s´erie para prever seus componentes futuros, po-
r´em os modelos determin´ısticos n˜ao fazem referˆencia `as fontes ou `a natureza
aleat´oria (estoc´astica) subjacente `a s´erie.
Uma s´erie temporal pode ser interpretada como um processo estoc´astico,
Hill, Griffiths e Judge (2003) observam que uma vari´avel econ´omica ´e aleat´o-
ria porque n˜ao se pode prevˆe-la perfeitamente e o modelo econ´omico que gera
uma vari´avel de s´erie temporal ´e chamado de processo estoc´astico ou aleat´o-
rio. Uma amostra particular da s´erie ´e normalmente chamada uma realiza¸c˜ao
particular do processo estoc´astico. Sobre o tema, Gujarati (2006) relata que:
“A distin¸c˜ao entre o processo estoc´astico e sua realiza¸c˜ao ´e parecida com
a distin¸c˜ao entre popula¸c˜ao e amostra em dados de corte (Cross Section).
Assim como utilizamos dados amostrais para fazer inferˆencias sobre uma po-
pula¸c˜ao, em s´eries temporais usamos a realiza¸c˜ao para fazer inferˆencias sobre
o processo estoc´astico subjacente”.
Seja Zt s´erie temporal de tamanho t dado por:
Zt, onde t = {1, 2, 3, 4, ..., n} (1)
As fun¸c˜oes nas quais se baseiam a vari´avel aleat´oria Zt podem ser repre-
sentadas pelas seguintes equa¸c˜oes:
• M´edia ou valor esperado: ´e o valor m´edio em rela¸c˜ao a todas a
observa¸c˜oes, isto ´e, o valor centro.
µz = E[Zt] (2)
• Variˆancia: mede o desvio das observa¸c˜oes em rela¸c˜ao ao valor m´edio,
tudo ao quadrado. Tem a seguinte f´ormula:
σ2
= E [Zt − µz]2
. (3)
• Autocovariˆancia: a autovariˆancia mede a dependˆencia entre duas
observa¸c˜oes separadas por k intervalo de tempo (lag k).
Υk = Cov[Zt, Zt+k] = E[Zt − µz][Zt+k − µz]. (4)
• Autocorrela¸c˜ao: a autocorrela¸c˜ao possui o objetivo de mensurar a
mem´oria de um processo estoc´astico. Isto significa que a autocorre-
la¸c˜ao mede a intensidade com que um valor observado no tempo t ´e
influenciado por aquele observado no tempo t - k.
ρk =
Cov[Zt, Zt+k]
V ar(Zt) ∗ V ar(Zt+k)
(5)
4.3 Estacionariedade da S´erie Temporal
Os modelos ARIMA de Box-Jenkins s˜ao excelentes modelos de previs˜ao a
curto prazo (Granger e Newbold, 1977). Resultados de an´alises com esses
modelos mostram que os melhores resultados (previs˜oes) s˜ao obtidos com s´e-
rie de 5 a 10 anos de informa¸c˜ao (mensal), particularmente na presen¸ca de
sazonalidade. Como j´a visto, a importˆancia do processo observado ser estaci-
on´ario ´e a possibilidade de fixar parˆametros do modelo v´alidos para previs˜ao
do futuro a partir do passado. Assim, como primeiro passo para essa mode-
lagem s˜ao realizados procedimentos para a remo¸c˜ao da n˜ao estacionariedade.
4.3.1 Modelos lineares Estacion´arios
A constru¸c˜ao dos modelos de s´eries temporais univariados ´e fundamental na
teoria de que existe uma grande quantidade de informa¸c˜ao presente na s´erie
de dados. Podendo ser capazes de fornecer estimativas sobre o comporta-
mento futuro da vari´avel em estudo. O modelo ARIMA parte de conce¸c˜ao
que as s´eries temporais envolvidos na an´alise ´e um processo estacion´ario.
Os modelos estoc´asticos de s´eries temporais s˜ao v´alidos apenas na aplica-
¸c˜ao em s´eries ditas estacion´arias, para Hill, Griffiths e Judge (2003 p. 389),
“Um processo estoc´astico (s´erie temporal) Zt ´e dito estacion´aria quando ele
se desenvolve no tempo aleatoriamente ao redor de uma m´edia e variˆancia
constantes, e a covariˆancia entre dois valores da s´erie depende apenas da dis-
tˆancia no tempo que separa os dois valores, e n˜ao dos tempos reais em que
as vari´aveis s˜ao observadas”.
Uma condi¸c˜ao necess´aria para aplica¸c˜ao dos modelos ARIMA, ´e de que o
processo que gerou a s´erie temporal seja estacion´ario de segunda ordem, ou
seja, que sua m´edia e variˆancia sejam constantes no tempo. De outro modo,
n˜ao apresente tendˆencia ou sazonalidade (S´afadi, 2004).
Um modelo ´e estacion´ario se para todo t, t-s tivemos:
i. E [Zt] = E [Zt−s] = µ, m´edia constante.
ii. E [(Zt − µ2
)] = E [(Zt−s − µ2
)] = σ2
y, variˆancia constante.
iii. E [(Zt − µ)(Zt−s − µ)] = E [(Zt−s − µ)(Zt−j−s − µ)], covariˆancia cons-
tante.
Processo ´e estritamente estacion´ario ou fortemente estacion´ario se cumpre
as seguintes propriedades:
• Propriedade 1: E[Zt] = µt, ∀ t ∈ T.
• Propriedade 2: V ar[Zt] = σ2
t , ∀ t ∈ T.
• Propriedade 3: Υ(τ) = Cov(Zt, Zt+τ ) = Cov(Z0, Zτ )
Um processo Zt diz-se estritamente estacion´ario se para todo o n e todo
t1, ... ,tn, a distribui¸c˜ao conjunta de Zt1 , ... , Ztn ´e igual `a distribui¸c˜ao
conjunta de Zt1+k
, ... , Ztn+k
qualquer que seja k N. Estacionariedade
estrita implica que a distribui¸c˜ao de probabilidade conjunta seja constante
ao longo do tempo, ou seja, que n˜ao depende do instante t.
Um processo ´e fracamente estacion´ario ou estacion´ario de segunda ordem
se os dois primeiros momentos (a m´edia e a matriz de variˆancia-covariˆancia)
da distribui¸c˜ao de probabilidade conjunta da vari´avel estoc´astica sejam cons-
tantes ao longo do tempo, isto ´e, processo Zt com variˆancia finita tal que
apresenta as seguintes propriedades:
• Propriedade 1: E[Zt] = µ, constante ∀ t ∈ T.
• Propriedade 2: E[Zt] < ∞, ∀ t ∈ T.
• Propriedade 3: Υ(τ) = Cov(Zt1 , Zt2 ) ´e uma fun¸c˜ao apenas de |t1−t2|.
4.3.2 Modelo Auto-Regressivo - AR(p)
Um modelo Auto-Regressivo de ordem p, representado como AR(p), descreve
o valor de uma observa¸c˜ao de uma s´erie temporal atrav´es da atribui¸c˜ao de
pesos `as p observa¸c˜oes anteriores. Em um modelo auto-regressivo, a s´erie de
dados Zt ´e descrita por seus valores passados Zt−1, Zt−2,..., Zt−P e pelo ru´ıdo
branco(res´ıduos s˜ao n˜ao correlacionados).
A estrutura auto-regressiva geral ´e expressa por:
Zt = φ1Zt−1 + φ2Zt−2 + φpZt−p + at (6)
Onde Zt ´e o valor observado no tempo t, φp representa o peso de cada
observa¸c˜ao (parˆametros) e o at ru´ıdo branco da observa¸c˜ao t com m´edia zero
e variˆancia σ2
y.
4.3.3 M´edias M´oveis - MA(q)
O processo de M´edias M´oveis ´e representado por MA(q). ´E semelhante ao
processo AR(p), por´em ao inv´es de definir a observa¸c˜ao atual atrav´es da atri-
bui¸c˜ao de peso `as observa¸c˜oes anteriores, constr´oi-se a observa¸c˜ao Zt atrav´es
da atribui¸c˜ao de peso aos ru´ıdos brancos das observa¸c˜oes passadas, isto ´e,
s˜ao formados por combina¸c˜ao linear do ru´ıdo branco, at, ocorridos no pe-
r´ıodo corrente e nos per´ıodos passados.
Os primeiros correspondem aos processos de m´edias m´oveis de ordem q,
em que cada observa¸c˜ao Zt ´e gerada por uma m´edia ponderada dos erros
aleat´orios q per´ıodos no passado.
Zt = at − θ1at−1 − θ2at−2 − ... − θpat−p (7)
Onde θi s˜ao parˆametros da estrutura, i = 1,..., p (a ordem da estrutura)
e at ´e ru´ıdo branco com m´edia zero e variˆancia σ2
y.
4.3.4 Modelo Auto-Regressivo M´edias M´oveis - ARMA(q,p)
Esse modelo ´e uma combina¸c˜ao dos dois anteriores, onde Zt ´e descrito por
seus valores passados e pelos ru´ıdos branco corrente e passados. Supondo Zt
a s´erie j´a diferenciada, os modelos ARMA em sua forma geral escrevem-se:
Zt = φ1Zt−1 + ... + φpZt−p + at − θ1at−1 − ... − θpat−p (8)
Onde: φi s˜ao os parˆametros da estrutura auto-regressiva, i = 1,..., p, θi
s˜ao os parˆametros da estrutura m´edias m´oveis, i = 1,..., p e at ru´ıdo branco.
Os modelos AR(p), MA(q) e ARMA(p,q) podem ser aplicados somente
em s´eries estacion´arias, ou seja, s´eries temporais que n˜ao possuam tendˆencia
e que suas m´edias e variˆancia sejam constantes. Contudo, s´eries temporais
reais nem sempre seguem um padr˜ao estacion´ario.
4.4 Modelos lineares n˜ao Estacion´arios
4.4.1 Modelo Auto-Regressivo Integrado M´edia M´oveis - ARIMA
(p,q,d)
Um processo Auto-Regressivo integrado de m´edia m´ovel ´e uma generaliza¸c˜ao
dos processos ARMA que incorpora s´eries n˜ao estacion´arias. Assim, tal como
nos m´etodos anteriores, possui apenas uma vari´avel e descreve o comporta-
mento de uma vari´avel em termos dos seus valores passados. (Brockwell e
Richard A. Davis, 2002).
De acordo com Matos (2000), a maioria das s´eries temporais s˜ao n˜ao es-
tacion´arias. No entanto, uma s´erie temporal utilizada na estima¸c˜ao de um
modelo univariado deve ser estacion´aria. Logo, a s´erie original passar´a por
algumas diferencia¸c˜oes, a fim de torn´a-la estacion´aria. O n´umero necess´a-
rio de diferen¸ca para tornar uma s´erie estacion´aria ´e denominado ordem de
integra¸c˜ao (d).
Os modelos ARIMA, elaborados por Box-Jenkins, normalmente s˜ao re-
presentados por ARIMA (p, d, q). O parˆametro p refere-se ao n´umero de
termos Auto-Regressivo, o parˆametro d diz respeito ao n´umero de diferen-
cia¸c˜oes, que s˜ao necess´arias para transformar a s´erie n˜ao estacion´aria, em
estacion´aria, conceito que ser´a abordado de seguida e, por fim, o q trata-se
do n´umero de m´edias m´oveis.
Fava (2000) observa que os modelos ARIMA resultam da combina¸c˜ao de
trˆes componentes tamb´em denominados filtros: o componente Auto-regressivo
(AR), o filtro de Integra¸c˜ao (I ) e o componente de M´edias M´oveis (MA). Uma
representa¸c˜ao ARIMA(1,2,0), indica um modelo de ordem 1 para o compo-
nente AR (Auto-Regressivo), ordem 2 para o componente I (Integra¸c˜ao ou
diferencia¸c˜ao) e o ´ultimo 0 para o componente MA (M´edia M´ovel).
Quando uma s´erie n˜ao ´e estacion´aria, a aplica¸c˜ao de um modelo ARMA(p,q)
´e prejudicada. Para isso, aplica-se a diferencia¸c˜ao na s´erie.
∆Z = Zt − Zt−1 (9)
Tendo-se assim um modelo auto-regressivo, integrado e de M´edias M´oveis,
denominado ARIMA(p,d,q), representado a seguir (Franses, 1998):
∆d
Zt = φ1∆d
Zt−1 +φ2∆d
Zt−2 +...+φp∆d
Zt−p +at −θ1at−1 −...−θpat−p (10)
Sendo d o n´umero de diferen¸cas necess´arias para tornar a s´erie estacion´a-
ria. Os modelos ARIMA s˜ao tamb´em univariados, isto ´e, eles s˜ao baseados
numa ´unica vari´avel de s´erie temporal (existem modelos multivariados que
est˜ao al´em do escopo deste trabalho). Todavia, se a s´erie observada prati-
camente, como j´a foi dito anteriormente, n˜ao apresentar a condi¸c˜ao da esta-
cionariedade, nela dever´a ser aplicado o operador diferen¸ca, o que efetuar´a
uma segunda filtragem, que poder´a ser repetida quantas vezes se julgarem
necess´arias, at´e a sua estacionariza¸c˜ao.
4.5 Avalia¸c˜ao da estacionariedade
Para detetar a n˜ao estacionariedade de uma s´erie, o comportamento tem-
poral pode ser analisado graficamente, buscando padr˜oes, como a inclina¸c˜ao
nos dados. E a varia¸c˜ao dos dados n˜ao permanece essencialmente constante
sobre o tempo, isto ´e, indicando que a variˆancia est´a se alterando ou, en-
t˜ao,aplicando os testes estat´ısticos de raiz unit´aria. O teste de raiz unit´aria
mais usado ´e Teste de Dickey-Fuller aumentado ou Teste ADF (do acrˆonimo
em inglˆes Augmented Dickey-Fuller).
O referido teste testa a hip´otese nula da existˆencia de raiz unit´aria na
s´erie. Caso esta hip´otese n˜ao seja rejeitada, a s´erie possuir´a raiz unit´aria,
portanto, n˜ao ser´a estacion´aria. A estat´ıstica ADF, usada no teste, ´e um
n´umero negativo, e quanto mais negativo, mais indicativo o teste se torna de
rejeitar a hip´otese nula de que existe raiz unit´aria na s´erie.
• H0: tem raiz unit´aria (n˜ao ´e estacion´aria);
• H1: n˜ao tem raiz unit´aria (´e estacion´aria);
Para o crit´erio de an´alise temos a estat´ıstica T, em que a hip´otese nula
´e rejeitada quando Tcalculado < Ttabelado. Para encontrar o valor de Tcalculado.
Faz-se uma regress˜ao das primeiras diferen¸cas da s´erie (∆Zt) em rela¸c˜ao a
Zt−1. Ent˜ao, divide-se o coeficiente estimado de Zt−1 pelo seu desvio padr˜ao,
e obt´em-se o Tcalculado.
Os valores tabelados de T para um n´ıvel de significˆancia de 1% est´a na
Tabela 1.
Para evitar o problema da autocorrela¸c˜ao dos res´ıduos, recomenda-se a
utiliza¸c˜ao do teste Dickey-Fuller Aumentado (ADF), que engloba a equa¸c˜ao
das defasagens para elimina¸c˜ao do problema de autocorrela¸c˜ao dos res´ıduos.
4.6 Fases na escolha do Melhor Modelo
O objetivo de s´eries temporais ´e descobrir qual o comportamento apresentado
pela s´erie, buscando-se o melhor modelo que represente o comportamento da
mesma. Sendo que este pode ser explicado por um processo Auto-Regressivo
Tabela 1: Estat´ıstica T tabelado para diferentes tamanhos de amostra
Tamanho de amostra T Tabela
25 -3,75
50 -3,58
100 -3,51
250 -3,46
500 -3,44
Infinito -3,43
– AR(p), por um M´edias Moveis - MA(p,d,q), por um Auto-Regressivo de
M´edias M´oveis - ARMA(p,q) ou por um Auto-Regressivo Integrados de M´e-
dias Moveis - ARIMA(p,d,q).
O m´etodo Box-Jenkins segue quatro fases para a modela¸c˜ao de s´eries
temporais:
Fase 1. Identifica¸c˜ao
Nesta fase deve preparar os dados (transformar dados para estabilizar a vari-
ˆancia e diferenciar dados para obter uma s´erie estacion´aria). Deve-se exami-
nar os dados, o gr´afico do tempo da s´erie em estudo. A an´alise desse gr´afico
pode indicar a presen¸ca de tendˆencia ou altera¸c˜ao de variˆancia, revelando se
a s´erie ´e ou n˜ao estacion´aria. An´alise da fun¸c˜oes de autocorrela¸c˜oes simples
(FAC) e fun¸c˜oes de autocorrela¸c˜oes parciais (FACP), indica qual o modelo
a ser utilizado, bem como auxilia no uso dos testes de ra´ızes unit´arias para
confirmar a estacionariedade. O objetivo da identifica¸c˜ao ´e determinar os va-
lores de p, d e q do modelo ARIMA(p,d,q), al´em de estimativas preliminares
dos parˆametros a serem usadas no est´agio de estima¸c˜ao.
Procedimentos:
a) verificar se existe a necessidade de uma transforma¸c˜ao na s´erie original;
b) tornar a s´erie estacion´aria por meio de diferen¸cas;
c) identificar o processo ARIMA(p,d,q) resultante.
Fase 2. Estima¸c˜ao
Nessa fase o objetivo passa por estimar os modelos candidatos a ser sele-
cionados ap´os a identifica¸c˜ao, procede-se a an´alise dos modelos e definir os
modelos que poder˜ao ser definidos como o modelo definitivo.
Fase 3. Teste de Diagn´ostico
Consiste em diagnosticar se o modelo descreve adequadamente a s´erie de
dados objeto da an´alise. Nos modelos de s´eries temporais assume-se a exis-
tˆencia de um processo erg´odico, que ´e um elemento fulcral na estima¸c˜ao.
Quando a s´erie possui esta propriedade pode dizer-se que os parˆametros s˜ao
significativos. Portanto, se a s´erie for estacion´ario e erg´odico ent˜ao as s´eries
convergem aos verdadeiros parˆametros populacionais. A an´alise dos res´ıduos
de modelo torna-se decisiva na escolha do modelo final. Casos os res´ıduos
sejam autocorrelacionados, a dinˆamica da s´erie n˜ao pode ser explicada pelos
coeficientes autocorrela¸c˜ao do modelo. Portando, deve excluir-se do processo
de escolha o modelo que apresente a autocorrela¸c˜ao residual.
O melhor modelo ser´a escolhido baseado em crit´erio de escolha. Existe
diferentes crit´erios para escolha de modelos candidatos a estima¸c˜ao:
• Crit´erio de Informa¸c˜ao de Akaike (AIC):
S˜ao alguns procedimentos de identifica¸c˜ao utilizados que minimizam
fun¸c˜oes penalizadoras particulares. Consideram n˜ao apenas a qualidade
do ajuste, mas tamb´em penalizam a inclus˜ao de parˆametros extras.
Os crit´erios de informa¸c˜ao s˜ao utilizados para compara¸c˜ao de modelos
e que levam em conta a variˆancia do erro, o tamanho da amostra N e
os valores de p, q. Regra b´asica: selecionar o modelo cujo crit´erio de
informa¸c˜ao calculado seja m´ınimo.
AIC(k, l) = lnσ2
k,l +
2(k + l)
N
(11)
Sendo k e l os valores de p e q respetivamente, do modelo ARMA(p,q)
que se deseja calcular o crit´erio. σ2
k,l representa o estimador de m´axima
verosimilhan¸ca e N ´e o n´umero de observa¸c˜oes da s´erie. A ideia do
modelo ´e escolher os valores de k e l que minimizam o valor de AIC,
indicando que s˜ao os melhores valores para a defini¸c˜ao de um modelo
ARMA(k,l).
Os crit´erios de informa¸c˜ao s˜ao utilizados para compara¸c˜ao de modelos
e que levam em conta a variˆancia do erro, o tamanho da amostra N e
os valores de p e q .
• Crit´erio de Informa¸c˜ao Bayesiano ou Crit´erio de Schwarz (BIC): pre-
mia o melhor ajuste, que por sua vez ´e medido pelo quadrado dos er-
ros, sendo escolhido o menor deles e penaliza aqueles que possuem um
grande n´umero de parˆametros. ´E utilizada para diferentes modelos,
mas para os mesmos dados.
AIC(k, l) = lnσ2
k,l +
2(k + l)
N
(12)
• Crit´erio de Erro Quadr´atico M´edio (EQM): todas as previs˜oes contˆem
uma parcela de erro ou res´ıduo no resultado apresentado. E esses erros,
segundo os autores Chase et al. (2006) podem ser de dois tipos: erros
sistem´aticos ou erros aleat´orios. Os erros sistem´aticos correspondem
aos erros cometidos de forma consistente. Os erros aleat´orios s˜ao os
erros que n˜ao podem ser explicados pelo modelo de previs˜ao usado,
sendo o melhor modelo aquele que minimiza as medidas de erro. Erro
Quadr´atico M´edio ´e obtido atrav´es da equa¸c˜ao:
EQM =
1
H
| Zt − Zt | (13)
Em linhas gerais, dentre os v´arios modelos apresentados, escolhe-se aquele
que apresenta o menor AIC e BIC. Salienta-se tamb´em que a escolha dever´a
levar em considera¸c˜ao os modelos parcimoniosos, ou seja, aqueles que apre-
sentam o menor n´umero de parˆametros. Por fim, ´e recomend´avel que esses
crit´erios sejam avaliados conjuntamente, pois s˜ao complementares e n˜ao ex-
cludentes.
Consideram n˜ao apenas a qualidade do ajuste, mas tamb´em penalizam a
inclus˜ao de parˆametros extras.
O melhor modelo ´e aquele que apresenta os menores valores de AIC e BIC
entre os modelos candidatos. E tamb´em apresenta o menor Erro Quadr´atico
M´edio.
Fase 4. Previs˜ao
A ´ultima etapa consiste em fazer a previs˜ao, isto ´e, prever os valores futuros.
Pode ser feitas de duas formas distintas:
• para prever valores futuros, aqueles que ainda n˜ao existem, chamada
de previs˜ao ex-ante.
• para fazer a previs˜ao dos valores j´a existente, denominada de previs˜ao
ex-post.
A partir do momento que conseguimos identificar e estimar um modelo
ARIMA adequado `as observa¸c˜oes, vamos ent˜ao estudar m´etodos que possa-
mos utilizar a modelagem ARIMA para prever os valores das observa¸c˜oes h
passos a frente.
5 Resultado e discuss˜ao
Neste cap´ıtulo apresenta-se a an´alise descritiva da s´erie em estudo, assim
como a aplica¸c˜ao dos m´etodos de previs˜ao j´a apresentados. De seguida o
procedimento adotado para a previs˜ao e o seu valor para um ano t´ıpico. Por
fim, apresenta-se uma conclus˜ao onde fez-se a an´alise da previs˜ao obtida.
Para a identifica¸c˜ao do modelo, ou seja, para a determina¸c˜ao das ordens p
(parte auto-regressiva), d (quantidade de diferencia¸c˜ao) e q (parte dos termos
de erros defasados – m´edia m´ovel) gerou-se correlogramas. Com as fun¸c˜oes
de autocorrela¸c˜ao parcial (FAC) e de autocorrela¸c˜ao simples (FACP) calcu-
ladas, determinou-se a ordem apropriada dos componentes AR e MA. Para
a determina¸c˜ao da presen¸ca ou n˜ao de raiz unit´aria (s´erie n˜ao estacion´aria)
utilizou-se o teste de Dickey-Fuller Aumentado (DFA) e, para determina¸c˜ao
dos n´umeros ´otimos de defasagens das p diferen¸cas a considerar, utilizou-se
os crit´erios de informa¸c˜ao da Akaike (AIC) e de Schwarz (BIC). A estima¸c˜ao
do modelo foi feita com a utiliza¸c˜ao dos softwares Gretl e R.
Anteriormente a previs˜ao de vendas, foi feita a an´alise descritiva da s´erie
temporal, que tem como objetivo apresentar os dados observados sob a forma
de tabelas e de medidas descritivas, estudando-se a distribui¸c˜ao da vari´avel,
acompanhada de medidas resumos que tornem mais f´acil uma primeira an´a-
lise de dados e ainda a obten¸c˜ao de valores num´ericos que os caraterizam
globalmente.
Segundo Bussab e Morettin (2003) a an´alise descritiva tem como prop´osito
sintetizar um conjunto de valores da mesma natureza, permitindo, dessa
forma, que se tenha uma vis˜ao global da varia¸c˜ao desses valores. Ela organiza
e descreve os dados.
Da aplica¸c˜ao pr´atica, duma an´alise breve, descritiva e sucinta, podemos
concluir que de acordo com a Tabela 2 a m´edia ´e de 43,7530. Sendo que
o valor m´aximo e m´ınimo da s´erie ´e de 104,991 e 11,8 respetivamente. No
que tange `a medida de tendˆencia n˜ao central, o desvio padr˜ao ´e de 21,1499
e o coeficiente de varia¸c˜ao em rela¸c˜ao a m´edia ´e de 0,48 (aproximadamente
48,3%).
Tabela 2: Estat´ıstica descritiva da s´erie temporal em estudo
Estat´ısticas Descritivas, usando as observa¸c˜oes 2000:01–2014:122
para a vari´avel Vendas (180 observa¸c˜oes v´alidas)
M´edia Mediana M´ınimo M´aximo
43,7530 38,5350 11,8000 104,991
Desvio Padr˜ao C.V. Enviesamento Ex. kurtosis
21,1499 0,483393 0,921452 −0,00623860
Ao estudar uma s´erie temporal temos de construir gr´afico para observar
a sua evolu¸c˜ao no tempo. O que pode ser bastante esclarecedor e permite
identificar como evolui a tendˆencia da s´erie, se existe ou n˜ao sazonalidade e
se ocorrem observa¸c˜oes aberrantes.
10
20
30
40
50
60
70
80
90
100
110
2000 2002 2004 2006 2008 2010 2012 2014
Vendas
Figura 1: Comportamento da s´erie em Estudo
Do exame do Figura 1 identificou-se padr˜oes n˜ao aleat´orios como: uma
tendˆencia crescente e decrescimento em vendas, uma sucess˜ao regular de “pi-
cos e vales”de vendas e existˆencias de flutua¸c˜oes sazonais. O que poder´a indi-
car a n˜ao estacionariedade da s´erie. Estes padr˜oes poderiam ser incorporados
a um modelo estat´ıstico, possibilitando fazer previs˜oes que auxiliar˜ao na to-
mada de decis˜oes. Quanto `a tendˆencia, pode verificar-se que esta encontra-se
presente na s´erie com um declive negativo.
Teste de Dickey-Fuller Aumentado
Para analisar se a s´erie ´e ou n˜ao estacion´aria procedeu-se ao teste da estaci-
onariedade da s´erie temporal que permite realizar os testes de Dickey-Fuller
Aumentado.
A partir do teste de Dickey-Fuller formula-se as hip´oteses:
• H0: tem raiz unit´aria (n˜ao ´e estacion´aria);
• H1: n˜ao tem raiz unit´aria (´e estacion´aria);
Figura 2: Teste de Dickey-Fuller incluindo 11 desfasamentos
Como a estat´ıstica do teste tau (calculado) ´e -1,52099 maior que ttabela =
-3,51, n˜ao temos condi¸c˜oes para rejeitar H0, logo conclui-se que a s´erie tem
raiz unit´aria (n˜ao ´e estacion´aria).
A Figura 3 ostenta o gr´afico QQ-Normal. Da sua observa¸c˜ao conclui-se
que os dados n˜ao se adequam `a normalidade, visto que outliers em extremos
”esticam”os valores de modo a n˜ao cumprirem normalidade.
-20
0
20
40
60
80
100
120
-20 0 20 40 60 80 100 120
Normal quantiles
Q-Q plot para Vendas
Figura 3: Gr´afico QQ-Normal
An´alise das fun¸c˜oes de autocorrela¸c˜oes Simples e de de
autocorrela¸c˜oes parciais
O comportamento das fun¸c˜oes de autocorrela¸c˜oes simples e autocorrela¸c˜oes
parciais auxiliam na verifica¸c˜ao da estacionariedade e na proposi¸c˜ao do mo-
delo.
Quando no correlograma o coeficiente de correla¸c˜ao inicial se mostra ele-
vado e com o crescimento das defasagens k este comportamento declina lenta-
mente, ´e carater´ıstico de uma s´erie n˜ao estacion´aria como mostra a Figura 1.
Analisando a Figura 4, nota-se uma tendˆencia sistem´atica de queda ao
longo do tempo, contudo, parece menos acentuada nas datas mais recentes.
Esta tendˆencia de queda sistem´atica ´e t´ıpica de s´eries n˜ao estacion´arias. Tam-
b´em se percebem picos seguidos de quedas, ao longo do tempo, caraterizando
uma poss´ıvel sazonalidade, comum em s´eries econ´omicas mensais. A fun¸c˜ao
autocorrela¸c˜ao simples (FAC) auxilia na verifica¸c˜ao da estacionariedade da
s´erie e na determina¸c˜ao da sazonalidade, como demonstra a Figura 4.
Com a an´alise do correlograma, Figura 4, confirma-se o diagn´ostico da n˜ao
estacionariedade da s´erie, pois quando uma s´erie ´e estacion´aria logo nas pri-
meiras defasagens o coeficiente de autocorrela¸c˜ao tende a cair abruptamente
para zero.
-1
-0,5
0
0,5
1
0 5 10 15 20
desfasamento
ACF para Vendas
+- 1,96/T^0,5
-1
-0,5
0
0,5
1
0 5 10 15 20
desfasamento
PACF para Vendas
+- 1,96/T^0,5
Figura 4: Correlogramas das FAC (ACF) e FACP (PAFC) da s´erie Vendas
Tamb´em nota-se no correlograma, uma carater´ıstica sazonal da s´erie, com
uma oscila¸c˜ao da fun¸c˜ao autocorrela¸c˜ao simples, t´ıpica de s´eries sazonais.
Desta forma, uma s´erie temporal n˜ao estacion´aria pode ser transformada
em estacion´aria atrav´es do c´alculo de diferen¸cas tomadas d vezes a partir de
seus valores originais. Neste caso, utilizou-se as primeiras diferen¸cas.
Na Figura 5, pode observar-se que em rela¸c˜ao `as primeiras diferen¸cas,
n˜ao se observa nitidamente nenhuma tendˆencia. Al´em disso, as m´edias e
as variˆancias entre os per´ıodos de tempo, conquanto n˜ao sejam uniformes,
apresentam um padr˜ao menos irregular do que aqueles observados na s´erie
original. Logo, ´e aceit´avel dizer que a s´erie diferenciada est´a mais pr´oxima
da estacionariedade do que a s´erie original.
Com base neste diagn´ostico, deve aplicar-se uma diferen¸ca sequencial e
tamb´em uma sazonal para conseguir a estacionariedade da s´erie.
A s´erie temporal deve ser transformada para torna-la estacion´aria em
rela¸c˜ao `a sua m´edia e variˆancia. Como a s´erie em estudo n˜ao ´e estacion´aria
fez-se a primeira diferen¸ca para ver se a s´erie com primeira diferen¸ca torna-se
estacion´aria:
-80
-60
-40
-20
0
20
40
60
80
2000 2002 2004 2006 2008 2010 2012 2014
d_Vendas
Figura 5: Primeira diferen¸ca da s´erie vendas
Da observa¸c˜ao da Figura 5 pode concluir sobre a poss´ıvel estacion´aria da
s´erie, embora apresenta vales no anos de 2004 e 2011. Nota-se a n˜ao existˆencia
de tendˆencia, sazonalidade na s´erie e tamb´em que os dados flutuam em torno
de uma m´edia e a variˆancia constante.
Teste de Dickey-Fuller Aumentado
Assim procedemos a aplicar o Teste de Dickey-Fuller Aumentado e avalia-
¸c˜ao do gr´afico QQ-Normal para confirmar a estacionaridade com a primeira
diferen¸ca da s´erie.
Da an´alise da Figura 6 observa-se que a estat´ıstica do teste tau ´e menor
(-8,68) que ttabela (-3,51), ent˜ao rejeita a hip´otese nula e conclui-se que a s´erie
´e estacion´aria (n˜ao tem raiz unit´aria).
Figura 6: Teste de Dickey-Fuller para a primeira diferen¸ca
A estacionariedade dos res´ıduos foi diagnosticada para confirmar a esta-
cionariedade das s´eries. Todas apresentaram res´ıduos ru´ıdo-branco. Estes
resultados foram refor¸cados a partir da realiza¸c˜ao do teste da raiz unit´aria
de Dickey-Fuller Aumendado, que indicou que as s´eries eram estacion´arias
em primeira diferen¸ca.
Figura 7: Teste de Normalidade para primeira diferen¸ca da s´erie
Da an´alise dos resultados Figura 7 observa-se que o valor de pvalues para
todos os testes de normalidade (Teste de Doornik-Hansen, W de Shapiro-
Wilk, Teste de Lilliefords e teste de Jarque-Bera) ´e menor que α = 5% (n´ıvel
de significˆancia).
A Figura 7 exibe o teste de normalidade atrav´es do gr´afico QQ-Normal.
-80
-60
-40
-20
0
20
40
-40 -30 -20 -10 0 10 20 30 40
Normal quantiles
Q-Q plot para d_Vendas
Figura 8: QQ-Normal para Primeira diferen¸ca da s´erie
As Figuras 9 e 10 ilustram a compara¸c˜ao da normalidade entre a s´erie de
vendas e a primeira diferen¸ca da s´erie vendas. Analisando as duas Figuras
( 9 e 10) observa-se que a Figura 10 (com primeira diferen¸ca de vendas) ´e
estacion´aria o que n˜ao acontece com a Figura 9, visto que, quase todas as
observa¸c˜oes est˜ao ajustadas a reta estimada da QQ-Normal da Figura 10.
-20
0
20
40
60
80
100
120
-20 0 20 40 60 80 100 120
Normal quantiles
Q-Q plot para Vendas
Figura 9: QQ-Normal da s´erie
(sem diferen¸ca)
-80
-60
-40
-20
0
20
40
-40 -30 -20 -10 0 10 20 30 40
Normal quantiles
Q-Q plot para d_Vendas
Figura 10: QQ-Normal da pri-
meira diferen¸ca da s´erie
An´alise das fun¸c˜oes de autocorrela¸c˜oes Simples e de de
autocorrela¸c˜oes parciais
Uma vez determinada a diferencia¸c˜ao necess´aria para fazer com que os dados
tornem-se estacion´arios, identifica-se as ordens apropriadas dos parˆametros
de M´edias M´oveis MA(p) e de Auto-Regressivo AR(p) dos potencias mode-
los. Utilizando coeficientes de autocorrela¸c˜ao simples (FAC) identificam-se
as ordens dos parˆametros de (AR) (p) e utilizando a autocorrela¸c˜ao par-
cial (FACP) da s´erie estacion´aria identificam-se as ordens dos parˆametros de
(MA) (q).
O comportamento dessas fun¸c˜oes auxilia na verifica¸c˜ao da estacionarie-
dade e na proposi¸c˜ao do modelo. Al´em de ajudar-nos a descrever os dados,
a fun¸c˜ao de autocorrela¸c˜ao tamb´em nos ajuda a verificar a estacionariedade,
escolher modelos e fazer diagn´osticos sobre regress˜oes ou at´e a identificar a
presen¸ca de sazonalidade (Enders, 2009).
A fun¸c˜ao de autocorrela¸c˜ao (ρk) d´a-nos a correla¸c˜ao entre duas vari´aveis
espa¸cadas por um tempo lag k (desfasamento/lag), ao caraterizar o desen-
volvimento de Zt ao longo do tempo, demonstrando o qu˜ao forte o valor
observado, atual, est´a correlacionado com os valores observados no passado
e como os choques, hoje afetam valores futuros da vari´avel estoc´astica.
A Figura 11 ostenta as fun¸c˜oes de autocorrela¸c˜oes (FAC) e autocorrela-
¸c˜oes parciais(FACP) da s´erie vendas revelando que as autocorrela¸c˜oes (FAC)
apresentam decaimento exponencial, t´ıpico do processo auto-regressivo, e o
correlograma da fun¸c˜ao autocorrela¸c˜oes parciais, apresenta a primeira defa-
sagem (lag) diferentes de zero significativamente. Assim, h´a uma indica¸c˜ao
de que a ordem do modelo autoregressivo ´e p = 1, no caso um modelo AR(1).
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
0 5 10 15 20
desfasamento
ACF para d_Vendas
+- 1,96/T^0,5
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
0 5 10 15 20
desfasamento
PACF para d_Vendas
+- 1,96/T^0,5
Figura 11: Correlogramas das FAC e FACP da s´erie vendas (primeira dife-
ren¸ca)
Com as diferencia¸c˜oes, a s´erie mostra-se sem tendˆencia (Figura 5), e es-
tabilizada em torno de sua m´edia de valor zero.
Da observa¸c˜ao do correlograma amostral (gr´afico ρk contra o lag k), pode
concluir-se, por exemplo, que a s´erie apresenta correla¸c˜ao de curta dura¸c˜ao
se as primeiras correla¸c˜oes forem elevadas, mas descerem rapidamente para
zero, isto ´e, cada observa¸c˜ao da s´erie apenas relaciona-se com as observa¸c˜oes
mais recentes.
A fun¸c˜ao de autocorrela¸c˜ao parcial d´a-nos a correla¸c˜ao entre a vari´avel
no instante t e um dos seus desfasamentos, retirando os efeitos de outros
desfasamentos. Ou seja, define a correla¸c˜ao entre as observa¸c˜oes Zt e Zt−k
removendo o efeito das observa¸c˜oes entre Zt−k e Zt (Cryer e Chan, 2008).
A fun¸c˜ao de autocorrela¸c˜ao decai exponencialmente, ind´ıcio de processo
Auto-regressivo (AR). Nesse caso, a fun¸c˜ao de autocorrela¸c˜ao parcial ajuda a
determinar a ordem do processo. Assim, a partir das fun¸c˜oes de autocorrela-
¸c˜ao estimadas, tentamos identificar um padr˜ao que se comporte teoricamente
com algum modelo.
5.1 Crit´erio de Escolha do melhor Modelo ARIMA
Para prever uma s´erie temporal atrav´es dos modelos ARIMA, torna-se neces-
s´ario identificar a ordem dos parˆametros p, d, q. O primeiro parˆametro a ser
identificado ´e o grau de diferencia¸c˜ao d necess´ario `a estabiliza¸c˜ao dos dados.
Atrav´es de um exame do correlograma, ou seja, do diagrama da fun¸c˜ao de au-
tocorrela¸c˜ao (FAC), no qual s˜ao apresentados os valores das autocorrela¸c˜oes
em rela¸c˜ao aos lags k.
Se as autocorrela¸c˜oes decrescerem de forma exponencial, realizam-se di-
ferencia¸c˜oes na s´erie, at´e que o diagrama apresente um corte abrupto para
um valor qualquer de autocorrela¸c˜ao, quando a s´erie ser´a considerada esta-
cion´aria.
A ordem auto-regressiva p ´e determinada pela verifica¸c˜ao da fun¸c˜ao de
autocorrela¸c˜ao parcial (FACP) da s´erie vendas. Se a s´erie for unicamente
auto-regressiva ARIMA(p,d,0), sua fun¸c˜ao de autocorrela¸c˜ao parcial sofrer´a
uma queda repentina ap´os o lag k. Se n˜ao, efetua-se uma an´alise dos estima-
dores para verificar at´e que ordem de defazagem do correlograma desta fun¸c˜ao
ele ´e estatisticamente significante. Essa ser´a sua ordem auto-regressiva.
A partir dos modelos sugeridos pela ordem de integra¸c˜ao propostos pelo
correlograma, procedeu-se a escolha dos modelos candidatos `a previs˜ao. Neste
ponto os modelos selecionados seriam aqueles que apresentassem menor AIC
e SIC.
Tendo em conta os crit´erios AIC e BIC foi escolhido do modelo ARIMA(4,1,1)
visto que apresenta menor AIC e BIC, de 1272,61, 1291,32 respetivamente.
Tabela 3: Escolha de modelo a Previs˜ao
ARIMA (p, d, q) AIC BIC EQM
(1,0,0) 1282,80 1292,15 119,58
(1,1,0) 1284,04 1296,52 118,95
(1,1,4) 1285,44 1304,15 117,34
(1,1,3) 1286,67 1302,26 119,37
(3,1,1) 1281,63 1297,22 116,5
(3,1,2) 1276,88 1295,59 111,69
(3,0,2) 1384,25 1400,19 124,86
(3,1,3) 1280,77 1302,59 112,9
(2,1,4) 1279,83 1301,66 112,39
(4,1,1) 1272,61 1291,32 108,54
(4,1,2) 1274,53 1296,35 108,62
Podemos ver tamb´em que o modeloARIMA(4,1,2) apresenta AIC de
1272.61. Ent˜ao h´a diferen¸cas significativas entre modelo ARIMA(4,1,2) e
ARIMA(4,1,1).
Pelo crit´erio de EQM tamb´em o modelo ARIMA(4,1,1) apresenta-se
como o melhor porque apresenta menor de EQM. Ent˜ao conclui-se pelos
trˆes crit´erios (EQM, BIC e AIC) que o melhor modelo ´e ARIMA(4,1,1).
Embora n˜ao havendo diferen¸cas significativas nos modelos ARIMA(4,1,2) e
ARIMA(4,1,1) conforme a an´alise da Tabela 4.
Tabela 4: Compara¸c˜ao entre modelo ARIMA(4,1,1) e ARIMA(4,1,2)
ARIMA (p, d, q) AIC SIC EQM
(4,1,1) 1272,61 1291,32 108,54
(4,1,2) 1274,53 1296,35 108,62
Como as diferen¸cas entre os dois modelos n˜ao ´e muito significativo ´e
necess´ario ver quais dos dois modelos apresenta coeficientes estatisticamente
significativa.
O modelo ARIMA(4,1,1) apresenta as seguintes estat´ısticas:
Tabela 5: Estat´ıstica do modelo ARIMA(4,1,1)
Modelo 1: ARIMA, usando as observa¸c˜oes 2001:02–2014:12 (T = 167)
Vari´avel dependente: (1 − Ls
)d Vendas
Erros padr˜ao baseados na Hessiana
Coeficiente Erro Padr˜ao z valor p
Φ1 −0,0542564 0,102634 −0,5286 0,5971
Φ2 0,0334261 0,0869356 0,3845 0,7006
Φ3 −0,175050 0,0796643 −2,1974 0,0280 **
Φ4 −0,317445 0,104566 −3,0358 0,0024 ***
Θ1 −0,959193 0,464166 −2,0665 0,0388 **
M´edia var. dependente −0,008928 D.P. var. dependente 14,16862
M´edia de inova¸c˜oes −0,266279 D.P. das inova¸c˜oes 9,346753
Log. da verosimilhan¸ca −630,3075 Crit´erio de Akaike 1272,615
Crit´erio de Schwarz 1291,323 Hannan-Quinn 1280,208
Zt = −0, 054Zt−1 + 0, 033Zt−2 − 0, 175Zt−3 − 0, 317Zt−4 − 0, 959at−1 (14)
O modelo acima apresenta trˆes coeficientes estatisticamente significativa
para n´ıvel de significˆancia (α) 5%. Visto que o valor da estat´ıstica pvalues ´e
menor do que 0,05.
O modelo ARIMA(4,1,2) apresenta as seguintes estat´ısticas:
Tabela 6: Estat´ıstica do modelo ARIMA(4,1,2)
Modelo 2: ARIMA, usando as observa¸c˜oes 2001:02–2014:12 (T = 167)
Vari´avel dependente: (1 − Ls
)d Vendas
Erros padr˜ao baseados na Hessiana
Coeficiente Erro Padr˜ao z valor p
Φ1 −0,207646 0,490365 −0,4235 0,6720
Φ2 0,0441978 0,0810759 0,5451 0,5857
Φ3 −0,164812 0,0770822 −2,1381 0,0325 **
Φ4 −0,335863 0,0990408 −3,3912 0,0007 ***
Θ1 −0,818196 0,617829 −1,3243 0,1854
Θ2 −0,181803 0,568292 −0,3199 0,7490
M´edia var. dependente −0,008928 D.P. var. dependente 14,16862
M´edia de inova¸c˜oes −0,271453 D.P. das inova¸c˜oes 9,212137
Log. da verosimilhan¸ca −630,2663 Crit´erio de Akaike 1274,533
Crit´erio de Schwarz 1296,358 Hannan–Quinn 1283,391
Pode-se constatar que coeficientes de Φ1, Φ2, Φ3, Θ1 e Θ2 n˜ao s˜ao esta-
tisticamente significativos no teste t. Indicando um ajustamento n˜ao ideal.
Zt = −0, 207Zt−1+0, 044Zt−2−0, 164Zt−3−0, 335Zt−4−0, 818at−1−0, 181at−2
(15)
Como o modelo ARIMA(4,1,2) apresenta maioria dos coeficientes n˜ao es-
tatisticamente significativos, optamos pelo modelo ARIMA(4,1,1) que apre-
senta maior n´umeros de parˆametros consistentes, menor valor de AIC, BIC,
embora ostenta maior valor de EQM. Logo o modelo ARIMA(4,1,1) apre-
senta como o melhor modelo para a previs˜ao.
5.2 Previs˜ao com Modelo ARIMA
A partir do momento que conseguiu-se identificar e estimar um modelo
ARIMA adequado `as observa¸c˜oes, permitindo a descri¸c˜ao da s´erie tempo-
ral, vai-se prever os valores das observa¸c˜oes h passos a frente utilizando a
modelagem ARIMA. ´E importante ressaltar que previs˜oes utilizando mode-
los ARIMA ser˜ao eficazes para um per´ıodo curto e as melhores previs˜oes
ser˜ao aquelas que apresentam um erro quadr´atico m´edio (EQM) m´ınimo.
Foi utilizado o modelo ARIMA(4,1,1) na previs˜ao de vendas para os pr´o-
ximos meses.
A Figura7 exibe o intervalo de confian¸ca para os coeficientes estimados
com 95% de confian¸ca.
t(162, 0, 025) = 1, 960
Tabela 7: IC para coeficientes do modelo ARIMA(4,1,1)
Coeficiente Intervalo de confian¸ca a 95%
Φ1 −0,0542564 −0,255416 0,146903
Φ2 0,0334261 −0,136965 0,203817
Φ3 −0,175050 −0,331190 −0,0189113
Φ4 −0,317445 −0,522390 −0,112501
Θ1 −0,959193 −1,86894 −0,0494456
A Figura 12 ilustra o ajustamento entre o modelo ajustado e a s´erie
inicial. Com o prop´osito de verificar se existe um desajuste pronunciado
entre o modelo ajustado e a s´erie inicial.
-80
-60
-40
-20
0
20
40
60
80
2000 2002 2004 2006 2008 2010 2012 2014
d_Vendas
Efectivo e ajustado d_Vendas
Modeloajustado
d_Vandas
Figura 12: Ajustamento do modelo ajustado a s´erie inicial
-70
-60
-50
-40
-30
-20
-10
0
10
20
30
40
2008 2009 2010 2011 2012 2013 2014 2015 2016
d_Vendas
predição
intervalo a 95 por cento
Figura 13: Previs˜ao para do modelo ARIMA(4,1,1)
A Figura 13 exibe a previs˜ao da s´erie vendas na amostra e fora da amostra
(ano 2015). Da an´alise do mesmo observa-se h´a uma tendˆencia para as vendas
aumentar de janeiro a junho e para diminu´ırem de julho a dezembro.
6 Conclus˜ao
Este trabalho teve como prop´osito produzir previs˜ao de vendas por configu-
ra¸c˜oes de modelos que apresentam bom desempenho preditivo e parˆametros
consistentes em suas significˆancias estat´ısticas. Modelos com parˆametros n˜ao
significativos at´e podem gerar boas previs˜oes para um per´ıodo espec´ıfico, mas
quando testados para outros per´ıodos n˜ao mostram bom desempenho. Po-
r´em, nesta pesquisa, constatou-se que modelo utilizado na previs˜ao, mesmo
com alguns parˆametros n˜ao significativos, tiveram boa performance predi-
tiva em todos os per´ıodo de previs˜ao. Conclui-se tamb´em que o objetivo
da an´alise de s´eries temporais ´e identificar padr˜oes n˜ao aleat´orios na s´erie
temporal de uma vari´avel de interesse e a observa¸c˜ao deste comportamento
passado pode permitir fazer previs˜oes sobre o futuro, orientando a tomada
de decis˜oes.
A principal conclus˜ao ´e a de que a metodologia de previs˜ao de Box-Jenkins
´e muito ampla, flex´ıvel e altamente subjetiva, mas, tamb´em ´e uma importante
ferramenta de gest˜ao, que pode auxiliar o processo de tomada de decis˜ao e
planeamento futuro. Apesar da modelagem ARIMA apresentar um adequado
poder de previs˜ao de curto prazo, recomenda-se, em outros trabalhos de
pesquisa, proceder `a estima¸c˜ao, utilizando outros modelos que n˜ao foram
considerados neste momento.
Em rela¸c˜ao a previs˜ao de vendas observou-se que sempre h´a uma tendˆen-
cia para aumentar no mˆes de janeiro a junho e diminu´ırem no mˆes de julho –
dezembro. No que tange aos crit´erios para escolha de modelos candidatos a
estima¸c˜ao, os crit´erios de Informa¸c˜ao de Akaike (AIC), crit´erio de Erro Qua-
dr´atico M´edio (EQM) e crit´erio de Informa¸c˜ao Bayesiano (SIC) indicaram
como o melhor modelo ARIMA(4,1,1) para a previs˜ao.
Estes resultados demonstram que a previs˜ao de vendas utilizando a meto-
dologia de previs˜ao deBox-Jenkins ´e uma t´ecnica promissora para solucionar
estes tipos de problemas, pois n˜ao exige uma grande quantidade de dados
hist´oricos, os modelos s˜ao bastante precisos, a formula¸c˜ao e entendimento
pelo pesquisador ´e relativamente f´acil, e exige pouco tempo computacional.
Referˆencias
ARCHER, B. Forecasting Demand. International Jurnal of Tourism Mana-
ement. v. 1, n. 1, p. 5-12, 1980.
BOX, G. P. E., Jenkins, G. M. e Reinsel, G. (1994). Time Series Analysis:
Forecasting and Control, 3rd Edition, Prentice-Hall.
LUSTOSA, L. J.; MESQUITA, M. A.; QUELHAS, O. G.; OLIVEIRA, R.
J. Planejamento de controle da produ¸c˜ao. Rio de Janeiro: Elsevier, 2008.
MAKRIDASKIS, S. The art and science of forecasting: An assessment and
future directions. International Jounar Of Forecasting, v. 2, p. 15-39,
1986.
ENDERS, W. (2009), Applied Econometric Time Series, Wiley Series in
Probability and Statistics, Wiley
FALKENBERG, A. V.; DIMINSKY A. S.; RIBEIRO, E. P. Redes neurais
artificiais aplicadas `a previs˜ao de consumo de ´agua. In: CONGRESSO
BRASILEIRO DE REDES NEURAIS, 6., 2003, S˜ao Paulo. Anais VI
Congresso Brasileiro de Redes Neurais. S˜ao Paulo: Centro Universit´ario
da FEI, 2003. p. 319-324.
MORETTIN, Pedro A. e TOLOI, Cl´elia M. S´eries Temporais. 2a ed. Editora
Atual, 1987.
HANKE J. E.; WCHERN D. W.; REITSCH, A. G. Business Forecasting.
7. ed., New York USA: Prentice Hall, 2001.
GRANER; NEWBOLD, Forecasting Economic Time Series, Academic
Press, NY, 1977.
GUJARATI, D. (2006), Econometria B´asica, Elsevier.
RHOADES, S. D.; WALSKI, T. M. Using Regression Analysis to Project
Pumpage. Journal of American Water Work Association, AWWA, De-
cember 1991.
FALKENBERG, A. V. Previs˜ao de consumo urbano de ´agua em curto prazo.
Disserta¸c˜ao de Mestrado. Universidade Federal do Paran´a UFPR. Curi-
tiba. 2005.
WALSKI, T.; CHASE D. V.; SAVIC, D. A. Water Distribution Modeling.
Waterbury, CT. USA: Haestad Press, 2003.
TRAUTWEIN, B. Avalia¸c˜ao de m´etodos para previs˜ao de consumo de ´agua
para curt´ıssimo prazo: Um estudo de caso em empresa de saneamento.
Disserta¸c˜ao de Mestrado. Pontif´ıcia Universidade Cat´olica do Paran´a,
PUC-PR. Curitiba. 2004.
7 Anexo
C´odigo em R
1 # ##==##==##==##==##==##==##==##==##==##==##==##==##==##=##=##
2 #==## ESTUDO DE S RIE TEMPORAL EM R =##
3 # ##==##==##==##==##==##==##==##==##==##==##==##==##==##=##=##
4
5 ###
6 ##Instalando os packages
7 install.packages("forecast")
8 install.packages("RMySQL")
9 install.packages("MASS")
10 install.packages("lubridate")
11 install.packages("Hmisc")
12 install.packages("tseries")
13 install.packages("ggplot2")
14 install.packages("devtools")
15
16 ##Bibiotecas em Para S rie Temporais
17 require(Rssa)
18 require(forecast)
19 library(Rssa)
20 library(forecast)
21
22 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas.
csv",sep=";",header=TRUE)
23 serietemporal
24 attach(serie)
25 names(serie)
26 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico
com eixo tempo e vendas
27 plot (( serie),col=4,main=’Vendas ’,xlab=’Meses ’,ylab=’vendas ’)
28
29 #Primeira D i f e r e n a
30 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas.
csv",sep=";",header=TRUE)
31 serietemporal
32 diff(Vendas)
33 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico
com eixo tempo e vendas
34 serie
35 plot (( diff(serie)),col=4,main=’Vendas - 1a d i f e r e n a ’,xlab=’
meses ’,ylab=’vendas ’)
36
37 #Segunda D i f e r e n a
38 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas.
csv",sep=";",header=TRUE)
39 serietemporal
40 diff(diff(diff(Vendas)))
41 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico
com eixo tempo e vendas
42 serie
43 plot(diff (( diff(serie))),col=4,main=’Vendas - 2a d i f e r e n a ’,
xlab=’meses ’,ylab=’vendas ’)
44
45 #Trabalhando Primeira D i f e r e n a
46 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas.
csv",sep=";",header=TRUE)
47 serietemporal
48 #diff(Vendas)
49 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico com
eixo tempo e vendas
50 serie
51 plot (( diff(serie)),col=4,main=’Vendas - 1a d i f e r e n a ’,xlab=’
meses ’,ylab=’vendas ’)
52 #Componente sazonal para lag =11
53 diff(diff(serie),lag.max =11)
54 plot(ts(diff(serie),lag.max =11) ,col=2,main=’VENDAS - 1a
d i f e r e n a simples e 1a sazonal ’,xlab=’meses ’,ylab=’Valores
em Reais (valores e milhares)’)
55
56 # F u n A u t o c o r r e l a (FAC) e A u t o c o r r e l a parcial (FACp)
com defasagem 11:
57 par(mfrow=c(1,1))
58 FAC=acf(diff(serie), main=’ACF Primeira d i f e r e n a ’)
59 FACp=pacf(diff(serie), main=’PACF Primeira d i f e r e n a ’)
60 A
61 ap
62
63 # D e t e n de Sazonalidade
64 Detsaz = ts(na.omit(diff(serie), frequency =30))
65 plot(Detsaz)
66 decomp = stl(Detsaz , s.window="periodic")
67 deseasonal_cnt <- seasadj(decomp)
68 plot(decomp)
69
70 #Dickey -Fuller Test
71 adf.test(Detsaz , alternative = "stationary")
72
73 # E s t i m a do modelo ARIMA:
74 #Modelo (1,1,3)
75 arima(diff(serie),order=c(1,1,3))
76 x.fit <- arima(diff(serie),order=c(1,1,3))
77 x.fit
78
79 #Modelo (4,1,1)
80 arima(diff(serie),order=c(4,1,1))
81 x.fit <- arima(diff(serie),order=c(4,1,1))
82 x.fit
83 summary(x.fit) # e s t a t stica do modelo
84 arima(x.fit)
85 forecast(arima(x.fit))
86 # Acuracia da p r e v i s o
87 library(forecast)
88 accuracy(x.fit)
89
90 # p r e d i para 12 meses
91 library(forecast)
92 pred <-forecast(x.fit , 12)
93 plot(forecast(x.fit , 12))
94 plot(pred ,type="l",xlab = "Ano",ylab = "Vendas",lwd = 2,col =
’red’,main=" P r e d i usando Modelo ARIMA")
95
96 #plot(forecast(arima(diff(serie)),xlab =" Time",ylab =" Number of
births ") #SS5 time series from ’90-’05
97 #lines(SS8 ,type ="l", ylim=R, col=" black ") #SS8 time series
from ’90-’08
98 #plot(forecast(arima(diff(serie)), xlab =" Time", ylab =" Number
of births ")

Mais conteúdo relacionado

Semelhante a Previsão de vendas com modelo ARIMA Box-Jenkins

Análise de Comportamento e Desempenho de Algoritmos de Ordenação
Análise de Comportamento e Desempenho de Algoritmos de OrdenaçãoAnálise de Comportamento e Desempenho de Algoritmos de Ordenação
Análise de Comportamento e Desempenho de Algoritmos de OrdenaçãoBruno Mourao Siqueira
 
Monografia fabiano rates
Monografia fabiano ratesMonografia fabiano rates
Monografia fabiano ratesFabiano Rates
 
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...Monografia sobre Inteligência artificial para comparar algoritmos de treiname...
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...Fabiano Rates
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Adriano Figueiredo
 
Plano de aula custos da produção
Plano de aula   custos da produçãoPlano de aula   custos da produção
Plano de aula custos da produçãoDaniel Moura
 
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Rodrigo Almeida
 
TCC JOSE CLAUDIO SOUZA REV 1.pptx
TCC JOSE CLAUDIO SOUZA REV 1.pptxTCC JOSE CLAUDIO SOUZA REV 1.pptx
TCC JOSE CLAUDIO SOUZA REV 1.pptxJosClaudioSouza1
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Adriano Figueiredo
 
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...Patrick Pires Alvim
 

Semelhante a Previsão de vendas com modelo ARIMA Box-Jenkins (20)

carlosSilveira_dissertacao
carlosSilveira_dissertacaocarlosSilveira_dissertacao
carlosSilveira_dissertacao
 
Tese marinho
Tese marinhoTese marinho
Tese marinho
 
Risco de resgate e taxa de juro
Risco de resgate e taxa de juroRisco de resgate e taxa de juro
Risco de resgate e taxa de juro
 
Risco de resgate e taxa de juro
Risco de resgate e taxa de juroRisco de resgate e taxa de juro
Risco de resgate e taxa de juro
 
Modelos quantitativos para a tomada de decisão.
Modelos quantitativos para a tomada de decisão.Modelos quantitativos para a tomada de decisão.
Modelos quantitativos para a tomada de decisão.
 
Econofísica
EconofísicaEconofísica
Econofísica
 
TCC_Gabriel Estêvão de Morais Rodrigues - Temporário
TCC_Gabriel Estêvão de Morais Rodrigues - TemporárioTCC_Gabriel Estêvão de Morais Rodrigues - Temporário
TCC_Gabriel Estêvão de Morais Rodrigues - Temporário
 
Análise de Comportamento e Desempenho de Algoritmos de Ordenação
Análise de Comportamento e Desempenho de Algoritmos de OrdenaçãoAnálise de Comportamento e Desempenho de Algoritmos de Ordenação
Análise de Comportamento e Desempenho de Algoritmos de Ordenação
 
Monografia fabiano rates
Monografia fabiano ratesMonografia fabiano rates
Monografia fabiano rates
 
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...Monografia sobre Inteligência artificial para comparar algoritmos de treiname...
Monografia sobre Inteligência artificial para comparar algoritmos de treiname...
 
Black Belt - Six Sigma Solutins
Black Belt - Six Sigma SolutinsBlack Belt - Six Sigma Solutins
Black Belt - Six Sigma Solutins
 
Com jairopasso2
Com jairopasso2Com jairopasso2
Com jairopasso2
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1
 
Plano de aula custos da produção
Plano de aula   custos da produçãoPlano de aula   custos da produção
Plano de aula custos da produção
 
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
Troca de contexto segura em sistemas operacionais embarcados utilizando técni...
 
TCC JOSE CLAUDIO SOUZA REV 1.pptx
TCC JOSE CLAUDIO SOUZA REV 1.pptxTCC JOSE CLAUDIO SOUZA REV 1.pptx
TCC JOSE CLAUDIO SOUZA REV 1.pptx
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1
 
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...
GERENCIAMENTO DO ESCOPO DE PROJETO DE SISTEMA DE DETECÇÃO, ALARME E COMBATE A...
 
1 76 (1)
1 76 (1)1 76 (1)
1 76 (1)
 
Dissertacao murilo h_de_sousa
Dissertacao murilo h_de_sousaDissertacao murilo h_de_sousa
Dissertacao murilo h_de_sousa
 

Previsão de vendas com modelo ARIMA Box-Jenkins

  • 1. PREVIS˜AO DE VENDAS COM MODELO ARIMA BOX-JENKINS Emanuel De Jesus Ramos Correia Borges∗ Jeremias Lopes Landim† Praia 17 de agosto de 2018 ∗ Licenciado em Estat´ıstica e Gest˜ao de Informa¸c˜ao, Universidade de Cabo Verde - Uni-CV. Caixa Postal, CEP: 7400, Praia, Santiago, Cabo Verde. E-mail: emanuelra- mos31@hotmail.com † Licenciado em Estat´ıstica e Gest˜ao de Informa¸c˜ao, Universidade de Cabo Verde - Uni-CV, Caixa Postal, CEP: 7400, Praia, Santiago, Cabo Verde. E-mail: jeremi- asl10@hotmail.com 1
  • 2. PREVIS˜AO DE VENDAS COM MODELO ARIMA BOX-JENKINS Resumo O prop´osito deste artigo consiste em captar o comportamento da s´erie temporal e com base nesse comportamento realizar previs˜oes fu- turas (vendas), utilizando a metodologia ARIMA (Auto-Regressivo Integrado de M´edias M´oveis) de Box-Jenkins de previs˜ao de s´eries temporais de forma univariada. Para a obten¸c˜ao do melhor modelo para a previs˜ao das vendas levou-se em considera¸c˜ao os crit´erios de In- forma¸c˜ao de Akaike (AIC), o Crit´erio Bayesiano de Schwartz (SIC) e o Crit´erio de Erro Quadr´atico M´edio (EQM). Atrav´es do melhor modelo foi feito a previs˜ao de vendas para os pr´oximos meses. A s´erie tem- poral usada neste artigo ´e mensal e corresponde a per´ıodo de Janeiro de 2000 a Dezembro 2014. A an´alise baseou-se em testes estat´ısticos, atrav´es da qual da an´alises, conclui-se que o modelo ARIMA(4,1,1) ´e o melhor dentre o conjunto de modelos testados. Palavra Chaves: 1. Previs˜ao; 2. S´erie Temporais; 3. Modelo ARIMA de Box-Jenkins;
  • 3. Sum´ario 1 Introdu¸c˜ao 5 2 Metodologia 6 3 Revis˜ao Bibliogr´afica 7 4 Referencial Te´orico 8 4.1 Metodologia de Box-Jenkins . . . . . . . . . . . . . . . . . . . 8 4.2 S´erie Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4.3 Estacionariedade da S´erie Temporal . . . . . . . . . . . . . . . 10 4.3.1 Modelos lineares Estacion´arios . . . . . . . . . . . . . . 10 4.3.2 Modelo Auto-Regressivo - AR(p) . . . . . . . . . . . . 12 4.3.3 M´edias M´oveis - MA(q) . . . . . . . . . . . . . . . . . 12 4.3.4 Modelo Auto-Regressivo M´edias M´oveis - ARMA(q,p) . 13 4.4 Modelos lineares n˜ao Estacion´arios . . . . . . . . . . . . . . . 13 4.4.1 Modelo Auto-Regressivo Integrado M´edia M´oveis - ARIMA (p,q,d) . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4.5 Avalia¸c˜ao da estacionariedade . . . . . . . . . . . . . . . . . . 15 4.6 Fases na escolha do Melhor Modelo . . . . . . . . . . . . . . . 16 5 Resultado e discuss˜ao 20 5.1 Crit´erio de Escolha do melhor Modelo ARIMA . . . . . . . . . 30 5.2 Previs˜ao com Modelo ARIMA . . . . . . . . . . . . . . . . . . 34 6 Conclus˜ao 36 7 Anexo 40 Lista de Figuras 1 Comportamento da s´erie em Estudo . . . . . . . . . . . . . . . 21 2 Teste de Dickey-Fuller incluindo 11 desfasamentos . . . . . . . 22 3 Gr´afico QQ-Normal . . . . . . . . . . . . . . . . . . . . . . . . 23 4 Correlogramas das FAC (ACF) e FACP (PAFC) da s´erie Vendas 24
  • 4. 5 Primeira diferen¸ca da s´erie vendas . . . . . . . . . . . . . . . . 25 6 Teste de Dickey-Fuller para a primeira diferen¸ca . . . . . . . . 26 7 Teste de Normalidade para primeira diferen¸ca da s´erie . . . . . 26 8 QQ-Normal para Primeira diferen¸ca da s´erie . . . . . . . . . . 27 9 QQ-Normal da s´erie (sem diferen¸ca) . . . . . . . . . . . . . . . 27 10 QQ-Normal da primeira diferen¸ca da s´erie . . . . . . . . . . . 27 11 Correlogramas das FAC e FACP da s´erie vendas (primeira diferen¸ca) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 12 Ajustamento do modelo ajustado a s´erie inicial . . . . . . . . . 35 13 Previs˜ao para do modelo ARIMA(4,1,1) . . . . . . . . . . . . 35 Lista de Tabelas 1 Estat´ıstica T tabelado para diferentes tamanhos de amostra . 15 2 Estat´ıstica descritiva da s´erie temporal em estudo . . . . . . . 21 3 Escolha de modelo a Previs˜ao . . . . . . . . . . . . . . . . . . 31 4 Compara¸c˜ao entre modelo ARIMA(4,1,1) e ARIMA(4,1,2) . . 31 5 Estat´ıstica do modelo ARIMA(4,1,1) . . . . . . . . . . . . . . 32 6 Estat´ıstica do modelo ARIMA(4,1,2) . . . . . . . . . . . . . . 33 7 IC para coeficientes do modelo ARIMA(4,1,1) . . . . . . . . . 34
  • 5. 1 Introdu¸c˜ao O uso de m´etodo de previs˜ao de vendas ´e um grande aliado no planeamento estrat´egico das empresas, pois permite saber a previs˜ao de vendas futuras, ao mesmo tempo em que mant´em os n´ıveis do mesmo em patamares aceit´aveis. Contudo, a dificuldade de utiliza¸c˜ao desses m´etodos, muitas vezes, passa pela falta de conhecimento das t´ecnicas existentes ou at´e mesmo da qualidade de base de dados. Lustosa et al. (2008) asseguram que o resultado econ´omico de uma em- presa ser´a diretamente impactado pela capacidade de prever bem, comparti- lhado por Chopra (2003) que refere que duas previs˜oes de vendas diferentes, com diferentes n´ıveis de erro, ter˜ao uma diferente pol´ıtica de gest˜ao, culmi- nando em resultados melhores ou piores. Os modelos de previs˜ao de Box-Jenkins s˜ao fundamentados em conceitos e princ´ıpios estat´ısticos e s˜ao capazes de modelarem um amplo espectro do comportamento de s´eries temporais. O intuito fundamental deste m´etodo para previs˜ao de s´eries temporais ´e encontrar uma f´ormula adequada para que os erros/res´ıduos sejam t˜ao pequenos quanto poss´ıvel (m´ınimos) e n˜ao apresentem padr˜oes. A an´alise de s´eries temporais ´e uma ´area de pesquisa pertinente em diver- sos campos do conhecimento, especialmente na ´area econ´omica. A principal motiva¸c˜ao para pesquisas sobre s´eries temporais ´e providenciar uma previs˜ao quando o modelo matem´atico de um fen´omeno ´e complexo, desconhecido ou incompleto. Existe um grande n´umero de m´etodos de previs˜ao bem conhecidos que s˜ao fundamentados apenas na an´alise de valores passados de uma sequˆencia de tempo, isto ´e, m´etodos que empregam princ´ıpios utilizados, normalmente na an´alise t´ecnica. Portanto a previs˜ao de s´eries temporais ´e um desafio da ´area de Estat´ıstica. Pois, prever valores futuros, em fun¸c˜ao de valores passados, tem-se tornado um assunto de especial interesse na engenharia, economia e na ind´ustria, com aplica¸c˜oes em gest˜ao de produ¸c˜ao, mercado de a¸c˜oes, entre outras ´areas.
  • 6. 2 Metodologia O m´etodo cient´ıfico utilizado nesta pesquisa ´e indutivo, pois as generaliza¸c˜oes ser˜ao de constata¸c˜oes particulares da realidade. A metodologia baseia-se em revis˜ao bibliogr´afica de carater´ısticas e aplica¸c˜oes de diferentes m´etodos de previs˜ao. Caraterizando-se como uma pesquisa aplicada, uma vez que visa gerar conhecimento para aplica¸c˜oes pr´aticas na solu¸c˜ao de problemas espec´ıficos. Foi utilizado a metodologia de Box-Jenkins, que mostra a constru¸c˜ao dos modelos ARIMA baseada em um ciclo iterativo, no qual a escolha do modelo ´e feita com base nos pr´oprios dados. Foi utilizado uma s´erie temporal de vendas mensais no per´ıodo de Janeiro de 2000 a Dezembro de 2014, com o prop´osito de aplicar o modelo ARIMA de Box-Jenkins para a previs˜ao. Existe diversos m´etodos para auxiliar na tarefa de previs˜ao de s´eries tem- porais, como por exemplo: modelos de Suaviza¸c˜ao Exponencial, Modelos Auto-regressivos (AR), de M´edias M´oveis (MA) e Modelos ARIMA. Em s´ıntese, foram feitos os seguintes procedimentos: i) Teste de estacionaridade (ADF); ii) An´alise de autocorrela¸c˜oes residuais (FAC e FACP); iii) Testes de significˆancia para com o conjunto de modelos ARIMA encon- trados; iv) Aplica¸c˜ao dos crit´erios penalizadores (AIC); v) Caso o modelo n˜ao seja adequado, o ciclo ´e repetido, voltando-se `a fase de identifica¸c˜ao; vi) Por fim, a verifica¸c˜ao da qualidade do modelo para realizar a previs˜ao de vendas. Os dados foram analisados com base em an´alise descritiva e m´etodos de previs˜oes. Foram utilizados os seguintes software para a an´alise e previs˜ao: R e Grelt.
  • 7. 3 Revis˜ao Bibliogr´afica Ap´os d´ecadas de estudos na ´area de previs˜ao de vendas, v´arias t´ecnicas foram desenvolvidas. De acordo com Lustosa et al. (2008), tais t´ecnicas podem ser divididas em trˆes grupos: qualitativos, proje¸c˜oes hist´oricas e causais. As suas principais diferen¸cas consistem na assertividade, na subjetividade e na simplicidade. Historicamente, os m´etodos de previs˜ao mais comuns baseiam-se em mo- delos de regress˜ao m´ultipla e modelos auto-regressivos. Mas recentemente com o avan¸co das pesquisas em Inteligˆencia Artificial (IA) come¸caram a sur- gir pesquisas com aplica¸c˜ao de t´ecnicas de Inteligˆencia Artificial em modelos de previs˜ao de consumo. A partir da d´ecada de 90, Crommelynk et al. (1992), Stark et al. (2000), Jain e Ormsebee (2002), Silva (2003), e Falkemberg et al. (2003) desenvol- veram modelos de previs˜ao baseados em t´ecnicas de inteligˆencia artificial. Falkemberg et al. (2003) desenvolveu modelos de Redes Neurais Artificiais (RNA) e de Regress˜ao M´ultipla, para previs˜ao de consumo vinte e quatro horas `a frente, considerando influˆencias do dia da semana, da hora do dia e do consumo passado, recomendando modelos de previs˜ao m´ultiplos para diferentes perfis de consumo e diferentes horas do dia. De acordo com Makridakis (1986) diferentes estudos possibilitaram di- ferentes conclus˜oes quanto ao desempenho dos m´etodos, n˜ao sendo poss´ıvel concluir qual apresenta melhores resultados.
  • 8. 4 Referencial Te´orico 4.1 Metodologia de Box-Jenkins De acordo com Archer (1980) o m´etodo de Box-Jenkins ´e um m´etodo de previs˜ao que utiliza um algoritmo matem´atico complexo, com termos auto- regressivos e de m´edia m´ovel, para identificar a forma do modelo matem´atico mais adequado para a s´erie temporal analisada com n observa¸c˜oes. A previ- s˜ao baseia-se no ajuste de modelos tentativo denominados ARIMA, a s´eries temporais de valores observados de forma que a diferen¸ca entre os valores gerados pelos modelos e os valores observados resulte em s´eries de res´ıduos de comportamento aleat´orio em torno de zero. Os modelos ARIMA (Auto-regressivos Integrados e de M´edias M´oveis) s˜ao capazes de descrever os processos de gera¸c˜ao de uma variedade de s´e- ries temporais para os previsores (que correspondem aos filtros) sem pre- cisar levar em conta as rela¸c˜oes econ´omicas, por exemplo, que geraram as s´eries. Portanto, descrevem tanto o comportamento estacion´ario como o n˜ao-estacion´ario. Dessa forma, pode afirmar que essa ´e uma metodologia de modelagem flex´ıvel, em que as previs˜oes com base nesses modelos s˜ao feitas a partir dos valores correntes e passados dessas s´eries. 4.2 S´erie Temporal Uma s´erie temporal ´e definida como um conjunto de observa¸c˜oes de uma dada vari´avel, geralmente distribu´ıdas de maneira equidistante pelo fator tempo, e que possuem como carater´ıstica central a presen¸ca de uma dependˆencia serial entre elas (Morettin e Toloi, 2004). De forma objetiva uma s´erie temporal ´e um conjunto de observa¸c˜oes discretas, realizadas em per´ıodos equidistantes e que apresentam uma dependˆencia serial entre essas observa¸c˜oes. Se estas observa¸c˜oes consecutivas s˜ao dependentes uma da outra, ent˜ao ´e poss´ıvel conseguir-se uma previs˜ao ou identifica¸c˜ao do sistema. Uma s´erie temporal pode ser apresentada de diversas formas, como por exemplo: di´aria, mensal, semestral ou anual, no entanto, obrigatoriamente toda a s´erie deve estar representada com a mesma periodicidade. Segundo
  • 9. Pindyck e Rubinfeld (2004), “Dados que descrevem o movimento de uma vari´avel ao longo do tempo s˜ao chamados s´eries temporais, as quais podem ser di´arias, semanais, mensais, trimestrais ou anuais”. Diante das dificuldades na utiliza¸c˜ao de modelos econom´etricos estrutu- rados que utilizam vari´aveis explicativas, os modelos de s´eries temporais s˜ao muito utilizados para previs˜ao de vari´aveis econ´omicas. Pindyck e Rubinfeld (2004) classificam em dois tipos os modelos de previs˜oes de s´eries temporais, modelos determin´ısticos e modelos estoc´asticos. Os dois modelos utilizam o comportamento passado da s´erie para prever seus componentes futuros, po- r´em os modelos determin´ısticos n˜ao fazem referˆencia `as fontes ou `a natureza aleat´oria (estoc´astica) subjacente `a s´erie. Uma s´erie temporal pode ser interpretada como um processo estoc´astico, Hill, Griffiths e Judge (2003) observam que uma vari´avel econ´omica ´e aleat´o- ria porque n˜ao se pode prevˆe-la perfeitamente e o modelo econ´omico que gera uma vari´avel de s´erie temporal ´e chamado de processo estoc´astico ou aleat´o- rio. Uma amostra particular da s´erie ´e normalmente chamada uma realiza¸c˜ao particular do processo estoc´astico. Sobre o tema, Gujarati (2006) relata que: “A distin¸c˜ao entre o processo estoc´astico e sua realiza¸c˜ao ´e parecida com a distin¸c˜ao entre popula¸c˜ao e amostra em dados de corte (Cross Section). Assim como utilizamos dados amostrais para fazer inferˆencias sobre uma po- pula¸c˜ao, em s´eries temporais usamos a realiza¸c˜ao para fazer inferˆencias sobre o processo estoc´astico subjacente”. Seja Zt s´erie temporal de tamanho t dado por: Zt, onde t = {1, 2, 3, 4, ..., n} (1) As fun¸c˜oes nas quais se baseiam a vari´avel aleat´oria Zt podem ser repre- sentadas pelas seguintes equa¸c˜oes: • M´edia ou valor esperado: ´e o valor m´edio em rela¸c˜ao a todas a observa¸c˜oes, isto ´e, o valor centro. µz = E[Zt] (2) • Variˆancia: mede o desvio das observa¸c˜oes em rela¸c˜ao ao valor m´edio, tudo ao quadrado. Tem a seguinte f´ormula:
  • 10. σ2 = E [Zt − µz]2 . (3) • Autocovariˆancia: a autovariˆancia mede a dependˆencia entre duas observa¸c˜oes separadas por k intervalo de tempo (lag k). Υk = Cov[Zt, Zt+k] = E[Zt − µz][Zt+k − µz]. (4) • Autocorrela¸c˜ao: a autocorrela¸c˜ao possui o objetivo de mensurar a mem´oria de um processo estoc´astico. Isto significa que a autocorre- la¸c˜ao mede a intensidade com que um valor observado no tempo t ´e influenciado por aquele observado no tempo t - k. ρk = Cov[Zt, Zt+k] V ar(Zt) ∗ V ar(Zt+k) (5) 4.3 Estacionariedade da S´erie Temporal Os modelos ARIMA de Box-Jenkins s˜ao excelentes modelos de previs˜ao a curto prazo (Granger e Newbold, 1977). Resultados de an´alises com esses modelos mostram que os melhores resultados (previs˜oes) s˜ao obtidos com s´e- rie de 5 a 10 anos de informa¸c˜ao (mensal), particularmente na presen¸ca de sazonalidade. Como j´a visto, a importˆancia do processo observado ser estaci- on´ario ´e a possibilidade de fixar parˆametros do modelo v´alidos para previs˜ao do futuro a partir do passado. Assim, como primeiro passo para essa mode- lagem s˜ao realizados procedimentos para a remo¸c˜ao da n˜ao estacionariedade. 4.3.1 Modelos lineares Estacion´arios A constru¸c˜ao dos modelos de s´eries temporais univariados ´e fundamental na teoria de que existe uma grande quantidade de informa¸c˜ao presente na s´erie de dados. Podendo ser capazes de fornecer estimativas sobre o comporta- mento futuro da vari´avel em estudo. O modelo ARIMA parte de conce¸c˜ao que as s´eries temporais envolvidos na an´alise ´e um processo estacion´ario.
  • 11. Os modelos estoc´asticos de s´eries temporais s˜ao v´alidos apenas na aplica- ¸c˜ao em s´eries ditas estacion´arias, para Hill, Griffiths e Judge (2003 p. 389), “Um processo estoc´astico (s´erie temporal) Zt ´e dito estacion´aria quando ele se desenvolve no tempo aleatoriamente ao redor de uma m´edia e variˆancia constantes, e a covariˆancia entre dois valores da s´erie depende apenas da dis- tˆancia no tempo que separa os dois valores, e n˜ao dos tempos reais em que as vari´aveis s˜ao observadas”. Uma condi¸c˜ao necess´aria para aplica¸c˜ao dos modelos ARIMA, ´e de que o processo que gerou a s´erie temporal seja estacion´ario de segunda ordem, ou seja, que sua m´edia e variˆancia sejam constantes no tempo. De outro modo, n˜ao apresente tendˆencia ou sazonalidade (S´afadi, 2004). Um modelo ´e estacion´ario se para todo t, t-s tivemos: i. E [Zt] = E [Zt−s] = µ, m´edia constante. ii. E [(Zt − µ2 )] = E [(Zt−s − µ2 )] = σ2 y, variˆancia constante. iii. E [(Zt − µ)(Zt−s − µ)] = E [(Zt−s − µ)(Zt−j−s − µ)], covariˆancia cons- tante. Processo ´e estritamente estacion´ario ou fortemente estacion´ario se cumpre as seguintes propriedades: • Propriedade 1: E[Zt] = µt, ∀ t ∈ T. • Propriedade 2: V ar[Zt] = σ2 t , ∀ t ∈ T. • Propriedade 3: Υ(τ) = Cov(Zt, Zt+τ ) = Cov(Z0, Zτ ) Um processo Zt diz-se estritamente estacion´ario se para todo o n e todo t1, ... ,tn, a distribui¸c˜ao conjunta de Zt1 , ... , Ztn ´e igual `a distribui¸c˜ao conjunta de Zt1+k , ... , Ztn+k qualquer que seja k N. Estacionariedade estrita implica que a distribui¸c˜ao de probabilidade conjunta seja constante ao longo do tempo, ou seja, que n˜ao depende do instante t. Um processo ´e fracamente estacion´ario ou estacion´ario de segunda ordem se os dois primeiros momentos (a m´edia e a matriz de variˆancia-covariˆancia)
  • 12. da distribui¸c˜ao de probabilidade conjunta da vari´avel estoc´astica sejam cons- tantes ao longo do tempo, isto ´e, processo Zt com variˆancia finita tal que apresenta as seguintes propriedades: • Propriedade 1: E[Zt] = µ, constante ∀ t ∈ T. • Propriedade 2: E[Zt] < ∞, ∀ t ∈ T. • Propriedade 3: Υ(τ) = Cov(Zt1 , Zt2 ) ´e uma fun¸c˜ao apenas de |t1−t2|. 4.3.2 Modelo Auto-Regressivo - AR(p) Um modelo Auto-Regressivo de ordem p, representado como AR(p), descreve o valor de uma observa¸c˜ao de uma s´erie temporal atrav´es da atribui¸c˜ao de pesos `as p observa¸c˜oes anteriores. Em um modelo auto-regressivo, a s´erie de dados Zt ´e descrita por seus valores passados Zt−1, Zt−2,..., Zt−P e pelo ru´ıdo branco(res´ıduos s˜ao n˜ao correlacionados). A estrutura auto-regressiva geral ´e expressa por: Zt = φ1Zt−1 + φ2Zt−2 + φpZt−p + at (6) Onde Zt ´e o valor observado no tempo t, φp representa o peso de cada observa¸c˜ao (parˆametros) e o at ru´ıdo branco da observa¸c˜ao t com m´edia zero e variˆancia σ2 y. 4.3.3 M´edias M´oveis - MA(q) O processo de M´edias M´oveis ´e representado por MA(q). ´E semelhante ao processo AR(p), por´em ao inv´es de definir a observa¸c˜ao atual atrav´es da atri- bui¸c˜ao de peso `as observa¸c˜oes anteriores, constr´oi-se a observa¸c˜ao Zt atrav´es da atribui¸c˜ao de peso aos ru´ıdos brancos das observa¸c˜oes passadas, isto ´e, s˜ao formados por combina¸c˜ao linear do ru´ıdo branco, at, ocorridos no pe- r´ıodo corrente e nos per´ıodos passados. Os primeiros correspondem aos processos de m´edias m´oveis de ordem q, em que cada observa¸c˜ao Zt ´e gerada por uma m´edia ponderada dos erros aleat´orios q per´ıodos no passado.
  • 13. Zt = at − θ1at−1 − θ2at−2 − ... − θpat−p (7) Onde θi s˜ao parˆametros da estrutura, i = 1,..., p (a ordem da estrutura) e at ´e ru´ıdo branco com m´edia zero e variˆancia σ2 y. 4.3.4 Modelo Auto-Regressivo M´edias M´oveis - ARMA(q,p) Esse modelo ´e uma combina¸c˜ao dos dois anteriores, onde Zt ´e descrito por seus valores passados e pelos ru´ıdos branco corrente e passados. Supondo Zt a s´erie j´a diferenciada, os modelos ARMA em sua forma geral escrevem-se: Zt = φ1Zt−1 + ... + φpZt−p + at − θ1at−1 − ... − θpat−p (8) Onde: φi s˜ao os parˆametros da estrutura auto-regressiva, i = 1,..., p, θi s˜ao os parˆametros da estrutura m´edias m´oveis, i = 1,..., p e at ru´ıdo branco. Os modelos AR(p), MA(q) e ARMA(p,q) podem ser aplicados somente em s´eries estacion´arias, ou seja, s´eries temporais que n˜ao possuam tendˆencia e que suas m´edias e variˆancia sejam constantes. Contudo, s´eries temporais reais nem sempre seguem um padr˜ao estacion´ario. 4.4 Modelos lineares n˜ao Estacion´arios 4.4.1 Modelo Auto-Regressivo Integrado M´edia M´oveis - ARIMA (p,q,d) Um processo Auto-Regressivo integrado de m´edia m´ovel ´e uma generaliza¸c˜ao dos processos ARMA que incorpora s´eries n˜ao estacion´arias. Assim, tal como nos m´etodos anteriores, possui apenas uma vari´avel e descreve o comporta- mento de uma vari´avel em termos dos seus valores passados. (Brockwell e Richard A. Davis, 2002). De acordo com Matos (2000), a maioria das s´eries temporais s˜ao n˜ao es- tacion´arias. No entanto, uma s´erie temporal utilizada na estima¸c˜ao de um modelo univariado deve ser estacion´aria. Logo, a s´erie original passar´a por
  • 14. algumas diferencia¸c˜oes, a fim de torn´a-la estacion´aria. O n´umero necess´a- rio de diferen¸ca para tornar uma s´erie estacion´aria ´e denominado ordem de integra¸c˜ao (d). Os modelos ARIMA, elaborados por Box-Jenkins, normalmente s˜ao re- presentados por ARIMA (p, d, q). O parˆametro p refere-se ao n´umero de termos Auto-Regressivo, o parˆametro d diz respeito ao n´umero de diferen- cia¸c˜oes, que s˜ao necess´arias para transformar a s´erie n˜ao estacion´aria, em estacion´aria, conceito que ser´a abordado de seguida e, por fim, o q trata-se do n´umero de m´edias m´oveis. Fava (2000) observa que os modelos ARIMA resultam da combina¸c˜ao de trˆes componentes tamb´em denominados filtros: o componente Auto-regressivo (AR), o filtro de Integra¸c˜ao (I ) e o componente de M´edias M´oveis (MA). Uma representa¸c˜ao ARIMA(1,2,0), indica um modelo de ordem 1 para o compo- nente AR (Auto-Regressivo), ordem 2 para o componente I (Integra¸c˜ao ou diferencia¸c˜ao) e o ´ultimo 0 para o componente MA (M´edia M´ovel). Quando uma s´erie n˜ao ´e estacion´aria, a aplica¸c˜ao de um modelo ARMA(p,q) ´e prejudicada. Para isso, aplica-se a diferencia¸c˜ao na s´erie. ∆Z = Zt − Zt−1 (9) Tendo-se assim um modelo auto-regressivo, integrado e de M´edias M´oveis, denominado ARIMA(p,d,q), representado a seguir (Franses, 1998): ∆d Zt = φ1∆d Zt−1 +φ2∆d Zt−2 +...+φp∆d Zt−p +at −θ1at−1 −...−θpat−p (10) Sendo d o n´umero de diferen¸cas necess´arias para tornar a s´erie estacion´a- ria. Os modelos ARIMA s˜ao tamb´em univariados, isto ´e, eles s˜ao baseados numa ´unica vari´avel de s´erie temporal (existem modelos multivariados que est˜ao al´em do escopo deste trabalho). Todavia, se a s´erie observada prati- camente, como j´a foi dito anteriormente, n˜ao apresentar a condi¸c˜ao da esta- cionariedade, nela dever´a ser aplicado o operador diferen¸ca, o que efetuar´a uma segunda filtragem, que poder´a ser repetida quantas vezes se julgarem necess´arias, at´e a sua estacionariza¸c˜ao.
  • 15. 4.5 Avalia¸c˜ao da estacionariedade Para detetar a n˜ao estacionariedade de uma s´erie, o comportamento tem- poral pode ser analisado graficamente, buscando padr˜oes, como a inclina¸c˜ao nos dados. E a varia¸c˜ao dos dados n˜ao permanece essencialmente constante sobre o tempo, isto ´e, indicando que a variˆancia est´a se alterando ou, en- t˜ao,aplicando os testes estat´ısticos de raiz unit´aria. O teste de raiz unit´aria mais usado ´e Teste de Dickey-Fuller aumentado ou Teste ADF (do acrˆonimo em inglˆes Augmented Dickey-Fuller). O referido teste testa a hip´otese nula da existˆencia de raiz unit´aria na s´erie. Caso esta hip´otese n˜ao seja rejeitada, a s´erie possuir´a raiz unit´aria, portanto, n˜ao ser´a estacion´aria. A estat´ıstica ADF, usada no teste, ´e um n´umero negativo, e quanto mais negativo, mais indicativo o teste se torna de rejeitar a hip´otese nula de que existe raiz unit´aria na s´erie. • H0: tem raiz unit´aria (n˜ao ´e estacion´aria); • H1: n˜ao tem raiz unit´aria (´e estacion´aria); Para o crit´erio de an´alise temos a estat´ıstica T, em que a hip´otese nula ´e rejeitada quando Tcalculado < Ttabelado. Para encontrar o valor de Tcalculado. Faz-se uma regress˜ao das primeiras diferen¸cas da s´erie (∆Zt) em rela¸c˜ao a Zt−1. Ent˜ao, divide-se o coeficiente estimado de Zt−1 pelo seu desvio padr˜ao, e obt´em-se o Tcalculado. Os valores tabelados de T para um n´ıvel de significˆancia de 1% est´a na Tabela 1. Para evitar o problema da autocorrela¸c˜ao dos res´ıduos, recomenda-se a utiliza¸c˜ao do teste Dickey-Fuller Aumentado (ADF), que engloba a equa¸c˜ao das defasagens para elimina¸c˜ao do problema de autocorrela¸c˜ao dos res´ıduos. 4.6 Fases na escolha do Melhor Modelo O objetivo de s´eries temporais ´e descobrir qual o comportamento apresentado pela s´erie, buscando-se o melhor modelo que represente o comportamento da mesma. Sendo que este pode ser explicado por um processo Auto-Regressivo
  • 16. Tabela 1: Estat´ıstica T tabelado para diferentes tamanhos de amostra Tamanho de amostra T Tabela 25 -3,75 50 -3,58 100 -3,51 250 -3,46 500 -3,44 Infinito -3,43 – AR(p), por um M´edias Moveis - MA(p,d,q), por um Auto-Regressivo de M´edias M´oveis - ARMA(p,q) ou por um Auto-Regressivo Integrados de M´e- dias Moveis - ARIMA(p,d,q). O m´etodo Box-Jenkins segue quatro fases para a modela¸c˜ao de s´eries temporais: Fase 1. Identifica¸c˜ao Nesta fase deve preparar os dados (transformar dados para estabilizar a vari- ˆancia e diferenciar dados para obter uma s´erie estacion´aria). Deve-se exami- nar os dados, o gr´afico do tempo da s´erie em estudo. A an´alise desse gr´afico pode indicar a presen¸ca de tendˆencia ou altera¸c˜ao de variˆancia, revelando se a s´erie ´e ou n˜ao estacion´aria. An´alise da fun¸c˜oes de autocorrela¸c˜oes simples (FAC) e fun¸c˜oes de autocorrela¸c˜oes parciais (FACP), indica qual o modelo a ser utilizado, bem como auxilia no uso dos testes de ra´ızes unit´arias para confirmar a estacionariedade. O objetivo da identifica¸c˜ao ´e determinar os va- lores de p, d e q do modelo ARIMA(p,d,q), al´em de estimativas preliminares dos parˆametros a serem usadas no est´agio de estima¸c˜ao. Procedimentos: a) verificar se existe a necessidade de uma transforma¸c˜ao na s´erie original; b) tornar a s´erie estacion´aria por meio de diferen¸cas; c) identificar o processo ARIMA(p,d,q) resultante.
  • 17. Fase 2. Estima¸c˜ao Nessa fase o objetivo passa por estimar os modelos candidatos a ser sele- cionados ap´os a identifica¸c˜ao, procede-se a an´alise dos modelos e definir os modelos que poder˜ao ser definidos como o modelo definitivo. Fase 3. Teste de Diagn´ostico Consiste em diagnosticar se o modelo descreve adequadamente a s´erie de dados objeto da an´alise. Nos modelos de s´eries temporais assume-se a exis- tˆencia de um processo erg´odico, que ´e um elemento fulcral na estima¸c˜ao. Quando a s´erie possui esta propriedade pode dizer-se que os parˆametros s˜ao significativos. Portanto, se a s´erie for estacion´ario e erg´odico ent˜ao as s´eries convergem aos verdadeiros parˆametros populacionais. A an´alise dos res´ıduos de modelo torna-se decisiva na escolha do modelo final. Casos os res´ıduos sejam autocorrelacionados, a dinˆamica da s´erie n˜ao pode ser explicada pelos coeficientes autocorrela¸c˜ao do modelo. Portando, deve excluir-se do processo de escolha o modelo que apresente a autocorrela¸c˜ao residual. O melhor modelo ser´a escolhido baseado em crit´erio de escolha. Existe diferentes crit´erios para escolha de modelos candidatos a estima¸c˜ao: • Crit´erio de Informa¸c˜ao de Akaike (AIC): S˜ao alguns procedimentos de identifica¸c˜ao utilizados que minimizam fun¸c˜oes penalizadoras particulares. Consideram n˜ao apenas a qualidade do ajuste, mas tamb´em penalizam a inclus˜ao de parˆametros extras. Os crit´erios de informa¸c˜ao s˜ao utilizados para compara¸c˜ao de modelos e que levam em conta a variˆancia do erro, o tamanho da amostra N e os valores de p, q. Regra b´asica: selecionar o modelo cujo crit´erio de informa¸c˜ao calculado seja m´ınimo. AIC(k, l) = lnσ2 k,l + 2(k + l) N (11) Sendo k e l os valores de p e q respetivamente, do modelo ARMA(p,q) que se deseja calcular o crit´erio. σ2 k,l representa o estimador de m´axima
  • 18. verosimilhan¸ca e N ´e o n´umero de observa¸c˜oes da s´erie. A ideia do modelo ´e escolher os valores de k e l que minimizam o valor de AIC, indicando que s˜ao os melhores valores para a defini¸c˜ao de um modelo ARMA(k,l). Os crit´erios de informa¸c˜ao s˜ao utilizados para compara¸c˜ao de modelos e que levam em conta a variˆancia do erro, o tamanho da amostra N e os valores de p e q . • Crit´erio de Informa¸c˜ao Bayesiano ou Crit´erio de Schwarz (BIC): pre- mia o melhor ajuste, que por sua vez ´e medido pelo quadrado dos er- ros, sendo escolhido o menor deles e penaliza aqueles que possuem um grande n´umero de parˆametros. ´E utilizada para diferentes modelos, mas para os mesmos dados. AIC(k, l) = lnσ2 k,l + 2(k + l) N (12) • Crit´erio de Erro Quadr´atico M´edio (EQM): todas as previs˜oes contˆem uma parcela de erro ou res´ıduo no resultado apresentado. E esses erros, segundo os autores Chase et al. (2006) podem ser de dois tipos: erros sistem´aticos ou erros aleat´orios. Os erros sistem´aticos correspondem aos erros cometidos de forma consistente. Os erros aleat´orios s˜ao os erros que n˜ao podem ser explicados pelo modelo de previs˜ao usado, sendo o melhor modelo aquele que minimiza as medidas de erro. Erro Quadr´atico M´edio ´e obtido atrav´es da equa¸c˜ao: EQM = 1 H | Zt − Zt | (13) Em linhas gerais, dentre os v´arios modelos apresentados, escolhe-se aquele que apresenta o menor AIC e BIC. Salienta-se tamb´em que a escolha dever´a levar em considera¸c˜ao os modelos parcimoniosos, ou seja, aqueles que apre- sentam o menor n´umero de parˆametros. Por fim, ´e recomend´avel que esses crit´erios sejam avaliados conjuntamente, pois s˜ao complementares e n˜ao ex- cludentes. Consideram n˜ao apenas a qualidade do ajuste, mas tamb´em penalizam a inclus˜ao de parˆametros extras.
  • 19. O melhor modelo ´e aquele que apresenta os menores valores de AIC e BIC entre os modelos candidatos. E tamb´em apresenta o menor Erro Quadr´atico M´edio. Fase 4. Previs˜ao A ´ultima etapa consiste em fazer a previs˜ao, isto ´e, prever os valores futuros. Pode ser feitas de duas formas distintas: • para prever valores futuros, aqueles que ainda n˜ao existem, chamada de previs˜ao ex-ante. • para fazer a previs˜ao dos valores j´a existente, denominada de previs˜ao ex-post. A partir do momento que conseguimos identificar e estimar um modelo ARIMA adequado `as observa¸c˜oes, vamos ent˜ao estudar m´etodos que possa- mos utilizar a modelagem ARIMA para prever os valores das observa¸c˜oes h passos a frente.
  • 20. 5 Resultado e discuss˜ao Neste cap´ıtulo apresenta-se a an´alise descritiva da s´erie em estudo, assim como a aplica¸c˜ao dos m´etodos de previs˜ao j´a apresentados. De seguida o procedimento adotado para a previs˜ao e o seu valor para um ano t´ıpico. Por fim, apresenta-se uma conclus˜ao onde fez-se a an´alise da previs˜ao obtida. Para a identifica¸c˜ao do modelo, ou seja, para a determina¸c˜ao das ordens p (parte auto-regressiva), d (quantidade de diferencia¸c˜ao) e q (parte dos termos de erros defasados – m´edia m´ovel) gerou-se correlogramas. Com as fun¸c˜oes de autocorrela¸c˜ao parcial (FAC) e de autocorrela¸c˜ao simples (FACP) calcu- ladas, determinou-se a ordem apropriada dos componentes AR e MA. Para a determina¸c˜ao da presen¸ca ou n˜ao de raiz unit´aria (s´erie n˜ao estacion´aria) utilizou-se o teste de Dickey-Fuller Aumentado (DFA) e, para determina¸c˜ao dos n´umeros ´otimos de defasagens das p diferen¸cas a considerar, utilizou-se os crit´erios de informa¸c˜ao da Akaike (AIC) e de Schwarz (BIC). A estima¸c˜ao do modelo foi feita com a utiliza¸c˜ao dos softwares Gretl e R. Anteriormente a previs˜ao de vendas, foi feita a an´alise descritiva da s´erie temporal, que tem como objetivo apresentar os dados observados sob a forma de tabelas e de medidas descritivas, estudando-se a distribui¸c˜ao da vari´avel, acompanhada de medidas resumos que tornem mais f´acil uma primeira an´a- lise de dados e ainda a obten¸c˜ao de valores num´ericos que os caraterizam globalmente. Segundo Bussab e Morettin (2003) a an´alise descritiva tem como prop´osito sintetizar um conjunto de valores da mesma natureza, permitindo, dessa forma, que se tenha uma vis˜ao global da varia¸c˜ao desses valores. Ela organiza e descreve os dados. Da aplica¸c˜ao pr´atica, duma an´alise breve, descritiva e sucinta, podemos concluir que de acordo com a Tabela 2 a m´edia ´e de 43,7530. Sendo que o valor m´aximo e m´ınimo da s´erie ´e de 104,991 e 11,8 respetivamente. No que tange `a medida de tendˆencia n˜ao central, o desvio padr˜ao ´e de 21,1499 e o coeficiente de varia¸c˜ao em rela¸c˜ao a m´edia ´e de 0,48 (aproximadamente 48,3%).
  • 21. Tabela 2: Estat´ıstica descritiva da s´erie temporal em estudo Estat´ısticas Descritivas, usando as observa¸c˜oes 2000:01–2014:122 para a vari´avel Vendas (180 observa¸c˜oes v´alidas) M´edia Mediana M´ınimo M´aximo 43,7530 38,5350 11,8000 104,991 Desvio Padr˜ao C.V. Enviesamento Ex. kurtosis 21,1499 0,483393 0,921452 −0,00623860 Ao estudar uma s´erie temporal temos de construir gr´afico para observar a sua evolu¸c˜ao no tempo. O que pode ser bastante esclarecedor e permite identificar como evolui a tendˆencia da s´erie, se existe ou n˜ao sazonalidade e se ocorrem observa¸c˜oes aberrantes. 10 20 30 40 50 60 70 80 90 100 110 2000 2002 2004 2006 2008 2010 2012 2014 Vendas Figura 1: Comportamento da s´erie em Estudo Do exame do Figura 1 identificou-se padr˜oes n˜ao aleat´orios como: uma tendˆencia crescente e decrescimento em vendas, uma sucess˜ao regular de “pi- cos e vales”de vendas e existˆencias de flutua¸c˜oes sazonais. O que poder´a indi- car a n˜ao estacionariedade da s´erie. Estes padr˜oes poderiam ser incorporados a um modelo estat´ıstico, possibilitando fazer previs˜oes que auxiliar˜ao na to-
  • 22. mada de decis˜oes. Quanto `a tendˆencia, pode verificar-se que esta encontra-se presente na s´erie com um declive negativo. Teste de Dickey-Fuller Aumentado Para analisar se a s´erie ´e ou n˜ao estacion´aria procedeu-se ao teste da estaci- onariedade da s´erie temporal que permite realizar os testes de Dickey-Fuller Aumentado. A partir do teste de Dickey-Fuller formula-se as hip´oteses: • H0: tem raiz unit´aria (n˜ao ´e estacion´aria); • H1: n˜ao tem raiz unit´aria (´e estacion´aria); Figura 2: Teste de Dickey-Fuller incluindo 11 desfasamentos
  • 23. Como a estat´ıstica do teste tau (calculado) ´e -1,52099 maior que ttabela = -3,51, n˜ao temos condi¸c˜oes para rejeitar H0, logo conclui-se que a s´erie tem raiz unit´aria (n˜ao ´e estacion´aria). A Figura 3 ostenta o gr´afico QQ-Normal. Da sua observa¸c˜ao conclui-se que os dados n˜ao se adequam `a normalidade, visto que outliers em extremos ”esticam”os valores de modo a n˜ao cumprirem normalidade. -20 0 20 40 60 80 100 120 -20 0 20 40 60 80 100 120 Normal quantiles Q-Q plot para Vendas Figura 3: Gr´afico QQ-Normal An´alise das fun¸c˜oes de autocorrela¸c˜oes Simples e de de autocorrela¸c˜oes parciais O comportamento das fun¸c˜oes de autocorrela¸c˜oes simples e autocorrela¸c˜oes parciais auxiliam na verifica¸c˜ao da estacionariedade e na proposi¸c˜ao do mo- delo. Quando no correlograma o coeficiente de correla¸c˜ao inicial se mostra ele- vado e com o crescimento das defasagens k este comportamento declina lenta- mente, ´e carater´ıstico de uma s´erie n˜ao estacion´aria como mostra a Figura 1. Analisando a Figura 4, nota-se uma tendˆencia sistem´atica de queda ao longo do tempo, contudo, parece menos acentuada nas datas mais recentes.
  • 24. Esta tendˆencia de queda sistem´atica ´e t´ıpica de s´eries n˜ao estacion´arias. Tam- b´em se percebem picos seguidos de quedas, ao longo do tempo, caraterizando uma poss´ıvel sazonalidade, comum em s´eries econ´omicas mensais. A fun¸c˜ao autocorrela¸c˜ao simples (FAC) auxilia na verifica¸c˜ao da estacionariedade da s´erie e na determina¸c˜ao da sazonalidade, como demonstra a Figura 4. Com a an´alise do correlograma, Figura 4, confirma-se o diagn´ostico da n˜ao estacionariedade da s´erie, pois quando uma s´erie ´e estacion´aria logo nas pri- meiras defasagens o coeficiente de autocorrela¸c˜ao tende a cair abruptamente para zero. -1 -0,5 0 0,5 1 0 5 10 15 20 desfasamento ACF para Vendas +- 1,96/T^0,5 -1 -0,5 0 0,5 1 0 5 10 15 20 desfasamento PACF para Vendas +- 1,96/T^0,5 Figura 4: Correlogramas das FAC (ACF) e FACP (PAFC) da s´erie Vendas Tamb´em nota-se no correlograma, uma carater´ıstica sazonal da s´erie, com uma oscila¸c˜ao da fun¸c˜ao autocorrela¸c˜ao simples, t´ıpica de s´eries sazonais. Desta forma, uma s´erie temporal n˜ao estacion´aria pode ser transformada em estacion´aria atrav´es do c´alculo de diferen¸cas tomadas d vezes a partir de seus valores originais. Neste caso, utilizou-se as primeiras diferen¸cas. Na Figura 5, pode observar-se que em rela¸c˜ao `as primeiras diferen¸cas, n˜ao se observa nitidamente nenhuma tendˆencia. Al´em disso, as m´edias e as variˆancias entre os per´ıodos de tempo, conquanto n˜ao sejam uniformes,
  • 25. apresentam um padr˜ao menos irregular do que aqueles observados na s´erie original. Logo, ´e aceit´avel dizer que a s´erie diferenciada est´a mais pr´oxima da estacionariedade do que a s´erie original. Com base neste diagn´ostico, deve aplicar-se uma diferen¸ca sequencial e tamb´em uma sazonal para conseguir a estacionariedade da s´erie. A s´erie temporal deve ser transformada para torna-la estacion´aria em rela¸c˜ao `a sua m´edia e variˆancia. Como a s´erie em estudo n˜ao ´e estacion´aria fez-se a primeira diferen¸ca para ver se a s´erie com primeira diferen¸ca torna-se estacion´aria: -80 -60 -40 -20 0 20 40 60 80 2000 2002 2004 2006 2008 2010 2012 2014 d_Vendas Figura 5: Primeira diferen¸ca da s´erie vendas Da observa¸c˜ao da Figura 5 pode concluir sobre a poss´ıvel estacion´aria da s´erie, embora apresenta vales no anos de 2004 e 2011. Nota-se a n˜ao existˆencia de tendˆencia, sazonalidade na s´erie e tamb´em que os dados flutuam em torno de uma m´edia e a variˆancia constante. Teste de Dickey-Fuller Aumentado Assim procedemos a aplicar o Teste de Dickey-Fuller Aumentado e avalia- ¸c˜ao do gr´afico QQ-Normal para confirmar a estacionaridade com a primeira diferen¸ca da s´erie. Da an´alise da Figura 6 observa-se que a estat´ıstica do teste tau ´e menor
  • 26. (-8,68) que ttabela (-3,51), ent˜ao rejeita a hip´otese nula e conclui-se que a s´erie ´e estacion´aria (n˜ao tem raiz unit´aria).
  • 27. Figura 6: Teste de Dickey-Fuller para a primeira diferen¸ca A estacionariedade dos res´ıduos foi diagnosticada para confirmar a esta- cionariedade das s´eries. Todas apresentaram res´ıduos ru´ıdo-branco. Estes resultados foram refor¸cados a partir da realiza¸c˜ao do teste da raiz unit´aria de Dickey-Fuller Aumendado, que indicou que as s´eries eram estacion´arias em primeira diferen¸ca. Figura 7: Teste de Normalidade para primeira diferen¸ca da s´erie Da an´alise dos resultados Figura 7 observa-se que o valor de pvalues para todos os testes de normalidade (Teste de Doornik-Hansen, W de Shapiro-
  • 28. Wilk, Teste de Lilliefords e teste de Jarque-Bera) ´e menor que α = 5% (n´ıvel de significˆancia). A Figura 7 exibe o teste de normalidade atrav´es do gr´afico QQ-Normal. -80 -60 -40 -20 0 20 40 -40 -30 -20 -10 0 10 20 30 40 Normal quantiles Q-Q plot para d_Vendas Figura 8: QQ-Normal para Primeira diferen¸ca da s´erie As Figuras 9 e 10 ilustram a compara¸c˜ao da normalidade entre a s´erie de vendas e a primeira diferen¸ca da s´erie vendas. Analisando as duas Figuras ( 9 e 10) observa-se que a Figura 10 (com primeira diferen¸ca de vendas) ´e estacion´aria o que n˜ao acontece com a Figura 9, visto que, quase todas as observa¸c˜oes est˜ao ajustadas a reta estimada da QQ-Normal da Figura 10. -20 0 20 40 60 80 100 120 -20 0 20 40 60 80 100 120 Normal quantiles Q-Q plot para Vendas Figura 9: QQ-Normal da s´erie (sem diferen¸ca) -80 -60 -40 -20 0 20 40 -40 -30 -20 -10 0 10 20 30 40 Normal quantiles Q-Q plot para d_Vendas Figura 10: QQ-Normal da pri- meira diferen¸ca da s´erie
  • 29. An´alise das fun¸c˜oes de autocorrela¸c˜oes Simples e de de autocorrela¸c˜oes parciais Uma vez determinada a diferencia¸c˜ao necess´aria para fazer com que os dados tornem-se estacion´arios, identifica-se as ordens apropriadas dos parˆametros de M´edias M´oveis MA(p) e de Auto-Regressivo AR(p) dos potencias mode- los. Utilizando coeficientes de autocorrela¸c˜ao simples (FAC) identificam-se as ordens dos parˆametros de (AR) (p) e utilizando a autocorrela¸c˜ao par- cial (FACP) da s´erie estacion´aria identificam-se as ordens dos parˆametros de (MA) (q). O comportamento dessas fun¸c˜oes auxilia na verifica¸c˜ao da estacionarie- dade e na proposi¸c˜ao do modelo. Al´em de ajudar-nos a descrever os dados, a fun¸c˜ao de autocorrela¸c˜ao tamb´em nos ajuda a verificar a estacionariedade, escolher modelos e fazer diagn´osticos sobre regress˜oes ou at´e a identificar a presen¸ca de sazonalidade (Enders, 2009). A fun¸c˜ao de autocorrela¸c˜ao (ρk) d´a-nos a correla¸c˜ao entre duas vari´aveis espa¸cadas por um tempo lag k (desfasamento/lag), ao caraterizar o desen- volvimento de Zt ao longo do tempo, demonstrando o qu˜ao forte o valor observado, atual, est´a correlacionado com os valores observados no passado e como os choques, hoje afetam valores futuros da vari´avel estoc´astica. A Figura 11 ostenta as fun¸c˜oes de autocorrela¸c˜oes (FAC) e autocorrela- ¸c˜oes parciais(FACP) da s´erie vendas revelando que as autocorrela¸c˜oes (FAC) apresentam decaimento exponencial, t´ıpico do processo auto-regressivo, e o correlograma da fun¸c˜ao autocorrela¸c˜oes parciais, apresenta a primeira defa- sagem (lag) diferentes de zero significativamente. Assim, h´a uma indica¸c˜ao de que a ordem do modelo autoregressivo ´e p = 1, no caso um modelo AR(1).
  • 30. -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 0 5 10 15 20 desfasamento ACF para d_Vendas +- 1,96/T^0,5 -0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4 0 5 10 15 20 desfasamento PACF para d_Vendas +- 1,96/T^0,5 Figura 11: Correlogramas das FAC e FACP da s´erie vendas (primeira dife- ren¸ca) Com as diferencia¸c˜oes, a s´erie mostra-se sem tendˆencia (Figura 5), e es- tabilizada em torno de sua m´edia de valor zero. Da observa¸c˜ao do correlograma amostral (gr´afico ρk contra o lag k), pode concluir-se, por exemplo, que a s´erie apresenta correla¸c˜ao de curta dura¸c˜ao se as primeiras correla¸c˜oes forem elevadas, mas descerem rapidamente para zero, isto ´e, cada observa¸c˜ao da s´erie apenas relaciona-se com as observa¸c˜oes mais recentes. A fun¸c˜ao de autocorrela¸c˜ao parcial d´a-nos a correla¸c˜ao entre a vari´avel no instante t e um dos seus desfasamentos, retirando os efeitos de outros desfasamentos. Ou seja, define a correla¸c˜ao entre as observa¸c˜oes Zt e Zt−k removendo o efeito das observa¸c˜oes entre Zt−k e Zt (Cryer e Chan, 2008). A fun¸c˜ao de autocorrela¸c˜ao decai exponencialmente, ind´ıcio de processo Auto-regressivo (AR). Nesse caso, a fun¸c˜ao de autocorrela¸c˜ao parcial ajuda a determinar a ordem do processo. Assim, a partir das fun¸c˜oes de autocorrela- ¸c˜ao estimadas, tentamos identificar um padr˜ao que se comporte teoricamente com algum modelo.
  • 31. 5.1 Crit´erio de Escolha do melhor Modelo ARIMA Para prever uma s´erie temporal atrav´es dos modelos ARIMA, torna-se neces- s´ario identificar a ordem dos parˆametros p, d, q. O primeiro parˆametro a ser identificado ´e o grau de diferencia¸c˜ao d necess´ario `a estabiliza¸c˜ao dos dados. Atrav´es de um exame do correlograma, ou seja, do diagrama da fun¸c˜ao de au- tocorrela¸c˜ao (FAC), no qual s˜ao apresentados os valores das autocorrela¸c˜oes em rela¸c˜ao aos lags k. Se as autocorrela¸c˜oes decrescerem de forma exponencial, realizam-se di- ferencia¸c˜oes na s´erie, at´e que o diagrama apresente um corte abrupto para um valor qualquer de autocorrela¸c˜ao, quando a s´erie ser´a considerada esta- cion´aria. A ordem auto-regressiva p ´e determinada pela verifica¸c˜ao da fun¸c˜ao de autocorrela¸c˜ao parcial (FACP) da s´erie vendas. Se a s´erie for unicamente auto-regressiva ARIMA(p,d,0), sua fun¸c˜ao de autocorrela¸c˜ao parcial sofrer´a uma queda repentina ap´os o lag k. Se n˜ao, efetua-se uma an´alise dos estima- dores para verificar at´e que ordem de defazagem do correlograma desta fun¸c˜ao ele ´e estatisticamente significante. Essa ser´a sua ordem auto-regressiva. A partir dos modelos sugeridos pela ordem de integra¸c˜ao propostos pelo correlograma, procedeu-se a escolha dos modelos candidatos `a previs˜ao. Neste ponto os modelos selecionados seriam aqueles que apresentassem menor AIC e SIC.
  • 32. Tendo em conta os crit´erios AIC e BIC foi escolhido do modelo ARIMA(4,1,1) visto que apresenta menor AIC e BIC, de 1272,61, 1291,32 respetivamente. Tabela 3: Escolha de modelo a Previs˜ao ARIMA (p, d, q) AIC BIC EQM (1,0,0) 1282,80 1292,15 119,58 (1,1,0) 1284,04 1296,52 118,95 (1,1,4) 1285,44 1304,15 117,34 (1,1,3) 1286,67 1302,26 119,37 (3,1,1) 1281,63 1297,22 116,5 (3,1,2) 1276,88 1295,59 111,69 (3,0,2) 1384,25 1400,19 124,86 (3,1,3) 1280,77 1302,59 112,9 (2,1,4) 1279,83 1301,66 112,39 (4,1,1) 1272,61 1291,32 108,54 (4,1,2) 1274,53 1296,35 108,62 Podemos ver tamb´em que o modeloARIMA(4,1,2) apresenta AIC de 1272.61. Ent˜ao h´a diferen¸cas significativas entre modelo ARIMA(4,1,2) e ARIMA(4,1,1). Pelo crit´erio de EQM tamb´em o modelo ARIMA(4,1,1) apresenta-se como o melhor porque apresenta menor de EQM. Ent˜ao conclui-se pelos trˆes crit´erios (EQM, BIC e AIC) que o melhor modelo ´e ARIMA(4,1,1). Embora n˜ao havendo diferen¸cas significativas nos modelos ARIMA(4,1,2) e ARIMA(4,1,1) conforme a an´alise da Tabela 4. Tabela 4: Compara¸c˜ao entre modelo ARIMA(4,1,1) e ARIMA(4,1,2) ARIMA (p, d, q) AIC SIC EQM (4,1,1) 1272,61 1291,32 108,54 (4,1,2) 1274,53 1296,35 108,62 Como as diferen¸cas entre os dois modelos n˜ao ´e muito significativo ´e necess´ario ver quais dos dois modelos apresenta coeficientes estatisticamente
  • 33. significativa. O modelo ARIMA(4,1,1) apresenta as seguintes estat´ısticas: Tabela 5: Estat´ıstica do modelo ARIMA(4,1,1) Modelo 1: ARIMA, usando as observa¸c˜oes 2001:02–2014:12 (T = 167) Vari´avel dependente: (1 − Ls )d Vendas Erros padr˜ao baseados na Hessiana Coeficiente Erro Padr˜ao z valor p Φ1 −0,0542564 0,102634 −0,5286 0,5971 Φ2 0,0334261 0,0869356 0,3845 0,7006 Φ3 −0,175050 0,0796643 −2,1974 0,0280 ** Φ4 −0,317445 0,104566 −3,0358 0,0024 *** Θ1 −0,959193 0,464166 −2,0665 0,0388 ** M´edia var. dependente −0,008928 D.P. var. dependente 14,16862 M´edia de inova¸c˜oes −0,266279 D.P. das inova¸c˜oes 9,346753 Log. da verosimilhan¸ca −630,3075 Crit´erio de Akaike 1272,615 Crit´erio de Schwarz 1291,323 Hannan-Quinn 1280,208 Zt = −0, 054Zt−1 + 0, 033Zt−2 − 0, 175Zt−3 − 0, 317Zt−4 − 0, 959at−1 (14) O modelo acima apresenta trˆes coeficientes estatisticamente significativa para n´ıvel de significˆancia (α) 5%. Visto que o valor da estat´ıstica pvalues ´e menor do que 0,05.
  • 34. O modelo ARIMA(4,1,2) apresenta as seguintes estat´ısticas: Tabela 6: Estat´ıstica do modelo ARIMA(4,1,2) Modelo 2: ARIMA, usando as observa¸c˜oes 2001:02–2014:12 (T = 167) Vari´avel dependente: (1 − Ls )d Vendas Erros padr˜ao baseados na Hessiana Coeficiente Erro Padr˜ao z valor p Φ1 −0,207646 0,490365 −0,4235 0,6720 Φ2 0,0441978 0,0810759 0,5451 0,5857 Φ3 −0,164812 0,0770822 −2,1381 0,0325 ** Φ4 −0,335863 0,0990408 −3,3912 0,0007 *** Θ1 −0,818196 0,617829 −1,3243 0,1854 Θ2 −0,181803 0,568292 −0,3199 0,7490 M´edia var. dependente −0,008928 D.P. var. dependente 14,16862 M´edia de inova¸c˜oes −0,271453 D.P. das inova¸c˜oes 9,212137 Log. da verosimilhan¸ca −630,2663 Crit´erio de Akaike 1274,533 Crit´erio de Schwarz 1296,358 Hannan–Quinn 1283,391 Pode-se constatar que coeficientes de Φ1, Φ2, Φ3, Θ1 e Θ2 n˜ao s˜ao esta- tisticamente significativos no teste t. Indicando um ajustamento n˜ao ideal. Zt = −0, 207Zt−1+0, 044Zt−2−0, 164Zt−3−0, 335Zt−4−0, 818at−1−0, 181at−2 (15) Como o modelo ARIMA(4,1,2) apresenta maioria dos coeficientes n˜ao es- tatisticamente significativos, optamos pelo modelo ARIMA(4,1,1) que apre- senta maior n´umeros de parˆametros consistentes, menor valor de AIC, BIC, embora ostenta maior valor de EQM. Logo o modelo ARIMA(4,1,1) apre- senta como o melhor modelo para a previs˜ao.
  • 35. 5.2 Previs˜ao com Modelo ARIMA A partir do momento que conseguiu-se identificar e estimar um modelo ARIMA adequado `as observa¸c˜oes, permitindo a descri¸c˜ao da s´erie tempo- ral, vai-se prever os valores das observa¸c˜oes h passos a frente utilizando a modelagem ARIMA. ´E importante ressaltar que previs˜oes utilizando mode- los ARIMA ser˜ao eficazes para um per´ıodo curto e as melhores previs˜oes ser˜ao aquelas que apresentam um erro quadr´atico m´edio (EQM) m´ınimo. Foi utilizado o modelo ARIMA(4,1,1) na previs˜ao de vendas para os pr´o- ximos meses. A Figura7 exibe o intervalo de confian¸ca para os coeficientes estimados com 95% de confian¸ca. t(162, 0, 025) = 1, 960 Tabela 7: IC para coeficientes do modelo ARIMA(4,1,1) Coeficiente Intervalo de confian¸ca a 95% Φ1 −0,0542564 −0,255416 0,146903 Φ2 0,0334261 −0,136965 0,203817 Φ3 −0,175050 −0,331190 −0,0189113 Φ4 −0,317445 −0,522390 −0,112501 Θ1 −0,959193 −1,86894 −0,0494456 A Figura 12 ilustra o ajustamento entre o modelo ajustado e a s´erie inicial. Com o prop´osito de verificar se existe um desajuste pronunciado entre o modelo ajustado e a s´erie inicial.
  • 36. -80 -60 -40 -20 0 20 40 60 80 2000 2002 2004 2006 2008 2010 2012 2014 d_Vendas Efectivo e ajustado d_Vendas Modeloajustado d_Vandas Figura 12: Ajustamento do modelo ajustado a s´erie inicial -70 -60 -50 -40 -30 -20 -10 0 10 20 30 40 2008 2009 2010 2011 2012 2013 2014 2015 2016 d_Vendas predição intervalo a 95 por cento Figura 13: Previs˜ao para do modelo ARIMA(4,1,1) A Figura 13 exibe a previs˜ao da s´erie vendas na amostra e fora da amostra (ano 2015). Da an´alise do mesmo observa-se h´a uma tendˆencia para as vendas aumentar de janeiro a junho e para diminu´ırem de julho a dezembro.
  • 37. 6 Conclus˜ao Este trabalho teve como prop´osito produzir previs˜ao de vendas por configu- ra¸c˜oes de modelos que apresentam bom desempenho preditivo e parˆametros consistentes em suas significˆancias estat´ısticas. Modelos com parˆametros n˜ao significativos at´e podem gerar boas previs˜oes para um per´ıodo espec´ıfico, mas quando testados para outros per´ıodos n˜ao mostram bom desempenho. Po- r´em, nesta pesquisa, constatou-se que modelo utilizado na previs˜ao, mesmo com alguns parˆametros n˜ao significativos, tiveram boa performance predi- tiva em todos os per´ıodo de previs˜ao. Conclui-se tamb´em que o objetivo da an´alise de s´eries temporais ´e identificar padr˜oes n˜ao aleat´orios na s´erie temporal de uma vari´avel de interesse e a observa¸c˜ao deste comportamento passado pode permitir fazer previs˜oes sobre o futuro, orientando a tomada de decis˜oes. A principal conclus˜ao ´e a de que a metodologia de previs˜ao de Box-Jenkins ´e muito ampla, flex´ıvel e altamente subjetiva, mas, tamb´em ´e uma importante ferramenta de gest˜ao, que pode auxiliar o processo de tomada de decis˜ao e planeamento futuro. Apesar da modelagem ARIMA apresentar um adequado poder de previs˜ao de curto prazo, recomenda-se, em outros trabalhos de pesquisa, proceder `a estima¸c˜ao, utilizando outros modelos que n˜ao foram considerados neste momento. Em rela¸c˜ao a previs˜ao de vendas observou-se que sempre h´a uma tendˆen- cia para aumentar no mˆes de janeiro a junho e diminu´ırem no mˆes de julho – dezembro. No que tange aos crit´erios para escolha de modelos candidatos a estima¸c˜ao, os crit´erios de Informa¸c˜ao de Akaike (AIC), crit´erio de Erro Qua- dr´atico M´edio (EQM) e crit´erio de Informa¸c˜ao Bayesiano (SIC) indicaram como o melhor modelo ARIMA(4,1,1) para a previs˜ao. Estes resultados demonstram que a previs˜ao de vendas utilizando a meto- dologia de previs˜ao deBox-Jenkins ´e uma t´ecnica promissora para solucionar estes tipos de problemas, pois n˜ao exige uma grande quantidade de dados hist´oricos, os modelos s˜ao bastante precisos, a formula¸c˜ao e entendimento pelo pesquisador ´e relativamente f´acil, e exige pouco tempo computacional.
  • 38. Referˆencias ARCHER, B. Forecasting Demand. International Jurnal of Tourism Mana- ement. v. 1, n. 1, p. 5-12, 1980. BOX, G. P. E., Jenkins, G. M. e Reinsel, G. (1994). Time Series Analysis: Forecasting and Control, 3rd Edition, Prentice-Hall. LUSTOSA, L. J.; MESQUITA, M. A.; QUELHAS, O. G.; OLIVEIRA, R. J. Planejamento de controle da produ¸c˜ao. Rio de Janeiro: Elsevier, 2008. MAKRIDASKIS, S. The art and science of forecasting: An assessment and future directions. International Jounar Of Forecasting, v. 2, p. 15-39, 1986. ENDERS, W. (2009), Applied Econometric Time Series, Wiley Series in Probability and Statistics, Wiley FALKENBERG, A. V.; DIMINSKY A. S.; RIBEIRO, E. P. Redes neurais artificiais aplicadas `a previs˜ao de consumo de ´agua. In: CONGRESSO BRASILEIRO DE REDES NEURAIS, 6., 2003, S˜ao Paulo. Anais VI Congresso Brasileiro de Redes Neurais. S˜ao Paulo: Centro Universit´ario da FEI, 2003. p. 319-324. MORETTIN, Pedro A. e TOLOI, Cl´elia M. S´eries Temporais. 2a ed. Editora Atual, 1987. HANKE J. E.; WCHERN D. W.; REITSCH, A. G. Business Forecasting. 7. ed., New York USA: Prentice Hall, 2001. GRANER; NEWBOLD, Forecasting Economic Time Series, Academic Press, NY, 1977. GUJARATI, D. (2006), Econometria B´asica, Elsevier. RHOADES, S. D.; WALSKI, T. M. Using Regression Analysis to Project Pumpage. Journal of American Water Work Association, AWWA, De- cember 1991. FALKENBERG, A. V. Previs˜ao de consumo urbano de ´agua em curto prazo. Disserta¸c˜ao de Mestrado. Universidade Federal do Paran´a UFPR. Curi- tiba. 2005. WALSKI, T.; CHASE D. V.; SAVIC, D. A. Water Distribution Modeling. Waterbury, CT. USA: Haestad Press, 2003. TRAUTWEIN, B. Avalia¸c˜ao de m´etodos para previs˜ao de consumo de ´agua
  • 39. para curt´ıssimo prazo: Um estudo de caso em empresa de saneamento. Disserta¸c˜ao de Mestrado. Pontif´ıcia Universidade Cat´olica do Paran´a, PUC-PR. Curitiba. 2004.
  • 40. 7 Anexo C´odigo em R 1 # ##==##==##==##==##==##==##==##==##==##==##==##==##==##=##=## 2 #==## ESTUDO DE S RIE TEMPORAL EM R =## 3 # ##==##==##==##==##==##==##==##==##==##==##==##==##==##=##=## 4 5 ### 6 ##Instalando os packages 7 install.packages("forecast") 8 install.packages("RMySQL") 9 install.packages("MASS") 10 install.packages("lubridate") 11 install.packages("Hmisc") 12 install.packages("tseries") 13 install.packages("ggplot2") 14 install.packages("devtools") 15 16 ##Bibiotecas em Para S rie Temporais 17 require(Rssa) 18 require(forecast) 19 library(Rssa) 20 library(forecast) 21 22 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas. csv",sep=";",header=TRUE) 23 serietemporal 24 attach(serie) 25 names(serie) 26 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico com eixo tempo e vendas 27 plot (( serie),col=4,main=’Vendas ’,xlab=’Meses ’,ylab=’vendas ’) 28 29 #Primeira D i f e r e n a 30 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas. csv",sep=";",header=TRUE) 31 serietemporal 32 diff(Vendas) 33 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico com eixo tempo e vendas 34 serie 35 plot (( diff(serie)),col=4,main=’Vendas - 1a d i f e r e n a ’,xlab=’ meses ’,ylab=’vendas ’) 36 37 #Segunda D i f e r e n a 38 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas. csv",sep=";",header=TRUE) 39 serietemporal 40 diff(diff(diff(Vendas)))
  • 41. 41 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico com eixo tempo e vendas 42 serie 43 plot(diff (( diff(serie))),col=4,main=’Vendas - 2a d i f e r e n a ’, xlab=’meses ’,ylab=’vendas ’) 44 45 #Trabalhando Primeira D i f e r e n a 46 serietemporal <-read.table(" P r e v i s o Modelo ARIMA Agriculas. csv",sep=";",header=TRUE) 47 serietemporal 48 #diff(Vendas) 49 serie=ts(serietemporal ,start =2000 , frequency =12) # g r fico com eixo tempo e vendas 50 serie 51 plot (( diff(serie)),col=4,main=’Vendas - 1a d i f e r e n a ’,xlab=’ meses ’,ylab=’vendas ’) 52 #Componente sazonal para lag =11 53 diff(diff(serie),lag.max =11) 54 plot(ts(diff(serie),lag.max =11) ,col=2,main=’VENDAS - 1a d i f e r e n a simples e 1a sazonal ’,xlab=’meses ’,ylab=’Valores em Reais (valores e milhares)’) 55 56 # F u n A u t o c o r r e l a (FAC) e A u t o c o r r e l a parcial (FACp) com defasagem 11: 57 par(mfrow=c(1,1)) 58 FAC=acf(diff(serie), main=’ACF Primeira d i f e r e n a ’) 59 FACp=pacf(diff(serie), main=’PACF Primeira d i f e r e n a ’) 60 A 61 ap 62 63 # D e t e n de Sazonalidade 64 Detsaz = ts(na.omit(diff(serie), frequency =30)) 65 plot(Detsaz) 66 decomp = stl(Detsaz , s.window="periodic") 67 deseasonal_cnt <- seasadj(decomp) 68 plot(decomp) 69 70 #Dickey -Fuller Test 71 adf.test(Detsaz , alternative = "stationary") 72 73 # E s t i m a do modelo ARIMA: 74 #Modelo (1,1,3) 75 arima(diff(serie),order=c(1,1,3)) 76 x.fit <- arima(diff(serie),order=c(1,1,3)) 77 x.fit 78 79 #Modelo (4,1,1) 80 arima(diff(serie),order=c(4,1,1)) 81 x.fit <- arima(diff(serie),order=c(4,1,1)) 82 x.fit 83 summary(x.fit) # e s t a t stica do modelo 84 arima(x.fit)
  • 42. 85 forecast(arima(x.fit)) 86 # Acuracia da p r e v i s o 87 library(forecast) 88 accuracy(x.fit) 89 90 # p r e d i para 12 meses 91 library(forecast) 92 pred <-forecast(x.fit , 12) 93 plot(forecast(x.fit , 12)) 94 plot(pred ,type="l",xlab = "Ano",ylab = "Vendas",lwd = 2,col = ’red’,main=" P r e d i usando Modelo ARIMA") 95 96 #plot(forecast(arima(diff(serie)),xlab =" Time",ylab =" Number of births ") #SS5 time series from ’90-’05 97 #lines(SS8 ,type ="l", ylim=R, col=" black ") #SS8 time series from ’90-’08 98 #plot(forecast(arima(diff(serie)), xlab =" Time", ylab =" Number of births ")