Análise de Séries Temporais

4.151 visualizações

Publicada em

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
4.151
No SlideShare
0
A partir de incorporações
0
Número de incorporações
24
Ações
Compartilhamentos
0
Downloads
117
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análise de Séries Temporais

  1. 1. Análise de Séries Temporais Thomás Freud de Morais Gonçalves Métodos Quantitativos 1. Introdução Série temporal corresponde a um conjunto de observações acerca de dados que guardam entre si uma relação temporal identificável e, comumente, definida para intervalos iguais de tempo. De modo geral, analisa-se uma série temporal com dois objetivos básicos, segundo afirma Karmel1: descrever o comportamento passado da série e analisar esse comportamento. Pode-se, matematicamente, definir uma série temporal pelos valores Y1, Y2,... Yn de uma variável Y qualquer, em função dos tempos t1, t2,... tn, de modo que Y seja uma função de t, como segue, conforme Spiegel2: ( ) (1.1) Uma série temporal decorrente de uma função como a equação (1.1) pode ser representada por meio de um gráfico de Y em função de t. O gráfico da Figura 1 representa os valores em série correspondentes ao índice de Preços ao Consumidor no Brasil, durante os anos 1980 até 2012. 90 80 Índice Nacional de Preços ao Consumidor - Amplo (IPCA) - No Brasil 1980-2013 Variação % Mensal 70 60 50 Fonte: Banco Central do Brasil/ Sistema Gerenciador de Séries Temporais 40 30 20 10 y = -0,0014x + 58,46 set/12 jul/11 mai/10 jan/08 mar/09 nov/06 jul/04 set/05 mai/03 mar/02 jan/01 nov/99 jul/97 set/98 mai/96 jan/94 mar/95 set/91 nov/92 jul/90 mai/89 jan/87 mar/88 nov/85 jul/83 set/84 mai/82 mar/81 -10 jan/80 0 Figura 1 – Índices de Preços ao Consumidor Amplo no Brasil 2. Características das Séries Temporais Um gráfico de uma série temporal contém movimentos característicos perceptíveis, estes podem ser identificados bastando que se observe o comportamento ao longo da série no decorrer do tempo. Pressupõe-se que estes componentes que influenciaram a série temporal no passado e no presente continuarão a persistir no futuro, deste modo, identificar e analisar tais fatores constitui-se na técnica de previsão de eventos futuros para uma mesma série. Existem, basicamente, quatro características – movimentos - inerentes a estas séries, quais sejam: 1 Karmel, Peter Henry; Polasek, M. Estatística geral e aplicada para economistas, São Paulo. Ed: Atlas, 1974. P.295 2 Spiegel, Murray R. Estatística. São Paulo. Ed. Makron Books, 1993. P.425
  2. 2. Tendência (T): Corresponde a um padrão persistente que descreve um comportamento geral e a longo prazo, podendo ser ascendente ou descendente, caracterizando uma direção para a curva; Efeito Cíclico (C), conforme Levine3: Corresponde a oscilações ou movimentos ascendentes ou descendentes ao longo de toda a série. Estes movimentos variam em termos de extensão, geralmente durando de 2 a 10 anos; Efeito Aleatório(A): Oscilações que não correspondem a Efeitos Cíclicos nem a Tendência da curva geralmente se classificam como efeito aleatório; Efeito Sazonal (S): Sazonalidade é um padrão que se repete na curva em intervalos regulares de tempo, podendo estar ainda mais evidente quando a série corresponde a dados mensais ou trimestrais. Geralmente tratam de eventos periódicos que ocorrem anualmente, como as vendas de fim de ano, por exemplo. 180 160 140 120 100 80 Varejo de Bens de Consumo na Região Metropolitana de São Paulo: 1990-2004 Fonte: Banco Central do Brasil/SGST 60 40 20 jan/04 jul/03 jan/03 jul/02 jul/01 jan/02 jan/01 jul/00 jan/00 jul/99 jan/99 jul/98 jan/98 jul/97 jul/96 jan/97 jan/96 jul/95 jan/95 jul/94 jul/93 jan/94 jan/93 jul/92 jan/92 jul/91 jul/90 jan/91 jan/90 0 Figura 2 – Varejo de Bens de Consumo na Região Metropolitana de São Paulo Observando a Figura 2 podemos identificar alguns dos fatores citados. Os pontos de máximo, ou picos, ao longo da linha representam o típico evento sazonal, coincidindo com as vendas de fim de ano. A linha tracejada, por outro lado, representa a tendência que segue a série, como é perceptível, identificamos uma tendência ascendente no decorrer do tempo. 3. Análise das Séries Temporais A análise de séries temporais consiste em técnicas matemáticas que buscam descrever os movimentos componentes – fatores – que se apresentam como características de uma série em particular. Considerando que um série temporal pode apresentar movimentos de Tendência (T), Cíclicos (C), Aleatórios (A) e Sazonais (S), de modo que Y seja um produto das variáveis T, C, A e S, variáveis estas que produzem os efeitos descritos na série. Logo, (1.2) 3 David M. Levine... [et al]. Estatística: teoria e aplicações: usando o Microsoft® Excel em português. Rio de Janeiro, Ed. LTC, 2012. P.615
  3. 3. Deste modo, a análise das séries temporais consiste em uma investigação dos fatores T, C, A e S e é frequentemente classificada como decomposição de uma série temporal em seus movimentos componentes básicos, segundo aborda Spiegel4. 3.1 Análise Gráfica Quando tratamos de analisar uma série temporal, o primeiro método do qual lançamos mão é a análise gráfica, assim, de imediato, tomamos uma “ideia” do comportamento da série ao longo do tempo. Estimando a tendência de uma série, podemos observar seu comportamento geral. Sendo assim, o primeiro passo que devemos tomar, é elaborar um gráfico a partir do conjunto de dados disponíveis. 3.2 Ajuste pelo Método das Médias Móveis Quando elaboramos o gráfico de uma série, para que possamos obter melhor percepção sobre o padrão de movimento nos dados ao longo do tempo, utilizamos o método das médias móveis, uma vez que este método suaviza a curva da série, eliminando variações indesejadas. Este método consiste em calcular uma média para determinado número de períodos de forma sucessiva, em relação ao número de períodos totais. Assim, basicamente, tomamos o ponto médio do intervalo de tempo escolhido para as médias. Definiremos Média Móvel para o período N como: MM(N). Ilustrativamente temos: ( ) , ( ) ( ) (1.3) As somas dos numeradores de (1.3) são denominados, segundo leciona Spiegel5, de totais móveis de ordem N. Na Tabela 1.1 constam valores referentes a Receitas de Vendas anuais de determinada companhia entre os anos de 1982 e 2008. 4 5 Spiegel, Murray R. Estatística. São Paulo. Ed. Makron Books, 1993. P.427 Ibidem P.428
  4. 4. Ano 1982 1983 1984 1985 1986 1987 1988 1989 1990 Receita 1588 1558 1753 1408 1310 1424 1677 1937 1685 Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 Receita 1488 1562 1619 1687 1841 1865 1637 1653 1699 Ano 2000 2001 2002 2003 2004 2005 2006 2007 2008 Receita 1698 1523 1557 1795 1934 2125 2543 2616 3191 Tabela 1.1 – Receitas (em milhões de Reais) para determinada Companhia nos anos de 19822008 Façamos o cálculo das médias móveis dos primeiros nove anos (de 1982 até 1990)6, para N = 3 anos: N = 3 anos Assim, Ano Receita 1982 1588 1983 1558 1984 1753 1985 1408 1986 1310 1987 1424 1988 1677 1989 1937 1990 1685 ( ) 6 ( ) ( ) ( ) ( ) ( ) ( ) Adaptado a partir de: David M. Levine ... [et al]. Estatística: teoria e aplicações: usando o Microsoft® Excel em português. Rio de Janeiro, Ed. LTC, 2012. P.615
  5. 5. Médias Móveis Para as Receitas 2500 Receita Anual 2000 1500 Receita MM (3 Anos) 1000 500 0 1982 1983 1984 1985 1986 1987 1988 1989 1990 Figura 3 –Gráfico referente as médias móveis calculadas para 9 anos com N=3 Observa-se no gráfico que a linha das médias móveis tornar-se mais suave que a linha original, isso porque as médias móveis, conforme argumenta Spiegel7, tem a propriedade de tenderem a reduzir o total da variação que se apresenta no conjunto de dados. Em séries temporais, utiliza-se esse método para eliminar flutuações indesejáveis. Este processo chama-se alisamento ou ajustamento de séries temporais. Observa-se também que ouve uma perda de valores extremos, isso porque, ao reduzirmos o número de anos das Receitas para nove e utilizando um N=3, nós ficamos impossibilitados de calcular uma média para os dois primeiros anos, assim como os dois últimos. Utilizando o Microsoft® Excel, procedemos o cálculo para o total das receitas constantes na tabela 1.1 e obtivemos o seguinte gráfico: Médias Móveis para as Receitas 3500 Receita Anual 3000 2500 2000 1500 1000 500 Receita MM (3 Anos) MM (7 Anos) Figura 4 Gráfico referente as médias móveis calculadas para todos os anos com N=3 e 7. Vide Tabela 1.1 7 Spiegel, Murray R. Estatística. São Paulo. Ed. Makron Books, 1993. P.428 2008 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 1997 1996 1995 1994 1993 1992 1991 1990 1989 1988 1987 1986 1985 1984 1983 1982 0
  6. 6. Pode-se observar na Figura 4 que, quanto mais aumentamos o valor N, mais suave fica a curva da série. 3.3 Ajuste pelo Método Exponencial Conforme Levine8, ajuste exponencial consiste em: Uma série de médias móveis exponencialmente ponderadas, de modo que os pesos atribuídos aos valores se modificam de forma que o valor mais recente recebe o maior peso, o valor anterior recebe o segundo maior peso e assim segue, com o primeiro valor recebendo o menor peso. Sendo assim, ao longo de toda a série, cada valor exponencialmente ajustado depende de todos os valores anteriores, permitindo, além disso, que sejam calculados prognósticos de curto prazo. O que se faz no ajuste exponencial, além de reconhecer a ligação entre os valores de Y no decorrer de tn, identificar o comportamento exponencial que a curva da série assume, dependendo do sentido da tendência. A equação utilizada para fazer o ajuste exponencial, segundo Levine9, consiste em três termos – o valor corrente na série temporal, Yn; o valor exponencialmente ajustado calculando anteriormente, En-1; e um coeficiente de ajuste, W. Assim, temos: (1.4) ( ) (1.5) Onde: En = Valor da série exponencialmente ajustada, calculada no tempo n. En-1= Valor da série exponencialmente ajustada, no tempo n-1. Yn = Valor observado da série no tempo n. W = Coeficiente de ajuste, onde (0<W<1). Façamos um exemplo utilizando os dados da Tabela 1.1 Substituindo na Equação (1.4) Y1= Vendas do primeiro ano, daí decorre que E1982 = 1588. Agora, trabalhando na equação (1.5): ( ) Para este exemplo tomaremos o coeficiente W=0,5, fazendo isto temos: ( ) ( ) Se continuarmos fazendo os cálculos para os demais anos, obteremos o seguinte gráfico: 8 David M. Levine ... [et al]. Estatística: teoria e aplicações: usando o Microsoft® Excel em português. Rio de Janeiro, Ed. LTC, 2012. P.617 9 Ibidem
  7. 7. Receita Exponencialmente Ajustada 3500 Receita Anual 3000 2500 2000 Receita 1500 W=0,5 1000 500 0 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 Figura 5 Receita Exponencialmente Ajustada com W=0,5 Receita Exponencialmente Ajustada 3500 Receita Anual 3000 2500 2000 Receita 1500 W=0,5 W=0,25 1000 500 0 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 Figura 6 Receita Exponencialmente Ajustada com W= 0,5 e W=0,25 O que percebemos ao analisarmos a figura 5 em relação à figura 6 é que, quando mais diminuímos o valor do coeficiente de ajuste, mais uniforme a curva vai ficando, tornando-a mais polida. Por outro lado, Levine10 afirma que, a escolha do coeficiente de ajuste é subjetiva, caso o observador apenas queira eliminar as oscilações indesejáveis, deve escolher um coeficiente baixo, próximo a zero; por outro lado, se que fazer um prognóstico de curto prazo11, aconselha-se o uso de um coeficiente próximo a 0,5. 10 11 Ibidem p.618 Para fazermos previsões de curto prazo, utilizamos sempre o valor corrente das receitas como Valor de E1.
  8. 8. 3.4 Ajuste pelo Método dos Mínimos Quadrados Um terceiro método de análise de séries temporais utilizado para identificar tendências é o de ajustar uma curva matemática à série de dados. Uma primeira medida a tomar é elaborar um gráfico de dispersão a partir do conjunto de dados que forma a série, com isso, podemos identificar o comportamento da variável Y em relação a X. Vejamos os dados seguintes12: Casa Idade (anos) Aluguel Mensal (Reais) 1 3 2 12 3 5 4 7 5 8 6 19 7 10 8 22 9 15 10 8 11 25 Tabela 1.2 Aluguel de Casas 50 32 40 33 45 13 30 14 28 51 26 Chamaremos de X a idade em anos e Y o aluguel em reais. Procuramos agora encontrar e medir a relação entre estas duas variáveis. Para encontrarmos essa relação elaboramos um gráfico de dispersão e depois façamos uma análise. Aluguel Mensal (Reais) 60 Aluguel Mensal 50 40 30 Aluguel Mensal (Reais) 20 10 0 0 5 10 15 20 25 30 Idade em anos Figura 7 Aluguel e Idade de onze casas 12 Adaptado a partir de: Karmel, Peter Henry; Polasek, M. Estatística geral e aplicada para economistas, São Paulo. Ed: Atlas, 1974. P.234
  9. 9. Ao analisarmos o gráfico da figura 7, identificamos uma relação inversa entre as variáveis, ou seja, existe uma relação inversa entre a idade dos imóveis e o aluguel. Evidentemente não podemos dizer muito se há uma aparente tendência, pois o gráfico não nos diz isso. Um gráfico que revelasse perfeitamente essa tendência deveria ser como o gráfico da figura 8. Figura 8 – Tendência Aparente 3.4.1 Método dos Mínimos Quadrados: Tendência Linear O método dos mínimos quadrados consiste em uma técnica que minimiza a soma das diferenças elevadas ao quadrado, entre os valores verdadeiros Yi e os valores previstos Ŷi, utilizando a equação da regressão linear simples. A soma do quadrado das diferenças e tido por: ∑( ) Suponhamos ter N pares de observações, devendo existir uma relação entre estas variáveis, se esta relação for linear, então será representada pela equação de uma reta: (1.6) Nesta equação, a e b são constantes que determinam a posição da reta, sendo a a altura em que a reta intercepta o eixo dos Y e b a inclinação da mesma. O símbolo indica o valor de que resulta da relação, para dado . Considerando que, por a relação entre variáveis não revelar uma tendência perfeita, provavelmente não serão os mesmos. A equação (1.6) expressa a relação média entre e e é chamada de regressão linear de A constante é conhecida como coeficiente de regressão de . A questão então é: como ajustar uma reta aos pontos que represente a relação entre eles. Essa reta é dada pela equação (1.6) onde são escolhidos de forma tal que ∑ ( ) seja um mínimo. Ou seja, que a soma dos desvios verticais ao quadrado, dos pontos verticais, à reta, seja um mínimo. Eis então, o funcionamento do método dos mínimos quadrados.
  10. 10. Temos que: ∑( Considerando que ) , então: ( ∑ ) Lembrando que D tem que ser um mínimo. Assim, derivando D com relação à temos: ) ∑( e ∑ ( ) ) ∑( Agora, para que D seja um mínimo, e devem ser ambos iguais a zero, o que ocorrerá quando: ) ∑( e ) ∑( Tendo em vista que: ) ∑( ∑ ∑ ∑ (∑ ) ∑ E que ) ∑( ∑ (∑ ) (∑ ) Obtemos o sistema de equações conhecido como equações normais, cujas incógnitas parâmetros da equação da reta. { ∑ ∑ são os (∑ ) (∑ ) (∑ ) Façamos um exemplo utilizando os dados da tabela 1.2: Para o exemplo vamos utilizar a ferramenta Excel: (1.7)
  11. 11. 60 50 Aluguel 40 Aluguel Mensal (Reais) 30 20 Linear (Aluguel Mensal (Reais)) y = -1,4524x + 50,602 10 0 0 5 10 15 20 25 30 Idade Observamos a equação e o gráfico, podemos concluir que, para cada acréscimo de um ano na idade do imóvel, espera-se que o aluguel, em média, caia $ 1,45. Se nossos dados variassem de forma exponencial, teríamos: 60 Título do Eixo 50 40 30 Aluguel Mensal (Reais) 20 Exponencial (Aluguel Mensal (Reais)) 10 y = 54,032e-0,05x 0 0 5 10 15 Título do Eixo 20 25 30

×