2014 - Seminário pós-graduação UTFPR - Tecnologias, livro didático e a escola...
2012 - Tese - Análise multivariada e filtros de graham
1. ANÁLISE MULTIVARIADA E FILTROS DEANÁLISE MULTIVARIADA E FILTROS DE
GRAHAM: reconhecimento de padrõesGRAHAM: reconhecimento de padrões
aplicado aos fundamentos do mercadoaplicado aos fundamentos do mercado
acionário brasileiro para o período deacionário brasileiro para o período de
1999-20091999-2009
Alysson Ramos Artuso
2012
Tese de Doutorado (Programação Matemática)
2. Apresentação
• Introdução
• Filtros de Graham
• Risco e Retorno de Ações
• Análise Multivariada
• Teoria da Informação
• Metodologia
• Principais resultados
• Considerações Finais
3. Introdução – Bolsa de
Valores
• Estabilização econômica (1994),
regulamentação do mercado (2001) e
longo período de alta (2002-2007)
crescimento no investimento em
renda variável
• Assunto começa a ser explorado nos
trabalhos de pós-graduação
5. Introdução – Bolsa de Valores
• Análise de valor Graham e Dodd
• Princípios centrais:
– A ação representa uma parte de um
negócio real, com um valor intrínseco que
independe do seu preço
– O mercado é um pêndulo entre o
otimismo insustentável e o pessimismo
injustificável
– Retorno depende do preço pago
– Margem de segurança e diversificação
6. Introdução – Filtros de Graham
• Uma empresa é potencialmente um
bom investimento se:
– For “boa” (crescimento consistente,
financiamento conservador etc)
– For “barata” (patrimônio líquido elevado,
lucro elevado etc em comparação ao
preço)
• Filtros de Graham formas de
identificar uma empresa “boa e
barata”
8. Introdução – Risco/Retorno
• Analisar retorno deve envolver uma
medida de risco:
– Comparação com um índice de mercado
Ibovespa
– Baseados em média/variância Índice de
Sharpe
– Baseado em coeficientes de regressão Alfa
de Jensen
• Hipótese do Mercado Eficiente
– Erros de precificação são aleatórios e não há
correlação dos desvios com qualquer variável
não há estratégias consistentes
9. Objetivo Geral
• Propor e analisar técnicas baseadas
em Métodos Estatísticos Multivariados
e na Teoria da Informação para
ranquear as empresas de acordo com
seus múltiplos e índices econômico-
financeiros comuns da Análise
Fundamentalista, visando à construção
de portfólios com uma rentabilidade
acima da de mercado.
10. Objetivos Específicos
• Testar a aplicabilidade dos filtros de
Graham e dos conceitos que os
sustentam no mercado acionário
nacional.
• Identificar e interpretar fatores
explicativos da maior parte da
variabilidade dos dados.
• Construir modelos de discriminação das
empresas de acordo com sua
rentabilidade e testar o poder preditivo
desses modelos.
• Apontar indícios sobre a eficiência do
11. Justificativas
• Tema:
– Vem se popularizando no Brasil
– Poucas pesquisas acadêmicas nacionais
• Suporte teórico de Graham:
– Estabeleceu um rigoroso método de
avaliação
– Sua escola de investimento é uma das
principais evidências contrárias à
Hipótese do Mercado Eficiente
– Pouco explorado nas pesquisas brasileiras
(nenhuma testando profundamente seus
conceitos)
12. Justificativas
• Técnicas Estatísticas:
– Fundamentais para avaliar risco/retorno
– Tratadas superficialmente na maioria dos
trabalhos da área
– Trazem somente comparações simples de
carteiras baseadas em múltiplos
• Análise Multivariada:
– Interesse crescente
– Problemas de diversificação e proposição
de modelos
– Inovação na forma de aplicação aos
fundamentos contábeis
13. Histórico de pesquisas
• Muitos dos estudos desconsideram
ajustes ao risco
• Baseados em estratégias utilizadas no
passado modificações no mercado
e disseminação da prática
• Ações de valor x ações de crescimento
e Múltiplos de Mercado (mas quase
nunca com critérios múltiplos)
14. Filtros de Graham
• São 10 filtros baseados em
– Múltiplos de mercado
– Indicadores econômicos e financeiros
• Mercado norte-americano entre as
décadas de 1930-70
• Abordagem de Graham
Reconhecimento de Padrões
identificar variáveis relevantes e
superfícies de separação
15. Filtros de Graham
1. Índice Lucro/Preço superior ao
dobro da taxa livre de risco
2. P/L menor que 40% do P/L
médio do mercado (5 anos)
3. DY maior que 2/3 da taxa livre
de risco
4. Preço inferior a 2/3 do VCT
5. Preço inferior a 2/3 do CGL
16. Filtros de Graham
6. Dívida total menor que VCT
7. Liquidez Corrente maior que 2
8. LGM maior que 2
9. Crescimento do lucro maior que
7% ao ano nos últimos 10 anos
10. Não mais do que 2 anos de
lucros em declínio nos últimos
10 anos
17. Filtros de Graham
• Avaliação bastante conservadora
poucas empresas satisfazem os 10
critérios (7 podem ser suficiente)
• Carteira deve ter pelo menos 10 ativos
(recomendado 30)
• Usando os qualificadores originais não
seria possível formar carteiras no
mercado brasileiro nos últimos 10
anos
18. Risco/Retorno
• Risco Desvio padrão
• Diversificação diminui o risco (diminui
a oscilação)
19. Risco/Retorno
• Medidas utilizadas:
– Comparação dos retornos logarítmicos
(Ibovespa como carteira de mercado)
– Índice de Sharpe
– Alfa de Jensen
fE(r) r
IS
−
=
σ
( )f f
E(r) r . E(r) r α = − + β −
20. Análise Multivariada
• Estudo simultâneo de muitas
variáveis:
– Redução de dados ou simplificação
estrutural
– Classificação e agrupamento;
– Investigação de dependência entre
variáveis
– Predição
– Teste e construção de hipóteses
21. Análise Multivariada –
Componentes Principais
• Investigar quais variáveis mais
contribuem para a variabilidade dos
dados
• Transformar um conjunto de variáveis
correlacionada em um novo conjunto
de variáveis não-correlacionadas
• Usada também para o descarte de
outliers
22. Análise Multivariada –
Componentes Principais
• A j-ésima componente amostral é
dada por
onde são os
autovalores e autovetores de S,
ˆ ˆ ˆ ˆY e X e X ... e Xˆ pj 1j 1 pj2j 2
= = + + +
'
e Xj
λ λ λ1 2 pp1 2
ˆ ˆ ˆ( , ),( , ),...,( , )ˆ ˆ ˆe e e
= λ =j j i j
ˆ ˆ ˆˆV(Y ) Cov(Y,Y ) 0e
23. Análise Multivariada – Análise
Fatorial
• Agrupar as variáveis em fatores
explicativos não-correlacionados
• Identificar fatores de forma a
compreender melhor o
funcionamento do evento
estudado
• Classificar as observações de
acordo com o escore fatorial
24. Análise Multivariada – Análise
Fatorial
• No modelo fatorial se pressupões
que as “p” variáveis X sejam
linearmente dependentes sobre
“m” variáveis aleatórias não-
observáveis F chamadas fatores
comuns
X LF−µ = +ε
25. Análise Multivariada – Análise
Fatorial
• Estimação dos pesos e variâncias
específicas pelo método das
componentes principais
λ
= Ψ = −1/2ˆˆ ˆ ˆˆˆL CD ; S LL'
ˆˆ ˆ ˆe e e
111 1p12
ˆ ˆ ˆe e e ˆ
1/221 22 2pˆ ˆ 2C D
ˆ ˆ ˆe e e ˆp1 p2 pp p
λ
λ
= =
λ
λ
L
L
M M M M O
L
26. Análise Multivariada – Análise
Fatorial
• Os escores fatoriais estimados
para as variáveis padronizados
são dados por:
• Escore bruto de cada observação
ponderado pelos autovalores:
( ) 1ˆ ˆ ˆ ˆF L'L L'z−
=
k k
j j i i
i 1 i 1
ˆ ˆ ˆE f '. / '
= =
= λ λ∑ ∑
27. Análise Multivariada – Teste T2
de
Hotelling
• Teste multivariado para diferença
entre as médias
• Constatar se dois grupos
previamente selecionados
possuem diferenças significativas
( ) ( )
1
2
1 2 0 p 1 2 0
1 2
1 1
T x x ' S x x
n n
−
= − − δ + − − δ ÷
( )
( )
( )1 2
2 1 2
p,n n p 1
1 2
n n p 1
T ~ F 1
n n 2 p
+ − −
+ − −
− α
+ −
28. Análise Multivariada – Análise
Discriminante
• Determinar quais variáveis
melhor segregam os grupos
• Utilizar essas variáveis para criar
regras de classificação, alocando
novos objetos nos grupos
previamente definidos
29. Análise Multivariada – Método de
Fisher
• Transformar as observações
multivariadas X em observações
univariadas Y, tal que os Y’s dos
grupos sejam separados tanto
quanto possível.
30. Análise Multivariada – Método de
Fisher
• Função Discriminante Linear de Fisher
aloca uma nova observação se Y ≥
m para um grupo ou para outro (Y <
m).
1ˆ ˆY ( )'Sp
−= = −
'
C X X X X1 2
Y Y1 1 1 2ˆm ( )'S ( )p2 2
+
−= − + =X X X X1 2 1 2
31. Análise Multivariada – Regressão
Logística
• Descrever a relação entre uma
variável resposta e as variáveis
explicativas
• Resposta dicotômica utilizada
para a classificação
• Estimação dos parâmetros via
métodos iterativos
33. Análise Multivariada – Método
stepwise
• Acréscimo (forward) ou retirada
(backward) de variável de acordo
com algum critério (p. ex.:
capacidade de previsão do
modelo).
• Manter a qualidade da previsão
usando um menor número de
variáveis
34. Teoria da Informação
• Originalmente desenvolvida para
sinais em cabos de comunicação
(Shannon, 1948)
• Capacidade de identificar variáveis
relevantes por meio de:
– Entropia: quantifica a incerteza
relacionada com o valor de uma v.a.
– Informação mútua: quantifica o quanto
conhecer uma variável diminui a
incerteza sobre outra.
35. Teoria da Informação
• Entropia: origem na Física
• Semelhanças:
– Expressão matemática
– Interpretação probabilística
• Diferenças:
– Entropia física está relacionada com o
sentido de processos estabelece um
princípio físico (2º Lei da Termodinâmica)
– Entropia física não faz referência a
distribuições de probabilidade específicas
36. Teoria da Informação
• Entropia de Shannon:
• Entropia condicional:
• Informação mútua:
( )
n
i i
i 1
H p log p
=
= −∑
( ) ( ) ( ) ( ) ( ) ( )
i j j i
H Y | X p i p j | i logp j | i p j,i logp j | i= − = −∑ ∑ ∑∑
( ) ( ) ( )
( ) ( )
( )
i j
I Y,X H Y – H Y | X
p i,j
I X,Y p i,j log
p(i).p(j)
=
= ÷
∑∑
38. Teoria da Informação
• Entropia de Rényi família de
medidas de entropia da qual a de
Shannon é um caso particular:
• Informação mútua de Rényi obtida
a partir da divergência de CS:
n
i
i 1
1
H log p
1
α
α
=
= ÷ ÷− α
∑
( ) ( )( )
( ) ( ) ( ) ( )
CS CS XY X Y
CS 2 XY X Y 2 XY 2 X Y
I X,Y D f x,y ;f (x)f (y)
1 1
I X,Y H f f f H f H f f
2 2
=
= × − −
39. Árvore de Decisão
• Objetivo de categorizar dados e gerar
regras de classificação facilmente
interpretáveis.
• Estrutura em forma de árvore:
– Cada nó indica um teste
– Cada ramo apresenta um resultado do
teste
– Cada nó final corresponde a uma
classificação
41. Árvore de Decisão
• Algoritmo C4.5 (Quinlan, 1993):
– Construção da árvore: seleciona a
variável que melhor separa os grupos
pela maior redução da entropia absoluta
(informação mútua) e relativa.
– Separação binária dos ramos: pesquisa
exaustiva
– Poda da árvore combater overfitting
redução de nós por error based
pruning
42. Árvore de Decisão
• Estimação da entropia quadrática de
Rényi pela Janela de Parzen com
kernel gaussiano:
com σ dado pela regra de Silvermann:
( ) ( )
N N
2 j i2 2
i 1 j 1
1ˆH X log G x x
N σ
= =
= − − ÷
∑∑
( )( )
1
11 d 4
X 4N 2d 1
−− +
σ = σ +
43. Avaliação dos métodos de
classificação
• Taxa aparente de erro (APER)
Matriz Confusão
• Abordagem de Lachenbruch
equivale a ter um grupo com n
observações para ajuste e outro
grupo (também de tamanho n) para
testar a eficiência do procedimento
44. Metodologia
• População Amostrada:
– Todas as empresas de capital aberta
não-financeiras e de negociação
diária (cerca de 350 empresas)
– Dados retirados dos relatórios
contábeis CVM e Economática
– Dados de 31/03
– Retiradas as que não apresentavam
dados completos (sobrando cerca
de 200)
45. Metodologia
• Variáveis utilizadas:
– Indicadores Financeiros: 8
– Indicadores de Rentabilidade: 5 (6)
– Múltiplos de Mercado: 7
– Medidas de Risco/Retorno: 3
– NALD incluída somente nos Filtros
de Graham
46. Metodologia
• Abordagem de carteira
• Avaliação dos Filtros de Graham
– Contribuição com novos indicadores
• Análise Fatorial
– Identificação e interpretação de
fatores
– Estratégia de ranqueamento
• Reconhecimento de Padrões
– Análise dos modelos: FDLF, MRLM,
ADS e ADR.
47. Metodologia – Filtros de
Graham
• Levantamento de dados
• Construção das carteiras
• Cálculo das rentabilidades
• Testes de hipótese e análise dos
resultados
• Proposição de novos
qualificadores quartis
desenvolvimento de filtros
brasileiros
48. Metodologia – Análise Fatorial
• Levantamento de dados
• Descarte de outliers
• Testes de viabilidade da AF
• Componentes Principais e
extração dos fatores
• Rotação varimax
• Cálculo do escore
• Construção das carteiras
49. Metodologia – Análise
Discriminante
• Separação de grupos (S/F)
• Testes de viabilidade da AD
• Uso de variáveis originais e
método forward stepwise
(separação dos grupos)
• FDFL e MRLM
• Avaliação da classificação
• Construção das carteiras
• Análise dos resultados
50. Metodologia – Árvore de
Decisão
• Mesmos grupos da AD
• Algoritmo C4.5 adaptado para
utilizar a entropia quadrática de
Rényi
• Análise da classificação
(Lachenbruch)
• Construção das carteiras
• Análise dos resultados
51. Metodologia – Contribuições
• Originalidade
– Aplicação de métodos não
utilizados na bibliografia levantada
– Desenvolvimento de novas
metodologias de classificação e
seleção de ativos financeiros
(Escores fatoriais, entropia
quadrática de Rényi)
• Não-trivialidade
– Extensão e complexidade do estudo
52. Metodologia – Contribuições
• Contribuição científica
– Discussão dos conceitos de entropia
para a Física e para a Teoria da
Informação
– Proposição de filtros brasileiros
– Ranqueamento de ativos via
escores fatoriais da AF
– Desenvolvimento e avaliação de
modelos de classificação
53. Metodologia – Contribuições
• Contribuição social
– Contribuição na compreensão do
mercado acionário brasileiro
– Proposição de modelos práticos
para o pequeno investidor pessoa
física
54. Principais resultados – Filtros de
Graham
• Rentabilidade acima do mercado
(ambos os casos)
• Indicadores originais:
– Preceitos são válidos
– Baixa diversificação (média de 5
ações em carteira)
• Qualificadores propostos:
– Mais adequados à realidade
brasileira
– Média de 12 ações em carteira
– Melhores retornos
55. Principais resultados – Análise
Fatorial
• Elimina o problema de diversificação
• Interpretação da influência das
variáveis
– Fator 1: Liquidez (LS, LC, LI)
– Fator 2: Preço (P/VC, P/VCT)
– Fator 3: Rentabilidade (ROA, ROE)
– Fator 4: Endividamento (GE, GEM)
• Estabilidade dos fatores
• Rentabilidade superior ao mercado
56. Principais resultados – Análise
Discriminante
• Variáveis de destaque:
– Preço de Mercado (PM)
– Dividend Yield (DY)
– Preço por Valor Contábil (P/VC)
• Característica dos ativos
selecionados: grandes
companhias, que pagam altos
dividendos e são negociados a um
baixo múltiplo P/VC Ações de
valor Graham
• Resultados próximos entre FDLF e
MRLM
57. Principais resultados – Análise
Discriminante
• Índice de acerto aproximado:
– Total: 83%; Fracasso: 97%; Sucesso: 20%
• Problema de diversificação: grande
oscilação no número de ativos
Seleção de somente 12 ativos com
base no valor de saída do modelo.
• Retornos superiores ao mercado,
mas nem sempre com valores
significativos
58. Principais resultados – Árvores de
Decisão
• Variáveis de destaque:
– Preço de Mercado (PM)
– Média de Crescimento dos Lucros (MCL)
– Preço por Valor Contábil Tangível (P/VCT)
– Dividend Yield (DY)
• Índice de acerto aproximado:
– Total: 86%; Fracasso: 98%; Sucesso: 40%
• Retornos superiores ao mercado,
mas nem sempre com valores
significativos Shannon melhor
que Rényi
59. Principais resultados –
Estratégias
Filtros de
Graham
originais (a.p)
Filtros de Graham
modificados (a.p)
Análise
Fatorial
(a.p.)
FDLF 12
Stepwise
1 ano *39,61% *39,78% *38,05% 23,89%
2 anos 55,05% *68,81% **64,81% 45,36%
3 anos 70,43% *91,01% *83,32% 72,41%
5 anos 118,3% 137,16% 145,23% 122,68%
MRLM 12
Stepwise
Árvore de Decisão
via Rényi
Árvore de
Decisão via
Shannon
Ibovespa
(a.p)
1 ano 23,62% 17,81% 22,67% 12,37%
2 anos 41,11% 35,61% 48,06% 29,32%
3 anos 64,87% 46,91% 65,66% 45,10%
5 anos 110,29% 92,90% 124,12% 92,49%
• Média do Retorno logarítmico
60. Principais resultados –
Estratégias
Filtros de
Graham
originais (a.p)
Filtros de Graham
modificados (a.p)
Análise
Fatorial
(a.p.)
FDLF 12
Stepwise
1 ano *0,1056 *0,0975 *0,0687 *0,0590
2 anos *0,0597 *0,0737 *0,0480 0,0422
3 anos *0,0434 *0,0610 *0,0371 0,0382
5 anos *0,0568 *0,0570 *0,0372 0,0354
MRLM 12
Stepwise
Árvore de Decisão
via Rényi
Árvore de
Decisão via
Shannon
Ibovespa
(a.p)
1 ano 0,0472 0,0328 0,0504 0,0053
2 anos 0,0342 0,0327 **0,0473 0,0067
3 anos 0,0277 0,0245 0,0355 0,0046
5 anos 0,0245 0,0272 *0,0369 0,0098
• Índice de Sharpe:
61. Principais resultados –
Estratégias
Filtros de
Graham
originais (a.p)
Filtros de Graham
modificados (a.p)
Análise
Fatorial
(a.p.)
FDLF 12
Stepwise
1 ano 173,61% *25,81% *26,14% *12,01%
2 anos *54,55% *40,93% *35,95% 13,41%
3 anos *65,33% *49,66% *41,66% *22,31%
5 anos *111,62% *76,60% *69,93% *35,14%
MRLM 12
Stepwise
Árvore de Decisão
via Rényi
Árvore de
Decisão via
Shannon
1 ano *12,16% *7,80% *9,15%
2 anos *11,17% 14,05% *17,81%
3 anos 15,20% 14,88% *19,85%
5 anos *24,74% *31,47% *41,42%
• Alfa de Jensen:
62. Considerações Finais
• Por meio de técnicas de análise
multivariada é possível usar a
análise fundamentalista, baseada
no método dos múltiplos, para se
conseguir rentabilidade acima do
mercado.
• Retornos superiores ao mercado:
– Fortalecimento do valuation
– Indícios de ineficiência do mercado
63. Considerações Finais
• É possível identificar e interpretar
fatores, eliminar o problema de
diversificação e construir uma
estratégia de sucesso
• 7 modelos testados: Filtros
modificados e Análise Fatorial
• Classificação superior a outros
modelos em pelo menos 15
pontos percentuais
64. Considerações Finais
• Possibilidade de continuidade por
novos estudos:
– Variações dos modelos
apresentados (nº de ativos,
estimação, separação dos grupos...)
– Redes Neurais
– Máquinas de vetor de suporte
(SVM)
– Conjuntos aproximativos
– Lógica fuzzy...
65. Trabalhos originados a partir da
tese
• Publicados/aceitos:
1. Filtros de Graham Aplicados ao Mercado
Acionário Brasileiro. In: XLI SBPO, 2009.
2. O uso de quartis para a aplicação dos filtros
de Graham na Bovespa (1998-2009). Revista
Contabilidade & Finanças, v. 21, 2010.
3. Entropias de Shannon e Rényi aplicadas ao
Reconhecimento de Padrões. Revista
CIATEC, v. 3, p. 56-72, 2011.
4. Estudo de variáveis fundamentalistas e
formação de carteiras no mercado acionário
via Análise Fatorial. Revista Produção
Online, 2012. (prelo)
66. Trabalhos originados a partir da
tese
• Sob avaliação:
1. Análise Discriminante e Regressão
Logística – reconhecimento de padrões
para a seleção de portfólios no mercado
acionário brasileiro
2. Entropia de Shannon e Rényi para a
seleção de portfólios no mercado
acionário brasileiro
67. ANÁLISE MULTIVARIADA, TEORIA DAANÁLISE MULTIVARIADA, TEORIA DA
INFORMAÇÃO E FILTROS DE GRAHAM:INFORMAÇÃO E FILTROS DE GRAHAM:
reconhecimento de padrões aplicadoreconhecimento de padrões aplicado
aos fundamentos do mercado acionárioaos fundamentos do mercado acionário
brasileiro para o período de 1999-2009brasileiro para o período de 1999-2009
Alysson Ramos Artuso
2012
Tese de Doutorado (Programação Matemática)