Fundamentos de SI com Dados Financeiros
Prof. Me. Tiago A. Silva
VERSÃO 2019
www.tiago.blog.br
SISTEMAS DE INFORMAÇÃO FINANCEIROS
O QUE SÃO SISTEMAS DE INFORMAÇÃO?
• As organizações precisam dos sistemas de informação para
gerenciar os dados de seu negócio e transformá-los em
informações úteis.
• De onde provém a informação? Qual é a matéria-prima necessária
para se produzir informação?
– Uma grande parte das informações presente na organização é
proveniente dos dados que ela mesma manipula.
• Dado? Mas de onde vem isso? Como os dados geram informações? Existe algo
mais envolvido?
www.tiago.blog.br 2
www.tiago.blog.br 3
PRÁTICA COM MICROSOFT EXCEL
BASE MATEMÁTICA
MODELO ESTATÍSTICO DE REGRESSÃO
Um modelo estatístico costuma envolver a determinação do melhor modelo de explicação para uma
variável y, que é explicada por uma outra variável x. Por isto o modelo estatístico é PROBABILÍSTICO e não
DETERMINÍSTICO.
y  Variável DEPENDENTE ou variável EXPLICADA.
x  Variável INDEPENDENTE ou variável EXPLICATIVA.
e  Erro associado ao processo de determinação dos valores de y com base em x (e são os resíduos).
O modelo de REGRESSÃO LINERA SIMPLES fica resumido a:
ො𝑦 = 𝑎 + 𝑏. 𝑥 + 𝑒
ො𝑦 = 𝑎 + 𝑏. 𝑥
MODELO ESTATÍSTICO DE REGRESSÃO
O processo de estimação do modelo gera uma reta (a reta de regressão ou reta de ajuste ótimo) que
produz os erros mínimos em relação aos pontos (pares ordenados – mapa de dispersão).
ො𝑦 = 𝑎 + 𝑏. 𝑥 + 𝑒
CÁLCULO DA RETA DE REGRESSÃO
Fórmulas para o cálculo da Reta de Regressão:
𝑎 =
Σ𝑦 − 𝑏. Σ𝑥
𝑛
𝑏 =
𝑛. (Σ𝑥𝑦) − (Σ𝑥. Σ𝑦)
𝑛. (Σ𝑥2) − (Σ𝑥)2
ො𝑦 = 𝑎 + 𝑏. 𝑥
Exemplo:
Gastos com publicidade
(x, em mil reais)
Vendas
(y, em mil reais)
x² y² xy
3 7 9 49 21
4 14 16 196 56
8 15 64 225 120
12 28 144 784 336
14 32 196 1.024 448
41 96 429 2.278 981
CÁLCULO DA RETA DE REGRESSÃO
Gastos com publicidade
(x, em mil reais)
Vendas
(y, em mil reais)
x² y² xy
3 7 9 49 21
4 14 16 196 56
8 15 64 225 120
12 28 144 784 336
14 32 196 1.024 448
41 96 429 2.278 981
𝑏 =
5. (981) − (41,96)
5. (429) − (41)2
=
969
464
= 2,0884
𝑎 =
96 − 2,0884 × 41
5
=
10,3756
5
= 2,0751
𝑦 = 2,0754 + 2,0884. 𝑥Daí segue a Equação da reta (modelo previsor):
Vendas e Publicidade
y = 2,0884x + 2,0754
R2
= 0,9308
0
5
10
15
20
25
30
35
0 2 4 6 8 10 12 14 16
publicidade
vendas
COEFICIENTE DE CORRELAÇÃO (r)
A análise de correlação determina um número que expressa uma medida numérica do grau da relação
encontrada entre duas variáveis. É, efetivamente, uma medida do grau e da direção de uma relação linear
entre duas variáveis. O nome correto desta análise é Coeficiente de Correlação produto dos momentos de
Pearson (r). É dado pela equação abaixo:
𝑟 =
Σ𝑥𝑦
𝑛
−
Σ𝑥
𝑛
.
Σ𝑦
𝑛
2
Σ𝑥2
𝑛
−
Σ𝑥
𝑛
2
.
Σ𝑦2
𝑛
−
Σ𝑦
𝑛
2
𝑟 =
𝑛. Σ𝑥𝑦 − (Σ𝑥). (Σ𝑦)
𝑛. Σ𝑥2 − (Σ𝑥)2. 𝑛. Σ𝑦2 − (Σ𝑦)2
Ou esta outra fórmula:
Faixa de variação de r: -1 ≤ r ≤ 1
Tipos de correlação:
a) Próximo de -1: Forte correlação
negativa;
b) Próximo de 1: Forte correlação
positiva.
c) Próximo de 0: Não há correlação
significativa.
COEFICIENTE DE DETERMINAÇÃO (r²)
O Coeficiente de Determinação (r²) é a razão entre a variação explicada e a variação total. Isto é,
Faixa de variação de r: 0 ≤ r² ≤ 1
Interpretação:
a) Próximo de 1: Forte poder de explicação do
modelo (reta de regressão);
b) Próximo de 0: Fraco poder de explicação do
modelo (reta de regressão);
c) Exempo: r² = 0,92. Então, 92% da variação de y
pode ser explicada pera relação entre x e y.
𝑟2
=
Variação explicada
Variação total
Matematicamente, pode-se escrever
a equação de r² desta forma:
𝑟2 =
σ𝑖=1
𝑛
ො𝑦𝑖 − 𝑦 2
σ𝑖=1
𝑛
𝑦𝑖 − 𝑦 2
REFERÊNCIAS
• Sistemas de Informação. Introdução aos Sistemas de
Informação. UNIVESP 2017.
• Slides: Análise de Regressão – Aplicação à Custos – Prof. Dr.
Darlan Marcelo Delgado. Fatec Mococa, 2010.
www.tiago.blog.br 13
OBRIGADO!
tiago.silva197@fatec.sp.gov.br
www.tiago.blog.br

SIF - Sistemas de Informacao e Regressao Linear

  • 1.
    Fundamentos de SIcom Dados Financeiros Prof. Me. Tiago A. Silva VERSÃO 2019 www.tiago.blog.br SISTEMAS DE INFORMAÇÃO FINANCEIROS
  • 2.
    O QUE SÃOSISTEMAS DE INFORMAÇÃO? • As organizações precisam dos sistemas de informação para gerenciar os dados de seu negócio e transformá-los em informações úteis. • De onde provém a informação? Qual é a matéria-prima necessária para se produzir informação? – Uma grande parte das informações presente na organização é proveniente dos dados que ela mesma manipula. • Dado? Mas de onde vem isso? Como os dados geram informações? Existe algo mais envolvido? www.tiago.blog.br 2
  • 3.
  • 4.
  • 5.
  • 6.
    MODELO ESTATÍSTICO DEREGRESSÃO Um modelo estatístico costuma envolver a determinação do melhor modelo de explicação para uma variável y, que é explicada por uma outra variável x. Por isto o modelo estatístico é PROBABILÍSTICO e não DETERMINÍSTICO. y  Variável DEPENDENTE ou variável EXPLICADA. x  Variável INDEPENDENTE ou variável EXPLICATIVA. e  Erro associado ao processo de determinação dos valores de y com base em x (e são os resíduos). O modelo de REGRESSÃO LINERA SIMPLES fica resumido a: ො𝑦 = 𝑎 + 𝑏. 𝑥 + 𝑒 ො𝑦 = 𝑎 + 𝑏. 𝑥
  • 7.
    MODELO ESTATÍSTICO DEREGRESSÃO O processo de estimação do modelo gera uma reta (a reta de regressão ou reta de ajuste ótimo) que produz os erros mínimos em relação aos pontos (pares ordenados – mapa de dispersão). ො𝑦 = 𝑎 + 𝑏. 𝑥 + 𝑒
  • 8.
    CÁLCULO DA RETADE REGRESSÃO Fórmulas para o cálculo da Reta de Regressão: 𝑎 = Σ𝑦 − 𝑏. Σ𝑥 𝑛 𝑏 = 𝑛. (Σ𝑥𝑦) − (Σ𝑥. Σ𝑦) 𝑛. (Σ𝑥2) − (Σ𝑥)2 ො𝑦 = 𝑎 + 𝑏. 𝑥 Exemplo: Gastos com publicidade (x, em mil reais) Vendas (y, em mil reais) x² y² xy 3 7 9 49 21 4 14 16 196 56 8 15 64 225 120 12 28 144 784 336 14 32 196 1.024 448 41 96 429 2.278 981
  • 9.
    CÁLCULO DA RETADE REGRESSÃO Gastos com publicidade (x, em mil reais) Vendas (y, em mil reais) x² y² xy 3 7 9 49 21 4 14 16 196 56 8 15 64 225 120 12 28 144 784 336 14 32 196 1.024 448 41 96 429 2.278 981 𝑏 = 5. (981) − (41,96) 5. (429) − (41)2 = 969 464 = 2,0884 𝑎 = 96 − 2,0884 × 41 5 = 10,3756 5 = 2,0751 𝑦 = 2,0754 + 2,0884. 𝑥Daí segue a Equação da reta (modelo previsor):
  • 10.
    Vendas e Publicidade y= 2,0884x + 2,0754 R2 = 0,9308 0 5 10 15 20 25 30 35 0 2 4 6 8 10 12 14 16 publicidade vendas
  • 11.
    COEFICIENTE DE CORRELAÇÃO(r) A análise de correlação determina um número que expressa uma medida numérica do grau da relação encontrada entre duas variáveis. É, efetivamente, uma medida do grau e da direção de uma relação linear entre duas variáveis. O nome correto desta análise é Coeficiente de Correlação produto dos momentos de Pearson (r). É dado pela equação abaixo: 𝑟 = Σ𝑥𝑦 𝑛 − Σ𝑥 𝑛 . Σ𝑦 𝑛 2 Σ𝑥2 𝑛 − Σ𝑥 𝑛 2 . Σ𝑦2 𝑛 − Σ𝑦 𝑛 2 𝑟 = 𝑛. Σ𝑥𝑦 − (Σ𝑥). (Σ𝑦) 𝑛. Σ𝑥2 − (Σ𝑥)2. 𝑛. Σ𝑦2 − (Σ𝑦)2 Ou esta outra fórmula: Faixa de variação de r: -1 ≤ r ≤ 1 Tipos de correlação: a) Próximo de -1: Forte correlação negativa; b) Próximo de 1: Forte correlação positiva. c) Próximo de 0: Não há correlação significativa.
  • 12.
    COEFICIENTE DE DETERMINAÇÃO(r²) O Coeficiente de Determinação (r²) é a razão entre a variação explicada e a variação total. Isto é, Faixa de variação de r: 0 ≤ r² ≤ 1 Interpretação: a) Próximo de 1: Forte poder de explicação do modelo (reta de regressão); b) Próximo de 0: Fraco poder de explicação do modelo (reta de regressão); c) Exempo: r² = 0,92. Então, 92% da variação de y pode ser explicada pera relação entre x e y. 𝑟2 = Variação explicada Variação total Matematicamente, pode-se escrever a equação de r² desta forma: 𝑟2 = σ𝑖=1 𝑛 ො𝑦𝑖 − 𝑦 2 σ𝑖=1 𝑛 𝑦𝑖 − 𝑦 2
  • 13.
    REFERÊNCIAS • Sistemas deInformação. Introdução aos Sistemas de Informação. UNIVESP 2017. • Slides: Análise de Regressão – Aplicação à Custos – Prof. Dr. Darlan Marcelo Delgado. Fatec Mococa, 2010. www.tiago.blog.br 13
  • 14.