SlideShare uma empresa Scribd logo
1 de 81
Festa
Slide nº 1
Festa
Slide nº 2
2
Estatística Básica
Jorge Festa
Festa
Slide nº 3
Análise Exploratória de
Dados
 Capítulo 1 - Resumo de Dados
Introdução
Tipos de Variáveis
Distribuição de Freqüências
Representação Gráfica das
Variáveis Quantitativas
Ramo-e-folhas
Festa
Slide nº 4
INTRODUÇÃO
 O que é ESTATÍSTICA ?
– É fundamental na análise de dados provenientes
de quaisquer processos onde exista
VARIABILIDADE.
– Uso de informações na: coleção, apresentação,
análise e tomada de decisões, para solucionar
problemas.
Y X
 
 
Festa
Slide nº 5
Estatística
 Uma estatística é uma quantidade que é
calculada dos dados amostrados. Ela é
usada para dar informações a respeito de
valores desconhecidos da correspondente
população. Por exemplo, a média dos dados
amostrados é utilizada para dar
informações sobre toda a média da
população da qual a amostra foi retirada.
Festa
Slide nº 6
GRANDES ÁREAS DA
ESTATÍSTICA
 Amostragem e planejamento de experimentos
 coleção ou coleta de dados
 Estatística descritiva
 organização, apresentação e
sintetização de dados
 Estatística inferencial
 métodos para tomada de decisões, nas
situações onde existem incertezas e
VARIAÇÕES.
Festa
Slide nº 7
AMOSTRAGEM
 É o processo de escolha da amostra. É a
parte inicial de qualquer estudo estatístico.
Consiste na escolha criteriosa dos elementos
a serem submetidos ao estudo.
– Ex. Pesquisas sobre tendências de votação.
 escolha da amostra, redação do questionário,
a entrevista, a codificação dos dados, a
apuração dos resultados são ETAPAS
FUNDAMENTAIS deste tipo de pesquisa.
Festa
Slide nº 8
ESTATÍSTICA DESCRITIVA
 É a parte mais conhecida. Quem vê o noticiário,
na televisão ou nos jornais, sabe quão freqüente é
o uso de média, índices e gráficos nas notícias.
– Exemplo:
 O INPC, Índice Nacional de Preços ao
Consumidor
– Aumento dos produtos da cesta básica.
 Anuário Estatístico Brasileiro
– educação, saúde, transporte, economia,
cultura etc.
Festa
Slide nº 9
Estatística Inferencial
 A estatística Inferencial faz
uso das informações
retiradas da amostra para
conclusões (inferências), a
respeito da população da
qual a amostra foi retirada.
Festa
Slide nº 10
POPULAÇÃO E AMOSTRA
 O estudo de qualquer fenômeno, seja ele natural,
social, econômico ou biológico, exige a coleta e
análise de dados estatísticos.
– População é a coleção de todas as observações
sobre determinado fenômeno.
– Amostra é o conjunto de dados efetivamente
observados, ou extraídos da população.
 Exemplo: Determinação do consumo de óleo
diesel em ônibus, avaliação de um programa de
ensino, renda média per capita em diversas
regiões do país etc.
Festa
Slide nº 11
INFERÊNCIA
 A tomada de decisões sobre a população, com base
nos dados da amostra, constitui o problema central
da INFERÊNCIA ESTATÍSTICA.
 A tais decisões estão sempre associados um grau
de incerteza e, conseqüentemente, uma
probabilidade de erro.
– Exemplo: Teste sobre medicamentos,
experimentos agrícolas, análise financeira,
consumo de energia etc.
Festa
Slide nº 12
APRESENTAÇÃO DE
DADOS
 Técnicas que permitem detectar e corrigir
erros e inconsistências ocorridos durante um
processo de coleta de dados e determinar
as principais características destes dados.
– Grupamento de dados;
– Construção de distribuições de freqüência;
– Gráficos.
Festa
Slide nº 13
Tipos de Variáveis
 Qualitativa
– Nominal
 Região de Procedência
– Ordinal
 Educação, Classe Social
 Quantitativa
– Discreta
 Número de Filhos
– Contínua
 Peso de Indivíduos, Salários em R$
Festa
Slide nº 14
GRUPAMENTO DE DADOS
1
68 1
7
2 1
7
0 1
81 1
69 1
7
3
1
64 1
7
5 1
82 1
7
7 1
7
6 1
7
3
1
7
0 1
86 1
83 1
7
0 1
68 1
66
1
69 1
80 1
7
5 1
64 1
81 1
7
9
1
7
2 1
69 1
7
4 1
7
1 1
7
8 1
66
Alturas, expressas em centímetros de 30 atletas de um clube.
Festa
Slide nº 15
CONSTRUÇÃO DE DISTRIBUIÇÕES
DE FREQÜÊNCIA
Tabulação de Freqüências
--------------------------------------------------------------------------------
Limite Limite Ponto Freqüência Freqüência Freqüência
Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum
--------------------------------------------------------------------------------
1 162.000 167.000 164.500 4 0.133 4 0.133
2 167.000 172.000 169.500 9 0.300 13 0.433
3 172.000 177.000 174.500 8 0.267 21 0.700
4 177.000 182.000 179.500 6 0.200 27 0.900
5 182.000 187.000 184.500 3 0.100 30 1.000
--------------------------------------------------------------------------------
Média = 173.367 Desvio Padrão = 5.89847 Mediana = 172.5
Alturas em cm. de 30 atletas
Festa
Slide nº 16
GRÁFICOS
157 162 167 172 177 182 187 192
Alturas
0
1
2
3
4
5
6
7
8
9
10
Frequencia Histograma de Frequencia
Festa
Slide nº 17
GRÁFICOS
157 162 167 172 177 182 187 192
Alturas
0
1
2
3
4
5
6
7
8
9
10
Frequencia
Poligono de Frequencias
Festa
Slide nº 18
GRÁFICOS
157 162 167 172 177 182 187 192
Alturas
0
10
20
30
40
50
60
70
80
90
100
Percentual
Frequencias Relativa Acumulada
Ogiva
Festa
Slide nº 19
GRUPAMENTO DE DADOS
0 1 2 3 4
5 1 1 2 2
2 3 3 2 2
3 4 5 1 2
2 3 2 3 2
Número de filhos em 25 famílias observadas
Festa
Slide nº 20
CONSTRUÇÃO DE
DISTRIBUIÇÕES DE FREQÜÊNCIA
Tabulação de Freqüências
--------------------------------------------------------------------------------
Limite Limite Ponto Freqüência Freqüência Freqüência
Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum
--------------------------------------------------------------------------------
1 -0.5000 0.5000 0.000 1 0.0400 1 0.0400
2 0.5000 1.5000 1.000 4 0.1600 5 0.2000
3 1.5000 2.5000 2.000 10 0.4000 15 0.6000
4 2.5000 3.5000 3.000 6 0.2400 21 0.8400
5 3.5000 4.5000 4.000 2 0.0800 23 0.9200
6 4.5000 5.5000 5.000 2 0.0800 25 1.0000
--------------------------------------------------------------------------------
Média = 2.4 Desvio Padrão = 1.22474 Mediana = 2
Número de filhos em 25 famílias observadas
Festa
Slide nº 21
GRÁFICOS
-0.5 0.5 1.5 2.5 3.5 4.5 5.5
Filhos
0
1
2
3
4
5
6
7
8
9
10
Frequencia
Histograma de Frequencias
Festa
Slide nº 22
GRÁFICOS
-1 0 1 2 3 4 5 6
Filhos
0
1
2
3
4
5
6
7
8
9
10
Frequencia
Poligono de Frequencias
Festa
Slide nº 23
Análise Exploratória de
Dados
 Capítulo 2 - Algumas medidas associadas
a variáveis Quantitativas
Medidas de Posição
Medidas de Dispersão
Outra Estratégia de Análise
Desenho Esquemático
Festa
Slide nº 24
Estatísticas Descritivas
 Tamanho da Amostra
 Média
 Mediana
 Moda
 Média Geométrica
 Variância
 Desvio-padrão
 Erro-padrão
 Mínimo
 Máximo
 Amplitude
 Quartil Inferior
 Quartil Superior
 Intervalo Inter-quartil
 Assimetria “Skewnwss”
 Assimetria Padronizada
 Curtose “Kurtosis”
 Curtose Padronizada
 Coeficiente de Variação
 Somatório
Festa
Slide nº 25
Estatística Clássica
Suposições Probabilísticas das Variáveis Envolvidas
Declarações sobre os Parâmetros ou Modelo
Utilizado
Noções Assintóticas de
– Consistência
– Variância “Grandes Amostras”
– Eficiência
“USE A ESTATÍSTICA COMO O BÊBADO USA OS
POSTES - MAIS PELO APOIO QUE PELA
ILUMINAÇÃO”
Andew Lang
Festa
Slide nº 26
Análise Exploratória de
Dados
Tukey J. W. (1977)
– Técnicas Visuais
Dados = Modelo + Resíduos
Modelo = parte Suave
Resíduos = parte Grosseira
Y X
 
 
Festa
Slide nº 27
Análise Exploratória de
Dados
 Ferramentas Principais
– Ramo-e-folhas - “Stem-and-
Leaf”
– Esquema de cinco números - “5-
number summary”
– Desenho Esquemático - “Box-Plot”
Festa
Slide nº 28
Ramo-e-folhas
 Apresentação
RAMO - à esquerda da linha vertical
FOLHAS - à direita da linha vertical
 Vantagem sobre a Tabela de Freqüência:
– Não perdemos informação
– Número de linhas é equivalente ao
número de classes
Festa
Slide nº 29
CONSTRUÇÃO DE
DISTRIBUIÇÕES DE FREQÜÊNCIA
Tabulação de Freqüências
--------------------------------------------------------------------------------
Limite Limite Ponto Freqüência Freqüência Freqüência
Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum
--------------------------------------------------------------------------------
1 162.000 167.000 164.500 4 0.133 4 0.133
2 167.000 172.000 169.500 9 0.300 13 0.433
3 172.000 177.000 174.500 8 0.267 21 0.700
4 177.000 182.000 179.500 6 0.200 27 0.900
5 182.000 187.000 184.500 3 0.100 30 1.000
--------------------------------------------------------------------------------
Média = 173.367 Desvio Padrão = 5.89847 Mediana = 172.5
Alturas em cm. de 30 atletas
Festa
Slide nº 30
RAMO-E-FOLHAS
Dispositivo Ramo-e-folhas para ALTURAS: unidade = 1 1|2 representa 12
2 16F|44
4 16S|66
9 16o|88999
13 17*|0001
(4) 17T|2233
13 17F|455
10 17S|67
8 17o|89
6 18*|011
3 18T|23
1 18F|
1 18S|6
Festa
Slide nº 31
CONSTRUÇÃO DE DISTRIBUIÇÕES
DE FREQÜÊNCIA
Tabulação de Freqüências
--------------------------------------------------------------------------------
Limite Limite Ponto Freqüência Freqüência Freqüência
Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum
--------------------------------------------------------------------------------
1 -0.5000 0.5000 0.000 1 0.0400 1 0.0400
2 0.5000 1.5000 1.000 4 0.1600 5 0.2000
3 1.5000 2.5000 2.000 10 0.4000 15 0.6000
4 2.5000 3.5000 3.000 6 0.2400 21 0.8400
5 3.5000 4.5000 4.000 2 0.0800 23 0.9200
6 4.5000 5.5000 5.000 2 0.0800 25 1.0000
--------------------------------------------------------------------------------
Média = 2.4 Desvio Padrão = 1.22474 Mediana = 2
Número de filhos em 25 famílias observadas
Festa
Slide nº 32
RAMO-E-FOLHAS
Dispositivo Ramo-e-folhas para FILHOS: unidade = 0.1 1|2 representa 1.2
LO|0
5 1|0000
(10) 2|0000000000
10 3|000000
4 4|00
HI|50,50
Festa
Slide nº 33
Esquema ou Resumo de 5
Números
Sugestão (Tukey) - 1977
(i) a mediana
(ii) os extremos (mínimo e máximo)
(iii) os quartis ou juntas (inferior e superior)
A Mediana é uma Medida Resistente,
não é afetada por valores extremos.
a Média amostral e o Desvio-padrão são afetados por
valores extremos
não temos idéia quanto a simetria da distribuição dos dados
Festa
Slide nº 34
Desenho Esquemático
“UM DESENHO ESQUEMÁTICO OU
GRÁFICO DO ESQUEMA DE 5
NÚMEROS VALE MAIS QUE 1000
PALAVRAS”
OUTLIERS
valores abaixo da J1 - 3/2 dJ
valores acima da J3 + 3/2 dJ, onde
J1 = 1º quartil, J3 = 3º quartil e dJ = J3 - J1
Festa
Slide nº 35
Exemplo
150 155 160 165 170 175 180 185 190 195 200
altura de alunos em cm
0
1
2
3
4
5
6
frequencia
Histograma de Frequencias
e a Normal Ajustada
Festa
Slide nº 36
Exemplo
150 155 160 165 170 175 180 185 190 195 200
altura de alunos em cm
Desenho Esquematico
Festa
Slide nº 37
Análise Exploratória de
Dados
 Capítulo 3 - Análise Bidimensional
Variáveis Multidimensionais
Independência de Variáveis
Medidas de Dependência entre
Duas Variáveis
Diagrama de Dispersão
Coeficiente de Correlação
Festa
Slide nº 38
Variáveis Multidimensionais
 Em muitas situações observamos duas
ou mais características
simultaneamente, para analisar o seu
comportamento.
 A DISTRIBUIÇÃO CONJUNTA das
freqüências será um poderoso
instrumento na compreensão dos dados.
Festa
Slide nº 39
Distribuição Conjunta
Y|X 1º Grau 2º Grau Superior Total
Capital 4 5 2 11
Interior 3 7 2 12
Outra 5 6 2 13
Total 12 18 6 36
Distribuição Conjunta do Grau de Instrução e Região
Festa
Slide nº 40
Independência de Variáveis
 Um dos principais objetivos de uma
distribuição conjunta é descrever a
ASSOCIABILIDADE existente ENTRE
DUAS VARIÁVEIS, isto é, queremos
conhecer o GRAU DE DEPENDÊNCIA entre
elas, de modo que possamos prever melhor o
resultado de uma delas quando conhecemos
a realização da outra.
Festa
Slide nº 41
Independência de Variáveis
Y|X Masculino Feminino Total
Economia 85 (61%) 35 (58%) 120 (60%)
Administração 55 (39%) 25 (42%) 80 (40%)
Total 140 (100%) 60 (100%) 200 (100%)
Distribuição conjunta das freqüências e porcentagens segundo sexo e curso
Festa
Slide nº 42
Medidas de Dependência
entre Duas Variáveis
 coeficientes de associação ou
correlação
– coeficiente de contingência de Karl Pearson
 



2
2
1
2
2 1
2
1














o e
e
C
n
e C C
t
t
i i
i
i
n
*
( )
Festa
Slide nº 43
Diagramas de Dispersão
150 160 170 180 190 200
Amostra Ordenada
-2.1
-1.1
-0.1
0.9
1.9
2.9
Escores
Padronizados
Diagrama de Dispersoes
Festa
Slide nº 44
Coeficiente de Correlação
   
y A Bx
B
n xy x y
n x x
A
y B x
n
r
n xy x y
n x x n y y
 
































 

2 2
2 2 2 2
( )
Festa
Slide nº 45
Origem do Termo “Regressão”
160 164 168 172 176 180 184
altura dos pais
160
164
168
172
176
180
184
Media de alturas de filhos contra
alturas composta dos pais
Observado
estimado
valor y=x
Festa
Slide nº 46
Probabilidades
 Capítulo 4 - Probabilidades
Introdução
Algumas Propriedades
Probabilidade Condicional e
Independência
Teorema de Bayes
Festa
Slide nº 47
Probabilidades
 Uma das principais ferramentas da
estatística é a probabilidade, que
teve seu início formal com a escolha
de jogos no início do século XVII.
 Para seu entendimento necessitamos
de alguns conhecimentos BÁSICOS
que seguem:
Festa
Slide nº 48
Experimento
 É qualquer processo ou estudo de
coletar dados revelantes, os quais
exibem variações em seus resultados,
resultados estes desconhecidos de ante
mão.
– Ex. Lançamento de um dado honesto e
observar a cada arremesso a face
voltada para cima.
Festa
Slide nº 49
Espaço Amostral “W”
 O espaço amostral “W”, é o conjunto
de todos os resultados possíveis,
elementares e indivisíveis do
experimento, onde cada resultado é
um evento simples.
– Ex. Lançamento de um dado honesto
W = { f1, f2, f3, f4, f5, f6 }
Festa
Slide nº 50
Evento
 Um evento, indicado pelas letras A, B, ..., é
qualquer subconjunto do espaço amostral “W”.
– Exemplo 1: A ocorrência de face impar, no
lançamento de um dado honesto.
evento A = { f1, f3, f5 }
– Exemplo 2: A ocorrência de face par, no
lançamento de um dado honesto.
evento B = { f2, f4, f6 }
Festa
Slide nº 51
s-álgebra
 Uma s-álgebra é uma classe de
subconjuntos do espaço amostral, W,
satisfazendo os seguintes axiomas:
i
ii Se A então A
iii Se A e B então A B
)
) ,
) ,
W 
 
 

 
  
Festa
Slide nº 52
Definição de Probabilidade
Definição Clássica
Definição Freqüentista
Definição Geométrica
Definição Axiomática
Festa
Slide nº 53
Definição Axiomática
( ) ( )
( ) ( )
( ) , , . . .,
, ( , , ; , , , , . . .) ,
[ ] [ ]
i P A
ii P
iii Se A A é uma sequencia de eventos mutuamente exclusivos em
isto é A A i j i j e se A então
P A P A
i j i
i
i
i
i
i


     








0
1
1 2
1 2
1
1 1
W
 


Festa
Slide nº 54
Algumas Propriedades
. [ ]
. , , . . ., ,
[ ] [ ]
. , [ ] [ ]
. [ ] [ ] [ ]
[ ] [ ] [ ] [ ]
. [
P
Se A A A são eventos mutuamente exclusivos em então
P A P A
Se A é um evento em então P A P A
Se A e A então P A P A A P A A e
P A A P A A P A P A A
Se A e A então P A A
n
i i
i
n
i
n
 

 
  
   
 



0
1
1 2
1
1
1 2 1 1 2 1 2
1 2 1 2 1 1 2
1 2 1





2 1 2 1 2
1 2 1 2 1 2
1 2
1
1
] [ ] [ ] [ ]
, [ ] [ ]
. , , . . ., , [ ] [ ]
   
  
 



P A P A P A A
Se A e A e A A então P A P A
Se A A A então P A P A
n i i
i
n
i
n

 
Festa
Slide nº 55
Probabilidade Condicional
P A B
P AB
P B
se P B desta forma
P AB P B P A B P A P B A
[ | ]
[ ]
[ ]
[ ] ,
[ ] [ ]. [ | ] [ ]. [ | ].
 
 
0
Festa
Slide nº 56
Teorema da Probabilidade
Total
P A P A B P B
j j
j
n
[ ] [ | ]. [ ]



1
Festa
Slide nº 57
Teorema de Bayes
P B A
P A B P B
P A B P B
k
k k
j j
j
n
[ | ]
[ | ]. [ ]
[ | ]. [ ]



1
Festa
Slide nº 58
Regra da Multiplicação
P A B C P A
P B A
P C A B
( ) ( )
( | )
( | )
 


P A A A P A P A A P A A A P A A A A
n n n
[ . ..... ] [ ]. [ | ]. [ | ]. . . . . [ | . ... ]
1 2 1 2 1 3 1 2 1 2 1
 
Festa
Slide nº 59
Independência
( ) [ ] [ ]. [ ]
( ) [ | ] [ ] [ ]
( ) [ | ] [ ] [ ]
i P AB P A P B
ii P A B P A se P B
iii P B A P B se P A

 
 
0
0
Festa
Slide nº 60
Variável Aleatória
 Uma variável aleatória, indicada
por X, é uma função com domínio
o espaço amostral e contradomínio
o conjunto dos números Reais, tal
que, o evento [ X  x ] pertence a
s-álgebra para todos os valores
de x que pertencem aos no.s
reais.
Festa
Slide nº 61
Função Distribuição
 Uma Função Distribuição, indicada por
F(x), é uma função, com domínio os
Reais e contradomínio o intervalo [0,1],
satisfazendo as seguintes
propriedades:
– F(x) é não decrescente;
– F(x) é contínua à direita;
– F(-) = 0 e F() = 1
Festa
Slide nº 62
Função Distribuição
Acumulada
 Dada a variável aleatória X,
chamaremos de função
distribuição acumulada a função
F x P X x x
( ) ( ),
   
Festa
Slide nº 63
O Conceito de Variável
Aleatória Discreta
 Uma variável aleatória X, é dita
discreta, se ela assume um número
finito ou infinito enumerável.
 A função, indicada por p(x), nós
chamamos função de probabilidade
da variável aleatória discreta X.
Festa
Slide nº 64
Função de Probabilidade
i p x
ii p x
x
) ( )
) ( )



0
1
Festa
Slide nº 65
O Conceito de Variável
Aleatória Contínua
 Uma variável aleatória, indicada
por X, é dita contínua, se existe
uma função f(x), chamada função
densidade de probabilidade, tal
que:
f x dx
( )  
z
Festa
Slide nº 66
Função Densidade de
Probabilidade
i f x
ii f x dx
) ( )
) ( )




z
0
1
Festa
Slide nº 67
Valor Esperado de uma
Variável Aleatória
 Dada uma variável aleatória X, chamamos
valor médio ou esperança matemática de X
ao valor
E x
x p x discreta
x f x dx continua
( )
( ),
( ) ,








Festa
Slide nº 68
Valor Esperado de Uma
Função de uma Variável
Aleatória X “g(X)”
 Dada a variável aleatória X,
chamamos esperança ou valor
esperado da função g(x) ao valor:
E g x
g x p x
g x f x dx
[ ( )]
( ) ( )
( ) ( )

R
S
|
T
|

z
Festa
Slide nº 69
Propriedades
 Se g(x) = aX + b,
– E[g(x)] = E(aX + b) = a E(X) + b
 Se g(x) =[X - E(X)]2
– E[g(x)] = Var(X)
Festa
Slide nº 70
Alguns Modelos Discretos
 Distribuição Uniforme Discreta
 Distribuição Bernoulli
 Distribuição Binomial
 Distribuição Hipergeométrica
 Distribuição Geométrica
 Distribuição Binomial Negativa
 Distribuição Poisson
Festa
Slide nº 71
Alguns Modelos Contínuos
 Uniforme Contínua
 Normal
 Exponencial
 Gama
 Beta
 Cauchy
 Lognormal
 Dupla-exponencial
 Weibull
 Logística
 Pareto
 Gumbel (Valor Extremo)
 t-Student’s
 F-Snedecor’s
 Qui-quadrado
 Normal Bivariada
Festa
Slide nº 72
Variáveis Aleatórias
Multidimensionais
 Capítulo 7 - Variáveis Aleatórias
Multidimensionais
– Distribuição Conjunta
– Distribuições Marginais e Condicionais
– Funções de Variáveis Aleatórias
– Covarância de Duas Variáveis Aleatórias
– Variáveis Contínuas
Festa
Slide nº 73
Distribuição Conjunta
 Em muitos experimentos, a um mesmo ponto
amostral w,atribuímos valores de duas ou mais
variáveis aleatórias.
– Ex. Suponha que queremos estudar a
composição de famílias com 3 crianças, quanto
ao sexo.
 X = número de meninos
 Y = 1 (se for homem) e 0 (se for mulher)
 Z = no. de vezes que houve variação do sexo
 W = número de meninas
Festa
Slide nº 74
Função Densidade Conjunta
i f x
ii f x y dx dy
) ( )
) ( , )






zz
0
1
Festa
Slide nº 75
Tabela de Probabilidades
Eventos Probabilidade X Y Z W
HHH 1/8 3 1 0 0
HHM 1/8 2 1 1 1
HMH 1/8 2 1 2 1
HMM 1/8 1 1 1 2
MHH 1/8 2 0 1 1
MHM 1/8 1 0 2 2
MMH 1/8 1 0 1 2
MMM 1/8 0 0 0 3
Festa
Slide nº 76
Distribuições Marginais
f x
f x y
f x y dy
( )
( , )
( , )








Festa
Slide nº 77
Distribuições Condicionais
f x y
f x y
f y
( | )
( , )
( )

Festa
Slide nº 78
Distribuições Independentes
f x y f x f y
( , ) ( ) ( )

Festa
Slide nº 79
Covariância de duas
variáveis aleatórias
Cov XY E X E X Y E Y
( ) [( ( )( ( )]
  
s   
XY XY X Y
 
Festa
Slide nº 80
Coeficiente de Correlação
de X e Y
( , )
( , )
( ) ( )
X Y
Cov X Y
Var X Var Y

   
1 1

s
s s
XY
XY
X y
Festa
Slide nº 81
Referências
Bibliográficas
Montgomery, Douglas C. & Runger, George C. Applied
statistics and probability for engineers. New York,
Wiley, 1994.
Montgomery, Douglas C., Introduction to statistical
quality control. New York, Wiley, 1991.
Bussab, Wilton O., Estatística Básica. 4.ed. São Paulo,
1987

Mais conteúdo relacionado

Semelhante a Análise Exploratória de Dados: Medidas de Posição e Dispersão

Aula de Estatística Básica -Aula 4
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4Luiz Martins Souza
 
Aula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxAula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxJoel Júnior
 
1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continuaNilson Costa
 
4 Ferramentas de qualidade.ppt
4 Ferramentas de qualidade.ppt4 Ferramentas de qualidade.ppt
4 Ferramentas de qualidade.pptMileny Lima
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...RaquelSilva604657
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunosCézar Guerra
 
Aula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaAula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaDalton Martins
 
Prestação de Contas para ONGs
Prestação de Contas para ONGsPrestação de Contas para ONGs
Prestação de Contas para ONGsMichel Freller
 
Atps estatística pedro
Atps estatística pedroAtps estatística pedro
Atps estatística pedroPeter San
 
Atividade 2 distância prob e est
Atividade 2 distância prob e estAtividade 2 distância prob e est
Atividade 2 distância prob e estAnacleto César
 
Visualização de Dados - Aula 2
Visualização de Dados - Aula 2Visualização de Dados - Aula 2
Visualização de Dados - Aula 2VicenteTino
 

Semelhante a Análise Exploratória de Dados: Medidas de Posição e Dispersão (20)

Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Estatisitica
EstatisiticaEstatisitica
Estatisitica
 
Aula de Estatística Básica -Aula 4
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4
 
Aula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptxAula 02 - Análise de dados e probabilidade.pptx
Aula 02 - Análise de dados e probabilidade.pptx
 
1 estatística descritiva, distribuição de frequência v discreta e continua
1   estatística descritiva, distribuição de frequência v discreta e continua1   estatística descritiva, distribuição de frequência v discreta e continua
1 estatística descritiva, distribuição de frequência v discreta e continua
 
4 Ferramentas de qualidade.ppt
4 Ferramentas de qualidade.ppt4 Ferramentas de qualidade.ppt
4 Ferramentas de qualidade.ppt
 
Atps estatatistica
Atps estatatisticaAtps estatatistica
Atps estatatistica
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Estatistica exercicios resolvidos
Estatistica exercicios resolvidosEstatistica exercicios resolvidos
Estatistica exercicios resolvidos
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
Aula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaAula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidiana
 
Prestação de Contas para ONGs
Prestação de Contas para ONGsPrestação de Contas para ONGs
Prestação de Contas para ONGs
 
Atps estatística pedro
Atps estatística pedroAtps estatística pedro
Atps estatística pedro
 
Atividade 2 distância prob e est
Atividade 2 distância prob e estAtividade 2 distância prob e est
Atividade 2 distância prob e est
 
Estatistica
EstatisticaEstatistica
Estatistica
 
CEP.pptx
CEP.pptxCEP.pptx
CEP.pptx
 
Visualização de Dados - Aula 2
Visualização de Dados - Aula 2Visualização de Dados - Aula 2
Visualização de Dados - Aula 2
 
Programa de Equalização em Estatística - 2014 A
Programa de Equalização em Estatística - 2014 APrograma de Equalização em Estatística - 2014 A
Programa de Equalização em Estatística - 2014 A
 

Mais de thiago barbosa da silva

Introdução a Custos_Desempenho e departamento
Introdução a Custos_Desempenho e departamentoIntrodução a Custos_Desempenho e departamento
Introdução a Custos_Desempenho e departamentothiago barbosa da silva
 
Projetos_e_Relatorios passo inicial de elaboração
Projetos_e_Relatorios passo inicial de elaboraçãoProjetos_e_Relatorios passo inicial de elaboração
Projetos_e_Relatorios passo inicial de elaboraçãothiago barbosa da silva
 
Modulo II Parte 5 Plano de Negócio2.pptx
Modulo II Parte 5 Plano de Negócio2.pptxModulo II Parte 5 Plano de Negócio2.pptx
Modulo II Parte 5 Plano de Negócio2.pptxthiago barbosa da silva
 
Modulo II Parte 4 Plano de Negócio.pptx2
Modulo II Parte 4 Plano de Negócio.pptx2Modulo II Parte 4 Plano de Negócio.pptx2
Modulo II Parte 4 Plano de Negócio.pptx2thiago barbosa da silva
 
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptx
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptxModulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptx
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptxthiago barbosa da silva
 
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptxthiago barbosa da silva
 
MARGEM e coleta de custo empresarial e empreendedimento
MARGEM e coleta de custo empresarial e empreendedimentoMARGEM e coleta de custo empresarial e empreendedimento
MARGEM e coleta de custo empresarial e empreendedimentothiago barbosa da silva
 
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...thiago barbosa da silva
 
Apresentação aticocepcional menor com sua utilização
Apresentação aticocepcional menor com sua utilizaçãoApresentação aticocepcional menor com sua utilização
Apresentação aticocepcional menor com sua utilizaçãothiago barbosa da silva
 
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptxthiago barbosa da silva
 

Mais de thiago barbosa da silva (20)

Introdução a Custos_Desempenho e departamento
Introdução a Custos_Desempenho e departamentoIntrodução a Custos_Desempenho e departamento
Introdução a Custos_Desempenho e departamento
 
Projetos_e_Relatorios passo inicial de elaboração
Projetos_e_Relatorios passo inicial de elaboraçãoProjetos_e_Relatorios passo inicial de elaboração
Projetos_e_Relatorios passo inicial de elaboração
 
Modulo II Parte 5 Plano de Negócio2.pptx
Modulo II Parte 5 Plano de Negócio2.pptxModulo II Parte 5 Plano de Negócio2.pptx
Modulo II Parte 5 Plano de Negócio2.pptx
 
Modulo II Parte 4 Plano de Negócio.pptx2
Modulo II Parte 4 Plano de Negócio.pptx2Modulo II Parte 4 Plano de Negócio.pptx2
Modulo II Parte 4 Plano de Negócio.pptx2
 
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptx
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptxModulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptx
Modulo II Parte 3 Plano de Negócio Parte 3 de seu passo passo .pptx
 
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx
03-identificaoeavaliaotradicionaldeoportunidades-120212235758-phpapp02.pptx
 
MARGEM e coleta de custo empresarial e empreendedimento
MARGEM e coleta de custo empresarial e empreendedimentoMARGEM e coleta de custo empresarial e empreendedimento
MARGEM e coleta de custo empresarial e empreendedimento
 
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...
manual_sei_ufop_solicitacao_de_alteracao_projeto_convenio_acordo_e_similar_-_...
 
Apresentação aticocepcional menor com sua utilização
Apresentação aticocepcional menor com sua utilizaçãoApresentação aticocepcional menor com sua utilização
Apresentação aticocepcional menor com sua utilização
 
Asma.P2.Maira (1).pptx
Asma.P2.Maira (1).pptxAsma.P2.Maira (1).pptx
Asma.P2.Maira (1).pptx
 
P-09-MOACIR-A.-MARAFON.pdf
P-09-MOACIR-A.-MARAFON.pdfP-09-MOACIR-A.-MARAFON.pdf
P-09-MOACIR-A.-MARAFON.pdf
 
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx
15_09_2016_14.32.13.8b9720a2815689bf83f87cfcb0fea06e.pptx
 
3291788.ppt
3291788.ppt3291788.ppt
3291788.ppt
 
Aula_2_ALESP.ppt
Aula_2_ALESP.pptAula_2_ALESP.ppt
Aula_2_ALESP.ppt
 
MOdulo IVSistema de Amortização.pptx
MOdulo IVSistema de Amortização.pptxMOdulo IVSistema de Amortização.pptx
MOdulo IVSistema de Amortização.pptx
 
Aula_02(1).ppt
Aula_02(1).pptAula_02(1).ppt
Aula_02(1).ppt
 
2579803.ppt
2579803.ppt2579803.ppt
2579803.ppt
 
4071675.ppt
4071675.ppt4071675.ppt
4071675.ppt
 
1705168.ppt
1705168.ppt1705168.ppt
1705168.ppt
 
Acelerador de staturp
Acelerador de staturpAcelerador de staturp
Acelerador de staturp
 

Análise Exploratória de Dados: Medidas de Posição e Dispersão

  • 2. Festa Slide nº 2 2 Estatística Básica Jorge Festa
  • 3. Festa Slide nº 3 Análise Exploratória de Dados  Capítulo 1 - Resumo de Dados Introdução Tipos de Variáveis Distribuição de Freqüências Representação Gráfica das Variáveis Quantitativas Ramo-e-folhas
  • 4. Festa Slide nº 4 INTRODUÇÃO  O que é ESTATÍSTICA ? – É fundamental na análise de dados provenientes de quaisquer processos onde exista VARIABILIDADE. – Uso de informações na: coleção, apresentação, análise e tomada de decisões, para solucionar problemas. Y X    
  • 5. Festa Slide nº 5 Estatística  Uma estatística é uma quantidade que é calculada dos dados amostrados. Ela é usada para dar informações a respeito de valores desconhecidos da correspondente população. Por exemplo, a média dos dados amostrados é utilizada para dar informações sobre toda a média da população da qual a amostra foi retirada.
  • 6. Festa Slide nº 6 GRANDES ÁREAS DA ESTATÍSTICA  Amostragem e planejamento de experimentos  coleção ou coleta de dados  Estatística descritiva  organização, apresentação e sintetização de dados  Estatística inferencial  métodos para tomada de decisões, nas situações onde existem incertezas e VARIAÇÕES.
  • 7. Festa Slide nº 7 AMOSTRAGEM  É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. – Ex. Pesquisas sobre tendências de votação.  escolha da amostra, redação do questionário, a entrevista, a codificação dos dados, a apuração dos resultados são ETAPAS FUNDAMENTAIS deste tipo de pesquisa.
  • 8. Festa Slide nº 8 ESTATÍSTICA DESCRITIVA  É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão freqüente é o uso de média, índices e gráficos nas notícias. – Exemplo:  O INPC, Índice Nacional de Preços ao Consumidor – Aumento dos produtos da cesta básica.  Anuário Estatístico Brasileiro – educação, saúde, transporte, economia, cultura etc.
  • 9. Festa Slide nº 9 Estatística Inferencial  A estatística Inferencial faz uso das informações retiradas da amostra para conclusões (inferências), a respeito da população da qual a amostra foi retirada.
  • 10. Festa Slide nº 10 POPULAÇÃO E AMOSTRA  O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e análise de dados estatísticos. – População é a coleção de todas as observações sobre determinado fenômeno. – Amostra é o conjunto de dados efetivamente observados, ou extraídos da população.  Exemplo: Determinação do consumo de óleo diesel em ônibus, avaliação de um programa de ensino, renda média per capita em diversas regiões do país etc.
  • 11. Festa Slide nº 11 INFERÊNCIA  A tomada de decisões sobre a população, com base nos dados da amostra, constitui o problema central da INFERÊNCIA ESTATÍSTICA.  A tais decisões estão sempre associados um grau de incerteza e, conseqüentemente, uma probabilidade de erro. – Exemplo: Teste sobre medicamentos, experimentos agrícolas, análise financeira, consumo de energia etc.
  • 12. Festa Slide nº 12 APRESENTAÇÃO DE DADOS  Técnicas que permitem detectar e corrigir erros e inconsistências ocorridos durante um processo de coleta de dados e determinar as principais características destes dados. – Grupamento de dados; – Construção de distribuições de freqüência; – Gráficos.
  • 13. Festa Slide nº 13 Tipos de Variáveis  Qualitativa – Nominal  Região de Procedência – Ordinal  Educação, Classe Social  Quantitativa – Discreta  Número de Filhos – Contínua  Peso de Indivíduos, Salários em R$
  • 14. Festa Slide nº 14 GRUPAMENTO DE DADOS 1 68 1 7 2 1 7 0 1 81 1 69 1 7 3 1 64 1 7 5 1 82 1 7 7 1 7 6 1 7 3 1 7 0 1 86 1 83 1 7 0 1 68 1 66 1 69 1 80 1 7 5 1 64 1 81 1 7 9 1 7 2 1 69 1 7 4 1 7 1 1 7 8 1 66 Alturas, expressas em centímetros de 30 atletas de um clube.
  • 15. Festa Slide nº 15 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Tabulação de Freqüências -------------------------------------------------------------------------------- Limite Limite Ponto Freqüência Freqüência Freqüência Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum -------------------------------------------------------------------------------- 1 162.000 167.000 164.500 4 0.133 4 0.133 2 167.000 172.000 169.500 9 0.300 13 0.433 3 172.000 177.000 174.500 8 0.267 21 0.700 4 177.000 182.000 179.500 6 0.200 27 0.900 5 182.000 187.000 184.500 3 0.100 30 1.000 -------------------------------------------------------------------------------- Média = 173.367 Desvio Padrão = 5.89847 Mediana = 172.5 Alturas em cm. de 30 atletas
  • 16. Festa Slide nº 16 GRÁFICOS 157 162 167 172 177 182 187 192 Alturas 0 1 2 3 4 5 6 7 8 9 10 Frequencia Histograma de Frequencia
  • 17. Festa Slide nº 17 GRÁFICOS 157 162 167 172 177 182 187 192 Alturas 0 1 2 3 4 5 6 7 8 9 10 Frequencia Poligono de Frequencias
  • 18. Festa Slide nº 18 GRÁFICOS 157 162 167 172 177 182 187 192 Alturas 0 10 20 30 40 50 60 70 80 90 100 Percentual Frequencias Relativa Acumulada Ogiva
  • 19. Festa Slide nº 19 GRUPAMENTO DE DADOS 0 1 2 3 4 5 1 1 2 2 2 3 3 2 2 3 4 5 1 2 2 3 2 3 2 Número de filhos em 25 famílias observadas
  • 20. Festa Slide nº 20 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Tabulação de Freqüências -------------------------------------------------------------------------------- Limite Limite Ponto Freqüência Freqüência Freqüência Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum -------------------------------------------------------------------------------- 1 -0.5000 0.5000 0.000 1 0.0400 1 0.0400 2 0.5000 1.5000 1.000 4 0.1600 5 0.2000 3 1.5000 2.5000 2.000 10 0.4000 15 0.6000 4 2.5000 3.5000 3.000 6 0.2400 21 0.8400 5 3.5000 4.5000 4.000 2 0.0800 23 0.9200 6 4.5000 5.5000 5.000 2 0.0800 25 1.0000 -------------------------------------------------------------------------------- Média = 2.4 Desvio Padrão = 1.22474 Mediana = 2 Número de filhos em 25 famílias observadas
  • 21. Festa Slide nº 21 GRÁFICOS -0.5 0.5 1.5 2.5 3.5 4.5 5.5 Filhos 0 1 2 3 4 5 6 7 8 9 10 Frequencia Histograma de Frequencias
  • 22. Festa Slide nº 22 GRÁFICOS -1 0 1 2 3 4 5 6 Filhos 0 1 2 3 4 5 6 7 8 9 10 Frequencia Poligono de Frequencias
  • 23. Festa Slide nº 23 Análise Exploratória de Dados  Capítulo 2 - Algumas medidas associadas a variáveis Quantitativas Medidas de Posição Medidas de Dispersão Outra Estratégia de Análise Desenho Esquemático
  • 24. Festa Slide nº 24 Estatísticas Descritivas  Tamanho da Amostra  Média  Mediana  Moda  Média Geométrica  Variância  Desvio-padrão  Erro-padrão  Mínimo  Máximo  Amplitude  Quartil Inferior  Quartil Superior  Intervalo Inter-quartil  Assimetria “Skewnwss”  Assimetria Padronizada  Curtose “Kurtosis”  Curtose Padronizada  Coeficiente de Variação  Somatório
  • 25. Festa Slide nº 25 Estatística Clássica Suposições Probabilísticas das Variáveis Envolvidas Declarações sobre os Parâmetros ou Modelo Utilizado Noções Assintóticas de – Consistência – Variância “Grandes Amostras” – Eficiência “USE A ESTATÍSTICA COMO O BÊBADO USA OS POSTES - MAIS PELO APOIO QUE PELA ILUMINAÇÃO” Andew Lang
  • 26. Festa Slide nº 26 Análise Exploratória de Dados Tukey J. W. (1977) – Técnicas Visuais Dados = Modelo + Resíduos Modelo = parte Suave Resíduos = parte Grosseira Y X    
  • 27. Festa Slide nº 27 Análise Exploratória de Dados  Ferramentas Principais – Ramo-e-folhas - “Stem-and- Leaf” – Esquema de cinco números - “5- number summary” – Desenho Esquemático - “Box-Plot”
  • 28. Festa Slide nº 28 Ramo-e-folhas  Apresentação RAMO - à esquerda da linha vertical FOLHAS - à direita da linha vertical  Vantagem sobre a Tabela de Freqüência: – Não perdemos informação – Número de linhas é equivalente ao número de classes
  • 29. Festa Slide nº 29 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Tabulação de Freqüências -------------------------------------------------------------------------------- Limite Limite Ponto Freqüência Freqüência Freqüência Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum -------------------------------------------------------------------------------- 1 162.000 167.000 164.500 4 0.133 4 0.133 2 167.000 172.000 169.500 9 0.300 13 0.433 3 172.000 177.000 174.500 8 0.267 21 0.700 4 177.000 182.000 179.500 6 0.200 27 0.900 5 182.000 187.000 184.500 3 0.100 30 1.000 -------------------------------------------------------------------------------- Média = 173.367 Desvio Padrão = 5.89847 Mediana = 172.5 Alturas em cm. de 30 atletas
  • 30. Festa Slide nº 30 RAMO-E-FOLHAS Dispositivo Ramo-e-folhas para ALTURAS: unidade = 1 1|2 representa 12 2 16F|44 4 16S|66 9 16o|88999 13 17*|0001 (4) 17T|2233 13 17F|455 10 17S|67 8 17o|89 6 18*|011 3 18T|23 1 18F| 1 18S|6
  • 31. Festa Slide nº 31 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA Tabulação de Freqüências -------------------------------------------------------------------------------- Limite Limite Ponto Freqüência Freqüência Freqüência Classe Inferior Superior Médio Freqüência Relativa Acumulada Rel. Acum -------------------------------------------------------------------------------- 1 -0.5000 0.5000 0.000 1 0.0400 1 0.0400 2 0.5000 1.5000 1.000 4 0.1600 5 0.2000 3 1.5000 2.5000 2.000 10 0.4000 15 0.6000 4 2.5000 3.5000 3.000 6 0.2400 21 0.8400 5 3.5000 4.5000 4.000 2 0.0800 23 0.9200 6 4.5000 5.5000 5.000 2 0.0800 25 1.0000 -------------------------------------------------------------------------------- Média = 2.4 Desvio Padrão = 1.22474 Mediana = 2 Número de filhos em 25 famílias observadas
  • 32. Festa Slide nº 32 RAMO-E-FOLHAS Dispositivo Ramo-e-folhas para FILHOS: unidade = 0.1 1|2 representa 1.2 LO|0 5 1|0000 (10) 2|0000000000 10 3|000000 4 4|00 HI|50,50
  • 33. Festa Slide nº 33 Esquema ou Resumo de 5 Números Sugestão (Tukey) - 1977 (i) a mediana (ii) os extremos (mínimo e máximo) (iii) os quartis ou juntas (inferior e superior) A Mediana é uma Medida Resistente, não é afetada por valores extremos. a Média amostral e o Desvio-padrão são afetados por valores extremos não temos idéia quanto a simetria da distribuição dos dados
  • 34. Festa Slide nº 34 Desenho Esquemático “UM DESENHO ESQUEMÁTICO OU GRÁFICO DO ESQUEMA DE 5 NÚMEROS VALE MAIS QUE 1000 PALAVRAS” OUTLIERS valores abaixo da J1 - 3/2 dJ valores acima da J3 + 3/2 dJ, onde J1 = 1º quartil, J3 = 3º quartil e dJ = J3 - J1
  • 35. Festa Slide nº 35 Exemplo 150 155 160 165 170 175 180 185 190 195 200 altura de alunos em cm 0 1 2 3 4 5 6 frequencia Histograma de Frequencias e a Normal Ajustada
  • 36. Festa Slide nº 36 Exemplo 150 155 160 165 170 175 180 185 190 195 200 altura de alunos em cm Desenho Esquematico
  • 37. Festa Slide nº 37 Análise Exploratória de Dados  Capítulo 3 - Análise Bidimensional Variáveis Multidimensionais Independência de Variáveis Medidas de Dependência entre Duas Variáveis Diagrama de Dispersão Coeficiente de Correlação
  • 38. Festa Slide nº 38 Variáveis Multidimensionais  Em muitas situações observamos duas ou mais características simultaneamente, para analisar o seu comportamento.  A DISTRIBUIÇÃO CONJUNTA das freqüências será um poderoso instrumento na compreensão dos dados.
  • 39. Festa Slide nº 39 Distribuição Conjunta Y|X 1º Grau 2º Grau Superior Total Capital 4 5 2 11 Interior 3 7 2 12 Outra 5 6 2 13 Total 12 18 6 36 Distribuição Conjunta do Grau de Instrução e Região
  • 40. Festa Slide nº 40 Independência de Variáveis  Um dos principais objetivos de uma distribuição conjunta é descrever a ASSOCIABILIDADE existente ENTRE DUAS VARIÁVEIS, isto é, queremos conhecer o GRAU DE DEPENDÊNCIA entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da outra.
  • 41. Festa Slide nº 41 Independência de Variáveis Y|X Masculino Feminino Total Economia 85 (61%) 35 (58%) 120 (60%) Administração 55 (39%) 25 (42%) 80 (40%) Total 140 (100%) 60 (100%) 200 (100%) Distribuição conjunta das freqüências e porcentagens segundo sexo e curso
  • 42. Festa Slide nº 42 Medidas de Dependência entre Duas Variáveis  coeficientes de associação ou correlação – coeficiente de contingência de Karl Pearson      2 2 1 2 2 1 2 1               o e e C n e C C t t i i i i n * ( )
  • 43. Festa Slide nº 43 Diagramas de Dispersão 150 160 170 180 190 200 Amostra Ordenada -2.1 -1.1 -0.1 0.9 1.9 2.9 Escores Padronizados Diagrama de Dispersoes
  • 44. Festa Slide nº 44 Coeficiente de Correlação     y A Bx B n xy x y n x x A y B x n r n xy x y n x x n y y                                      2 2 2 2 2 2 ( )
  • 45. Festa Slide nº 45 Origem do Termo “Regressão” 160 164 168 172 176 180 184 altura dos pais 160 164 168 172 176 180 184 Media de alturas de filhos contra alturas composta dos pais Observado estimado valor y=x
  • 46. Festa Slide nº 46 Probabilidades  Capítulo 4 - Probabilidades Introdução Algumas Propriedades Probabilidade Condicional e Independência Teorema de Bayes
  • 47. Festa Slide nº 47 Probabilidades  Uma das principais ferramentas da estatística é a probabilidade, que teve seu início formal com a escolha de jogos no início do século XVII.  Para seu entendimento necessitamos de alguns conhecimentos BÁSICOS que seguem:
  • 48. Festa Slide nº 48 Experimento  É qualquer processo ou estudo de coletar dados revelantes, os quais exibem variações em seus resultados, resultados estes desconhecidos de ante mão. – Ex. Lançamento de um dado honesto e observar a cada arremesso a face voltada para cima.
  • 49. Festa Slide nº 49 Espaço Amostral “W”  O espaço amostral “W”, é o conjunto de todos os resultados possíveis, elementares e indivisíveis do experimento, onde cada resultado é um evento simples. – Ex. Lançamento de um dado honesto W = { f1, f2, f3, f4, f5, f6 }
  • 50. Festa Slide nº 50 Evento  Um evento, indicado pelas letras A, B, ..., é qualquer subconjunto do espaço amostral “W”. – Exemplo 1: A ocorrência de face impar, no lançamento de um dado honesto. evento A = { f1, f3, f5 } – Exemplo 2: A ocorrência de face par, no lançamento de um dado honesto. evento B = { f2, f4, f6 }
  • 51. Festa Slide nº 51 s-álgebra  Uma s-álgebra é uma classe de subconjuntos do espaço amostral, W, satisfazendo os seguintes axiomas: i ii Se A então A iii Se A e B então A B ) ) , ) , W           
  • 52. Festa Slide nº 52 Definição de Probabilidade Definição Clássica Definição Freqüentista Definição Geométrica Definição Axiomática
  • 53. Festa Slide nº 53 Definição Axiomática ( ) ( ) ( ) ( ) ( ) , , . . ., , ( , , ; , , , , . . .) , [ ] [ ] i P A ii P iii Se A A é uma sequencia de eventos mutuamente exclusivos em isto é A A i j i j e se A então P A P A i j i i i i i i                 0 1 1 2 1 2 1 1 1 W    
  • 54. Festa Slide nº 54 Algumas Propriedades . [ ] . , , . . ., , [ ] [ ] . , [ ] [ ] . [ ] [ ] [ ] [ ] [ ] [ ] [ ] . [ P Se A A A são eventos mutuamente exclusivos em então P A P A Se A é um evento em então P A P A Se A e A então P A P A A P A A e P A A P A A P A P A A Se A e A então P A A n i i i n i n                  0 1 1 2 1 1 1 2 1 1 2 1 2 1 2 1 2 1 1 2 1 2 1      2 1 2 1 2 1 2 1 2 1 2 1 2 1 1 ] [ ] [ ] [ ] , [ ] [ ] . , , . . ., , [ ] [ ]             P A P A P A A Se A e A e A A então P A P A Se A A A então P A P A n i i i n i n   
  • 55. Festa Slide nº 55 Probabilidade Condicional P A B P AB P B se P B desta forma P AB P B P A B P A P B A [ | ] [ ] [ ] [ ] , [ ] [ ]. [ | ] [ ]. [ | ].     0
  • 56. Festa Slide nº 56 Teorema da Probabilidade Total P A P A B P B j j j n [ ] [ | ]. [ ]    1
  • 57. Festa Slide nº 57 Teorema de Bayes P B A P A B P B P A B P B k k k j j j n [ | ] [ | ]. [ ] [ | ]. [ ]    1
  • 58. Festa Slide nº 58 Regra da Multiplicação P A B C P A P B A P C A B ( ) ( ) ( | ) ( | )     P A A A P A P A A P A A A P A A A A n n n [ . ..... ] [ ]. [ | ]. [ | ]. . . . . [ | . ... ] 1 2 1 2 1 3 1 2 1 2 1  
  • 59. Festa Slide nº 59 Independência ( ) [ ] [ ]. [ ] ( ) [ | ] [ ] [ ] ( ) [ | ] [ ] [ ] i P AB P A P B ii P A B P A se P B iii P B A P B se P A      0 0
  • 60. Festa Slide nº 60 Variável Aleatória  Uma variável aleatória, indicada por X, é uma função com domínio o espaço amostral e contradomínio o conjunto dos números Reais, tal que, o evento [ X  x ] pertence a s-álgebra para todos os valores de x que pertencem aos no.s reais.
  • 61. Festa Slide nº 61 Função Distribuição  Uma Função Distribuição, indicada por F(x), é uma função, com domínio os Reais e contradomínio o intervalo [0,1], satisfazendo as seguintes propriedades: – F(x) é não decrescente; – F(x) é contínua à direita; – F(-) = 0 e F() = 1
  • 62. Festa Slide nº 62 Função Distribuição Acumulada  Dada a variável aleatória X, chamaremos de função distribuição acumulada a função F x P X x x ( ) ( ),    
  • 63. Festa Slide nº 63 O Conceito de Variável Aleatória Discreta  Uma variável aleatória X, é dita discreta, se ela assume um número finito ou infinito enumerável.  A função, indicada por p(x), nós chamamos função de probabilidade da variável aleatória discreta X.
  • 64. Festa Slide nº 64 Função de Probabilidade i p x ii p x x ) ( ) ) ( )    0 1
  • 65. Festa Slide nº 65 O Conceito de Variável Aleatória Contínua  Uma variável aleatória, indicada por X, é dita contínua, se existe uma função f(x), chamada função densidade de probabilidade, tal que: f x dx ( )   z
  • 66. Festa Slide nº 66 Função Densidade de Probabilidade i f x ii f x dx ) ( ) ) ( )     z 0 1
  • 67. Festa Slide nº 67 Valor Esperado de uma Variável Aleatória  Dada uma variável aleatória X, chamamos valor médio ou esperança matemática de X ao valor E x x p x discreta x f x dx continua ( ) ( ), ( ) ,        
  • 68. Festa Slide nº 68 Valor Esperado de Uma Função de uma Variável Aleatória X “g(X)”  Dada a variável aleatória X, chamamos esperança ou valor esperado da função g(x) ao valor: E g x g x p x g x f x dx [ ( )] ( ) ( ) ( ) ( )  R S | T |  z
  • 69. Festa Slide nº 69 Propriedades  Se g(x) = aX + b, – E[g(x)] = E(aX + b) = a E(X) + b  Se g(x) =[X - E(X)]2 – E[g(x)] = Var(X)
  • 70. Festa Slide nº 70 Alguns Modelos Discretos  Distribuição Uniforme Discreta  Distribuição Bernoulli  Distribuição Binomial  Distribuição Hipergeométrica  Distribuição Geométrica  Distribuição Binomial Negativa  Distribuição Poisson
  • 71. Festa Slide nº 71 Alguns Modelos Contínuos  Uniforme Contínua  Normal  Exponencial  Gama  Beta  Cauchy  Lognormal  Dupla-exponencial  Weibull  Logística  Pareto  Gumbel (Valor Extremo)  t-Student’s  F-Snedecor’s  Qui-quadrado  Normal Bivariada
  • 72. Festa Slide nº 72 Variáveis Aleatórias Multidimensionais  Capítulo 7 - Variáveis Aleatórias Multidimensionais – Distribuição Conjunta – Distribuições Marginais e Condicionais – Funções de Variáveis Aleatórias – Covarância de Duas Variáveis Aleatórias – Variáveis Contínuas
  • 73. Festa Slide nº 73 Distribuição Conjunta  Em muitos experimentos, a um mesmo ponto amostral w,atribuímos valores de duas ou mais variáveis aleatórias. – Ex. Suponha que queremos estudar a composição de famílias com 3 crianças, quanto ao sexo.  X = número de meninos  Y = 1 (se for homem) e 0 (se for mulher)  Z = no. de vezes que houve variação do sexo  W = número de meninas
  • 74. Festa Slide nº 74 Função Densidade Conjunta i f x ii f x y dx dy ) ( ) ) ( , )       zz 0 1
  • 75. Festa Slide nº 75 Tabela de Probabilidades Eventos Probabilidade X Y Z W HHH 1/8 3 1 0 0 HHM 1/8 2 1 1 1 HMH 1/8 2 1 2 1 HMM 1/8 1 1 1 2 MHH 1/8 2 0 1 1 MHM 1/8 1 0 2 2 MMH 1/8 1 0 1 2 MMM 1/8 0 0 0 3
  • 76. Festa Slide nº 76 Distribuições Marginais f x f x y f x y dy ( ) ( , ) ( , )        
  • 77. Festa Slide nº 77 Distribuições Condicionais f x y f x y f y ( | ) ( , ) ( ) 
  • 78. Festa Slide nº 78 Distribuições Independentes f x y f x f y ( , ) ( ) ( ) 
  • 79. Festa Slide nº 79 Covariância de duas variáveis aleatórias Cov XY E X E X Y E Y ( ) [( ( )( ( )]    s    XY XY X Y  
  • 80. Festa Slide nº 80 Coeficiente de Correlação de X e Y ( , ) ( , ) ( ) ( ) X Y Cov X Y Var X Var Y      1 1  s s s XY XY X y
  • 81. Festa Slide nº 81 Referências Bibliográficas Montgomery, Douglas C. & Runger, George C. Applied statistics and probability for engineers. New York, Wiley, 1994. Montgomery, Douglas C., Introduction to statistical quality control. New York, Wiley, 1991. Bussab, Wilton O., Estatística Básica. 4.ed. São Paulo, 1987