SlideShare uma empresa Scribd logo
1 de 242
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
Estatística AplicadaEstatística Aplicada II
Universidade Federal do Pará
Instituto de Tecnologia
Campus de Belém
Curso de Engenharia Mecânica
Prof. Dr. Jorge Teófilo de Barros Lopes
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
Capítulo ICapítulo I
Universidade Federal do Pará
Instituto de Tecnologia
Estatística DescritivaEstatística Descritiva
Campus de Belém
Curso de Engenharia Mecânica
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
I - Estatística Descritiva
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 ESTATÍSTICA: É a disciplina que objetiva estudar os
métodos científicos para a coleta, organização, resumo,
apresentação e análise de dados, bem como obter
conclusões válidas e tomar decisões razoáveis baseadas
em tais análises.
 Técnicas Estatísticas: São as várias técnicas por meio
das quais é possível estudar conjuntos de dados e, a
partir de uma amostra (se necessária), tirar conclusões
válidas para conjuntos maiores (população).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 De uma maneira geral, as técnicas estatísticas são
utilizadas em três etapas principais do trabalho de
pesquisa:
1. A coleta de dados, incluindo o planejamento do
trabalho e da pesquisa;
2. A apresentação dos dados coletados; e
3. A análise dos dados coletados, com a formulação
de conclusões e generalizações.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
- Essa primeira etapa corresponde ao estabelecimento
do método de coleta de dados (questionário ou teste
ou ensaio de material) e elaboração dos
questionamentos ou determinação das variáveis que
serão estudadas, de acordo com o interesse do
pesquisador; e o cálculo do tamanho da amostra, de
acordo com a natureza da pesquisa, do tempo e do
orçamento disponíveis.
COLETA DE DADOS
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
- A segunda etapa requer técnicas específicas para a
transformação dos dados numéricos em tabelas ou
gráficos (é a partir da organização dos dados
coletados que se poderá elaborar a interpretação).
APRESENTAÇÃO DOS DADOS COLETADOS
ANÁLISE DOS DADOS COLETADOS
- Essa etapa é simultânea à anterior, pois durante a
própria organização dos dados já é possível ir
percebendo a tendência geral da pesquisa.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
• No sentido de melhor esclarecer o significado da
análise e interpretação dos dados, deve-se estabelecer
uma distinção entre
ESTATÍSTICA DESCRITIVA
e
INFERÊNCIA
ESTATÍSTICA
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
• Como o próprio nome sugere, constitui-se num conjunto
de técnicas que objetivam descrever, analisar e interpretar
os dados numéricos de uma população ou amostra.
 Estatística Descritiva: Objetiva sintetizar e representar de
uma forma compreensível a informação contida num
conjunto de dados.
• Materializa-se na construção de tabelas e/ou gráficos ou
no cálculo de medidas que representem convenientemente
a informação contida nos dados.
• Adquire importância quando o volume de dados for
significativo.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
• Objetivo mais ambicioso que o da estatística descritiva.
 Inferência Estatística: Baseada na análise de um conjunto
limitado de dados (uma amostra), objetiva caracterizar o
todo a partir do qual tais dados foram obtidos (a população).
• Os métodos e técnicas utilizados são mais sofisticados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Figura 1.1- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Figura 1.2- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 População: É o conjunto de todos os elementos que contêm
uma certa característica que se deseja estudar.
• Como é comum a todos os elementos, esta característica
varia em quantidade ou qualidade.
• Uma população pode ter dimensão finita ou infinita.
 Amostra: É um subconjunto de dados que pertencem à
população. As amostras aleatórias são escolhidas por meio
de processos (técnicas de amostragem) que garantem que o
subconjunto obtido é representativo da população.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Principais motivos para o estudo da amostra:
1. População infinita;
2. Custo em termos de tempo ou de dinheiro que um
estudo em toda a população implicaria;
3. Obtenção de informação por meio de testes destrutivos,
no âmbito industrial;
4. Impossibilidade de acesso a todos os elementos da
população.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Fases do método de análise estatística:
• No âmbito da Estatística, o método de abordagem dos
problemas pode ser dividido em cinco fases:
1. Estabelecimento do objetivo da análise a efetuar (questões a
serem resolvidas) e definição das populações correspondentes;
2. Concepção de um procedimento adequado para a seleção de
uma ou mais amostras (escolha das técnicas de amostragem a
utilizar).
3. Coleta de dados.
4. Análise dos dados (Estatística Descritiva).
5. Estabelecimento de inferências a respeito da população
(Inferência Estatística)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Fases do método de análise estatística:
Identificação do problema → Objetivo da análise
Planejamento da experiência → Técnicas de Amostragem
Coleta de dados
Análise exploratória dos dados → Estatística Descritiva
Análise e interpretação dos resultados → Inferência Estatística
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Isso é necessário, pois podem ocorrer registros que não
se encaixam no padrão geral observado e, dessa forma,
a sua veracidade deve ser averiguada, pois podem tratar-
se de erros de observação, bem como do próprio registro
ou provenientes de alterações do fenômeno em estudo.
• Não existe uma estratégia única para iniciar o estudo
descritivo, embora uma primeira recomendação seja
começar por uma exploração visual dos dados
levantados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Embora estas análises já se encontrem disponíveis em
vários softwares e calculadoras programáveis, para uma
melhor interpretação das mesmas é conveniente
conhecer as técnicas utilizadas.
• Para se ter uma ideia mais concreta sobre os dados
levantados, deve-se recorrer às tabelas e/ou gráficos que
podem representar, de maneira sintética, as informações
sobre o comportamento de variáveis numéricas
levantadas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Portanto, para se proceder um estudo descritivo, é importante:
- Ordenação dos dados – fase onde se começa a ter uma ideia a
respeito de algumas medidas de posição (média, mediana,
quartis etc.);
- Estatísticas amostrais – a partir de algumas medidas promove-se
um resumo dos dados levantados, relativamente à posição,
dispersão e forma;
- Agrupamento dos dados e representação gráfica – revela a forma
possível para a população em estudo e permite escolher a classe
de modelos que deve ser explorada nas análises mais
sofisticadas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Dados brutos: Como primeiro resultado de uma pesquisa, obtêm-
se dados brutos, ou seja, um conjunto de números ainda sem
organização alguma.
 Rol: Os dados brutos são então ordenados de forma crescente ou
decrescente, com a indicação da frequência de cada um, dando origem
ao chamado rol.
 Tabulação dos dados: Depois de elaborar o rol é preciso
determinar quantas faixas terá a tabela de frequência. A fórmula de
Sturges é utilizada para estabelecer o número aproximado de classes
onde: n = número de elementos da amostra (tamanho da amostra)
k = número de classes que a tabela de classes deverá conter.
nlog22,31k ⋅+≅
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
• Observações: - k deverá ser no mínimo 3 e no máximo 20;
- Como a variável k é um número inteiro, ela
deverá ser aproximada para o maior inteiro (por
exemplo, se k ≈ 6,4, usa-se k = 7).
 Frequência de classes: O passo seguinte é subdividir os dados
pelas classes ou categorias e determinar o número de indivíduos
pertencentes a cada uma, resultando nas frequências de classes.
 Apresentação final dos dados (tabela completa): Com
base em todos os cálculos feitos anteriormente, pode-se fazer uma
nova tabela com todas as frequências, as quais serão estudadas a
posteriori.
 Gráficos: A partir da tabela de frequências, faz-se o desenho
gráfico, um recurso de visualização dos dados constantes na tabela.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Os dados que constituem uma amostra podem ser de
quatro tipos, assim distribuídos:
• Qualitativos
- Nominal
- Ordinal
• Quantitativos
- Intervalar
- Absoluto
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
a) Dados nominais: Quando cada um deles for identificado
pela atribuição de um nome que designa uma classe.
a) Exaustivas - qualquer dado pertence a uma das classes;
b) Mutuamente exclusivas - cada dado pertence somente
a uma classe;
c) Não ordenáveis - não existe nenhum critério relevante
que permita estabelecer preferência por qualquer
classe em relação às restantes.
Neste caso, as classes devem ser:
- Exemplo: Classificação das pessoas pela cor do cabelo
(preto, castanho, louro etc.).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Exemplo: Classificação de conceitos de avaliação na
disciplina em insuficiente, regular, bom e excelente.
b) Dados ordinais: São semelhantes aos dados nominais;
contudo, nessa escala existe a possibilidade de se
estabelecer uma ordenação dos dados nas classes,
segundo algum critério relevante.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observação: Neste caso, pode-se atribuir um significado
à diferença entre esses números, mas não à razão entre
eles.
Por exemplo, o registro de temperaturas em ºC, em determinadas
horas de dias sucessivos. Se em três dias consecutivos a
temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o
terceiro dia esteve duas vezes mais quente que o segundo, pois se
a temperatura fosse expressa em outra escala, a razão entre os
valores registrados naqueles dias seria diferente.
c) Dados intervalares: No caso da escala intervalar, os
dados são diferenciados e ordenados por números
expressos em uma ordem cuja origem é arbitrária.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
d) Dados absolutos: Contrariamente ao que sucede com a
escala intervalar, a escala absoluta tem origem fixa (nesta
escala, o valor zero tem significado).
• Escala intervalar: temperatura de 0ºC não significa que não haja
temperatura.
• Escala absoluta: peso de 0 kg significa que não existe peso.
• Em conseqüência ao fato da origem ser fixa, a razão entre os
dados expressos numa escala absoluta passa a ter significado; uma
pessoa com 60 kg tem o dobro do peso de uma com 30 kg.
- Exemplo: Pesos de pessoas expressos em kg.
- Observações:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observação: Quando se trabalha com dados quantitativos,
é necessário que se faça a distinção entre os dados discretos
e os contínuos.
Os dados denominam-se discretos quando são valores de uma
variável aleatória discreta, que é a aquela que assume valores em
pontos da reta real (por exemplo, número de páginas em um
livro: 1, 2, 3, 4, 5...).
Os dados são contínuos quando são valores de uma variável
aleatória contínua, que é aquela que pode assumir qualquer valor
em certo intervalo da reta real (por exemplo, o peso de
funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de frequências:
• Devido à necessidade das categorias estarem
ordenadas, somente se pode falar de frequências
acumuladas quando os dados estão em escalas ordinais,
intervalar ou absoluta.
• A representação tabular com todos os tipos de
frequências é mostrada a seguir:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de frequências:
a) Frequência absoluta (ni): O número de dados contidos
numa classe ou categoria qualquer i (i = 1,..., k) de
um conjunto de dados designa-se por frequência
absoluta da classe ou categoria i.
• Denotando-se por ni tal frequência e admitindo que
as categorias especificadas contêm todos os dados,
o número total de dados (n) é calculado por:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de frequências:
b) Frequência relativa (fi): O número total de dados que
pertencem a uma classe ou categoria qualquer i,
quando expressos como uma proporção do número
total de dados, designa-se por frequência relativa da
classe ou categoria i e é dada por:
• As frequências relativas são muitas vezes definidas
em termos percentuais.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de frequências:
c) Frequência absoluta acumulada (Ni): Representa para
cada classe ou categoria i, a frequência absoluta de
dados que pertencem à classe ou às classes anteriores.
d) Frequência relativa acumulada (Fi): Representa para
cada classe categoria i, a frequência relativa de dados
que pertencem à classe ou às classes anteriores.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de frequências:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
• Uma vez elaborada a tabela de frequências, segue-se o
desenho do gráfico, um recurso de visualização dos
dados constantes na tabela.
• Os tipos de gráficos mais comuns são: histograma;
polígono de frequência, setograma e ogiva de Galton.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma: Este tipo de gráfico é utilizado para
representar as frequências absolutas (ni) em relação à
sua classe, e é assim construído:
1. No eixo das abscissas marcam-se, em escala, as classes dos
dados;
2. No eixo das ordenadas, marcam-se as frequências das classes;
3. Faz-se a correspondência entre cada intervalo no eixo das
classes com um valor no eixo das frequências, formando um
desenho de colunas paralelas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
1. No eixo das abscissas, coloca-se o ponto médio de
cada intervalo de classe;
2. No eixo das ordenadas, permanecem as frequências
absolutas das classes (ni) ;
3. Ligam-se os pontos médios por segmentos de reta;
4. Para completar o polígono, acrescenta-se um ponto
médio com frequência zero em cada uma das
extremidades da escala horizontal.
- Polígono de frequência: Utilizado para indicar o ponto médio
ou representante de classe em suas respectivas frequências
absolutas; normalmente, é construído sobre o histograma, da
seguinte forma:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma e Polígono de frequência:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma
- Polígono de frequência:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico em setores (Setograma): Também conhecido como
gráfico de pizza, é utilizado para representar valores relativos (%);
é construído da seguinte forma:
1. Faz-se um círculo;
2. Cada setor é regido pela
fórmula:
3. No círculo, distribui-se os
valores das frequências
percentuais
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Ogiva de Galton: Este tipo de gráfico é utilizada para
representar as frequências acumuladas de uma
distribuição; é construído da seguinte forma:
1. No eixo das abscissas coloca-se as classes dos dados, tal como
no histograma;
2. No eixo das ordenadas, escreve-se uma das frequências
acumuladas, marcando o ponto com os limites superiores (Li) de
cada classe; inicia-se com a frequência zero e com limite
inferior da 1ª classe.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Ogiva de Galton:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico linear: É o tipo
de gráfico que apresenta
os dados estatísticos por
meio de uma linha
poligonal. Os pontos da
polígono são obtidos pelas
informações contidas em
cada linha da tabela, e
marcados no plano
utilizando o sistema
cartesiano. São utilizados
para representar séries
cronológicas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico de colunas: É
o tipo de gráfico que
apresenta os dados
estatísticos por meio de
retângulos (colunas)
dispostas em posições
vertical. Todos os
retângulos possuem a
mesma base e a altura
proporcional aos dados.
Podem ser utilizados para
representar qualquer série
estatística.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico de colunas:
Este tipo de gráfico é
semelhante ao de colunas,
onde os retângulos
(barras) estão dispostos
horizontalmente. É
utilizado para legendas
longas, em todas as séries.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Qualitativos:
• Exemplo: Em uma amostra constituída de 120 peças, constatou-
se que 100 não tinham qualquer defeito, 15 tinham defeitos
recuperáveis e 5 apresentavam defeitos irrecuperáveis.
Representar em uma tabela, e também graficamente, as
frequências (absolutas e relativas) dos dados que constituem essa
amostra:
Categoria de peças Frequência absoluta
(ni)
Frequência relativa
(fi)
Sem defeitos
Recuperáveis
irrecuperáveis
100
15
5
83,3%
12,5%
4,2%
TOTAL 120 100%
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Qualitativos:
Gráfico em Setores
83,3%
12,5%
4,2%
Sem defeitos
Recuperáveis
irrecuperáveis
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
• Exemplo: Em um estudo realizado com o objetivo de
caracterizar o comportamento dos clientes de um
supermercado, analisou-se o número de ocupantes por
veículo para 1000 veículos que entraram no
estacionamento do referido supermercado, em um
sábado. Os resultados encontram-se resumidos na
tabela seguinte:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
Nº de ocupantes
por veículo
(xi)
Frequência
absoluta
(ni)
Frequência
relativa
(fi)
Frequência
absoluta acumulada
(Ni)
Frequência
relativa acumulada
(Fi)
1
2
3
4
5
6
7
103
147
248
197
152
100
53
10,3%
14,7%
24,8%
19,7%
15,2%
10,0%
5,3%
103
250
498
695
847
947
1000
10,3%
25,0%
49,8%
69,5%
84,7%
94,7%
100,0%
TOTAL 1000 100%
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
0
50
100
150
200
250
300
ni
1 2 3 4 5 6 7
Nº ocupantes / veículo
Gráfico em colunas
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
• Distribuições agrupadas: Essas distribuições são úteis
quando existe um grande número de dados relativos a
uma variável contínua, cujos valores observados são
muito próximos uns dos outros.
- A frequência de cada classe é o número de observações que ela
contém.
- No exemplo anterior, os dados observados correspondem a uma
variável discreta; para o caso de dados relativos uma variável
contínua existem algumas diferenças.
 Dados Quantitativos:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
• Exemplo: O conjunto de dados baixo representa o
peso, em gramas, do conteúdo de uma série de 100
garrafas que, no decurso de um teste, saíram de uma
linha de enchimento automático:
302,25; 299,20; 300,24; 297,22; 298,35; 303,76;
298,65; 299,38; 300,36; 299,16; 300,86; 299,83;
302,52; 300,12; 301,81; 297,99; 299,23; 298,73;
303,07; 299,07; 297,83; ... ; 300,80
 Dados Quantitativos:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
• No conjunto de dados mostrado não existe
praticamente repetição de valores; logo, não é
vantagem se utilizar os dados agrupados numa tabela
de frequências, pois a mesma teria tantas linhas quanto
o número de dados.
• No entanto, a tabela de frequências pode ser construída
se os dados forem agrupados por classes:
 Dados Quantitativos:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
Classes
Frequência
absoluta
(ni)
Frequência
relativa (%)
(fi)
Frequência
absoluta
acumulada
(Ni)
Frequência
relativa
acumulada (%)
(Fi)
[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[
8
21
28
15
11
10
5
1
1
8
21
28
15
11
10
5
1
1
8
29
57
72
83
93
98
99
100
8
29
57
72
83
93
98
99
100
TOTAL 100 100%
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
Histograma
0
5
10
15
20
25
30
[297,00 ;
298,00[
[298,00 ;
299,00[
[299,00 ;
300,00[
[300.00 ;
301,00[
[301,00 ;
302,00[
[302,00 ;
303,00[
[303,00 ;
304,00[
[304,00 ;
305,00[
[305,00 ;
306,00[
Peso (kg)
fi
 Dados Quantitativos:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Nas seções anteriores foi visto a sintetização de dos dados
sob a forma de tabelas, gráficos e distribuição de
frequências.
 O cálculo de estatísticas amostrais é uma forma mais
sintética de descrever um conjunto de dados, ou seja,
possibilita representar um conjunto de dados relativos à
observação de determinado fenômeno de forma reduzida.
 As estatísticas amostrais são calculadas com base nos
dados, a partir das quais é possível descrever globalmente
o conjunto de valores que os referidos dados tomam.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição ou de tendência central:
• Média aritmética, média geométrica, média harmônica,
mediana, quartis, decis, percentis e moda.
• Amplitude total, desvio médio, variância, desvio
padrão, amplitude interquartílica e coeficiente de
variação.
b) Medidas de dispersão:
• Medidas de assimetria e medidas de curtose.
c) Medidas de forma:
 As estatísticas amostrais ou medidas estatísticas são
divididas em três grupos:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Essas medidas nos orientam quanto à posição da
distribuição no eixo x (eixo dos números reais);
• Possibilitam comparações de séries de dados entre si
pelo confronto desses números.
• São chamadas de medidas de tendência central, pelo
fato de representarem os fenômenos pelos seus valores
médios, em torno dos quais tendem a concentrar-se os
dados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
n
x
x
n
1i
i∑=
= (dados não agrupados)
a) Medidas de posição:
• Para um conjunto de n dados de xi (i = 1,2,..., n) a
média aritmética simples ou média amostral,
representada por é definida pela expressão:x
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
87,2x
15
411312557323312
x
n
x
x
n
1i
i
=
∴
++++++++++++++
=
∴=
∑=
2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4
• Exemplo: Determinar a média aritmética simples (média
aritmética amostral) dos dados mostrados abaixo:
a) Medidas de posição:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição:
• Quando os dados estiverem agrupados numa
distribuição de frequência usa-se a média
aritmética dos valores xi ponderadas pelas
respectivas frequências absolutas ni, assim:
n
xn
x
n
1i
ii∑=
= (dados agrupados)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição:
• Exemplo (dados agrupados): Determinar a média
aritmética simples (média aritmética amostral) da
distribuição dada abaixo:
xi 1 2 3 4 5 7
ni 4 3 4 1 2 1
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
87,2x
15
43
15
)17(...)41(
n
nx
x
n
1i
ii
=
=
⋅++⋅
==
∑=
a) Medidas de posição:
• Exemplo (dados agrupados): xi ni xini
1
2
3
4
5
7
4
3
4
1
2
1
4
6
12
4
10
7
Σ 15 43
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição
• No caso da variável ser contínua, visto que se
perdeu os valores concretos do conjunto (ficaram
afetos a uma determinada classe) não se pode
calcular a média amostral diretamente dos valores
dos dados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição:
• Deste modo, à cada classe vai ser atribuído um representante
(xi), e a média amostral será calculada por meio desses
representantes:
n
xn
x
k
1i
ii∑=
= (dados agrupados em classes)
onde k é o número de classes do agrupamento, ni é a
frequência absoluta da classe i e xi é o ponto médio da classe
i, o qual é considerado como elemento representativo da
classe.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição:
• Exemplo (dados agrupados em classes):
Determinar a média da distribuição a seguir, a
qual representa o peso, em gramas, do conteúdo
de uma série de 100 garrafas que, no decurso de
um teste, saíram de uma linha de enchimento
automático (exemplo anterior):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética:
a) Medidas de posição:
• Exemplo (dados agrupados em classes):
Classes ni xi xini
[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[
8
21
28
15
11
10
5
1
1
297,5
298,5
299,5
300.5
301,5
302,5
303,5
304,5
305,5
2380,0
6268,5
8386,0
4507,5
3316,5
3025,0
1517,5
304,5
305,5
Σ 100 30011,0
11,300x
100
0,30011
x
n
xn
x
9
1i
ii
=
=
=
∑=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética (Ponderada)
a) Medidas de posição:
• Às vezes, associam-se os números x1, x2, ..., xk a certos
fatores de ponderação ou pesos w1, w2, ... , wk que
dependem do significado ou importância atribuída aos
mesmos. Nesse caso
k21
kk2211
i
k
1i
ii
w...ww
xw...xwxw
w
xw
x
+++
+++
==
∑
∑=
é denominada de média aritmética ponderada.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.1) Média aritmética (Ponderada)
a) Medidas de posição:
• Exemplo: Em um curso, a avaliação final tem peso 3 e as
parciais peso 1; a nota média de um estudante que obtenha
nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais,
será:
3,8
5
5,41
311
)5,83()0,91()0,71(
w
xw
x 3
1i
i
3
1i
ii
==
++
⋅+⋅+⋅
==
∑
∑
=
=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.2) Média geométrica: A média geométrica G (ou ) de
um conjunto de n números x1, x2, ..., xn é a raiz de
ordem n do produto desses números:
a) Medidas de posição:
n
n21 x...xxG ⋅⋅=
464842G 33
==⋅⋅=
- Exemplo: A média geométrica dos números 2, 4 e 8:
Gx
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.2) Média geométrica (dados agrupados): Se os elementos
x1, x2, ..., xn ocorrem com as frequências n1, n2,..., nk,
sendo n1+n2+...+nk = n a frequência total, a média
geométrica G desses elementos será deduzida como:
a) Medidas de posição:
n n
k
n
2
n
1n
vezesn
kkk
vezesn
222
vezesn
111
k21
k21
x...xxxxxx...xxx...xxG ⋅==
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.3) Média harmônica: A média harmônica H (ou ) de
um conjunto de n elementos x1, x2, ..., xn é a recíproca
da média aritmética da recíproca dos elementos:
a) Medidas de posição:
∑∑ ==
== n
1j j
n
1j j x
1
n
x
1
n
1
1
H
43,3
8
7
3
8
1
4
1
2
1
3
x
1
n
H n
1j j
==
++
==
∑=
- Exemplo: A média harmônica dos números 2, 4 e 8:
Hx
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.4) Mediana: Para os dados colocados em ordem crescente,
mediana (md, Me ou ) é o valor que divide a amostra,
ou população, em duas partes iguais. Assim:
a) Medidas de posição:
x~
50% 100%0%
x~
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.4) Mediana (série de elementos não agrupados):
a) Medidas de posição:
• Considerando que os dados que integram a
amostra são colocados em ordem crescente,
formando um vetor (x1, x2, ..., xn) - amostra
ordenada -, a mediana amostral é definida como
segue:







+
=
=
+
+
2
xx
x~
xx~
2
2n
2
n
2
1n n ímpar
n par
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.4) Mediana (série de elementos não agrupados):
a) Medidas de posição:
• Exemplo: Para as distribuições abaixo, determinar as
respectivas medianas:
8, 5, 15,11, 4, 1, 7, 2, 9
Ordenando:
1, 2, 4, 5, 7, 8, 9, 11,15
Como n é ímpar, então:
7xxx~
5
2
1n === +
8, 5, 15,11, 4, 1, 7, 2, 9, 3
Ordenando:
1, 2, 3, 4, 5, 7, 8, 9, 11,15
Como n é par, então:
6
2
75
2
xx
2
xx
x~ 652
2n
2
n
=
+
=
+
=
+
=
+
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de frequência):
a) Medidas de posição:
• Exemplo: Para a distribuição abaixo, determinar a mediana:
xi ni Ni
1
2
3
4
1
3
5
2
1
4
9
11
Σ 11
contém o 6º
elemento
n = 11 (ímpar), logo será o
elemento de ordem (n+1)/2, ou
seja, (11+1)/2 = 6º elemento.
Da coluna da frequência
acumulada crescente, encontra-se
o valor xi correspondente à classe
que contém a ordem calculada,
assim: = 3.x~
x~
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Para a distribuição abaixo, determinar a mediana:
xi ni Ni
82
85
87
89
90
9
12
11
6
4
9
21
32
38
42
Σ 42 86
2
8785
x~ =
+
=
22º
n = 42, é par, logo será a média
entre os elemento de ordem n/2 e
(n/2)+1, ou seja, 21º e 22º
elementos.
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 85
e 87, assim:
21º
x~
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Para a distribuição abaixo, determinar a mediana:
xi ni Ni
82
85
87
89
90
5
10
15
8
4
5
15
30
38
42
Σ 42
21º e 22º
n = 42, é par, logo será a média
entre os elemento de ordem n/2 e
(n/2)+1, ou seja, 21º e 22º
elementos.
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 87
e 87, assim:
87
2
8787
x~ =
+
=
x~
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Para variáveis contínuas, identifica-se a classe que contém
a mediana (n/2), denominada classe Md (como a variável é
contínua, não interessa se n é par ou ímpar); o valor
aproximado para a mediana será calculado pela equação:
Md
Md
1Md
Md
Md
Md1Md
Md a
f
F5,0
l
n
aN
2
n
lx~ −
−
−
+=






−
+=
onde: NMd-1 é a frequência absoluta acumulada da classe antes da classe
mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente, o
limite inferior, a amplitude e a frequência absoluta da classe mediana.
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Dada a distribuição amostral, calcular a mediana:
Classes ni Ni
35 45
45 55
55 65
65 75
75 85
85 95
5
12
18
14
6
3
5
17
35
49
55
58
Σ 58
classe Md
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo:
1º Passo: Calcula-se n/2; como n=58, então 58/2=29º.
2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª).
3º Passo: Aplica-se a fórmula:
Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:
67,61
18
1017
2
58
55
n
aN
2
n
lx~
i
i1i
i =






−
+=






−
+=
−
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.5) Quartis:
a) Medidas de posição:
• Como já visto anteriormente, a mediana é a
medida de posição que divide um conjunto de
dados em duas partes iguais;
• Os quartis dividem um conjunto de dados em
quatro partes iguais, assim:
50% 75%25%
Q1 Q2 Q3
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.5) Quartis:
a) Medidas de posição:
Q1 = 1º quartil, deixa 25% dos elementos;
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos
elementos;
Q3 = 3º quartil, deixa 75% dos elementos.
50% 75%25%
Q1 Q2 Q3
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.5) Quartis (série de elementos não agrupados):
a) Medidas de posição:
• A determinação de Qk (k = 1, 2 e 3), segue a fórmula:





 +
=
4
1n
kQk
• Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207,
305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ?
196elementoº2
4
17
1Q1 →=




 +
=
3,193elementoº75,1
4
16
1Q1 →=




 +
=
597elementoº6
4
17
3Q3 →=




 +
=
8,579elementoº25,5
4
16
3Q3 →=




 +
=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• A determinação de Qk (k = 1, 2 e 3), segue os passos:
k
k
k
k Q
Q
1Q
Qk a
n
N
4
kn
lQ ⋅






−
+=
−
- 1º Passo: Calcula-se a ordem kn/4;
- 2º Passo: Identifica-se a classe Qk pela frequência acumulada N;
- 3º Passo: Aplica-se a fórmula:
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição
• Exemplo: Dada a distribuição amostral, determinar Q1 e Q3:
Classes ni Ni
35 45
45 55
55 65
65 75
75 85
85 95
5
12
18
14
6
3
5
17
35
49
55
58
Σ 58
classe Q1
classe Q3
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Para Q1.
1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º.
2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).
3º Passo: Aplica-se a fórmula:
Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:
( ) 92,5210
12
55,14
45a
n
N
4
n1
lQ 1
1
1
1 Q
Q
1Q
Q1 =⋅
−
+=⋅






−
+=
−
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Para Q3.
1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º.
2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).
3º Passo: Aplica-se a fórmula:
Neste caso lQ3 = 65, n = 58, NQ3-1 = 35, aQ3 = 10, nQ3 = 14; logo:
( ) 07,7110
14
355,43
65a
n
N
4
n3
lQ 3
3
3
3 Q
Q
1Q
Q3 =⋅
−
+=⋅






−
+=
−
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Exemplo: Diante desses resultados, pode-se afirmar que,
nesta distribuição, tem-se:
25% 25%25%25%
52,92 61,67 71,0735 95
ou seja: O valor de 52,92 deixa 25% dos elementos;
O valor de 61,67 deixa 50% dos elementos;
O valor de 71,07 deixa 75% dos elementos.
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.6) Decis:
a) Medidas de posição:
• Os decis dividem um conjunto de dados em dez
partes iguais, assim:
D1
90%80%70%60%50%40%30%20%10%
D2 D3 D4 D5 D6 D7 D8 D9
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.6) Decis:
a) Medidas de posição:
D1 = 1º decil, deixa 10% dos elementos da série;
D2 = 2º decil, deixa 12% dos elementos da série;
D5 = 5º decil, coincide com a mediana, deixa 50% dos
elementos da série;
D6 = 6º decil, deixa 60% dos elementos da série;
D7 = 7º decil, deixa 70% dos elementos da série;
D8 = 8º decil, deixa 80% dos elementos da série;
D9 = 9º decil, deixa 90% dos elementos da série.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.6) Decis (série de elementos não agrupados):
a) Medidas de posição:
• A determinação de Dk (k = 1, 2, ..., 9), segue a fórmula:





 +
=
10
1n
kDk
• Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207,
305, 574, 597, 612.
305elementoº4
10
17
5D5 →=




 +
=
2,520elementoº8,4
10
17
6D6 →=




 +
=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• A determinação de Dk (k = 1, 2, ..., 9), para o caso de
variáveis contínuas com os dados divididos em classes,
segue os passos:
k
k
k
k D
D
1D
Dk a
n
N
10
kn
lD ⋅






−
+=
−
- 1º Passo: Calcula-se a ordem kn/10;
- 2º Passo: Identifica-se a classe Dk pela frequência acumulada N;
- 3º Passo: Aplica-se a fórmula:
a.6) Decis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Percentis:
a) Medidas de posição:
• Os percentis dividem um conjunto de dados em
cem partes iguais, assim:
P1
99%98%97%3% . . .2%1%
P2 P3 P50 P97 P98 P99
50% . . .
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Percentis:
a) Medidas de posição:
P1 = 1º percentil, deixa 1% dos elementos;
P2 = 2º percentil, deixa 2% dos elementos.
P50 = 50º percentil, coincide com a mediana, deixa 50% dos
elementos;
P99 = 99º percentil, deixa 99% dos elementos.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Percentis (série de elementos não agrupados):
a) Medidas de posição:
• A determinação de Pk (k = 1, 2, ..., 99) para uma série de
elementos não agrupados, segue a fórmula:





 +
=
100
1n
kPk
• Exemplo: Determine o 50º e o 60º percentis da série 185, 196,
207, 305, 574, 597, 612.
305elementoº4
100
17
50P50 →=




 +
=
2,520elementoº8,4
100
17
60D60 →=




 +
=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• A determinação de Pk (k = 1, 2, ..., 99), para o caso de
variáveis contínuas com os dados divididos em classes,
segue os passos:
k
k
k
k P
P
1P
Pk a
n
N
100
kn
lP ⋅






−
+=
−
- 1º Passo: Calcula-se a ordem kn/100;
- 2º Passo: Identifica-se a classe Pk pela frequência acumulada N;
- 3º Passo: Aplica-se a fórmula:
a.7) Percentis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de frequência):
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º
percentil da seguinte distribuição:
a) Medidas de posição:
Classes ni Ni
35 45
45 55
55 65
65 75
75 85
85 95
5
12
18
14
6
3
5
17
35
49
55
58
Σ 58
classe D4
classe P72
Cálculo de D4
34,5510
18
17
10
584
55D
18n;10a
;58n;17N;55l
2,23
10
584
10
kn
4
DD
1DD
o
44
44
=⋅






−
⋅
+=
==
===
=
⋅
=
−
1º Passo:
2º Passo:
3º Passo:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º
percentil da seguinte distribuição:
a) Medidas de posição:
Classes ni Ni
35 45
45 55
55 65
65 75
75 85
85 95
5
12
18
14
6
3
5
17
35
49
55
58
Σ 58
classe D4
classe P72
Cálculo de P72
82,6910
14
35
100
5872
65P
14n;10a
;58n;35N;65l
8,41
100
5872
100
kn
72
PP
1PP
o
7272
7272
=⋅






−
⋅
+=
==
===
=
⋅
=
−
1º Passo:
2º Passo:
3º Passo:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.7) Exemplo (decil e percentil).
a) Medidas de posição:
• Portanto, na distribuição analisada, tem-se que:
- O valor 55,34 indica que 40% dos elementos da
distribuição estão abaixo dele e os outros 60%
acima.
- O valor 69,82 indica que 72% dos elementos da
distribuição estão abaixo dele e os outros 28%
acima.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda
a) Medidas de posição:
• Moda (Mo) é a medida que indica o valor ou a gama
de valores nos quais a concentração dos dados
amostrais é máxima.
- Para variáveis discretas, a moda é o valor dos dados
que ocorre com maior frequência;
- Para variáveis contínuas, a classe modal é o intervalo
de classe com maior frequência.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda
a) Medidas de posição:
• Assim, da representação gráfica dos dados, obtém-se
imediatamente o valor que representa a moda ou a
classe modal.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda
a) Medidas de posição:
• Esta medida é especialmente útil para reduzir a
informação de um conjunto de dados qualitativos,
apresentados sob a forma de nomes ou categorias,
para os quais não se pode calcular a média e por
vezes a mediana (se não forem susceptíveis de
ordenação).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (distribuições simples)
a) Medidas de posição:
• Para distribuições simples (sem agrupamento em
classes), a identificação da moda é facilitada pela
simples observação do elemento que apresenta maior
frequência.
- Exemplo: Para a distribuição abaixo Mo = 248.
xi 243 245 248 251 307
ni 7 17 23 20 8
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (dados agrupados)
a) Medidas de posição:
• Para dados agrupados em classe, existem diversas
fórmulas para o cálculo da moda:
- Fórmula de Czuber: Após a identificação da classe modal,
aplica-se a fórmula abaixo, onde
i
21
1
io alM ⋅
+
+=
∆∆
∆
l = limite inferior da classe modal;
Δ1= diferença entre a frequência absoluta da
classe modal e a imediatamente anterior;
Δ2 = diferença entre a frequência absoluta da
classe modal e a imediatamente posterior;
ai = amplitude da classe modal.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (dados agrupados)
a) Medidas de posição:
- Exemplo: Determinar a moda para a distribuição:
Classes ni
35 45
45 55
55 65
65 75
75 85
85 95
5
12
18
14
6
3
- A classe com maior frequência absoluta
é [55, 65[; logo, ela é a classe modal.
- Aplicando a fórmula de Czuber, tem-se:
61M
10
)1418()1218(
1218
55M
alM
o
o
i
21
1
io
=
⋅
−+−
−
+=
⋅
+
+=
∆∆
∆
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (dados agrupados)
a) Medidas de posição:
- Densidades de classes: Quando as amplitudes das
classes são diferentes, deve-se calcular as densidades
de classes para identificar a classe modal, as quais são
obtidas por meio da relação ni/ai.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (dados agrupados)
a) Medidas de posição:
- Exemplo: Determinar a moda para a distribuição:
Salários (US$) ni ai ni/ai
80 180
180 250
250 300
300 500
70
140
140
60
100
70
50
200
0,7
2,0
2,8
0,3
12,26250
)3,08,2()0,28,2(
0,28,2
250alM i
21
1
io =⋅
−+−
−
+=⋅
+
+=
∆∆
∆
classe modal
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a.8) Moda (dados agrupados)
a) Medidas de posição:
- Fórmula de Pearson: Fornece uma boa aproximação
quando a distribuição apresenta razoável simetria em
relação à média. É dada pela relação:
x2x~3Mo −≅
ou seja, a moda é aproximadamente igual a diferença
entre o triplo da mediana e o dobro da média
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Observações:
a) Medidas de posição:
1. Média versus Mediana:
 Diferença entre estas duas medidas fica mais clara quando se
considera o exemplo das notas obtidas por um aluno como
sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode
ser comprovado, a média aritmética e a mediana são iguais a 14.
 Se esse aluno elevar a nota mais baixa, passando de 10 para 14,
a mediana ainda será o mesmo valor, mas o valor da média
sofrerá um aumento, passando para 14,4.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Observações:
a) Medidas de posição:
 A média, ao contrário da mediana, é uma medida de posição
muito pouco resistente, isto é, ela é muito influenciada por
valores muito grandes ou muito pequenos, mesmo que estes
valores surjam em pequeno número na amostra.
 Estes valores são os responsáveis pela má utilização da média
em muitas situações em que teria mais significado utilizar a
mediana.
1. Média versus Mediana:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Observações:
a) Medidas de posição:
 Entretanto, a preferência de uma ou de outra dependerá do
contexto em que forem utilizadas: se a distribuição é simétrica
essas medidas coincidem; caso contrário, observar que a mediana
não é tão sensível quanto a média, às observações que são muito
maiores ou muito menores do que as restantes; além disso, a
média reflete o valor de todas as observações.
1. Média versus Mediana:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Observações:
a) Medidas de posição:
 Representação das distribuições dos dados na forma de uma
curva de frequência:
1. Média versus Mediana:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Observações:
a) Medidas de posição:
 A média geométrica de um conjunto de números positivos é
menor ou igual à sua média aritmética, mas é maior ou igual à
sua média harmônica:
xGH ≤≤
 O sinal de igualdade somente é válido quanto todos os números
do conjunto de dados são idênticos.
2. Relação entre as médias aritmética, geométrica e harmônica:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
• São medidas estatísticas utilizadas para avaliar o grau de
variabilidade ou dispersão, dos valores em torno da
média.
• Servem para medir a representatividade da média
b) Medidas de dispersão
- Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30,
como pode ser calculado, ambas possuem média aritmética
igual a 20; entretanto, na primeira não existe dispersão,
enquanto a segunda apresenta dispersão em torno da média 20;
portanto, a média é muito mais representativa para a segunda
série.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
- Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36
R = 36 – 10 = 26
b.1) Amplitude total (ou amplitude amostral): É definida
como sendo a diferença entre o maior e o menor dos
valores da série, ou seja:
minmáx xxR −=
- Observação: É uma medida de dispersão muito limitada, pois
depende apenas dos valores externos, o que a torna instável,
não sendo afetada pela dispersão dos valores internos.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.2) Desvio médio: O desvio médio de um conjunto de n
números x1, x2 , ... , xn é definido por:
n
xx
n
xx
n
d
D
n
1i
i
n
1i
i
M
∑∑∑ −
=
−
== ==
onde
=− xxi
média aritmética dos números;
valor absoluto do desvio de cada número
em relação à média aritmética.
=x
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn
ocorrerem com as frequências n1, n2, ... , nn,
respectivamente, o desvio médio poderá ser indicado
da seguinte forma:
n
xxn
n
xxn
n
dn
D
i
n
1i
ii
n
1i
ii
M
∑∑∑ −
=
−
== ==
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância: A variância de um conjunto de dados é
definida como o quadrado do desvio padrão, evitando-
se com isso que Σdi=0.
- Quando é necessário distinguir entre o desvio
padrão de uma população e o de uma amostra
dela extraída, adota-se frequentemente o símbolo
σ para o primeiro e s para o último.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
- Para o caso da variância populacional são
adotadas as seguintes fórmulas:
N
)Xx(
N
)Xx( 2
n
1i
2
i
2 ∑∑ −
=
−
= =
σ (dados não agrupados)
N
)Xx(n
N
)Xx(n 2
i
k
1i
2
ii
2 ∑∑ −
=
−
= =
σ (dados agrupados)
média populacional;=X tamanho da população.=N
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
- Para o caso da variância amostral são adotadas
as seguintes fórmulas:
1n
)xx(
1n
)xx(
s
2
n
1i
2
i
2
−
−
=
−
−
=
∑∑=
(dados não agrupados)
1n
)xx(n
1n
)xx(n
s
2
i
k
1i
2
ii
2
−
−
=
−
−
=
∑∑=
(dados agrupados)
média amostral;=x tamanho da amostra.=n
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
• Fórmulas práticas para os cálculos das
variâncias:
( )








−=
∑
∑ N
xn
xn
N
1
2
ii2
ii
2
σ
( )








−
−
=
∑
∑ n
xn
xn
1n
1
s
2
ii2
ii
2
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão: Uma vez que a variância envolve a
soma de quadrados, a unidade em que se exprime não
é a mesma que a dos dados. Assim, para se conseguir
uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, toma-se a raiz
quadrada da variância e obtém-se o desvio padrão.
2
2
ss =
= σσ (desvio padrão populacional)
(desvio padrão amostral)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• O desvio padrão é uma medida que só pode assumir
valores não negativos e quanto maior for, maior será a
dispersão dos dados.
• Algumas propriedades do desvio padrão, que resultam
imediatamente da definição, são:
- o desvio padrão é sempre não negativo e será tanto maior,
quanta mais variabilidade houver entre os dados;
- se s= 0, então não existe variabilidade, isto é, os dados são
todos iguais.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
xi 5 7 8 9 11
ni 2 3 5 4 2
xi ni nixi
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
Σ 16 129
06,8
16
129
16
xn
n
xn
x
5
1i
ii
k
1i
ii
====
∑∑ ==
- Média aritmética:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
2,1
16
24,19
n
xxn
D
i
M ==
−
=
∑
xi ni nixi |xi-x| = |di| ni|di|
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
|5 – 8,06| = 3,06
|7 – 8,06| = 1,06
|8 – 8,06| = 0,06
|9 – 8,06| = 0,94
|11 – 8,06| = 2,94
6,12
3,18
0,30
3,76
5,88
Σ 16 129 19,24
- Desvio médio:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
xi ni nixi nixi
2
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
50
147
320
324
242
Σ 16 129 1.083
- Variância:
( )
86,2
16
)129(
083.1
116
1
s
n
xn
xn
1n
1
s
2
2
2
ii2
ii
2
=





−
−
=
=








−
−
=
∑
∑
- Desvio padrão:
69,186,2ss 2
===
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• A medida anterior tem a grande desvantagem de
ser muito sensível à existência, na amostra, de
uma observação muito grande ou muito pequena.
• Por esse motivo, define-se uma outra medida, a
amplitude interquartílica.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Esta medida é, de certa forma, uma solução de
compromisso, pois não é afetada, de um modo
geral, pela existência de um pequeno número de
valores demasiadamente grandes ou pequenos. É
definida como sendo a diferença entre o 3º e 1º
quartis; assim:
13Q QQD −=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Da definição de amplitude interquartílica, pode-se concluir
que 50% dos elementos do meio da amostra estão contidos
num intervalo com aquela amplitude. Esta medida é não
negativa e será tanto maior quanto maior for a variabilidade
nos dados.
• Ao contrário do que acontece com o desvio padrão, uma
amplitude interquartílica nula não significa necessariamente,
que os dados não apresentem variabilidade.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Alguns autores preferem calcular uma medida
próxima da referida: a amplitude semi-
interquartílica (ASI).
2
QQ
ASI 13 −
=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• A variação ou dispersão real, determinada a partir
do desvio padrão, ou qualquer outra medida de
dispersão, é denominada dispersão absoluta;
entretanto, uma variação ou dispersão, na medida
de uma determinada distância, é inteiramente
diferente quanto ao efeito, da mesma variação em
uma distância menor.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• A medida desse efeito é proporcionada pela
dispersão relativa, definida por:
Média
absolutaDispersão
relativaDispersão =
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Se a dispersão absoluta é o desvio padrão e a
média é a aritmética, a dispersão relativa é
denominada coeficiente de variação ou de
dispersão, dado por:
• coeficiente de variação é uma medida relativa de dispersão,
útil para a comparação em termos relativos do grau de
concentração em torno da média de séries distintas.
100
x
s
CVou100
X
CV ⋅=⋅=
σ
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Exemplo: Em uma empresa, o salário médio dos homens é
de $4.000,00, com desvio padrão de $1.500,00, e o das
mulheres é em média de $3.000,00, com desvio padrão de
$1.200,00. Então:
• Desses valores conclui-se, portanto, que o salário das
mulheres apresentam maior dispersão que os dos homens
%0,40100
3000
1200
100
X
CV
%5,37100
4000
1500
100
X
CV
=⋅=⋅=
=⋅=⋅=
σ
σ
Para os homens:
Para as mulheres:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Diz-se que a distribuição possui baixa, média ou alta
variabilidade (dispersão) conforme os seguintes valores:
Baixa dispersão: CV ≤ 10%
Média dispersão: 10% < CV < 20%
Alta dispersão: CV ≥ 20%
• Alguns analistas consideram valores diferentes:
Baixa dispersão: CV ≤ 15%
Média dispersão: 15% < CV < 30%
Alta dispersão: CV ≥ 30%
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Uma distribuição de frequência pode simétrica,
assimétrica positiva ou assimétrica negativa.
c.1) Medidas de assimetria:
• Denomina-se assimetria o grau de desvio ou
afastamento da simetria de uma distribuição.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Uma distribuição simétrica apresenta a igualdade entre as três
medidas de posição, média aritmética, mediana e modo, ou:
xx~Mo ==
xx~Mo <<
• Em uma distribuição assimétrica positiva, ou assimétrica à
direita, tem-se que:
• Em uma distribuição assimétrica negativa, ou assimétrica à
esquerda, tem-se que:
oMx~x <<
c.1) Medidas de assimetria:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Existem várias fórmulas para o cálculo do coeficiente de
assimetria, dentre elas duas são bastante utilizadas:
- 1º Coeficiente de Pearson:
s
Mx
ASou
Mx
AS oo −
=
−
=
σ
- 2º Coeficiente de Pearson:
13
31
QQ
x~2QQ
AS
−
−+
=
• Se AS = 0, a distribuição é simétrica
AS > 0, a distribuição é assimétrica positiva
AS < 0. a distribuição é assimétrica negativa.
c.1) Medidas de assimetria:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Exemplo: Identificar o grau de assimetria da
distribuição:
c.1) Medidas de assimetria:
Salários ($1.000,00) 30 50 50 100 100 150
Empregados 80 50 30
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Exemplo:
c.1) Medidas de assimetria:
Classes xi ni nixi nixi
2
ni/ai Ni
30 50
50
100
100
150
40
75
12
5
80
50
30
3200
3750
3750
128.00
0281.2
50468.
750
80/20 = 4
50/50 = 1
30/50 =
0,6
80
130
160
Σ
16
0
10.70
0
878.00
0
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Exemplo:
c.1) Medidas de assimetria:
6,0
4090
29040
QQ
x~2QQ
AS96,31s
796,0
96,31
429,4185,66
s
Mx
AS62,1021
160
)700.10(
000.878
159
1
s
5020
80
)080(
30x~429,4120
34
4
30M
9050
50
)80120(
50Q62,1021
160
)700.10(
000.878
159
1
s
4020
80
)040(
30Q875,66
160
700.10
x
13
31
o
2
2
o
3
2
2
1
=
−
−+
=
−
−+
==
=
−
=
−
==





−=
=⋅
−
+==⋅
+
+=
=⋅
−
+==





−=
=⋅
−
+===
- Como AS > 0, então a distribuição é assimétrica positiva.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Denomina-se curtose o grau de achatamento de
uma distribuição.
• Uma distribuição de frequência pode ser:
- Mesocúrtica: quando sua forma nem é achatada e
nem delgada;
- Leptocúrtica: quando apresenta a forma delgada;
- Platicúrdica: quando apresenta a forma achatada.
c.2) Medidas de curtose:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.2) Medidas de curtose:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Para medir o grau de curtose utiliza-se o coeficiente:
)PP(2
QQ
K
1090
13
−
−
=
onde Q3 = 3º quartil; P90 = 90º percentil;
Q1 = 1º quartil; P10 = 10º percentil.
• Se K = 0,263 – a curva correspondente à distribuição é
mesocúrtica;
K > 0,263 – a curva é platicúrdica;
K < 0,263 – a curva é leptocúrdica.
c.2) Medidas de curtose:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
• Exemplo: Para a mesma distribuição do exemplo da assimetria,
calcula-se ainda P10 e P90; logo:
c.2) Medidas de curtose:
355,0
)34375,104(2
4090
)PP(2
QQ
K
375,10450
160
)130144(
100P
3420
80
)016(
30P
1090
13
90
10
=
−
−
=
−
−
=
=⋅
−
+=
=⋅
−
+=
- Como K > 0,273, então a distribuição é do tipo platicúrtica.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
I - Estatística Descritiva
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
• Além dos diagramas já estudados, existem outras formas bastante
utilizadas internacionalmente para apresentar os dados amostrais. Um
bom modo de obter uma apresentação visual eficiente de um conjunto de
dados pode ser conseguido por meio de três tipos de gráficos: diagramas
de pontos, diagramas de ramo e folhas, e diagramas de caixa.
• O diagrama de pontos é uma apresentação útil de dados, no caso de
amostras pequenas (até cerca de 20 observações). Entretanto, quando o
número de observações for moderadamente alto, o diagrama de ramo e
folhas e o diagrama de caixa podem ser mais úteis.
• Questões como quantidades de dados abaixo de certo valor, tendência
central (média ou mediana), dispersão (desvio-padrão), possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e o
desvio da simetria, não são fáceis de responder, pois existem muitas
observações, e a construção de um diagrama de pontos, usando esses
dados, seria relativamente ineficiente .
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de pontos
• Um diagrama de pontos é um gráfico estatístico que consiste
em grupos de pontos de dados traçados em uma escala
simples.
• São utilizados para dados contínuos, quantitativos e
univariados, e são muito úteis para exibir um pequeno
conjunto de dados.
• Esse tipo de gráfico permite uma fácil visualização de duas
características dos dados: a posição (meio) e a dispersão
(espalhamento ou variabilidade)
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de pontos
• Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está
projetando um conector de náilon para ser usado em aplicação
automotiva. Ele considera estabelecer como especificação do projeto
uma espessura de 3/32 pol., mas está inseguro. Oito unidades do
protótipo são produzidas e suas forças de remoção são medidas,
resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3;
13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses
dados.
1.6 Outras Apresentações Gráficas de Dados
12 14 15
13
Força de remoção
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de pontos
• Exemplo 02: O engenheiro do exemplo anterior decide considerar
um projeto alternativo com uma espessura maior da parede do
conector, 1/8 pol. Oito protótipos desse projeto são construídos,
sendo as medidas observadas da força de remoção, resultando nos
seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5
e 13,1. Construa um diagrama de pontos para esses dados,
sobrepondo-o ao anterior para uma melhor análise da influência da
espessura da parede na força de remoção.
1.6 Outras Apresentações Gráficas de Dados
12 14 15
13,0 13,4
Força de remoção
3/32 pol.
1/8 pol.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
• Esta forma de apresentação de dados tem sido frequentemente
utilizada em trabalhos técnicos do mundo inteiro.
• Para construir o diagrama de ramo e folhas, dividimos o elemento
amostral em duas partes: um ramo (stem), consistindo em um ou
mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos
restantes.
Exemplo: O dado 458 é dividido em duas partes, a primeira parte
45, e a segunda parte 8.
• Geralmente, escolhe-se relativamente poucos ramos em comparação
ao número de observações (5 a 20 itens).
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
• Exemplo (Montgomery, 2004, p.16): Considere o
conjunto de dados abaixo, relativos à resistência a
compressão de uma liga de alumínio.
105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149
O diagrama de ramo e folhas resultante é apresentado a
seguir:
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas (dados brutos)
Ramo Folha Frequência
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
6
7
7
5 1
5 8 0
1 0 3
4 1 3 5 3 5
2 9 5 8 3 1 6 9
4 7 1 3 4 0 8 8 6 8 0 8
3 0 7 3 0 5 0 8 7 9
8 5 4 4 1 6 2 1 0 6
0 3 6 1 4 1 0
9 6 0 9 3 4
7 1 0 8
8
1 8 9
7
5
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas (dados ordenados)
Ramo Folha Frequência
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
6
7
7
1 5
0 5 8
0 1 3
1 3 3 4 5 5
1 2 3 5 6 8 9 9
0 0 1 3 4 4 6 7 8 8 8 8
0 0 0 3 3 5 7 7 8 9
0 1 1 2 4 4 5 6 6 8
0 0 1 1 3 4 6
0 3 4 6 9 9
0 1 7 8
8
1 8 9
7
5
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
• Em alguns casos pode ser desejável construir mais intervalos ou
ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em
dois ou mais novos ramos, conforme mostrado abaixo:
Ramo Folha
14L
14U
15L
15U
1 2 3 5
6 8 9 9
0 0 1 3 4 4
6 7 8 8 8 8
Ramo Folha
14z
14t
14f
14s
14e
15z
15t
15f
15s
15e
1
2
3
5
0 0
1 3
4 4
6 7 8
8 8 8
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
Frequência acumulada Ramo Folha
1
2
3
5
8
11
17
25
37
(10)
33
23
16
10
6
5
2
1
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
6
7
7
1 5
0 5 8
0 1 3
1 3 3 4 5 5
1 2 3 5 6 8 9 9
0 0 1 3 4 4 6 7 8 8 8 8
0 0 0 3 3 5 7 7 8 9
0 1 1 2 4 4 5 6 6 8
0 0 1 1 3 4 6
0 3 4 6 9 9
0 1 7 8
8
1 8 9
7
5
1.6 Outras Apresentações Gráficas de Dados
N = 80
Min = 76
Max = 245
Média = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00
S2
= 33,77
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
1.6 Outras Apresentações Gráficas de Dados
• Exercício (Montgomery, 2004, p.17): Os seguintes dados são os
números de ciclos até a falha, de corpos de prova de alumínio,
sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos
por segundo:
1115
1310
1540
1502
1258
1315
1085
798
1020
865
2130
1421
1109
1481
1567
1883
1203
1270
1015
845
1674
1016
1102
1605
706
2215
785
885
1223
375
2265
1910
1018
1452
1890
2100
1594
2023
1315
1269
1260
1888
1782
1522
1792
1000
1820
1940
1120
910
1730
1102
1578
758
1416
1560
1055
1764
1330
1608
1535
1781
1750
1501
1238
990
1468
1512
1750
1642
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de ramo e folhas
1.6 Outras Apresentações Gráficas de Dados
• (a) Construa um diagrama de ramo e folhas para esses dados. (b)
Você acha que o corpo de prova “sobreviverá” além de 2.000
ciclos? Justifique a sua resposta. (c) Encontre a mediana e os
quartis.Profundidade Ramo Folha
1
5
8
10
17
22
29
33
(5)
32
22
18
11
7
5
4
2
3
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
75
06 58 85 98
45 65 85
10 90
00 15 16 18 20 55 85
02 02 09 15 20
03 23 38 58 60 69 70
10 15 15 30
16 21 52 68 81
01 02 12 22 35 40 60 67 78 94
05 08 42 74
30 50 50 64 81 82 92
20 83 88 90
10 40
23
00 30
15 65
b) Não. A probabilidade
é muito pequena.
c) M = 1436,5
Q1 = 1097,8
Q3 = 1735
a)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de caixa (box plot)
1.6 Outras Apresentações Gráficas de Dados
• Uma outra forma gráfica de apresentar os dados é o chamado
diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and
whiskers), que permite descrever simultaneamente vários fatores
importantes de uma série de dados, tais como a tendência central
(média ou mediana), a dispersão (desvio-padrão), a possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e
o desvio da simetria.
• Um diagrama de caixa apresenta três quartis, em uma caixa
retangular, alinhados tanto horizontal como verticalmente;
opcionalmente, pode apresentar a média.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de caixa (box plot)
1.6 Outras Apresentações Gráficas de Dados
• A caixa inclui a amplitude interquartil, com o canto esquerdo (ou
inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no
terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a
amplitude interquartil , DQ = Q3 - Q1.
• Uma linha é desenhada através da caixa, no segundo quartil (que é o
percentil 50 ou a mediana), Q2. A média, como já dito, é opcional.
• Uma linha (whisker) estende-se de cada extremidade da caixa.
• A linha inferior (ou esquerda) começa no primeiro quartil indo até o
menor valor do conjunto de pontos dentro das amplitudes
interquartis de 1,5, a partir do primeiro quartil.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de caixa (box plot)
1.6 Outras Apresentações Gráficas de Dados
• A linha superior (ou direita) começa no terceiro quartil indo até o
maior do conjunto de pontos dentro das amplitudes interquartis de
1,5, a partir do terceiro quartil.
• Dados mais afastados dos que as linhas são plotados como pontos
individuais. Um ponto além da linha, porém a menos de 3
amplitudes interquartis a partir da extremidade da caixa, é chamado
de dispersos (outliers).
• Um ponto a mais de 3 amplitudes interquartis a partir da
extremidade da caixa é chamado de um outlier extremo.
Ocasionalmente, símbolos diferentes (círculos abertos e fechados,
por exemplo) são usados para identificar os dois tipos de outlier.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de caixa (box plot)
1.6 Outras Apresentações Gráficas de Dados
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
 Diagrama de caixa (box plot)
1.6 Outras Apresentações Gráficas de Dados
• Exercício: Represente o diagrama de caixa para os dados da
resistência à compressão do alumínio mostrados no exercício
anterior.
N = 80
Min = 76
Max = 245
Média = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
I - Estatística Descritiva
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Introdução
• A análise de regressão é uma técnica estatística para
investigar e modelar a relação entre variáveis, sendo uma
das mais utilizadas na análise de dados.
• É denominada “linear” porque se considera que a relação
da resposta às variáveis é uma função linear de alguns
parâmetros.
• Os modelos de regressão que não são uma função linear
dos parâmetros se chamam modelos de regressão não-
linear.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Introdução
• A regressão linear pode ser simples ou múltipla.
• A regressão simples envolve duas variáveis
(estimadores): uma variável dependente e uma variável
independente.
• A regressão múltipla envolve três ou mais variáveis,
ainda uma única variável dependente, porém duas ou
mais variáveis independentes (explicativas).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
Regressão Linear Simples
 Relação entre duas variáveis
• Em inúmeras ocasiões o estudo descritivo não se resume
ao estudo de apenas uma variável; para se ter uma visão
global do problema em estudo, muitas vezes é necessário
a observação de duas ou mais variáveis.
• Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passa-
se a ter dados bivariados (xi, yi), i = 1, 2, ..., n.
• Um dos objetivos desse estudo é a relação existente entre
as variáveis do par.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Para se ter uma ideia de como as duas variáveis se
relacionam é comum representar graficamente esta
relação por meio de um diagrama de dispersão. Esta
representação consiste na marcação das observações em
um sistema de eixos cartesianos.
• Se as variáveis fornecem um diagrama de dispersão em
que os pontos se colocam ao redor de uma reta crescente
ou decrescente, diz-se que essas variáveis estão
linearmente correlacionadas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Quanto menor a dispersão dos pontos em torno da reta,
mais forte será a correlação.
• A correlação linear será positiva ou negativa caso a
tendência da reta seja crescente ou decrescente.
• Se nenhuma tendência positiva ou negativa pode ser
detectada, a explicação possível para os valores da
segunda variável é sua média. Nesse caso, o eixo da
dispersão será horizontal, contendo a média da segunda
variável, e diz-se que as variáveis não são linearmente
correlacionadas.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
y
x
Correlação linear forte
(positiva)
y
x
Correlação linear forte
(negativa)
y
x
Correlação linear fraca
(positiva)
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
y
x
Variáveis não
correlacionadas
y
x
Variáveis não
correlacionadas
linearmente
y
x
Variáveis não
correlacionadas
linearmente
y
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Exemplo: A tabela abaixo mostra os dados da temperatura do gás
combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma
turbina de combustão, para ser usada em refrigeração, construa o
diagrama de dispersão para esses dados.
x 100 125 150 175 200 225 250 275
y 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8
x 300 325 350 375 400 425 450 500
y 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7
• Desse diagrama pode-se extrair que talvez exista uma correlação
linear entre as variáveis; esta relação pode ser traduzida por meio
de uma reta.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• A determinação da correlação entre duas variáveis por
meio de uma inspeção nos pares anotados ou no
diagrama de dispersão correspondente é pouco precisa e
subjetiva.
• Essa dificuldade pode ser contornada pelo uso de uma
medida que caracterize a correlação linear e seja
independente do observador que esteja examinando os
dados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Karl Pearson propôs o chamado coeficiente de
correlação linear, o qual é dado pela relação:
2
y
2
x ss
)y,x(Cov
r
⋅
=
onde: Cov (x,y) é a covariância das variáveis x e y, e seu
cálculo é dado por
1n
)yy()xx(
)y,x(Cov
−
−⋅−
=
∑
e sx
2
e sy
2
são as variâncias da variáveis x e y.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Fazendo-se as devidas substituições e simplificações,
obtém-se o coeficiente de correlação de forma mais
simples:
yyxx
xy
ss
s
r
⋅
=
( )
∑
∑−=
n
x
xs
2
2
xx
( )
∑
∑−=
n
y
ys
2
2
yy
onde:
∑
∑∑ ⋅
−=
n
yx
xysxy
1r1 ≤≤−
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• r = -1, indica correlação linear negativa perfeita; os
pontos (x,y) estão sobre uma reta com coeficiente
angular negativo.
• r = 0, indica que os pontos não estão correlacionados,
nem apresentam tendência crescente ou decrescente.
• r = 1, indica correlação linear positiva perfeita; os pontos
(x,y) estão sobre uma reta com coeficiente angular
positivo.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Nos casos em que os pontos do diagrama de dispersão estão em uma
reta vertical ou horizontal, o quociente que calcula o coeficiente de
correlação não está definido, pois apresenta numerador e
denominador nulos. Nesse caso, o coeficiente de correlação será
considerado nulo.
r = 0, Cov (x,y) = 0, sy
2
= 0
y
x
r = 0, pois Cov (x,y) = 0, sx
2
= 0
y
x
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• A correlação entre duas variáveis pretende captar o fato
dessas variáveis apresentarem a mesma tendência ao
crescimento, ou tendências contrárias.
• O fato de duas variáveis evoluírem no mesmo sentido ou
em sentidos opostos fornece uma ideia do que se pode
esperar sobre um valor desconhecido da variável y para
um particular valor de x.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
x
y
• Se as variáveis x e y são positivamente correlacionadas, e se procura
estimar o valor de y1 para certo valor x1 menor que a média , deve-
se esperar o valor correspondente y1 menor que a média ; para um
valor x2 maior que a média , deve-se esperar um valor y2 maior que
a média , acompanhando a tendência do eixo crescente dos pontos.
x
y
y
x
y2
y1
x2
x1 x
y
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Os problemas que envolvem estimativas de valores desconhecidos a
partir de valores históricos são chamados problemas de previsão ou
predição.
• O conhecimento da correlação entre duas variáveis, embora possa
fornecer uma pista para a previsão de um valor desconhecido de
uma delas, nada informa a respeito da qualidade dessa previsão, ou
seja, não se pode, em geral, com base apenas no conhecimento da
correlação, transformar a incerteza da previsão em risco (isto só é
possível quando a correlação é perfeita).
• Entretanto, o fato de duas variáveis serem correlacionadas levanta a
possibilidade de uma relação causal entre elas, o que é importante
em problemas de previsão.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples
• Como visto anteriormente, uma previsão construída
baseada nas informações obtidas da correlação nada diz a
respeito da confiabilidade do valor previsto.
• Um método de previsão que permite a avaliação em
termos de confiabilidade é a regressão linear, pois,
satisfeitas determinadas condições, ela proporciona a
transformação da incerteza em risco
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Quando se verifica, quer por meio do gráfico de
dispersão, quer pelo coeficiente de correlação linear,
uma correlação forte entre duas variáveis, a relação entre
essas variáveis pode ser descrita por meio de uma reta de
regressão (a reta que melhor se ajusta aos dados).
• Essa reta serve de modelo matemático para expressar a
relação linear entre duas variáveis.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Considere o relacionamento de duas variáveis x e y com
as seguintes características:
x: é a variável cujos valores são controlados e, portanto,
determinados; ela é conhecida por variável independente ou
variável de decisão;
y: variável aleatória; é a variável que se quer prever; seu valor
depende do valor atribuído a x, embora para cada valor de x se
possa ter vários valores de y, devido a sua característica aleatória
(variável dependente de x).
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• O modelo teórico define a verdadeira reta de regressão, cuja
equação pode ser escrita como:
xy βα +=
y
O valor de y é dado por:
onde:
UxyouUyy ++=+= βα
é a parte funcional de y (a parte do valor de y explicada pelo
valor de x);
U é a parte aleatória de y, a qual é introduzida no valor de y por
fatores imponderáveis.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Nessas condições, dado um valor para x, a previsão ou expectativa
para o correspondente valor de y é:
• Entretanto, dificilmente se conhece a população dos valores de y
para cada valor da variável controlada x. O que se conhece,
geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma
amostra dessas variáveis.
• Portanto, com base nos dados amostrais, deve-se pensar como
estimar os valores de α e β, o que pode ser feito de forma eficiente
por meio do método dos mínimos quadrados.
xy βα +=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Um dos métodos mais utilizados para ajustar uma reta a um
conjunto de dados é o Método dos Mínimos Quadrados (MMQ), o
qual consiste em determinar a reta que minimiza a soma dos
quadrados dos desvios (os chamados erros ou resíduos) entre os
verdadeiros valores de y e os valores estimados a partir da reta de
regressão que se pretende ajustar, ŷ.
^ŷ = a + bx
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Adota-se o quadrado das diferenças, pois como os pontos
se situam acima e abaixo da reta estimada, as diferenças
podem ser positivas ou negativas, e na soma podem
anular-se, não refletindo o ajustamento.
• Sendo números positivos, esses quadrados refletem a
qualidade do ajuste através de sua soma.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• O modelo de regressão linear é a reta de regressão
ŷi = a + bxi + εi
onde
ŷ é o estimador de y;
a e b os estimadores de α e β.
∑ ∑∑ +−=−= 2
ii
2
ii
2
i )]bxa(y[min)yˆy(minmin ε
• A reta estimada é obtida de tal modo que a soma dos quadrados dos
desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Como tal, para estimar os parâmetros do modelo, é necessário que
as primeiras derivadas em relação a a e a b sejam nulas, e as
segundas sejam maiores ou iguais a zero, assim:







=−−
∂
∂
=−−
∂
∂
∑
∑
0)bxay(
b
0)bxay(
a
2
ii
2
ii
( ) xx
xy
2
2
s
s
n
x
x
n
yx
xy
b,xby
n
x
b
n
y
a =
−
⋅
−
=−=−=
∑
∑
∑
∑ ∑
∑∑
As estimativas dos mínimos quadrados para os parâmetros α e β são:
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• Calculada a estimativa de mínimos quadrados para uma
amostra dada, deve-se verificar a qualidade do ajuste
dessa reta aos dados históricos.
• Uma forma de medir a qualidade do ajuste é verificar
qual a porcentagem da variação dos valores de y em
relação à sua média pode ser explicada pela regressão de
y sobre x, o que dará origem ao coeficiente de explicação
R2
.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x,
observa-se que o valor de yi correspondente a um valor xi pode ser
composto de duas partes: a parte explicada pela média e a parte não
explicada pela média.
y
=y parte do valor de y explicada pela média
parte do valor de y explicada pela regressão=− yyˆ
parte do valor de y não explicada pela média=− yˆyi
}
xxi
yi
ŷ
y
}
}
ŷ = a + bx
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
• Interessa avaliar que porcentagem da parte não explicada pela
média, , pode ser explicada pela regressão de y sobre x, isto
é, por .
1.7 Regressão Linear
 Coeficiente de explicação
yyˆ −
yyi −
( )∑ −=
2
i yyVT
VE = variação explicada, a soma dos quadrados das variações em
relação à média.
( )∑ −=
2
yyˆVE
• Designando:
VT = variação total, soma dos quadrados das variações de y em
relação à sua média.
• No método dos mínimos quadrados, ao invés de somar essas
diferenças, soma-se o quadrado delas para evitar que valores
positivos e negativos se anulem.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
( )
22
yy
xy2
2
2
2
rR
s
s
bRou
n
y
y
n
yx
xy
bR =⋅=
−
⋅
−
⋅=
∑
∑
∑
∑ ∑
• O coeficiente de explicação R2
pode ser definido agora como sendo
a porcentagem da variação total representada pela variação
explicada.
( )
( )∑
∑
−
−
== 2
i
2
2
yy
yyˆ
VT
VE
R
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Exemplo: No exemplo anterior, observou-se no diagrama
de dispersão uma possível relação linear entre as
variáveis.
a) Confirme essa relação por meio do coeficiente de
correlação;
b) Encontre a reta de regressão pelo método dos
mínimos quadrados.
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Cálculos:i x y x2
y2
xy
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
100
125
150
175
200
225
250
275
300
325
350
375
400
425
450
500
99,1
98,8
98,5
98,5
98,5
98,2
98,0
97,8
97,8
97,8
97,6
97,5
97,3
97,0
96,8
96,7
10000
15625
22500
30625
40000
50625
62500
75625
90000
105625
122500
140625
160000
180625
202500
250000
9820,8
9761,4
9702,2
9702,2
9702,2
9643,2
9604,0
9564,8
9564,8
9564,8
9525,8
9506,2
9467,3
9409,0
9370,2
9350,9
9910,0
12350,0
14775,0
17237,5
19700,0
22095,0
24500,0
26895,0
29340,0
31785,0
34160,0
36562,5
38920,0
41225,0
43560,0
48350,0
Σ 4625 1565,9 1559375 153259,8 451365,0
( ) ( )
977,0)99,0(R
99,0r
16
)9,1565(
8,153259
16
)4625(
1559375
16
9,15654625
451365
r
n
y
y
n
x
x
n
yx
xy
r
ss
s
r
22
22
2
2
2
2
yyxx
xy
=−=
−=
−⋅−
⋅
−
=
−⋅−
⋅
−
=
=
⋅
=
∑ ∑∑ ∑
∑ ∑ ∑
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Cálculos:
- O valor da correlação e do coeficiente de explicação indicam uma
forte correlação linear entre a temperatura do gás combustível e a
taxa de calor. Pode-se, portanto, estimar, através do MMQ os
parâmetros a e b e traçar a reta de regressão:
( ) ( )
516,99
16
4625
)0057,0(
16
9,1565
n
x
b
n
y
a
0057,0
16
4625
1559375
16
9,15654625
451365
n
x
x
n
yx
xy
b 22
2
=⋅−−=⋅−=
−=
−
⋅
−
=
−
⋅
−
=
∑∑
∑
∑
∑
∑ ∑
- Sendo assim, a reta de regressão é: x0057,0516,99bxayˆ −=+=
27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Para que se evite erros de previsão, a condição inicial
para um estudo de regressão linear entre duas variáveis é
que essas variáveis apresentem uma razoável correlação
linear.
• Caso os valores de y para crescentes valores de x variem
de modo aleatório, sem apresentar qualquer tendência, o
valor que melhor explica y é, geralmente, a sua média;
entretanto, em alguns casos, o diagrama de dispersão
apresenta uma tendência não linear, isto é, uma curva
bem definida, em torno da qual os pontos parecem
agrupar-se.
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia
Estatística Descritiva Aplicada à Engenharia

Mais conteúdo relacionado

Mais procurados

Uma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESMEUma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESMERilva Lopes de Sousa Muñoz
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)Luccy Crystal
 
1ª aula estatística básica (cam241)
1ª aula estatística básica (cam241)1ª aula estatística básica (cam241)
1ª aula estatística básica (cam241)Daniela Gomes
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimicasmpgiacobbo
 
Aula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaAula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaFisio Unipampa
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goesStefania Helena
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)João Leal
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parteRobson Odé
 
Apostila de estatística
Apostila de  estatística Apostila de  estatística
Apostila de estatística Cidinha Santos
 
Aula 02: Gráficos Estatísticos
Aula 02: Gráficos EstatísticosAula 02: Gráficos Estatísticos
Aula 02: Gráficos EstatísticosIsrael serique
 
Aula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaAula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaDalton Martins
 
Estatística básica
Estatística básicaEstatística básica
Estatística básicaJose_ferreira
 

Mais procurados (20)

Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Apostila estatistica1
Apostila estatistica1Apostila estatistica1
Apostila estatistica1
 
Uma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESMEUma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESME
 
Conceitos iniciais
Conceitos iniciaisConceitos iniciais
Conceitos iniciais
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 
1ª aula estatística básica (cam241)
1ª aula estatística básica (cam241)1ª aula estatística básica (cam241)
1ª aula estatística básica (cam241)
 
Apostila5 ine5102 quimica
Apostila5 ine5102 quimicaApostila5 ine5102 quimica
Apostila5 ine5102 quimica
 
Aula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaAula de Gráficos - Bioestatistica
Aula de Gráficos - Bioestatistica
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Artigos de Revisão - metadados
Artigos de Revisão - metadadosArtigos de Revisão - metadados
Artigos de Revisão - metadados
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)
 
3398 11579-1-pb
3398 11579-1-pb3398 11579-1-pb
3398 11579-1-pb
 
bioestatística - 1 parte
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
 
Apostila de estatística
Apostila de  estatística Apostila de  estatística
Apostila de estatística
 
Aula 02: Gráficos Estatísticos
Aula 02: Gráficos EstatísticosAula 02: Gráficos Estatísticos
Aula 02: Gráficos Estatísticos
 
Aula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidianaAula 02 - Estatística da vida cotidiana
Aula 02 - Estatística da vida cotidiana
 
Noções de estatística 3º ano
Noções de estatística 3º anoNoções de estatística 3º ano
Noções de estatística 3º ano
 
Econometria
EconometriaEconometria
Econometria
 
Estatística básica
Estatística básicaEstatística básica
Estatística básica
 

Destaque

Capítulo 1 matemática_financeira_para_dec._gerenciais
Capítulo 1 matemática_financeira_para_dec._gerenciaisCapítulo 1 matemática_financeira_para_dec._gerenciais
Capítulo 1 matemática_financeira_para_dec._gerenciaisTatiana Tenório
 
Clase sensores temperatura ii cuat 2010
Clase sensores temperatura ii cuat 2010Clase sensores temperatura ii cuat 2010
Clase sensores temperatura ii cuat 2010rubenfabrizio
 
Apostila de-estatistica-experimental-20141234567
Apostila de-estatistica-experimental-20141234567Apostila de-estatistica-experimental-20141234567
Apostila de-estatistica-experimental-20141234567Erick Amâncio
 
Atividades e-planos-para-aula-de-matemática-do-9°-ano
Atividades e-planos-para-aula-de-matemática-do-9°-anoAtividades e-planos-para-aula-de-matemática-do-9°-ano
Atividades e-planos-para-aula-de-matemática-do-9°-anodaviagr
 
A produtividade-no-chao-de-fabrica
A produtividade-no-chao-de-fabricaA produtividade-no-chao-de-fabrica
A produtividade-no-chao-de-fabricaFabrício Páris
 
Apostila de estatística experimental
Apostila de estatística experimentalApostila de estatística experimental
Apostila de estatística experimentalgraciela marques
 
Delineamentos experimentais-basicos
Delineamentos experimentais-basicosDelineamentos experimentais-basicos
Delineamentos experimentais-basicosnayara moraes
 
Delineamento experimental básico
Delineamento experimental básicoDelineamento experimental básico
Delineamento experimental básicoCaio Maximino
 
Aula Gestão da Produção e Logística: Arranjo Físico
Aula Gestão da Produção e Logística: Arranjo FísicoAula Gestão da Produção e Logística: Arranjo Físico
Aula Gestão da Produção e Logística: Arranjo FísicoWilian Gatti Jr
 
DIC Presentation
DIC PresentationDIC Presentation
DIC PresentationSalsabil A.
 
Pesquisa Operacional
Pesquisa OperacionalPesquisa Operacional
Pesquisa Operacionalmsleite100
 
Curso Matemática Financeira p/ TCE-SC
Curso Matemática Financeira p/ TCE-SC Curso Matemática Financeira p/ TCE-SC
Curso Matemática Financeira p/ TCE-SC Estratégia Concursos
 

Destaque (20)

Capítulo 1 matemática_financeira_para_dec._gerenciais
Capítulo 1 matemática_financeira_para_dec._gerenciaisCapítulo 1 matemática_financeira_para_dec._gerenciais
Capítulo 1 matemática_financeira_para_dec._gerenciais
 
Apostila de estatística 2
Apostila de estatística 2Apostila de estatística 2
Apostila de estatística 2
 
Clase sensores temperatura ii cuat 2010
Clase sensores temperatura ii cuat 2010Clase sensores temperatura ii cuat 2010
Clase sensores temperatura ii cuat 2010
 
Diapositivo 4
Diapositivo 4Diapositivo 4
Diapositivo 4
 
TERMISTORES
TERMISTORES TERMISTORES
TERMISTORES
 
Transdutores
TransdutoresTransdutores
Transdutores
 
Apostila de-estatistica-experimental-20141234567
Apostila de-estatistica-experimental-20141234567Apostila de-estatistica-experimental-20141234567
Apostila de-estatistica-experimental-20141234567
 
Atividades e-planos-para-aula-de-matemática-do-9°-ano
Atividades e-planos-para-aula-de-matemática-do-9°-anoAtividades e-planos-para-aula-de-matemática-do-9°-ano
Atividades e-planos-para-aula-de-matemática-do-9°-ano
 
A produtividade-no-chao-de-fabrica
A produtividade-no-chao-de-fabricaA produtividade-no-chao-de-fabrica
A produtividade-no-chao-de-fabrica
 
Apostila de estatística experimental
Apostila de estatística experimentalApostila de estatística experimental
Apostila de estatística experimental
 
Delineamentos experimentais-basicos
Delineamentos experimentais-basicosDelineamentos experimentais-basicos
Delineamentos experimentais-basicos
 
Miebach milestone
Miebach milestoneMiebach milestone
Miebach milestone
 
Pcp aula1
Pcp aula1Pcp aula1
Pcp aula1
 
Transp pcp 1
Transp pcp 1Transp pcp 1
Transp pcp 1
 
Delineamento experimental básico
Delineamento experimental básicoDelineamento experimental básico
Delineamento experimental básico
 
Aula 2.1 - Projeto de Fábrica e Layout
Aula 2.1 - Projeto de Fábrica e Layout Aula 2.1 - Projeto de Fábrica e Layout
Aula 2.1 - Projeto de Fábrica e Layout
 
Aula Gestão da Produção e Logística: Arranjo Físico
Aula Gestão da Produção e Logística: Arranjo FísicoAula Gestão da Produção e Logística: Arranjo Físico
Aula Gestão da Produção e Logística: Arranjo Físico
 
DIC Presentation
DIC PresentationDIC Presentation
DIC Presentation
 
Pesquisa Operacional
Pesquisa OperacionalPesquisa Operacional
Pesquisa Operacional
 
Curso Matemática Financeira p/ TCE-SC
Curso Matemática Financeira p/ TCE-SC Curso Matemática Financeira p/ TCE-SC
Curso Matemática Financeira p/ TCE-SC
 

Semelhante a Estatística Descritiva Aplicada à Engenharia

dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...RaquelSilva604657
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
Aula1 oscar ribas
Aula1 oscar ribasAula1 oscar ribas
Aula1 oscar ribasValmirLemos
 
estatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialestatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialElizeuNetto2
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Capítulo 1 livro básico probabiliade
Capítulo 1  livro básico probabiliadeCapítulo 1  livro básico probabiliade
Capítulo 1 livro básico probabiliadeWodson Vieira Gomes
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Teoria de erros e graficos
Teoria de erros e graficosTeoria de erros e graficos
Teoria de erros e graficosEduardo Nagel
 
Cap3 - Apresentação De Dados
Cap3 - Apresentação De DadosCap3 - Apresentação De Dados
Cap3 - Apresentação De DadosRegis Andrade
 

Semelhante a Estatística Descritiva Aplicada à Engenharia (20)

23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando23126 estatisticaaplicada manualtecnicoformando
23126 estatisticaaplicada manualtecnicoformando
 
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
dokumen.tips_estatistica-aplicada-exercicios-resolvidos-manual-tecnico-forman...
 
Estatistica exercicios resolvidos
Estatistica exercicios resolvidosEstatistica exercicios resolvidos
Estatistica exercicios resolvidos
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Estatistica de cana
Estatistica de canaEstatistica de cana
Estatistica de cana
 
Ipaee capitulo2
Ipaee capitulo2Ipaee capitulo2
Ipaee capitulo2
 
Aula1 oscar ribas
Aula1 oscar ribasAula1 oscar ribas
Aula1 oscar ribas
 
Atps estatatistica
Atps estatatisticaAtps estatatistica
Atps estatatistica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
estatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencialestatistica discreta, estatistica inferencial
estatistica discreta, estatistica inferencial
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Capítulo 1 livro básico probabiliade
Capítulo 1  livro básico probabiliadeCapítulo 1  livro básico probabiliade
Capítulo 1 livro básico probabiliade
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Teoria de erros e graficos
Teoria de erros e graficosTeoria de erros e graficos
Teoria de erros e graficos
 
Atps estatistica 2
Atps estatistica 2Atps estatistica 2
Atps estatistica 2
 
Apostila ferramentas QT
Apostila ferramentas QTApostila ferramentas QT
Apostila ferramentas QT
 
Cap3 - Apresentação De Dados
Cap3 - Apresentação De DadosCap3 - Apresentação De Dados
Cap3 - Apresentação De Dados
 
Ipaee capitulo1
Ipaee capitulo1Ipaee capitulo1
Ipaee capitulo1
 
Ipaee capitulo 1_slides
Ipaee capitulo 1_slidesIpaee capitulo 1_slides
Ipaee capitulo 1_slides
 

Último

FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃO
FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃOFASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃO
FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃOAulasgravadas3
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Atividade sobre os Pronomes Pessoais.pptx
Atividade sobre os Pronomes Pessoais.pptxAtividade sobre os Pronomes Pessoais.pptx
Atividade sobre os Pronomes Pessoais.pptxDianaSheila2
 
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....LuizHenriquedeAlmeid6
 
Rotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaRotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaronaldojacademico
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
análise de redação completa - Dissertação
análise de redação completa - Dissertaçãoanálise de redação completa - Dissertação
análise de redação completa - DissertaçãoMaiteFerreira4
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfFernandaMota99
 
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfPRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfprofesfrancleite
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...Rosalina Simão Nunes
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Ilda Bicacro
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxBeatrizLittig1
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfGEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfElianeElika
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...azulassessoria9
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Ilda Bicacro
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 

Último (20)

FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃO
FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃOFASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃO
FASE 1 MÉTODO LUMA E PONTO. TUDO SOBRE REDAÇÃO
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
Atividade sobre os Pronomes Pessoais.pptx
Atividade sobre os Pronomes Pessoais.pptxAtividade sobre os Pronomes Pessoais.pptx
Atividade sobre os Pronomes Pessoais.pptx
 
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
 
Rotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaRotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riqueza
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
análise de redação completa - Dissertação
análise de redação completa - Dissertaçãoanálise de redação completa - Dissertação
análise de redação completa - Dissertação
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdf
 
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdfPRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
PRÉDIOS HISTÓRICOS DE ASSARÉ Prof. Francisco Leite.pdf
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
 
Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"Nós Propomos! " Pinhais limpos, mundo saudável"
Nós Propomos! " Pinhais limpos, mundo saudável"
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docx
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdfGEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
GEOGRAFIA - ENSINO FUNDAMENTAL ANOS FINAIS.pdf
 
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...Considere a seguinte situação fictícia:  Durante uma reunião de equipe em uma...
Considere a seguinte situação fictícia: Durante uma reunião de equipe em uma...
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!Rota das Ribeiras Camp, Projeto Nós Propomos!
Rota das Ribeiras Camp, Projeto Nós Propomos!
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 

Estatística Descritiva Aplicada à Engenharia

  • 1. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva Estatística AplicadaEstatística Aplicada II Universidade Federal do Pará Instituto de Tecnologia Campus de Belém Curso de Engenharia Mecânica Prof. Dr. Jorge Teófilo de Barros Lopes
  • 2. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva Capítulo ICapítulo I Universidade Federal do Pará Instituto de Tecnologia Estatística DescritivaEstatística Descritiva Campus de Belém Curso de Engenharia Mecânica
  • 3. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear I - Estatística Descritiva
  • 4. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear
  • 5. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução  ESTATÍSTICA: É a disciplina que objetiva estudar os métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como obter conclusões válidas e tomar decisões razoáveis baseadas em tais análises.  Técnicas Estatísticas: São as várias técnicas por meio das quais é possível estudar conjuntos de dados e, a partir de uma amostra (se necessária), tirar conclusões válidas para conjuntos maiores (população).
  • 6. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução  De uma maneira geral, as técnicas estatísticas são utilizadas em três etapas principais do trabalho de pesquisa: 1. A coleta de dados, incluindo o planejamento do trabalho e da pesquisa; 2. A apresentação dos dados coletados; e 3. A análise dos dados coletados, com a formulação de conclusões e generalizações.
  • 7. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução - Essa primeira etapa corresponde ao estabelecimento do método de coleta de dados (questionário ou teste ou ensaio de material) e elaboração dos questionamentos ou determinação das variáveis que serão estudadas, de acordo com o interesse do pesquisador; e o cálculo do tamanho da amostra, de acordo com a natureza da pesquisa, do tempo e do orçamento disponíveis. COLETA DE DADOS
  • 8. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução - A segunda etapa requer técnicas específicas para a transformação dos dados numéricos em tabelas ou gráficos (é a partir da organização dos dados coletados que se poderá elaborar a interpretação). APRESENTAÇÃO DOS DADOS COLETADOS ANÁLISE DOS DADOS COLETADOS - Essa etapa é simultânea à anterior, pois durante a própria organização dos dados já é possível ir percebendo a tendência geral da pesquisa.
  • 9. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução • No sentido de melhor esclarecer o significado da análise e interpretação dos dados, deve-se estabelecer uma distinção entre ESTATÍSTICA DESCRITIVA e INFERÊNCIA ESTATÍSTICA
  • 10. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução • Como o próprio nome sugere, constitui-se num conjunto de técnicas que objetivam descrever, analisar e interpretar os dados numéricos de uma população ou amostra.  Estatística Descritiva: Objetiva sintetizar e representar de uma forma compreensível a informação contida num conjunto de dados. • Materializa-se na construção de tabelas e/ou gráficos ou no cálculo de medidas que representem convenientemente a informação contida nos dados. • Adquire importância quando o volume de dados for significativo.
  • 11. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução • Objetivo mais ambicioso que o da estatística descritiva.  Inferência Estatística: Baseada na análise de um conjunto limitado de dados (uma amostra), objetiva caracterizar o todo a partir do qual tais dados foram obtidos (a população). • Os métodos e técnicas utilizados são mais sofisticados.
  • 12. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução Figura 1.1- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006).
  • 13. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.1 Introdução Figura 1.2- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006).
  • 14. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear
  • 15. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.2 Conceitos e Definições  População: É o conjunto de todos os elementos que contêm uma certa característica que se deseja estudar. • Como é comum a todos os elementos, esta característica varia em quantidade ou qualidade. • Uma população pode ter dimensão finita ou infinita.  Amostra: É um subconjunto de dados que pertencem à população. As amostras aleatórias são escolhidas por meio de processos (técnicas de amostragem) que garantem que o subconjunto obtido é representativo da população.
  • 16. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.2 Conceitos e Definições  Principais motivos para o estudo da amostra: 1. População infinita; 2. Custo em termos de tempo ou de dinheiro que um estudo em toda a população implicaria; 3. Obtenção de informação por meio de testes destrutivos, no âmbito industrial; 4. Impossibilidade de acesso a todos os elementos da população.
  • 17. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.2 Conceitos e Definições  Fases do método de análise estatística: • No âmbito da Estatística, o método de abordagem dos problemas pode ser dividido em cinco fases: 1. Estabelecimento do objetivo da análise a efetuar (questões a serem resolvidas) e definição das populações correspondentes; 2. Concepção de um procedimento adequado para a seleção de uma ou mais amostras (escolha das técnicas de amostragem a utilizar). 3. Coleta de dados. 4. Análise dos dados (Estatística Descritiva). 5. Estabelecimento de inferências a respeito da população (Inferência Estatística)
  • 18. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.2 Conceitos e Definições  Fases do método de análise estatística: Identificação do problema → Objetivo da análise Planejamento da experiência → Técnicas de Amostragem Coleta de dados Análise exploratória dos dados → Estatística Descritiva Análise e interpretação dos resultados → Inferência Estatística
  • 19. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear
  • 20. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados  Iniciando o estudo: • Isso é necessário, pois podem ocorrer registros que não se encaixam no padrão geral observado e, dessa forma, a sua veracidade deve ser averiguada, pois podem tratar- se de erros de observação, bem como do próprio registro ou provenientes de alterações do fenômeno em estudo. • Não existe uma estratégia única para iniciar o estudo descritivo, embora uma primeira recomendação seja começar por uma exploração visual dos dados levantados.
  • 21. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados  Iniciando o estudo: • Embora estas análises já se encontrem disponíveis em vários softwares e calculadoras programáveis, para uma melhor interpretação das mesmas é conveniente conhecer as técnicas utilizadas. • Para se ter uma ideia mais concreta sobre os dados levantados, deve-se recorrer às tabelas e/ou gráficos que podem representar, de maneira sintética, as informações sobre o comportamento de variáveis numéricas levantadas.
  • 22. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados  Iniciando o estudo: • Portanto, para se proceder um estudo descritivo, é importante: - Ordenação dos dados – fase onde se começa a ter uma ideia a respeito de algumas medidas de posição (média, mediana, quartis etc.); - Estatísticas amostrais – a partir de algumas medidas promove-se um resumo dos dados levantados, relativamente à posição, dispersão e forma; - Agrupamento dos dados e representação gráfica – revela a forma possível para a população em estudo e permite escolher a classe de modelos que deve ser explorada nas análises mais sofisticadas.
  • 23. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados  Dados brutos: Como primeiro resultado de uma pesquisa, obtêm- se dados brutos, ou seja, um conjunto de números ainda sem organização alguma.  Rol: Os dados brutos são então ordenados de forma crescente ou decrescente, com a indicação da frequência de cada um, dando origem ao chamado rol.  Tabulação dos dados: Depois de elaborar o rol é preciso determinar quantas faixas terá a tabela de frequência. A fórmula de Sturges é utilizada para estabelecer o número aproximado de classes onde: n = número de elementos da amostra (tamanho da amostra) k = número de classes que a tabela de classes deverá conter. nlog22,31k ⋅+≅
  • 24. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados • Observações: - k deverá ser no mínimo 3 e no máximo 20; - Como a variável k é um número inteiro, ela deverá ser aproximada para o maior inteiro (por exemplo, se k ≈ 6,4, usa-se k = 7).  Frequência de classes: O passo seguinte é subdividir os dados pelas classes ou categorias e determinar o número de indivíduos pertencentes a cada uma, resultando nas frequências de classes.  Apresentação final dos dados (tabela completa): Com base em todos os cálculos feitos anteriormente, pode-se fazer uma nova tabela com todas as frequências, as quais serão estudadas a posteriori.  Gráficos: A partir da tabela de frequências, faz-se o desenho gráfico, um recurso de visualização dos dados constantes na tabela.
  • 25. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados  Os dados que constituem uma amostra podem ser de quatro tipos, assim distribuídos: • Qualitativos - Nominal - Ordinal • Quantitativos - Intervalar - Absoluto
  • 26. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados a) Dados nominais: Quando cada um deles for identificado pela atribuição de um nome que designa uma classe. a) Exaustivas - qualquer dado pertence a uma das classes; b) Mutuamente exclusivas - cada dado pertence somente a uma classe; c) Não ordenáveis - não existe nenhum critério relevante que permita estabelecer preferência por qualquer classe em relação às restantes. Neste caso, as classes devem ser: - Exemplo: Classificação das pessoas pela cor do cabelo (preto, castanho, louro etc.).
  • 27. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados - Exemplo: Classificação de conceitos de avaliação na disciplina em insuficiente, regular, bom e excelente. b) Dados ordinais: São semelhantes aos dados nominais; contudo, nessa escala existe a possibilidade de se estabelecer uma ordenação dos dados nas classes, segundo algum critério relevante.
  • 28. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados - Observação: Neste caso, pode-se atribuir um significado à diferença entre esses números, mas não à razão entre eles. Por exemplo, o registro de temperaturas em ºC, em determinadas horas de dias sucessivos. Se em três dias consecutivos a temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o terceiro dia esteve duas vezes mais quente que o segundo, pois se a temperatura fosse expressa em outra escala, a razão entre os valores registrados naqueles dias seria diferente. c) Dados intervalares: No caso da escala intervalar, os dados são diferenciados e ordenados por números expressos em uma ordem cuja origem é arbitrária.
  • 29. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados d) Dados absolutos: Contrariamente ao que sucede com a escala intervalar, a escala absoluta tem origem fixa (nesta escala, o valor zero tem significado). • Escala intervalar: temperatura de 0ºC não significa que não haja temperatura. • Escala absoluta: peso de 0 kg significa que não existe peso. • Em conseqüência ao fato da origem ser fixa, a razão entre os dados expressos numa escala absoluta passa a ter significado; uma pessoa com 60 kg tem o dobro do peso de uma com 30 kg. - Exemplo: Pesos de pessoas expressos em kg. - Observações:
  • 30. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.3 Classificação dos Dados - Observação: Quando se trabalha com dados quantitativos, é necessário que se faça a distinção entre os dados discretos e os contínuos. Os dados denominam-se discretos quando são valores de uma variável aleatória discreta, que é a aquela que assume valores em pontos da reta real (por exemplo, número de páginas em um livro: 1, 2, 3, 4, 5...). Os dados são contínuos quando são valores de uma variável aleatória contínua, que é aquela que pode assumir qualquer valor em certo intervalo da reta real (por exemplo, o peso de funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)
  • 31. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear
  • 32. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de frequências: • Devido à necessidade das categorias estarem ordenadas, somente se pode falar de frequências acumuladas quando os dados estão em escalas ordinais, intervalar ou absoluta. • A representação tabular com todos os tipos de frequências é mostrada a seguir:
  • 33. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de frequências: a) Frequência absoluta (ni): O número de dados contidos numa classe ou categoria qualquer i (i = 1,..., k) de um conjunto de dados designa-se por frequência absoluta da classe ou categoria i. • Denotando-se por ni tal frequência e admitindo que as categorias especificadas contêm todos os dados, o número total de dados (n) é calculado por:
  • 34. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de frequências: b) Frequência relativa (fi): O número total de dados que pertencem a uma classe ou categoria qualquer i, quando expressos como uma proporção do número total de dados, designa-se por frequência relativa da classe ou categoria i e é dada por: • As frequências relativas são muitas vezes definidas em termos percentuais.
  • 35. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de frequências: c) Frequência absoluta acumulada (Ni): Representa para cada classe ou categoria i, a frequência absoluta de dados que pertencem à classe ou às classes anteriores. d) Frequência relativa acumulada (Fi): Representa para cada classe categoria i, a frequência relativa de dados que pertencem à classe ou às classes anteriores.
  • 36. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Tabela de frequências:
  • 37. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos • Uma vez elaborada a tabela de frequências, segue-se o desenho do gráfico, um recurso de visualização dos dados constantes na tabela. • Os tipos de gráficos mais comuns são: histograma; polígono de frequência, setograma e ogiva de Galton.
  • 38. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Histograma: Este tipo de gráfico é utilizado para representar as frequências absolutas (ni) em relação à sua classe, e é assim construído: 1. No eixo das abscissas marcam-se, em escala, as classes dos dados; 2. No eixo das ordenadas, marcam-se as frequências das classes; 3. Faz-se a correspondência entre cada intervalo no eixo das classes com um valor no eixo das frequências, formando um desenho de colunas paralelas.
  • 39. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos 1. No eixo das abscissas, coloca-se o ponto médio de cada intervalo de classe; 2. No eixo das ordenadas, permanecem as frequências absolutas das classes (ni) ; 3. Ligam-se os pontos médios por segmentos de reta; 4. Para completar o polígono, acrescenta-se um ponto médio com frequência zero em cada uma das extremidades da escala horizontal. - Polígono de frequência: Utilizado para indicar o ponto médio ou representante de classe em suas respectivas frequências absolutas; normalmente, é construído sobre o histograma, da seguinte forma:
  • 40. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Histograma e Polígono de frequência:
  • 41. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Histograma - Polígono de frequência:
  • 42. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Gráfico em setores (Setograma): Também conhecido como gráfico de pizza, é utilizado para representar valores relativos (%); é construído da seguinte forma: 1. Faz-se um círculo; 2. Cada setor é regido pela fórmula: 3. No círculo, distribui-se os valores das frequências percentuais
  • 43. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Ogiva de Galton: Este tipo de gráfico é utilizada para representar as frequências acumuladas de uma distribuição; é construído da seguinte forma: 1. No eixo das abscissas coloca-se as classes dos dados, tal como no histograma; 2. No eixo das ordenadas, escreve-se uma das frequências acumuladas, marcando o ponto com os limites superiores (Li) de cada classe; inicia-se com a frequência zero e com limite inferior da 1ª classe.
  • 44. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Ogiva de Galton:
  • 45. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Gráfico linear: É o tipo de gráfico que apresenta os dados estatísticos por meio de uma linha poligonal. Os pontos da polígono são obtidos pelas informações contidas em cada linha da tabela, e marcados no plano utilizando o sistema cartesiano. São utilizados para representar séries cronológicas.
  • 46. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Gráfico de colunas: É o tipo de gráfico que apresenta os dados estatísticos por meio de retângulos (colunas) dispostas em posições vertical. Todos os retângulos possuem a mesma base e a altura proporcional aos dados. Podem ser utilizados para representar qualquer série estatística.
  • 47. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Gráficos estatísticos - Gráfico de colunas: Este tipo de gráfico é semelhante ao de colunas, onde os retângulos (barras) estão dispostos horizontalmente. É utilizado para legendas longas, em todas as séries.
  • 48. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Dados Qualitativos: • Exemplo: Em uma amostra constituída de 120 peças, constatou- se que 100 não tinham qualquer defeito, 15 tinham defeitos recuperáveis e 5 apresentavam defeitos irrecuperáveis. Representar em uma tabela, e também graficamente, as frequências (absolutas e relativas) dos dados que constituem essa amostra: Categoria de peças Frequência absoluta (ni) Frequência relativa (fi) Sem defeitos Recuperáveis irrecuperáveis 100 15 5 83,3% 12,5% 4,2% TOTAL 120 100%
  • 49. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Dados Qualitativos: Gráfico em Setores 83,3% 12,5% 4,2% Sem defeitos Recuperáveis irrecuperáveis
  • 50. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: • Exemplo: Em um estudo realizado com o objetivo de caracterizar o comportamento dos clientes de um supermercado, analisou-se o número de ocupantes por veículo para 1000 veículos que entraram no estacionamento do referido supermercado, em um sábado. Os resultados encontram-se resumidos na tabela seguinte:
  • 51. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: Nº de ocupantes por veículo (xi) Frequência absoluta (ni) Frequência relativa (fi) Frequência absoluta acumulada (Ni) Frequência relativa acumulada (Fi) 1 2 3 4 5 6 7 103 147 248 197 152 100 53 10,3% 14,7% 24,8% 19,7% 15,2% 10,0% 5,3% 103 250 498 695 847 947 1000 10,3% 25,0% 49,8% 69,5% 84,7% 94,7% 100,0% TOTAL 1000 100%
  • 52. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados  Dados Quantitativos: 0 50 100 150 200 250 300 ni 1 2 3 4 5 6 7 Nº ocupantes / veículo Gráfico em colunas
  • 53. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados • Distribuições agrupadas: Essas distribuições são úteis quando existe um grande número de dados relativos a uma variável contínua, cujos valores observados são muito próximos uns dos outros. - A frequência de cada classe é o número de observações que ela contém. - No exemplo anterior, os dados observados correspondem a uma variável discreta; para o caso de dados relativos uma variável contínua existem algumas diferenças.  Dados Quantitativos:
  • 54. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados • Exemplo: O conjunto de dados baixo representa o peso, em gramas, do conteúdo de uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha de enchimento automático: 302,25; 299,20; 300,24; 297,22; 298,35; 303,76; 298,65; 299,38; 300,36; 299,16; 300,86; 299,83; 302,52; 300,12; 301,81; 297,99; 299,23; 298,73; 303,07; 299,07; 297,83; ... ; 300,80  Dados Quantitativos:
  • 55. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados • No conjunto de dados mostrado não existe praticamente repetição de valores; logo, não é vantagem se utilizar os dados agrupados numa tabela de frequências, pois a mesma teria tantas linhas quanto o número de dados. • No entanto, a tabela de frequências pode ser construída se os dados forem agrupados por classes:  Dados Quantitativos:
  • 56. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados Classes Frequência absoluta (ni) Frequência relativa (%) (fi) Frequência absoluta acumulada (Ni) Frequência relativa acumulada (%) (Fi) [297,00 ; 298,00[ [298,00 ; 299,00[ [299,00 ; 300,00[ [300,00 ; 301,00[ [301,00 ; 302,00[ [302,00 ; 303,00[ [303,00 ; 304,00[ [304,00 ; 305,00[ [305,00 ; 306,00[ 8 21 28 15 11 10 5 1 1 8 21 28 15 11 10 5 1 1 8 29 57 72 83 93 98 99 100 8 29 57 72 83 93 98 99 100 TOTAL 100 100%
  • 57. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados Histograma 0 5 10 15 20 25 30 [297,00 ; 298,00[ [298,00 ; 299,00[ [299,00 ; 300,00[ [300.00 ; 301,00[ [301,00 ; 302,00[ [302,00 ; 303,00[ [303,00 ; 304,00[ [304,00 ; 305,00[ [305,00 ; 306,00[ Peso (kg) fi  Dados Quantitativos:
  • 58. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear
  • 59. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Nas seções anteriores foi visto a sintetização de dos dados sob a forma de tabelas, gráficos e distribuição de frequências.  O cálculo de estatísticas amostrais é uma forma mais sintética de descrever um conjunto de dados, ou seja, possibilita representar um conjunto de dados relativos à observação de determinado fenômeno de forma reduzida.  As estatísticas amostrais são calculadas com base nos dados, a partir das quais é possível descrever globalmente o conjunto de valores que os referidos dados tomam.
  • 60. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição ou de tendência central: • Média aritmética, média geométrica, média harmônica, mediana, quartis, decis, percentis e moda. • Amplitude total, desvio médio, variância, desvio padrão, amplitude interquartílica e coeficiente de variação. b) Medidas de dispersão: • Medidas de assimetria e medidas de curtose. c) Medidas de forma:  As estatísticas amostrais ou medidas estatísticas são divididas em três grupos:
  • 61. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Essas medidas nos orientam quanto à posição da distribuição no eixo x (eixo dos números reais); • Possibilitam comparações de séries de dados entre si pelo confronto desses números. • São chamadas de medidas de tendência central, pelo fato de representarem os fenômenos pelos seus valores médios, em torno dos quais tendem a concentrar-se os dados.
  • 62. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: n x x n 1i i∑= = (dados não agrupados) a) Medidas de posição: • Para um conjunto de n dados de xi (i = 1,2,..., n) a média aritmética simples ou média amostral, representada por é definida pela expressão:x
  • 63. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: 87,2x 15 411312557323312 x n x x n 1i i = ∴ ++++++++++++++ = ∴= ∑= 2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4 • Exemplo: Determinar a média aritmética simples (média aritmética amostral) dos dados mostrados abaixo: a) Medidas de posição:
  • 64. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição: • Quando os dados estiverem agrupados numa distribuição de frequência usa-se a média aritmética dos valores xi ponderadas pelas respectivas frequências absolutas ni, assim: n xn x n 1i ii∑= = (dados agrupados)
  • 65. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição: • Exemplo (dados agrupados): Determinar a média aritmética simples (média aritmética amostral) da distribuição dada abaixo: xi 1 2 3 4 5 7 ni 4 3 4 1 2 1
  • 66. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: 87,2x 15 43 15 )17(...)41( n nx x n 1i ii = = ⋅++⋅ == ∑= a) Medidas de posição: • Exemplo (dados agrupados): xi ni xini 1 2 3 4 5 7 4 3 4 1 2 1 4 6 12 4 10 7 Σ 15 43
  • 67. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição • No caso da variável ser contínua, visto que se perdeu os valores concretos do conjunto (ficaram afetos a uma determinada classe) não se pode calcular a média amostral diretamente dos valores dos dados.
  • 68. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição: • Deste modo, à cada classe vai ser atribuído um representante (xi), e a média amostral será calculada por meio desses representantes: n xn x k 1i ii∑= = (dados agrupados em classes) onde k é o número de classes do agrupamento, ni é a frequência absoluta da classe i e xi é o ponto médio da classe i, o qual é considerado como elemento representativo da classe.
  • 69. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição: • Exemplo (dados agrupados em classes): Determinar a média da distribuição a seguir, a qual representa o peso, em gramas, do conteúdo de uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha de enchimento automático (exemplo anterior):
  • 70. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética: a) Medidas de posição: • Exemplo (dados agrupados em classes): Classes ni xi xini [297,00 ; 298,00[ [298,00 ; 299,00[ [299,00 ; 300,00[ [300,00 ; 301,00[ [301,00 ; 302,00[ [302,00 ; 303,00[ [303,00 ; 304,00[ [304,00 ; 305,00[ [305,00 ; 306,00[ 8 21 28 15 11 10 5 1 1 297,5 298,5 299,5 300.5 301,5 302,5 303,5 304,5 305,5 2380,0 6268,5 8386,0 4507,5 3316,5 3025,0 1517,5 304,5 305,5 Σ 100 30011,0 11,300x 100 0,30011 x n xn x 9 1i ii = = = ∑=
  • 71. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética (Ponderada) a) Medidas de posição: • Às vezes, associam-se os números x1, x2, ..., xk a certos fatores de ponderação ou pesos w1, w2, ... , wk que dependem do significado ou importância atribuída aos mesmos. Nesse caso k21 kk2211 i k 1i ii w...ww xw...xwxw w xw x +++ +++ == ∑ ∑= é denominada de média aritmética ponderada.
  • 72. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.1) Média aritmética (Ponderada) a) Medidas de posição: • Exemplo: Em um curso, a avaliação final tem peso 3 e as parciais peso 1; a nota média de um estudante que obtenha nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais, será: 3,8 5 5,41 311 )5,83()0,91()0,71( w xw x 3 1i i 3 1i ii == ++ ⋅+⋅+⋅ == ∑ ∑ = =
  • 73. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.2) Média geométrica: A média geométrica G (ou ) de um conjunto de n números x1, x2, ..., xn é a raiz de ordem n do produto desses números: a) Medidas de posição: n n21 x...xxG ⋅⋅= 464842G 33 ==⋅⋅= - Exemplo: A média geométrica dos números 2, 4 e 8: Gx
  • 74. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.2) Média geométrica (dados agrupados): Se os elementos x1, x2, ..., xn ocorrem com as frequências n1, n2,..., nk, sendo n1+n2+...+nk = n a frequência total, a média geométrica G desses elementos será deduzida como: a) Medidas de posição: n n k n 2 n 1n vezesn kkk vezesn 222 vezesn 111 k21 k21 x...xxxxxx...xxx...xxG ⋅==
  • 75. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.3) Média harmônica: A média harmônica H (ou ) de um conjunto de n elementos x1, x2, ..., xn é a recíproca da média aritmética da recíproca dos elementos: a) Medidas de posição: ∑∑ == == n 1j j n 1j j x 1 n x 1 n 1 1 H 43,3 8 7 3 8 1 4 1 2 1 3 x 1 n H n 1j j == ++ == ∑= - Exemplo: A média harmônica dos números 2, 4 e 8: Hx
  • 76. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.4) Mediana: Para os dados colocados em ordem crescente, mediana (md, Me ou ) é o valor que divide a amostra, ou população, em duas partes iguais. Assim: a) Medidas de posição: x~ 50% 100%0% x~
  • 77. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.4) Mediana (série de elementos não agrupados): a) Medidas de posição: • Considerando que os dados que integram a amostra são colocados em ordem crescente, formando um vetor (x1, x2, ..., xn) - amostra ordenada -, a mediana amostral é definida como segue:        + = = + + 2 xx x~ xx~ 2 2n 2 n 2 1n n ímpar n par
  • 78. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.4) Mediana (série de elementos não agrupados): a) Medidas de posição: • Exemplo: Para as distribuições abaixo, determinar as respectivas medianas: 8, 5, 15,11, 4, 1, 7, 2, 9 Ordenando: 1, 2, 4, 5, 7, 8, 9, 11,15 Como n é ímpar, então: 7xxx~ 5 2 1n === + 8, 5, 15,11, 4, 1, 7, 2, 9, 3 Ordenando: 1, 2, 3, 4, 5, 7, 8, 9, 11,15 Como n é par, então: 6 2 75 2 xx 2 xx x~ 652 2n 2 n = + = + = + = +
  • 79. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência): a) Medidas de posição: • Exemplo: Para a distribuição abaixo, determinar a mediana: xi ni Ni 1 2 3 4 1 3 5 2 1 4 9 11 Σ 11 contém o 6º elemento n = 11 (ímpar), logo será o elemento de ordem (n+1)/2, ou seja, (11+1)/2 = 6º elemento. Da coluna da frequência acumulada crescente, encontra-se o valor xi correspondente à classe que contém a ordem calculada, assim: = 3.x~ x~
  • 80. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Para a distribuição abaixo, determinar a mediana: xi ni Ni 82 85 87 89 90 9 12 11 6 4 9 21 32 38 42 Σ 42 86 2 8785 x~ = + = 22º n = 42, é par, logo será a média entre os elemento de ordem n/2 e (n/2)+1, ou seja, 21º e 22º elementos. Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela Ni, ou seja, 85 e 87, assim: 21º x~ a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência):
  • 81. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Para a distribuição abaixo, determinar a mediana: xi ni Ni 82 85 87 89 90 5 10 15 8 4 5 15 30 38 42 Σ 42 21º e 22º n = 42, é par, logo será a média entre os elemento de ordem n/2 e (n/2)+1, ou seja, 21º e 22º elementos. Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela Ni, ou seja, 87 e 87, assim: 87 2 8787 x~ = + = x~ a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência):
  • 82. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Para variáveis contínuas, identifica-se a classe que contém a mediana (n/2), denominada classe Md (como a variável é contínua, não interessa se n é par ou ímpar); o valor aproximado para a mediana será calculado pela equação: Md Md 1Md Md Md Md1Md Md a f F5,0 l n aN 2 n lx~ − − − +=       − += onde: NMd-1 é a frequência absoluta acumulada da classe antes da classe mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente, o limite inferior, a amplitude e a frequência absoluta da classe mediana. a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 83. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Dada a distribuição amostral, calcular a mediana: Classes ni Ni 35 45 45 55 55 65 65 75 75 85 85 95 5 12 18 14 6 3 5 17 35 49 55 58 Σ 58 classe Md a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 84. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: 1º Passo: Calcula-se n/2; como n=58, então 58/2=29º. 2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª). 3º Passo: Aplica-se a fórmula: Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo: 67,61 18 1017 2 58 55 n aN 2 n lx~ i i1i i =       − +=       − += − a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 85. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.5) Quartis: a) Medidas de posição: • Como já visto anteriormente, a mediana é a medida de posição que divide um conjunto de dados em duas partes iguais; • Os quartis dividem um conjunto de dados em quatro partes iguais, assim: 50% 75%25% Q1 Q2 Q3
  • 86. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.5) Quartis: a) Medidas de posição: Q1 = 1º quartil, deixa 25% dos elementos; Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos; Q3 = 3º quartil, deixa 75% dos elementos. 50% 75%25% Q1 Q2 Q3
  • 87. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.5) Quartis (série de elementos não agrupados): a) Medidas de posição: • A determinação de Qk (k = 1, 2 e 3), segue a fórmula:       + = 4 1n kQk • Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207, 305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ? 196elementoº2 4 17 1Q1 →=      + = 3,193elementoº75,1 4 16 1Q1 →=      + = 597elementoº6 4 17 3Q3 →=      + = 8,579elementoº25,5 4 16 3Q3 →=      + =
  • 88. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • A determinação de Qk (k = 1, 2 e 3), segue os passos: k k k k Q Q 1Q Qk a n N 4 kn lQ ⋅       − += − - 1º Passo: Calcula-se a ordem kn/4; - 2º Passo: Identifica-se a classe Qk pela frequência acumulada N; - 3º Passo: Aplica-se a fórmula: a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 89. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição • Exemplo: Dada a distribuição amostral, determinar Q1 e Q3: Classes ni Ni 35 45 45 55 55 65 65 75 75 85 85 95 5 12 18 14 6 3 5 17 35 49 55 58 Σ 58 classe Q1 classe Q3 a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 90. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Para Q1. 1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º. 2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª). 3º Passo: Aplica-se a fórmula: Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo: ( ) 92,5210 12 55,14 45a n N 4 n1 lQ 1 1 1 1 Q Q 1Q Q1 =⋅ − +=⋅       − += − a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 91. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Para Q3. 1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º. 2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª). 3º Passo: Aplica-se a fórmula: Neste caso lQ3 = 65, n = 58, NQ3-1 = 35, aQ3 = 10, nQ3 = 14; logo: ( ) 07,7110 14 355,43 65a n N 4 n3 lQ 3 3 3 3 Q Q 1Q Q3 =⋅ − +=⋅       − += − a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 92. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • Exemplo: Diante desses resultados, pode-se afirmar que, nesta distribuição, tem-se: 25% 25%25%25% 52,92 61,67 71,0735 95 ou seja: O valor de 52,92 deixa 25% dos elementos; O valor de 61,67 deixa 50% dos elementos; O valor de 71,07 deixa 75% dos elementos. a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 93. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.6) Decis: a) Medidas de posição: • Os decis dividem um conjunto de dados em dez partes iguais, assim: D1 90%80%70%60%50%40%30%20%10% D2 D3 D4 D5 D6 D7 D8 D9
  • 94. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.6) Decis: a) Medidas de posição: D1 = 1º decil, deixa 10% dos elementos da série; D2 = 2º decil, deixa 12% dos elementos da série; D5 = 5º decil, coincide com a mediana, deixa 50% dos elementos da série; D6 = 6º decil, deixa 60% dos elementos da série; D7 = 7º decil, deixa 70% dos elementos da série; D8 = 8º decil, deixa 80% dos elementos da série; D9 = 9º decil, deixa 90% dos elementos da série.
  • 95. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.6) Decis (série de elementos não agrupados): a) Medidas de posição: • A determinação de Dk (k = 1, 2, ..., 9), segue a fórmula:       + = 10 1n kDk • Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207, 305, 574, 597, 612. 305elementoº4 10 17 5D5 →=      + = 2,520elementoº8,4 10 17 6D6 →=      + =
  • 96. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • A determinação de Dk (k = 1, 2, ..., 9), para o caso de variáveis contínuas com os dados divididos em classes, segue os passos: k k k k D D 1D Dk a n N 10 kn lD ⋅       − += − - 1º Passo: Calcula-se a ordem kn/10; - 2º Passo: Identifica-se a classe Dk pela frequência acumulada N; - 3º Passo: Aplica-se a fórmula: a.6) Decis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 97. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Percentis: a) Medidas de posição: • Os percentis dividem um conjunto de dados em cem partes iguais, assim: P1 99%98%97%3% . . .2%1% P2 P3 P50 P97 P98 P99 50% . . .
  • 98. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Percentis: a) Medidas de posição: P1 = 1º percentil, deixa 1% dos elementos; P2 = 2º percentil, deixa 2% dos elementos. P50 = 50º percentil, coincide com a mediana, deixa 50% dos elementos; P99 = 99º percentil, deixa 99% dos elementos.
  • 99. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Percentis (série de elementos não agrupados): a) Medidas de posição: • A determinação de Pk (k = 1, 2, ..., 99) para uma série de elementos não agrupados, segue a fórmula:       + = 100 1n kPk • Exemplo: Determine o 50º e o 60º percentis da série 185, 196, 207, 305, 574, 597, 612. 305elementoº4 100 17 50P50 →=      + = 2,520elementoº8,4 100 17 60D60 →=      + =
  • 100. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a) Medidas de posição: • A determinação de Pk (k = 1, 2, ..., 99), para o caso de variáveis contínuas com os dados divididos em classes, segue os passos: k k k k P P 1P Pk a n N 100 kn lP ⋅       − += − - 1º Passo: Calcula-se a ordem kn/100; - 2º Passo: Identifica-se a classe Pk pela frequência acumulada N; - 3º Passo: Aplica-se a fórmula: a.7) Percentis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):
  • 101. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º percentil da seguinte distribuição: a) Medidas de posição: Classes ni Ni 35 45 45 55 55 65 65 75 75 85 85 95 5 12 18 14 6 3 5 17 35 49 55 58 Σ 58 classe D4 classe P72 Cálculo de D4 34,5510 18 17 10 584 55D 18n;10a ;58n;17N;55l 2,23 10 584 10 kn 4 DD 1DD o 44 44 =⋅       − ⋅ += == === = ⋅ = − 1º Passo: 2º Passo: 3º Passo:
  • 102. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º percentil da seguinte distribuição: a) Medidas de posição: Classes ni Ni 35 45 45 55 55 65 65 75 75 85 85 95 5 12 18 14 6 3 5 17 35 49 55 58 Σ 58 classe D4 classe P72 Cálculo de P72 82,6910 14 35 100 5872 65P 14n;10a ;58n;35N;65l 8,41 100 5872 100 kn 72 PP 1PP o 7272 7272 =⋅       − ⋅ += == === = ⋅ = − 1º Passo: 2º Passo: 3º Passo:
  • 103. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.7) Exemplo (decil e percentil). a) Medidas de posição: • Portanto, na distribuição analisada, tem-se que: - O valor 55,34 indica que 40% dos elementos da distribuição estão abaixo dele e os outros 60% acima. - O valor 69,82 indica que 72% dos elementos da distribuição estão abaixo dele e os outros 28% acima.
  • 104. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda a) Medidas de posição: • Moda (Mo) é a medida que indica o valor ou a gama de valores nos quais a concentração dos dados amostrais é máxima. - Para variáveis discretas, a moda é o valor dos dados que ocorre com maior frequência; - Para variáveis contínuas, a classe modal é o intervalo de classe com maior frequência.
  • 105. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda a) Medidas de posição: • Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal.
  • 106. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda a) Medidas de posição: • Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação).
  • 107. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (distribuições simples) a) Medidas de posição: • Para distribuições simples (sem agrupamento em classes), a identificação da moda é facilitada pela simples observação do elemento que apresenta maior frequência. - Exemplo: Para a distribuição abaixo Mo = 248. xi 243 245 248 251 307 ni 7 17 23 20 8
  • 108. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (dados agrupados) a) Medidas de posição: • Para dados agrupados em classe, existem diversas fórmulas para o cálculo da moda: - Fórmula de Czuber: Após a identificação da classe modal, aplica-se a fórmula abaixo, onde i 21 1 io alM ⋅ + += ∆∆ ∆ l = limite inferior da classe modal; Δ1= diferença entre a frequência absoluta da classe modal e a imediatamente anterior; Δ2 = diferença entre a frequência absoluta da classe modal e a imediatamente posterior; ai = amplitude da classe modal.
  • 109. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (dados agrupados) a) Medidas de posição: - Exemplo: Determinar a moda para a distribuição: Classes ni 35 45 45 55 55 65 65 75 75 85 85 95 5 12 18 14 6 3 - A classe com maior frequência absoluta é [55, 65[; logo, ela é a classe modal. - Aplicando a fórmula de Czuber, tem-se: 61M 10 )1418()1218( 1218 55M alM o o i 21 1 io = ⋅ −+− − += ⋅ + += ∆∆ ∆
  • 110. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (dados agrupados) a) Medidas de posição: - Densidades de classes: Quando as amplitudes das classes são diferentes, deve-se calcular as densidades de classes para identificar a classe modal, as quais são obtidas por meio da relação ni/ai.
  • 111. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (dados agrupados) a) Medidas de posição: - Exemplo: Determinar a moda para a distribuição: Salários (US$) ni ai ni/ai 80 180 180 250 250 300 300 500 70 140 140 60 100 70 50 200 0,7 2,0 2,8 0,3 12,26250 )3,08,2()0,28,2( 0,28,2 250alM i 21 1 io =⋅ −+− − +=⋅ + += ∆∆ ∆ classe modal
  • 112. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais a.8) Moda (dados agrupados) a) Medidas de posição: - Fórmula de Pearson: Fornece uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. É dada pela relação: x2x~3Mo −≅ ou seja, a moda é aproximadamente igual a diferença entre o triplo da mediana e o dobro da média
  • 113. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Observações: a) Medidas de posição: 1. Média versus Mediana:  Diferença entre estas duas medidas fica mais clara quando se considera o exemplo das notas obtidas por um aluno como sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode ser comprovado, a média aritmética e a mediana são iguais a 14.  Se esse aluno elevar a nota mais baixa, passando de 10 para 14, a mediana ainda será o mesmo valor, mas o valor da média sofrerá um aumento, passando para 14,4.
  • 114. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Observações: a) Medidas de posição:  A média, ao contrário da mediana, é uma medida de posição muito pouco resistente, isto é, ela é muito influenciada por valores muito grandes ou muito pequenos, mesmo que estes valores surjam em pequeno número na amostra.  Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana. 1. Média versus Mediana:
  • 115. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Observações: a) Medidas de posição:  Entretanto, a preferência de uma ou de outra dependerá do contexto em que forem utilizadas: se a distribuição é simétrica essas medidas coincidem; caso contrário, observar que a mediana não é tão sensível quanto a média, às observações que são muito maiores ou muito menores do que as restantes; além disso, a média reflete o valor de todas as observações. 1. Média versus Mediana:
  • 116. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Observações: a) Medidas de posição:  Representação das distribuições dos dados na forma de uma curva de frequência: 1. Média versus Mediana:
  • 117. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais  Observações: a) Medidas de posição:  A média geométrica de um conjunto de números positivos é menor ou igual à sua média aritmética, mas é maior ou igual à sua média harmônica: xGH ≤≤  O sinal de igualdade somente é válido quanto todos os números do conjunto de dados são idênticos. 2. Relação entre as médias aritmética, geométrica e harmônica:
  • 118. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais • São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores em torno da média. • Servem para medir a representatividade da média b) Medidas de dispersão - Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30, como pode ser calculado, ambas possuem média aritmética igual a 20; entretanto, na primeira não existe dispersão, enquanto a segunda apresenta dispersão em torno da média 20; portanto, a média é muito mais representativa para a segunda série.
  • 119. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão - Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36 R = 36 – 10 = 26 b.1) Amplitude total (ou amplitude amostral): É definida como sendo a diferença entre o maior e o menor dos valores da série, ou seja: minmáx xxR −= - Observação: É uma medida de dispersão muito limitada, pois depende apenas dos valores externos, o que a torna instável, não sendo afetada pela dispersão dos valores internos.
  • 120. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.2) Desvio médio: O desvio médio de um conjunto de n números x1, x2 , ... , xn é definido por: n xx n xx n d D n 1i i n 1i i M ∑∑∑ − = − == == onde =− xxi média aritmética dos números; valor absoluto do desvio de cada número em relação à média aritmética. =x
  • 121. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn ocorrerem com as frequências n1, n2, ... , nn, respectivamente, o desvio médio poderá ser indicado da seguinte forma: n xxn n xxn n dn D i n 1i ii n 1i ii M ∑∑∑ − = − == ==
  • 122. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.3) Variância: A variância de um conjunto de dados é definida como o quadrado do desvio padrão, evitando- se com isso que Σdi=0. - Quando é necessário distinguir entre o desvio padrão de uma população e o de uma amostra dela extraída, adota-se frequentemente o símbolo σ para o primeiro e s para o último.
  • 123. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.3) Variância: - Para o caso da variância populacional são adotadas as seguintes fórmulas: N )Xx( N )Xx( 2 n 1i 2 i 2 ∑∑ − = − = = σ (dados não agrupados) N )Xx(n N )Xx(n 2 i k 1i 2 ii 2 ∑∑ − = − = = σ (dados agrupados) média populacional;=X tamanho da população.=N
  • 124. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.3) Variância: - Para o caso da variância amostral são adotadas as seguintes fórmulas: 1n )xx( 1n )xx( s 2 n 1i 2 i 2 − − = − − = ∑∑= (dados não agrupados) 1n )xx(n 1n )xx(n s 2 i k 1i 2 ii 2 − − = − − = ∑∑= (dados agrupados) média amostral;=x tamanho da amostra.=n
  • 125. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.3) Variância: • Fórmulas práticas para os cálculos das variâncias: ( )         −= ∑ ∑ N xn xn N 1 2 ii2 ii 2 σ ( )         − − = ∑ ∑ n xn xn 1n 1 s 2 ii2 ii 2
  • 126. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.4) Desvio padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para se conseguir uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, toma-se a raiz quadrada da variância e obtém-se o desvio padrão. 2 2 ss = = σσ (desvio padrão populacional) (desvio padrão amostral)
  • 127. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.4) Desvio padrão: • O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. • Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: - o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre os dados; - se s= 0, então não existe variabilidade, isto é, os dados são todos iguais.
  • 128. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.4) Desvio padrão: • Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral: xi 5 7 8 9 11 ni 2 3 5 4 2 xi ni nixi 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 Σ 16 129 06,8 16 129 16 xn n xn x 5 1i ii k 1i ii ==== ∑∑ == - Média aritmética:
  • 129. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.4) Desvio padrão: • Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral: 2,1 16 24,19 n xxn D i M == − = ∑ xi ni nixi |xi-x| = |di| ni|di| 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 |5 – 8,06| = 3,06 |7 – 8,06| = 1,06 |8 – 8,06| = 0,06 |9 – 8,06| = 0,94 |11 – 8,06| = 2,94 6,12 3,18 0,30 3,76 5,88 Σ 16 129 19,24 - Desvio médio:
  • 130. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.4) Desvio padrão: • Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral: xi ni nixi nixi 2 5 7 8 9 11 2 3 5 4 2 10 21 40 36 22 50 147 320 324 242 Σ 16 129 1.083 - Variância: ( ) 86,2 16 )129( 083.1 116 1 s n xn xn 1n 1 s 2 2 2 ii2 ii 2 =      − − = =         − − = ∑ ∑ - Desvio padrão: 69,186,2ss 2 ===
  • 131. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.5) Amplitude interquartílica: • A medida anterior tem a grande desvantagem de ser muito sensível à existência, na amostra, de uma observação muito grande ou muito pequena. • Por esse motivo, define-se uma outra medida, a amplitude interquartílica.
  • 132. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.5) Amplitude interquartílica: • Esta medida é, de certa forma, uma solução de compromisso, pois não é afetada, de um modo geral, pela existência de um pequeno número de valores demasiadamente grandes ou pequenos. É definida como sendo a diferença entre o 3º e 1º quartis; assim: 13Q QQD −=
  • 133. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.5) Amplitude interquartílica: • Da definição de amplitude interquartílica, pode-se concluir que 50% dos elementos do meio da amostra estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto maior quanto maior for a variabilidade nos dados. • Ao contrário do que acontece com o desvio padrão, uma amplitude interquartílica nula não significa necessariamente, que os dados não apresentem variabilidade.
  • 134. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.5) Amplitude interquartílica: • Alguns autores preferem calcular uma medida próxima da referida: a amplitude semi- interquartílica (ASI). 2 QQ ASI 13 − =
  • 135. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.6) Coeficiente de variação: • A variação ou dispersão real, determinada a partir do desvio padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta; entretanto, uma variação ou dispersão, na medida de uma determinada distância, é inteiramente diferente quanto ao efeito, da mesma variação em uma distância menor.
  • 136. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.6) Coeficiente de variação: • A medida desse efeito é proporcionada pela dispersão relativa, definida por: Média absolutaDispersão relativaDispersão =
  • 137. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.6) Coeficiente de variação: • Se a dispersão absoluta é o desvio padrão e a média é a aritmética, a dispersão relativa é denominada coeficiente de variação ou de dispersão, dado por: • coeficiente de variação é uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. 100 x s CVou100 X CV ⋅=⋅= σ
  • 138. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.6) Coeficiente de variação: • Exemplo: Em uma empresa, o salário médio dos homens é de $4.000,00, com desvio padrão de $1.500,00, e o das mulheres é em média de $3.000,00, com desvio padrão de $1.200,00. Então: • Desses valores conclui-se, portanto, que o salário das mulheres apresentam maior dispersão que os dos homens %0,40100 3000 1200 100 X CV %5,37100 4000 1500 100 X CV =⋅=⋅= =⋅=⋅= σ σ Para os homens: Para as mulheres:
  • 139. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais b) Medidas de dispersão b.6) Coeficiente de variação: • Diz-se que a distribuição possui baixa, média ou alta variabilidade (dispersão) conforme os seguintes valores: Baixa dispersão: CV ≤ 10% Média dispersão: 10% < CV < 20% Alta dispersão: CV ≥ 20% • Alguns analistas consideram valores diferentes: Baixa dispersão: CV ≤ 15% Média dispersão: 15% < CV < 30% Alta dispersão: CV ≥ 30%
  • 140. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Uma distribuição de frequência pode simétrica, assimétrica positiva ou assimétrica negativa. c.1) Medidas de assimetria: • Denomina-se assimetria o grau de desvio ou afastamento da simetria de uma distribuição.
  • 141. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Uma distribuição simétrica apresenta a igualdade entre as três medidas de posição, média aritmética, mediana e modo, ou: xx~Mo == xx~Mo << • Em uma distribuição assimétrica positiva, ou assimétrica à direita, tem-se que: • Em uma distribuição assimétrica negativa, ou assimétrica à esquerda, tem-se que: oMx~x << c.1) Medidas de assimetria:
  • 142. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Existem várias fórmulas para o cálculo do coeficiente de assimetria, dentre elas duas são bastante utilizadas: - 1º Coeficiente de Pearson: s Mx ASou Mx AS oo − = − = σ - 2º Coeficiente de Pearson: 13 31 QQ x~2QQ AS − −+ = • Se AS = 0, a distribuição é simétrica AS > 0, a distribuição é assimétrica positiva AS < 0. a distribuição é assimétrica negativa. c.1) Medidas de assimetria:
  • 143. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Exemplo: Identificar o grau de assimetria da distribuição: c.1) Medidas de assimetria: Salários ($1.000,00) 30 50 50 100 100 150 Empregados 80 50 30
  • 144. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Exemplo: c.1) Medidas de assimetria: Classes xi ni nixi nixi 2 ni/ai Ni 30 50 50 100 100 150 40 75 12 5 80 50 30 3200 3750 3750 128.00 0281.2 50468. 750 80/20 = 4 50/50 = 1 30/50 = 0,6 80 130 160 Σ 16 0 10.70 0 878.00 0
  • 145. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Exemplo: c.1) Medidas de assimetria: 6,0 4090 29040 QQ x~2QQ AS96,31s 796,0 96,31 429,4185,66 s Mx AS62,1021 160 )700.10( 000.878 159 1 s 5020 80 )080( 30x~429,4120 34 4 30M 9050 50 )80120( 50Q62,1021 160 )700.10( 000.878 159 1 s 4020 80 )040( 30Q875,66 160 700.10 x 13 31 o 2 2 o 3 2 2 1 = − −+ = − −+ == = − = − ==      −= =⋅ − +==⋅ + += =⋅ − +==      −= =⋅ − +=== - Como AS > 0, então a distribuição é assimétrica positiva.
  • 146. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Denomina-se curtose o grau de achatamento de uma distribuição. • Uma distribuição de frequência pode ser: - Mesocúrtica: quando sua forma nem é achatada e nem delgada; - Leptocúrtica: quando apresenta a forma delgada; - Platicúrdica: quando apresenta a forma achatada. c.2) Medidas de curtose:
  • 147. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma c.2) Medidas de curtose:
  • 148. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Para medir o grau de curtose utiliza-se o coeficiente: )PP(2 QQ K 1090 13 − − = onde Q3 = 3º quartil; P90 = 90º percentil; Q1 = 1º quartil; P10 = 10º percentil. • Se K = 0,263 – a curva correspondente à distribuição é mesocúrtica; K > 0,263 – a curva é platicúrdica; K < 0,263 – a curva é leptocúrdica. c.2) Medidas de curtose:
  • 149. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.5 Estatísticas Amostrais c) Medidas de forma • Exemplo: Para a mesma distribuição do exemplo da assimetria, calcula-se ainda P10 e P90; logo: c.2) Medidas de curtose: 355,0 )34375,104(2 4090 )PP(2 QQ K 375,10450 160 )130144( 100P 3420 80 )016( 30P 1090 13 90 10 = − − = − − = =⋅ − += =⋅ − += - Como K > 0,273, então a distribuição é do tipo platicúrtica.
  • 150. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear I - Estatística Descritiva
  • 151. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.6 Outras Apresentações Gráficas de Dados • Além dos diagramas já estudados, existem outras formas bastante utilizadas internacionalmente para apresentar os dados amostrais. Um bom modo de obter uma apresentação visual eficiente de um conjunto de dados pode ser conseguido por meio de três tipos de gráficos: diagramas de pontos, diagramas de ramo e folhas, e diagramas de caixa. • O diagrama de pontos é uma apresentação útil de dados, no caso de amostras pequenas (até cerca de 20 observações). Entretanto, quando o número de observações for moderadamente alto, o diagrama de ramo e folhas e o diagrama de caixa podem ser mais úteis. • Questões como quantidades de dados abaixo de certo valor, tendência central (média ou mediana), dispersão (desvio-padrão), possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria, não são fáceis de responder, pois existem muitas observações, e a construção de um diagrama de pontos, usando esses dados, seria relativamente ineficiente .
  • 152. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de pontos • Um diagrama de pontos é um gráfico estatístico que consiste em grupos de pontos de dados traçados em uma escala simples. • São utilizados para dados contínuos, quantitativos e univariados, e são muito úteis para exibir um pequeno conjunto de dados. • Esse tipo de gráfico permite uma fácil visualização de duas características dos dados: a posição (meio) e a dispersão (espalhamento ou variabilidade) 1.6 Outras Apresentações Gráficas de Dados
  • 153. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de pontos • Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está projetando um conector de náilon para ser usado em aplicação automotiva. Ele considera estabelecer como especificação do projeto uma espessura de 3/32 pol., mas está inseguro. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas, resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses dados. 1.6 Outras Apresentações Gráficas de Dados 12 14 15 13 Força de remoção
  • 154. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de pontos • Exemplo 02: O engenheiro do exemplo anterior decide considerar um projeto alternativo com uma espessura maior da parede do conector, 1/8 pol. Oito protótipos desse projeto são construídos, sendo as medidas observadas da força de remoção, resultando nos seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e 13,1. Construa um diagrama de pontos para esses dados, sobrepondo-o ao anterior para uma melhor análise da influência da espessura da parede na força de remoção. 1.6 Outras Apresentações Gráficas de Dados 12 14 15 13,0 13,4 Força de remoção 3/32 pol. 1/8 pol.
  • 155. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas • Esta forma de apresentação de dados tem sido frequentemente utilizada em trabalhos técnicos do mundo inteiro. • Para construir o diagrama de ramo e folhas, dividimos o elemento amostral em duas partes: um ramo (stem), consistindo em um ou mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos restantes. Exemplo: O dado 458 é dividido em duas partes, a primeira parte 45, e a segunda parte 8. • Geralmente, escolhe-se relativamente poucos ramos em comparação ao número de observações (5 a 20 itens). 1.6 Outras Apresentações Gráficas de Dados
  • 156. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas • Exemplo (Montgomery, 2004, p.16): Considere o conjunto de dados abaixo, relativos à resistência a compressão de uma liga de alumínio. 105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158 160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149 O diagrama de ramo e folhas resultante é apresentado a seguir: 1.6 Outras Apresentações Gráficas de Dados
  • 157. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas (dados brutos) Ramo Folha Frequência 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 6 7 7 5 1 5 8 0 1 0 3 4 1 3 5 3 5 2 9 5 8 3 1 6 9 4 7 1 3 4 0 8 8 6 8 0 8 3 0 7 3 0 5 0 8 7 9 8 5 4 4 1 6 2 1 0 6 0 3 6 1 4 1 0 9 6 0 9 3 4 7 1 0 8 8 1 8 9 7 5 1 1 1 2 3 3 6 8 12 10 10 7 6 4 1 3 1 1 1.6 Outras Apresentações Gráficas de Dados
  • 158. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas (dados ordenados) Ramo Folha Frequência 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 6 7 7 1 5 0 5 8 0 1 3 1 3 3 4 5 5 1 2 3 5 6 8 9 9 0 0 1 3 4 4 6 7 8 8 8 8 0 0 0 3 3 5 7 7 8 9 0 1 1 2 4 4 5 6 6 8 0 0 1 1 3 4 6 0 3 4 6 9 9 0 1 7 8 8 1 8 9 7 5 1 1 1 2 3 3 6 8 12 10 10 7 6 4 1 3 1 1 1.6 Outras Apresentações Gráficas de Dados
  • 159. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas • Em alguns casos pode ser desejável construir mais intervalos ou ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em dois ou mais novos ramos, conforme mostrado abaixo: Ramo Folha 14L 14U 15L 15U 1 2 3 5 6 8 9 9 0 0 1 3 4 4 6 7 8 8 8 8 Ramo Folha 14z 14t 14f 14s 14e 15z 15t 15f 15s 15e 1 2 3 5 0 0 1 3 4 4 6 7 8 8 8 8 1.6 Outras Apresentações Gráficas de Dados
  • 160. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas Frequência acumulada Ramo Folha 1 2 3 5 8 11 17 25 37 (10) 33 23 16 10 6 5 2 1 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 6 7 7 1 5 0 5 8 0 1 3 1 3 3 4 5 5 1 2 3 5 6 8 9 9 0 0 1 3 4 4 6 7 8 8 8 8 0 0 0 3 3 5 7 7 8 9 0 1 1 2 4 4 5 6 6 8 0 0 1 1 3 4 6 0 3 4 6 9 9 0 1 7 8 8 1 8 9 7 5 1.6 Outras Apresentações Gráficas de Dados N = 80 Min = 76 Max = 245 Média = 162,7 Mediana = 161,5 Q1 = 143,50 Q3 = 181,00 S2 = 33,77
  • 161. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas 1.6 Outras Apresentações Gráficas de Dados • Exercício (Montgomery, 2004, p.17): Os seguintes dados são os números de ciclos até a falha, de corpos de prova de alumínio, sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos por segundo: 1115 1310 1540 1502 1258 1315 1085 798 1020 865 2130 1421 1109 1481 1567 1883 1203 1270 1015 845 1674 1016 1102 1605 706 2215 785 885 1223 375 2265 1910 1018 1452 1890 2100 1594 2023 1315 1269 1260 1888 1782 1522 1792 1000 1820 1940 1120 910 1730 1102 1578 758 1416 1560 1055 1764 1330 1608 1535 1781 1750 1501 1238 990 1468 1512 1750 1642
  • 162. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de ramo e folhas 1.6 Outras Apresentações Gráficas de Dados • (a) Construa um diagrama de ramo e folhas para esses dados. (b) Você acha que o corpo de prova “sobreviverá” além de 2.000 ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.Profundidade Ramo Folha 1 5 8 10 17 22 29 33 (5) 32 22 18 11 7 5 4 2 3 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 75 06 58 85 98 45 65 85 10 90 00 15 16 18 20 55 85 02 02 09 15 20 03 23 38 58 60 69 70 10 15 15 30 16 21 52 68 81 01 02 12 22 35 40 60 67 78 94 05 08 42 74 30 50 50 64 81 82 92 20 83 88 90 10 40 23 00 30 15 65 b) Não. A probabilidade é muito pequena. c) M = 1436,5 Q1 = 1097,8 Q3 = 1735 a)
  • 163. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de caixa (box plot) 1.6 Outras Apresentações Gráficas de Dados • Uma outra forma gráfica de apresentar os dados é o chamado diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and whiskers), que permite descrever simultaneamente vários fatores importantes de uma série de dados, tais como a tendência central (média ou mediana), a dispersão (desvio-padrão), a possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria. • Um diagrama de caixa apresenta três quartis, em uma caixa retangular, alinhados tanto horizontal como verticalmente; opcionalmente, pode apresentar a média.
  • 164. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de caixa (box plot) 1.6 Outras Apresentações Gráficas de Dados • A caixa inclui a amplitude interquartil, com o canto esquerdo (ou inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a amplitude interquartil , DQ = Q3 - Q1. • Uma linha é desenhada através da caixa, no segundo quartil (que é o percentil 50 ou a mediana), Q2. A média, como já dito, é opcional. • Uma linha (whisker) estende-se de cada extremidade da caixa. • A linha inferior (ou esquerda) começa no primeiro quartil indo até o menor valor do conjunto de pontos dentro das amplitudes interquartis de 1,5, a partir do primeiro quartil.
  • 165. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de caixa (box plot) 1.6 Outras Apresentações Gráficas de Dados • A linha superior (ou direita) começa no terceiro quartil indo até o maior do conjunto de pontos dentro das amplitudes interquartis de 1,5, a partir do terceiro quartil. • Dados mais afastados dos que as linhas são plotados como pontos individuais. Um ponto além da linha, porém a menos de 3 amplitudes interquartis a partir da extremidade da caixa, é chamado de dispersos (outliers). • Um ponto a mais de 3 amplitudes interquartis a partir da extremidade da caixa é chamado de um outlier extremo. Ocasionalmente, símbolos diferentes (círculos abertos e fechados, por exemplo) são usados para identificar os dois tipos de outlier.
  • 166. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de caixa (box plot) 1.6 Outras Apresentações Gráficas de Dados
  • 167. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Diagrama de caixa (box plot) 1.6 Outras Apresentações Gráficas de Dados • Exercício: Represente o diagrama de caixa para os dados da resistência à compressão do alumínio mostrados no exercício anterior. N = 80 Min = 76 Max = 245 Média = 162,7 Mediana = 161,5 Q1 = 143,50 Q3 = 181,00
  • 168. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva  Introdução  Conceitos e definições  Classificação dos dados  Caracterização e apresentação dos dados  Estatísticas amostrais  Outras apresentações gráficas de dados  Regressão linear I - Estatística Descritiva
  • 169. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Introdução • A análise de regressão é uma técnica estatística para investigar e modelar a relação entre variáveis, sendo uma das mais utilizadas na análise de dados. • É denominada “linear” porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. • Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não- linear.
  • 170. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Introdução • A regressão linear pode ser simples ou múltipla. • A regressão simples envolve duas variáveis (estimadores): uma variável dependente e uma variável independente. • A regressão múltipla envolve três ou mais variáveis, ainda uma única variável dependente, porém duas ou mais variáveis independentes (explicativas).
  • 171. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear Regressão Linear Simples  Relação entre duas variáveis • Em inúmeras ocasiões o estudo descritivo não se resume ao estudo de apenas uma variável; para se ter uma visão global do problema em estudo, muitas vezes é necessário a observação de duas ou mais variáveis. • Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passa- se a ter dados bivariados (xi, yi), i = 1, 2, ..., n. • Um dos objetivos desse estudo é a relação existente entre as variáveis do par.
  • 172. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Correlação linear • Para se ter uma ideia de como as duas variáveis se relacionam é comum representar graficamente esta relação por meio de um diagrama de dispersão. Esta representação consiste na marcação das observações em um sistema de eixos cartesianos. • Se as variáveis fornecem um diagrama de dispersão em que os pontos se colocam ao redor de uma reta crescente ou decrescente, diz-se que essas variáveis estão linearmente correlacionadas.
  • 173. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Correlação linear • Quanto menor a dispersão dos pontos em torno da reta, mais forte será a correlação. • A correlação linear será positiva ou negativa caso a tendência da reta seja crescente ou decrescente. • Se nenhuma tendência positiva ou negativa pode ser detectada, a explicação possível para os valores da segunda variável é sua média. Nesse caso, o eixo da dispersão será horizontal, contendo a média da segunda variável, e diz-se que as variáveis não são linearmente correlacionadas.
  • 174. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Correlação linear y x Correlação linear forte (positiva) y x Correlação linear forte (negativa) y x Correlação linear fraca (positiva)
  • 175. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Correlação linear y x Variáveis não correlacionadas y x Variáveis não correlacionadas linearmente y x Variáveis não correlacionadas linearmente y
  • 176. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Correlação linear • Exemplo: A tabela abaixo mostra os dados da temperatura do gás combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma turbina de combustão, para ser usada em refrigeração, construa o diagrama de dispersão para esses dados. x 100 125 150 175 200 225 250 275 y 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8 x 300 325 350 375 400 425 450 500 y 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7 • Desse diagrama pode-se extrair que talvez exista uma correlação linear entre as variáveis; esta relação pode ser traduzida por meio de uma reta.
  • 177. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • A determinação da correlação entre duas variáveis por meio de uma inspeção nos pares anotados ou no diagrama de dispersão correspondente é pouco precisa e subjetiva. • Essa dificuldade pode ser contornada pelo uso de uma medida que caracterize a correlação linear e seja independente do observador que esteja examinando os dados.
  • 178. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • Karl Pearson propôs o chamado coeficiente de correlação linear, o qual é dado pela relação: 2 y 2 x ss )y,x(Cov r ⋅ = onde: Cov (x,y) é a covariância das variáveis x e y, e seu cálculo é dado por 1n )yy()xx( )y,x(Cov − −⋅− = ∑ e sx 2 e sy 2 são as variâncias da variáveis x e y.
  • 179. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • Fazendo-se as devidas substituições e simplificações, obtém-se o coeficiente de correlação de forma mais simples: yyxx xy ss s r ⋅ = ( ) ∑ ∑−= n x xs 2 2 xx ( ) ∑ ∑−= n y ys 2 2 yy onde: ∑ ∑∑ ⋅ −= n yx xysxy 1r1 ≤≤−
  • 180. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • r = -1, indica correlação linear negativa perfeita; os pontos (x,y) estão sobre uma reta com coeficiente angular negativo. • r = 0, indica que os pontos não estão correlacionados, nem apresentam tendência crescente ou decrescente. • r = 1, indica correlação linear positiva perfeita; os pontos (x,y) estão sobre uma reta com coeficiente angular positivo.
  • 181. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • Nos casos em que os pontos do diagrama de dispersão estão em uma reta vertical ou horizontal, o quociente que calcula o coeficiente de correlação não está definido, pois apresenta numerador e denominador nulos. Nesse caso, o coeficiente de correlação será considerado nulo. r = 0, Cov (x,y) = 0, sy 2 = 0 y x r = 0, pois Cov (x,y) = 0, sx 2 = 0 y x
  • 182. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • A correlação entre duas variáveis pretende captar o fato dessas variáveis apresentarem a mesma tendência ao crescimento, ou tendências contrárias. • O fato de duas variáveis evoluírem no mesmo sentido ou em sentidos opostos fornece uma ideia do que se pode esperar sobre um valor desconhecido da variável y para um particular valor de x.
  • 183. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear x y • Se as variáveis x e y são positivamente correlacionadas, e se procura estimar o valor de y1 para certo valor x1 menor que a média , deve- se esperar o valor correspondente y1 menor que a média ; para um valor x2 maior que a média , deve-se esperar um valor y2 maior que a média , acompanhando a tendência do eixo crescente dos pontos. x y y x y2 y1 x2 x1 x y
  • 184. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de correlação linear • Os problemas que envolvem estimativas de valores desconhecidos a partir de valores históricos são chamados problemas de previsão ou predição. • O conhecimento da correlação entre duas variáveis, embora possa fornecer uma pista para a previsão de um valor desconhecido de uma delas, nada informa a respeito da qualidade dessa previsão, ou seja, não se pode, em geral, com base apenas no conhecimento da correlação, transformar a incerteza da previsão em risco (isto só é possível quando a correlação é perfeita). • Entretanto, o fato de duas variáveis serem correlacionadas levanta a possibilidade de uma relação causal entre elas, o que é importante em problemas de previsão.
  • 185. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples • Como visto anteriormente, uma previsão construída baseada nas informações obtidas da correlação nada diz a respeito da confiabilidade do valor previsto. • Um método de previsão que permite a avaliação em termos de confiabilidade é a regressão linear, pois, satisfeitas determinadas condições, ela proporciona a transformação da incerteza em risco
  • 186. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples – Modelo teórico • Quando se verifica, quer por meio do gráfico de dispersão, quer pelo coeficiente de correlação linear, uma correlação forte entre duas variáveis, a relação entre essas variáveis pode ser descrita por meio de uma reta de regressão (a reta que melhor se ajusta aos dados). • Essa reta serve de modelo matemático para expressar a relação linear entre duas variáveis.
  • 187. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples – Modelo teórico • Considere o relacionamento de duas variáveis x e y com as seguintes características: x: é a variável cujos valores são controlados e, portanto, determinados; ela é conhecida por variável independente ou variável de decisão; y: variável aleatória; é a variável que se quer prever; seu valor depende do valor atribuído a x, embora para cada valor de x se possa ter vários valores de y, devido a sua característica aleatória (variável dependente de x).
  • 188. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples – Modelo teórico • O modelo teórico define a verdadeira reta de regressão, cuja equação pode ser escrita como: xy βα += y O valor de y é dado por: onde: UxyouUyy ++=+= βα é a parte funcional de y (a parte do valor de y explicada pelo valor de x); U é a parte aleatória de y, a qual é introduzida no valor de y por fatores imponderáveis.
  • 189. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Regressão linear simples – Modelo teórico • Nessas condições, dado um valor para x, a previsão ou expectativa para o correspondente valor de y é: • Entretanto, dificilmente se conhece a população dos valores de y para cada valor da variável controlada x. O que se conhece, geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma amostra dessas variáveis. • Portanto, com base nos dados amostrais, deve-se pensar como estimar os valores de α e β, o que pode ser feito de forma eficiente por meio do método dos mínimos quadrados. xy βα +=
  • 190. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Um dos métodos mais utilizados para ajustar uma reta a um conjunto de dados é o Método dos Mínimos Quadrados (MMQ), o qual consiste em determinar a reta que minimiza a soma dos quadrados dos desvios (os chamados erros ou resíduos) entre os verdadeiros valores de y e os valores estimados a partir da reta de regressão que se pretende ajustar, ŷ. ^ŷ = a + bx
  • 191. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Adota-se o quadrado das diferenças, pois como os pontos se situam acima e abaixo da reta estimada, as diferenças podem ser positivas ou negativas, e na soma podem anular-se, não refletindo o ajustamento. • Sendo números positivos, esses quadrados refletem a qualidade do ajuste através de sua soma.
  • 192. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • O modelo de regressão linear é a reta de regressão ŷi = a + bxi + εi onde ŷ é o estimador de y; a e b os estimadores de α e β. ∑ ∑∑ +−=−= 2 ii 2 ii 2 i )]bxa(y[min)yˆy(minmin ε • A reta estimada é obtida de tal modo que a soma dos quadrados dos desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,
  • 193. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Como tal, para estimar os parâmetros do modelo, é necessário que as primeiras derivadas em relação a a e a b sejam nulas, e as segundas sejam maiores ou iguais a zero, assim:        =−− ∂ ∂ =−− ∂ ∂ ∑ ∑ 0)bxay( b 0)bxay( a 2 ii 2 ii ( ) xx xy 2 2 s s n x x n yx xy b,xby n x b n y a = − ⋅ − =−=−= ∑ ∑ ∑ ∑ ∑ ∑∑ As estimativas dos mínimos quadrados para os parâmetros α e β são:
  • 194. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de explicação • Calculada a estimativa de mínimos quadrados para uma amostra dada, deve-se verificar a qualidade do ajuste dessa reta aos dados históricos. • Uma forma de medir a qualidade do ajuste é verificar qual a porcentagem da variação dos valores de y em relação à sua média pode ser explicada pela regressão de y sobre x, o que dará origem ao coeficiente de explicação R2 .
  • 195. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de explicação • Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x, observa-se que o valor de yi correspondente a um valor xi pode ser composto de duas partes: a parte explicada pela média e a parte não explicada pela média. y =y parte do valor de y explicada pela média parte do valor de y explicada pela regressão=− yyˆ parte do valor de y não explicada pela média=− yˆyi } xxi yi ŷ y } } ŷ = a + bx
  • 196. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva • Interessa avaliar que porcentagem da parte não explicada pela média, , pode ser explicada pela regressão de y sobre x, isto é, por . 1.7 Regressão Linear  Coeficiente de explicação yyˆ − yyi − ( )∑ −= 2 i yyVT VE = variação explicada, a soma dos quadrados das variações em relação à média. ( )∑ −= 2 yyˆVE • Designando: VT = variação total, soma dos quadrados das variações de y em relação à sua média. • No método dos mínimos quadrados, ao invés de somar essas diferenças, soma-se o quadrado delas para evitar que valores positivos e negativos se anulem.
  • 197. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Coeficiente de explicação ( ) 22 yy xy2 2 2 2 rR s s bRou n y y n yx xy bR =⋅= − ⋅ − ⋅= ∑ ∑ ∑ ∑ ∑ • O coeficiente de explicação R2 pode ser definido agora como sendo a porcentagem da variação total representada pela variação explicada. ( ) ( )∑ ∑ − − == 2 i 2 2 yy yyˆ VT VE R
  • 198. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Exemplo: No exemplo anterior, observou-se no diagrama de dispersão uma possível relação linear entre as variáveis. a) Confirme essa relação por meio do coeficiente de correlação; b) Encontre a reta de regressão pelo método dos mínimos quadrados.
  • 199. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Cálculos:i x y x2 y2 xy 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 100 125 150 175 200 225 250 275 300 325 350 375 400 425 450 500 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7 10000 15625 22500 30625 40000 50625 62500 75625 90000 105625 122500 140625 160000 180625 202500 250000 9820,8 9761,4 9702,2 9702,2 9702,2 9643,2 9604,0 9564,8 9564,8 9564,8 9525,8 9506,2 9467,3 9409,0 9370,2 9350,9 9910,0 12350,0 14775,0 17237,5 19700,0 22095,0 24500,0 26895,0 29340,0 31785,0 34160,0 36562,5 38920,0 41225,0 43560,0 48350,0 Σ 4625 1565,9 1559375 153259,8 451365,0 ( ) ( ) 977,0)99,0(R 99,0r 16 )9,1565( 8,153259 16 )4625( 1559375 16 9,15654625 451365 r n y y n x x n yx xy r ss s r 22 22 2 2 2 2 yyxx xy =−= −= −⋅− ⋅ − = −⋅− ⋅ − = = ⋅ = ∑ ∑∑ ∑ ∑ ∑ ∑
  • 200. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Método dos mínimos quadrados • Cálculos: - O valor da correlação e do coeficiente de explicação indicam uma forte correlação linear entre a temperatura do gás combustível e a taxa de calor. Pode-se, portanto, estimar, através do MMQ os parâmetros a e b e traçar a reta de regressão: ( ) ( ) 516,99 16 4625 )0057,0( 16 9,1565 n x b n y a 0057,0 16 4625 1559375 16 9,15654625 451365 n x x n yx xy b 22 2 =⋅−−=⋅−= −= − ⋅ − = − ⋅ − = ∑∑ ∑ ∑ ∑ ∑ ∑ - Sendo assim, a reta de regressão é: x0057,0516,99bxayˆ −=+=
  • 201. 27/06/16 04:01 ESTATÍSTICA APLICADA I - Estatística Descritiva 1.7 Regressão Linear  Funções linearizáveis • Para que se evite erros de previsão, a condição inicial para um estudo de regressão linear entre duas variáveis é que essas variáveis apresentem uma razoável correlação linear. • Caso os valores de y para crescentes valores de x variem de modo aleatório, sem apresentar qualquer tendência, o valor que melhor explica y é, geralmente, a sua média; entretanto, em alguns casos, o diagrama de dispersão apresenta uma tendência não linear, isto é, uma curva bem definida, em torno da qual os pontos parecem agrupar-se.