SlideShare uma empresa Scribd logo
1 de 17
Baixar para ler offline
PAULO VIEIRA NETO
Estatística Descritiva: Conceitos Básicos
São Paulo, Março/2004
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 2
O que é Estatística:
Estatística: é uma parte da Matemática Aplicada que fornece métodos para a coleta, a organização, a descrição, a
análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões.
Estatística: basicamente se divide em 3 áreas:
1. Descritiva;
2. Probabilidade;
3. Inferência Estatística.
• Estatística descritiva utiliza-se de análise (Análise Exploratória).
Objetivo: descrever e resumir os dados a fim de que possamos tirar conclusões a respeito de características de
interesse.
[ •1) Etapa inicial da análise de dados; •2) Tabelas; •3) Gráficos •4) Medidas resumo ]
• Probabilidade: a ferramenta matemática que deduz a partir de um modelo as propriedades de um fenômeno aleatório.
• Inferência: Conjunto de métodos que permite inferir o comportamento de uma população a partir do conhecimento da amostra.
População e Amostra
POPULAÇÃO: conjunto de elementos em estudo que tem pelo menos uma característica em comum. (pessoas, coisas,
objetos etc.). Exemplo: População de carros da cidade de São Paulo.
AMOSTRA: qualquer subconjunto, não vazio, de uma população.
Fases do Método Estatístico:
Podemos subdividi-las em:
• Coleta de dados;
• Apuração dos dados;
• Apresentação dos dados
• Análise, interpretação e conclusão dos dados.
Coleta dos dados: Devemos separá-la em dois métodos:
• Coleta de Dados Primários
• Coleta de Dados Secundários
Coleta de Dados Primários (Diretos), quando o pesquisador coleta os dados direto (na fonte originária).
A coleta Direta de dados pode ser classificada ao fator tempo.
• Contínua: (registro) - feitos continuamente, tal como a de nascimentos e óbitos, freqüência dos alunos às aulas.
• Periódicos: feita em intervalos constantes de tempo: inflação mensal, censos (10 em 10 anos).
• Ocasional: feita extemporaneamente, fins de atender uma conjuntura ou emergência, Exemplo.: praga que dizima uma colheita.
Coleta de Dados Secundários (Indiretos), quando o pesquisador utiliza de outras fontes.
Apuração dos dados: Assim que terminamos a coleta dos dados, torna-se mister sua apuração, ou contagem.
Denominamo-la como Tabulação. De posse desses dados (sobre o mesmo fenômeno), devemos ordená-los mediante
critérios de classificação. Essas classificações podem ser: manual, mecânica ou eletrônica.
Apresentação dos dados:
Depois de os tabularmos, ou apurá-los podemos apresentá-los em:
a) Tabelas;
b) Medidas Resumo;
c) Gráficos.
VARIÁVEL: convencionalmente, é o conjunto de resultados possíveis de um fenômeno.
• Qualitativa: quando os valores forem expressos por atributos: sexo (masculino - feminino), cor da pele (branca, parda, amarela etc.).
• Quantitativa: quando os valores forem expressos em números (salários dos operários, altura dos alunos de uma classe de aula etc.).
VARIÁVEIS
• Nominal (Sexo, Cor dos olhos....)
Qualitativa
• Ordinal (Grau de Instrução, Classe Social)
• Contínua (Peso, Idade, Altura....)
Quantitativa
• Discreta (Número de Filhos, Número de carros...)
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 3
FASES DO ESTUDO ESTATÍSTICO: Já nos ocupamos, anteriormente para falar do assunto. Vamos delinear as fases do
estudo da estatística, limitando-nos à definição do problema, planejamento, coleta dos dados, apuração dos dados,
apresentação dos dados através de tabulação (tabelas, gráficos) e, por último, a análise e interpretação dos dados.
DEFINIÇÃO DO PROBLEMA: Estamos interessados em formar dois times de basquete para enfrentar outro time da
faculdade vizinha, um masculino e outro feminino. Foi feito cartazes e afixados nos quadros de avisos de nossa Escola,
para nossa surpresa só apareceram baixinhos e baixinhas.
Nesta etapa devem-se ter claramente respostas às seguintes questões:
• O quê? (objetivo da pesquisa, público alvo, metodologia , entre outros)
• Onde:? (Local que será efetuado a pesquisa, uma sala de aula, um bairro, um município, estado etc.)
• Quando? (Época que será efetuada a pesquisa, situação de tempo)
PLANEJAMENTO: Definido o problema, torna-se mister como proceder para sua resolução. Como levantar as informações, como
obtê-los? Como se deve obtê-los, pesquisa de campo, questionário via correio? - Em síntese, é preciso planejar. Em relação ao
nosso problema, foram feitos novos cartazes, limitando à(os) candidatos(as), a altura mínima de 172,5cm.
COLETA DE DADOS: Em nosso trabalho, apareceram diversos candidatos, os mesmos não tomaram conhecimento da
condição exigida, apareceram 50 alunos com altura variando entre 150cm e 180cm. Aos dados coletados, à medida que
vão chegando os candidatos, dá-se o nome de dados brutos.
METODOLOGIA
Método Científico
Conhecimento: • VULGAR
• CIENTÍFICO
Vulgar: desconhece as verdadeiras causas dos fenômenos.
Científico: obedece a um método nas investigações, nas análises, nas pesquisas etc.
Método: conjunto de meios dispostos convenientemente para chegar a um fim que se deseja.
Método científico: alguns pontos a destacar
• Método Dedutivo;
• Método Indutivo;
• Método Experimental;
• Método Estatístico.
Método Dedutivo: É o que procede do geral para o particular. O raciocínio dedutivo parte de princípios gerais
considerados como verdadeiros e indiscutíveis para chegar a conclusões de maneira puramente formal, i.e., em virtude
unicamente de sua lógica.
Método Indutivo: Procede inversamente ao dedutivo: parte do particular e coloca a generalização como um produto
posterior do trabalho de coleta de dados particulares.
Método Experimental: consiste em manter constantes todas as causas (variáveis), exceto uma, e varia esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso existam.
Método Estatístico: face à impossibilidade em manter as demais variáveis constantes, admite todas essas variáveis
(causas) presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências
cabem a cada uma delas.
Estatística: exprime por meio de números as observações que se fazem de elementos, com pelo menos, uma característica
comum. (ex.: os alunos do sexo masculino de uma cidade), obtemos os chamados DADOS referentes a esses elementos. logo,
Estatística: é uma parte da Matemática Aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a
interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões.
TABULAÇÃO
A partir do momento que é feita a coleta e a crítica dos dados, e sua respectiva apuração, devemos efetuar a
apresentação dos dados, que geralmente é feita através de tabelas e gráficos, pois permitem a síntese dos resultados.
As tabelas devem obedecer ao seguinte postulado:
"Obter um máximo de esclarecimentos com um mínimo de espaço e tempo."
TABELA: é um quadro que resume um conjunto de informações, conforme o exemplo
População residente no Brasil, segundo o sexo,
de acordo com o censo demográfico de 1980
Sexo Freqüência Percentual
Masculino 59 125 361 49,7
Feminino 59 879 345 50,3
Total 119 002 706 100,0
FONTE: IBGE (1983)
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 4
Uma tabela compõe-se de:
1. Corpo: é o conjunto de linhas e colunas que contêm informações sobre a variável que estamos estudando;
2. Cabeçalho: parte superior da tabela que indica o conteúdo das colunas;
3. Coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
4. Casa ou célula: espaço destinado a um só número;
5. Título: conjunto de informações, as mais completas possíveis, dando respostas às perguntas: O quê?, Quando?,
Onde? Localizado no topo da tabela.
Vide CRESPO, (1998:25-26)
As tabelas devem apresentar o conjunto de informações de acordo com a Resolução 886, de 26 de outubro de 1966, do
Conselho Nacional de Estatística da Fundação IBGE. A tabela ou um gráfico, deve apresentar obrigatoriamente o
cabeçalho, o corpo e o rodapé. focalizado no topo da tabela.
Conforme modelo abaixo.
As tabelas podem ser de : Entrada simples, entrada dupla ou de múltiplas entradas
Exemplo de tabela de entrada simples:
População residente no Brasil, segundo o sexo,
de acordo com o censo demográfico de 1980
Sexo Freqüência
Masculino 59 125 361
Feminino 59 879 345
Total 119 002 706
FONTE: IBGE (1983)
Exemplo de uma tabela de dupla entrada:
Exemplo: Entrada Dupla
Alunos do 1º Grau matriculados na cidade
ABC no ano de 19XX
Escolas Masculino Feminino
Santa Marina 250 200
Santa Brígida 200 300
São Cristóvão 450 400
Total 900 900
FONTE: Secretaria de Educação da Cidade ABC
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 5
Exemplo: Entrada Múltipla
População presente, segundo as Grandes Regiões e Unidades da Federação
entre 1940 - 1980
Grandes Regiões População Presente
Unidades da Federação 01/09/1940 01/07/1950 01/09/1960 01/09/1970 01/09/1980
BRASIL 41.236.315 51.944.397 70.070.457 93.139.037 119.070.865
NORTE 1.462.420 1.844.655 2.561.782 3.630.860 5.885.536
NORDESTE 14.434.080 17.973.413 22.181.880 28.111.927 34.855.469
SUDESTE 18.345.831 22.548.494 30.630.728 39.853.498 51.746.318
SUL 5.735.305 7.840.870 11.753.075 16.496.493 19.038.935
CENTRO-OESTE 1.258.679 1.736.965 2.942.992 5.073.259 7.544.607
FONTE: IBGE
ESTRUTURAÇÃO
Título: Título, é a apresentação do que a tabela está procurando representar, deve conter o suficiente para que sejam
respondidas as seguintes questões: O QUÊ? (referente ao fato), ONDE? (relativo ao lugar), QUANDO? (correspondente
ao tempo). Exemplo: Acidentes na rodovia dos Imigrantes em 1998.
• O quê? - (fato): Acidentes
• Onde? - (lugar): Rodovia dos Imigrantes
• Quando? - (tempo): 1998
ESTRUTURA DA TABELA
População residente no Brasil, segundo o sexo,
de acordo com o censo demográfico de 1980
Sexo Freqüência Percentual
Masculino 59 125 361 49,7
Feminino 59 879 345 50,3
Total 119 002 706 100
FONTE: IBGE (1983)
Título
Corpo da
Tabela
Cabeçalho
Coluna Indicadora
Cabeçalho: especifica a informação apresentada em cada coluna. Observe o exemplo de cabeçalho abaixo:
Sexo Freqüência Percentual
Corpo: é representado por um conjunto de linhas e colunas. Segundo o corpo, as tabelas podem ser: de simples entrada,
de Dupla Entrada e de Múltipla Entrada. veja o exemplo abaixo sobre o Corpo da tabela: é formado pelos dados
distribuídos em linhas e colunas:
59 125 361 49,7
59 879 345 50,3
119 002 706 100
Célula: o cruzamento de cada linha com uma coluna vem a constituir uma célula, exemplo: O número 59.879.345,
primeira coluna com a segunda linha, é uma casa ou célula.
5599 887799 334455
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 6
Coluna indicadora: parte da tabela que especifica o conteúdo que cada linha contém. Exemplo:
Masculino
Feminino
Total
Existem, na tabela, outros elementos complementares a serem considerados, tais como: fontes, notas e chamadas.
Fonte: É a Instituição, a entidade responsável pelo fornecimento das informações, dos dados. Na tabela, em epígrafe,
como indica a fonte, colocada no rodapé, os dados foram fornecidos pela Fundação Instituto Brasileiro de Geografia e
Estatística – IBGE.
Não se indica a fonte nos casos em que a tabela é apresentadas pelo próprio pesquisador ou pelo próprio instituto que
obteve os dados.
Notas: São as informações, que servem para esclarecer o conteúdo da tabela.
Chamadas: são informações que servem para explicar ou conceituar determinados dados.
SÉRIES ESTATÍSTICAS
Chamamos de série estatística, toda tabela que apresenta uma distribuição de uma amostra ou população em função do
tempo, do local e espécie.
Tipos de Série
Quando o observador está estudando um fenômeno, sua atenção poderá voltar-se mais para: O tempo, o espaço e categoria.
• O tempo: o fenômeno é estudado em uma determinada faixa de tempo. É conhecida como (Séries temporais,
cronológicas, evolutivas, históricas ou marchas
1
).
Produção de automóveis no Brasil
no período de 1980-1982
Ano Número de automóveis
1980 600 706
1981 406 016
1982 475 112
FONTE: Fundação Getúlio Vargas (1986).
• O espaço: o fenômeno é estudado em uma ou mais região. É conhecida como Séries geográficas, espaciais,
territoriais ou de localização.
Casamentos registrados no Brasil
segundo a região, no ano 1983
Região Casamentos registrados
Norte 30 485
Nordeste 211 162
Sudeste 408 271
Sul 160 566
Centro-Oeste 55 706
FONTE: IBGE (1984).
• A categoria: o fenômeno é estudado, o tempo e o espaço são fixos, a categoria varia. É conhecida como Séries
categóricas ou específicas.
Ofertas de trabalho em São Paulo
Semana de 13-06 a 19-06 de 1986
Área Especializada Número de Vagas
Administração geral/Executivos 130
Marketing/Vendas 163
Finanças/Contábil 321
Informática 145
Produção/Materiais 739
Recursos Humanos 249
Total 1.747
FONTE: Data Folha
1
Este assunto está também em: PEREIRA e TANAKA (1990:40-42)
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 7
TABELAS: As tabelas recebem nomes de acordo com o tipo de estudo do fenômeno que expressam:
• Tabelas cronológicas: o fenômeno é estudado em uma faixa de tempo.
• Tabelas regionais ou geográficas: o fenômeno é estudado em diferentes regiões.
• Tabelas categóricas: o fenômeno é estudado por categorias.
• O tempo: o fenômeno é estudado em uma determinada faixa de tempo. É conhecida como Série cronológica.
Produção de automóveis no Brasil
no período de 1980-19832
Ano Número de automóveis
1980 600 706
1981 406 016
1982 475 112
1983 576 356
FONTE: Fundação Getúlio Vargas (1986).
• O espaço: o fenômeno é estudado em uma ou mais região. É também conhecida como Série geográfica.
Casamentos registrados no Brasil
segundo a região, no ano 1983
Região Casamentos registrados
Norte 30 485
Nordeste 211 162
Sudeste 408 271
Sul 160 566
Centro-Oeste 55 706
FONTE: IBGE (1984).
• A categoria: o fenômeno é estudado, o tempo e o espaço são fixos, a categoria varia. É conhecida como Série categórica.
Ofertas de trabalho em São Paulo
Semana de 13-06 a 19-06 de 1986
Área Especializada Número de Vagas
Administração geral/Executivos 130
Marketing/Vendas 163
Finanças/Contábil 321
Informática 145
Produção/Materiais 739
Recursos Humanos 249
Total 1.747
FONTE: Data Folha
ESTATÍSTICA GRÁFICA.
Corresponde às representações dos dados estatísticos sob diferentes formas gráficas com o objetivo de permitir
uma leitura rápida e global dos fenômenos estudados.
Os dados estatísticos, apresentados em tabelas, também podem ser expostos em gráficos. Desde que não haja
necessidade de grande precisão, os gráficos dão, melhor do que as tabelas, visão de tendências e ajudam a interpretar
um fenômeno em estudo.
Na apresentação gráfica deve tomar alguns cuidados, que são necessários:
a) todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos
adicionais através de um texto;.
b) o titulo do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o titulo acima do gráfico;
c) no eixo dos X, eixo das abscissas, a escala cresce da esquerda para a direita e escrita embaixo do eixo, como mostra
o esquema abaixo:
0 1 2 3 4 5 6 7 8 9 10
2
O mesmo assunto é tratado em: VIEIRA e HOFFMANN (1988:28-29)
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 8
d) no eixo das ordenadas, a escala cresce de baixo para cima e é escrita à esquerda do eixo. Veja o exemplo abaixo:
5
4
3
2
1
0
e) podem ser feitas setas para indicar a direção dos eixos;
f) as variáveis representadas cm cada eixo devem ser claramente identificadas. No eixo das ordenadas escreve-se o
nome da variável na extremidade do eixo. No eixo das abscissas escreve-se o nome da variável embaixo da escala:
Porcentagem
40
30
20
10
0
150 160 180 190 500
Altura (cm)
g) a escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito
altos (como, por exemplo, 100, 101 etc.), deve ser feita urna interrupção no eixo, com indicação clara da posição do zero.
100 200 300
h) o sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se
pretende evidenciar:
Porcentagem
40
30
20
10
0
5 10 15 20 30
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 9
Exemplo: Vendas de automóveis na Região C no ano de 199X.
Vendas de automóveis
na Região C – 199X
Meses Qtide
Jan 20
Fev 30
Mar 40
Abr 50
Maio 60
Jun 75
Jul 85
Ago 97
Set 103
Out 110
Nov 115
Dez 125
Fonte: Depto Vendas
Representação gráfica das Vendas de Automóveis na Região C. Trata-se de uma série histórica, o gráfico adequado para
representá-la é o gráfico de linha.
Vendas de Automóveis na Região C no ano de 199X
0
20
40
60
80
100
120
Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez
GRÁFICO EM COLUNAS E GRÁFICO EM BARRAS
É a representação gráfica de uma série estatística através de retângulos: verticais (Gráfico em colunas); Horizontais
(Gráfico em barras)
GRÁFICO DE BARRAS
O gráfico de barras é usado para apresentar séries cronológicas, geográficas e categóricas. Para entender como
se faz um gráfico primeiro observe a série cronológica apresentada na tabela abaixo:
População presente no Brasil, segundo o ano
do censo demográfico
Ano do censo Demográfico População
1940 41 236 315
1950 51 944 397
1960 70 191 370
1970 (1) 93 139 037
1980 (1) 119 002 706
Fonte: IBGE (1984)
(1) População residente
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 10
Para apresentar os dados da tabela acima, em um gráfico de barras, siga os seguintes passos:
1) trace um sistema de eixos cartesianos;
2) escreva os anos do censo no eixo X; a população no eixo Y, das ordenadas. Como mostra o esquema abaixo:
População
(em milhões)
120
90
60
30
0
1940 1950 1960 1970 1980
Ano do censo
3) construa barras retangulares para representar a população em cada ano de censo. As barras deverão Ter as bases de
mesma largura, porém a altura será dada pela população de cada ano.
4) ponha o título na figura.
Gráfico de colunas: Retângulos verticais.
População Presente no Brasil, segundo o
ano do censo demográfico
0
20
40
60
80
100
120
140
1940 1950 1960 1970 1980
Anos do censo
A apresentação gráfica de séries geográficas e categóricas, por gráficos de barras, é feita de maneira análoga. Veja o
exemplo:
Exportações Brasileiras
Março de 1995
ESTADOS VALOR – (US$ MILHÕES)
São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
Fonte: SECEX
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 11
Gráfico de Barras: Retângulos horizontais.
Exportações Brasileiras - Março/1995
0 500 1000 1500
SP
MG
RS
ES
PR
SC
Milhões de dólaresFonte: SECEX.
Gráfico de Linhas: É usado para apresentar séries cronológicas. Veja o exemplo a seguir: (Utilizando a tabela
População presente no Brasil, do IBGE).
1) trace um sistema de eixos cartesianos;
2) escreva no eixo das abscissas, os anos do censo (eixo X); E a população no eixo das ordenadas (eixo Y).
3) Faça corresponder um ponto para cada par de valores ( XY ) da série:
4) Una os pontos por segmentos de reta
5) Coloque um título na figura.
População Residente no Brasil, segundo o ano do censo
demográfico
0
20
40
60
80
100
120
140
1 2 3 4 5 6
Gráfico Retangular de composição: É usado para evidenciar a composição percentual de uma amostra ou de uma
população. Veja o exemplo com dados fictícios:
Distribuição de uma amostra de 50 alunos da Faculdade Montessori, -
em 1999 - segundo o interesse em aprender Excel
Interesse Número de Alunos Porcentagem
Têm 25 50
Não têm 15 30
Não sabem 10 20
Total 50 100
Para fazer um gráfico retangular de composição:
1. Trace um retângulo, de comprimento conveniente, para representar o total. Neste exemplo vamos utilizar um retângulo
de 7 cm de comprimento.
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 12
2. se 50 alunos são representados por 7 cm, os 25 alunos com interesse em aprender Excel são representados por um
comprimento x, tal que:
3,5x
50
25x7
x
25
x
50
7
=⇒=→=
Da mesma forma, os 15 alunos que não têm interesse por Excel são representados pelo retângulo, pelo comprimento y, tal que:
2,1y
50
15x7
y
15
y
50
7
=⇒=→=
Os 10 alunos sem definição, não sabem se têm interesse por Excel é representado pelo retângulo, pelo comprimento z, tal que:
1,4z
50
10x7
z
10
z
50
7
=⇒=→=
Feito os cálculos, marque os valores obtidos dentro do retângulo, separando-os por traços
Outros gráficos não citados [que poderemos vê-los]
• RAMOS-E-FOLHAS;
• GRÁFICO DE PONTOS (DOT PLOT);
• BOX-PLOT
• ETC.,
RESUMO DE ESTATÍSTICA
AMOSTRA: qualquer subconjunto, não vazio, de uma população.
AMOSTRAGEM ALEATÓRIA SIMPLES: sorteia-se para o estudo pelo menos 10% dos elementos da população
AMOSTRAGEM ALEATÓRIA SISTEMÁTICA: sorteia-se de 1 a 10. Ele ser o primeiro elemento da amostra. Os demais elementos
correspondentes aos outros elementos, são determinados em intervalos de 10 unidades.
AMPLITUDE AMOSTRAL: AA = x(max) - x(min) {AA = Ls - Li, da amostra}
AMPLITUDE TOTAL: AT = L(max) - L(min). {AT = Ls - Li, da distribuição}
CARTOGRAMA: a representação sobre uma carta geográfica.
CENTIS ou PERCENTIS: Dividem a distribuição, em cem partes iguais.
Correlação: A intensidade e a direção do relacionamento entre duas variáveis. correlação curvilínea Relação entre X e Y que começa como
positiva (ou negativa) e inverte a direção.
Curtose [1]: Grau de achatamento de uma distribuição. Ela é medida em relação a uma curva normalmente achatada chamada
mesocúrtica. Uma curva mais achatada que ela será denominada platicúrtica e uma menos achatada (ou mais afilada), leptocúrtica.
Curtose [2]: O grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada CURVA NORMAL. Podem ser
leptocúrtica (bastante pontiaguda ou alta), platicúrtica (quando são achatadas) ou mesocúrtica (quando não são nem muito
pontiagudas nem muito achatadas).
Curva assimétrica: Estas curvas, assimétrica positiva e assimétrica negativa, apresentam a cauda de ordenada máxima mais longa que a
outra. Se a cauda é mais alongada à direita, é conhecida como assimétrica positiva ou inviesada à direita: moda > mediana > média.
assimétrica negativa: média < mediana < moda.
• Em uma distribuição simétrica a Média = Mediana = Moda (é o caso da Curva normal)
• Em uma distribuição assimétrica positiva a Média > Mediana > Moda
• Em uma distribuição assimétrica negativa a Média < Mediana < Moda
Curva normal: Distribuição suave, simétrica, em forma de sino e unimodal. decis Postos percentis que dividem em décimos a escala de 100
unidades. desvio A distância e a direção de qualquer escore bruto em relação à média.
Curva simétrica: Apresenta o valor máximo no ponto central e os pontos eqüidistantes desse ponto têm a mesma freqüência. (Medidas
de Assimetria, Medidas de Curtose).
CURVAS EM FORMA DE SINO: Caracterizam-se por ter um valor máximo na região central onde a média = mediana = moda.
Distinguimos a curva em forma de sino simétrica e assimétrica.
Curtose, Medida de: Medida de curtose, Entende-se por medida de curtose o grau de achatamento de uma distribuição. Curvas
Leptocúrtica, Mesocúrtica e platicúrtica.
Para medir o grau de curtose utilizaremos o coeficiente:
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 13
Coeficiente de Curtose
P10)2(P90
Q1Q3K
−
−
=
em que:
P90 = 90º percentil; Q3 = 3º quartil
P10 = 10º percentil; Q1 = 1º quartil
• Se K = 0,263, dizemos que a curva correspondente à distribuição de freqüência é mesocúrtica;
• Se K > 0,263, dizemos que a curva correspondente à distribuição de freqüência é platicúrtica;
• Se K < 0,263, dizemos que a curva correspondente à distribuição de freqüência é leptocúrtica;
Dado Estatístico: - é o resultado da observação de um atributo/variável qualitativa ou quantitativa.
DADOS BRUTOS: são os dados coletados e ainda não organizados numericamente.
Dados Simples: - vão valores associados a uma dada variável e cuja representação é feita através de uma tabela.
DECIS: Dividem a amostra, distribuição, em dez partes iguais.
Definição do Problema: - é a primeira fase do estudo estatístico e consiste na definição e formulação correcta do problema a ser estudado.
Desvio médio: Soma dos desvios absolutos a contar da média dividida pelo número de escores em uma distribuição. Medida de
variabilidade que indica a média dos desvios em relação à média.
Desvio. Diferença entre um escore e a média aritmética. É equivalente à expressão afastamento, a qual, todavia, é menos empregada.
Desvio-padrão. Medida de dispersão ou variabilidade de um conjunto de valores. É igual à raiz quadrada da soma dos desvios ao quadrado
dividida pelo número de casos. Em outras palavras, é a raiz quadrada da média dos desvios elevados ao quadrado. Verifica-se que
quanto maior for o desvio-padrão, maior será a flutuação da variável em torno da média
DIAGRAMAS: são gráficos geométricos de, no máximo, duas dimensões, geralmente, para sua construção usamos o sistema cartesiano.
Distribuição de freqüências agrupadas: Tabela que indica a freqüência da ocorrência de casos situados dentro de uma série de intervalos
de classe.
Distribuição de Freqüências [1]. Tabela que indica as freqüências com que ocorrem os casos correspondentes a cada intervalo de classe
(ou valor individual da variável quando esta não estiver agrupada em classes).
Distribuição de Freqüências [2]: - o mesmo que Tabela de Freqüências.
Erro amostral: Diferença inevitável entre uma amostra aleatória e sua população, baseada apenas na chance.
Erro de Amostragem. Diferença entre os valores obtidos numa amostra (estatísticas) e os valores da população (parâmetros). Se um
escore for usado como estimador dos escores de toda a população, a diferença entre esse escore e a média de todos os valores
registrados será um erro de amostragem.
Erro padrão da diferença entre médias: Estimativa do desvio padrão da distribuição amostrai de diferenças baseada nos desvios padrão
de duas amostras aleatórias.
Erro padrão da média: Estimativa do desvio padrão da distribuição amostrai de médias com base no desvio padrão de uma única amostra
aleatória.
Erro Padrão da Medida. Erro padrão de qualquer medida, por causa das flutuações da amostragem ou dos erros de observação.
Erro Padrão. Desvio-padrão da distribuição dos diversos valores de uma estatística, em conseqüência da flutuação das amostras. Se, de
uma população, for tirado um grande número de amostras e calculadas as respectivas médias, haverá uma diferença entre cada média e
a média da população. Se for computada a média de tais médias, seu desvio-padrão será o erro da amostragem (a margem de erro a ser
esperada toda vez que se empregar tal processo de amostragem).
Erro tipo I: Erro que consiste em rejeitar a hipótese nula quando ela é verdadeira.
Erro tipo II: Erro que consiste em aceitar a hipótese nula quando ela é falsa.
Espaço Amostral. Conjunto de todos os possíveis resultados de uma experiência aleatória, resultados esses que podem ser de natureza
quantitativa ou qualitativa.
Estatística Descritiva Indutiva: descreve e analisa os fenômenos.
Estatística Descritiva[1]: Apuração, apresentação, análise e interpretação dos dados observados. Em outras palavras, descreve as
amostras ou a população.
Estatística Descritiva[2]: - ramo da Estatística que tem por finalidade descrever certas propriedades relativas a um conjunto de dados.
ESTATÍSTICA Indutiva[1]: baseada na análise dos fatos, infere conclusões de sua validade.
Estatística Indutiva [2]: Método que parte do particular para o geral, ou seja, o processo pelo qual são feitas generalizações para a
população, com base nas amostras. E também conhecida por inferência estatística.
Estatística Indutiva[3]: ramo da Estatística que procura inferir propriedades da população a partir de propriedades verificadas numa
amostra da mesma.
Estatística Indutiva [4]: baseada na análise dos fatos, infere conclusões de sua validade.
Estatística[1]: Qualquer número usado para descrever um aspecto da amostra. Assim, a média, o desvio-padrão, o coeficiente de
correlação entre dois conjuntos de medidas dos membros de uma amostra são exemplos de estatística. A cada estatística na amostra
corresponde um parâmetro na população. As estatísticas são representadas por letras de nosso alfabeto, ao passo que os parâmetros
são simbolizados pelas letras gregas correspondentes.
Estatística[2]:é o método que ensina a recolher, classificar, apresentar e interpretar um conjunto de dados numéricos.
Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através de cálculos de probabilidades.
Estimador: uma característica numérica estabelecida para toda uma amostra.
Fonte Primária: quando as informações são colhidas diretamente pelo pesquisador ou por seus auxiliares.
Fonte Secundária: quando o pesquisador recorre a relatórios, revistas, livros ou dados coletados por instituições especializadas.
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 14
FORMA DAS CURVAS DE FREQÜÊNCIAS:
CURVAS EM FORMA DE SINO: Caracterizam-se por ter um valor máximo na região central onde a média = mediana = moda.
Distinguimos a curva em forma de sino simétrica e assimétrica.
Curva simétrica: Apresenta o valor máximo no ponto central e os pontos eqüidistantes desse ponto têm a mesma freqüência.
(Medidas de Assimetria, Medidas de Curtose).
Curtose: O grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada CURVA NORMAL. Podem
ser leptocúrtica (bastante pontiaguda ou alta), platicúrtica (quando são achatadas) ou mesocúrtica (quando não são nem muito
pontiagudas nem muito achatadas).
CURVA NORMAL
Curva em forma de jota: são relativas às distribuições extremamente assimétrica, apresenta o ponto de ordenada máxima em uma das
extremidades, para o estudante de economia a curva da oferta é um exemplo. A curva em forma de jota invertido, outro bom exemplo é a
curva da demanda. As curvas em forma de U apresentam ordenadas em ambas as extremidades.
Freqüência. Número de ocorrências de determinado fenômeno.
Freqüência Absoluta ( fi ): - é o número de vezes que o valor de determinada variável é observado.
FREQÜÊNCIA ABSOLUTA ou simplesmente freqüência (Fi): o número de vezes que cada dado aparece no rol.
Freqüência Absoluta Simples de Classe. Número de casos incluídos em determinada classe ou intervalo de uma distribuição de
freqüências (ou valor individual da variável quando esta não estiver agrupada em classes).
Freqüência Absoluta Acumulada (Fi) [1]: é a soma das freqüências absolutas anteriores com a freqüência absoluta deste valor.
Freqüência Absoluta Acumulada (Fac) [2]: Soma da freqüência simples absoluta dessa classe (ou valor individual da variável quando esta
não estiver agrupada em classes) com as freqüências simples absolutas das classes (ou valores individuais da variável) anteriores.
FREQÜÊNCIA ACUMULADA [3]: a soma de cada freqüência com as que lhe são anteriores na distribuição.
Freqüência Relativa ( fr ): - é o quociente entre a freqüência absoluta do valor da variável e o número total de observações.
Freqüência Relativa Acumulada (Fri): - é a soma das freqüências relativas anteriores com a freqüência relativa desse valor.
FREQÜÊNCIA RELATIVA: o quociente da freqüência absoluta pelo n total dados (Fi/N) "N = freqüência. total"
Gráfico. Qualquer representação geométrica de um fenômeno quantitativo.
Gráfico Circular: é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais à freqüência que lhe
corresponde.
Gráfico de barras (histograma): Método gráfico no qual barras retangulares representam as freqüências de uma faixa de valores de
escores ou de categorias.
Gráfico de Barras [1]: - é constituído por barras, horizontais ou verticais, de comprimento proporcional à freqüência.
Gráfico em Barras [ 2]. Representação dos valores de determinado fenômeno por meio de barras de comprimentos proporcionais às
respectivas freqüências. Quando as barras são verticais, chama-se gráfico de colunas.
GRÁFICO EM COLUNAS OU EM BARRAS: representação de uma série por meio de retângulos, verticalmente (em colunas) ou
horizontalmente (em barras).
Gráfico de linhas: Gráfico de diferenças entre grupos ou tendências de alguma variável ao longo do tempo.
Gráfico de setores [1]: Gráfico circular cujas partes têm por soma 100%.
Gráfico em Setores. [2] Representação das freqüências de um fenômeno pelas áreas de setores de um círculo. Os setores correspondem
a certa percentagem.
Gráfico Polar. Representação de uma série por meio de um polígono. Geralmente, presta-se para apresentação de séries temporais. Para
construí-lo, divide-se uma circunferência em tantos arcos iguais quantos forem os dados a representar e traçam-se raios pelas divisas.
Histograma: é um gráfico de barras em que a área destas é proporcional à freqüência, não havendo espaço entre as mesmas. Só se utiliza
em variáveis quantitativas contínuas.
HISTOGRAMA: formado por um conjunto de retângulos justapostos, suas bases, coincidem com o eixo horizontal, de tal modo que seus PM
coincidam com os PM dos intervalos de classe.
Limite de classe: Ponto a meio caminho entre intervalos de classe adjacentes que serve para preencher a lacuna entre eles.
LIMITE DE CLASSE: São os extremos de cada classe.
LIMITE INFERIOR [Li]: o menor valor que a variável pode assumir.
LIMITE SUPERIOR [Ls]: o maior valor que a variável pode assumir.
Margem de erro: Extensão da imprecisão esperada quando estimamos a média ou proporção populacional; é o resultado da multiplicação
do erro padrão pelo valor tabelado de z ou t.
Média ponderada: A 'média de médias' que leva em conta diferenças nos tamanhos dos grupos.
Média [1]: Em sua acepção mais ampla, qualquer promédio de uma distribuição de freqüência. Em sentido estrito, média aritmética.
Média [2]: Soma de um conjunto de escores dividida pelo número total de escores no conjunto. É uma medida de tendência central.
Média Aritmética Ponderada: é o quociente entre o somatório do produto de cada dado classificado pela sua freqüência absoluta e o
número desses dados.
Média Aritmética Simples: - é o quociente da soma de todos os dados não classificados pelo número desses dados.
Média Aritmética. Soma de todos os valores dividida pelo número de valores.
Mediana [1]: Medida de tendência central, através de seu valor, a distribuição de freqüências é dividida em duas partes de igual valor.
Mediana [2]: é o valor da variável, para dados não classificados, que ocupa a posição central da distribuição.
MEDIANA [3]: valor que ocupa a posição central da distribuição. Isto é, divide a amostra em duas partes iguais.
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 15
Medida de Assimetria
Primeiro Coeficiente de Pearson
s
Md)3(Me
As
−
= Onde: Me: Média Aritmética; Md: Mediana; s: Desvio-Padrao.
Se AS = 0 A distribuição é simétrica; • Assimetria moderada se: 0,15 < | AS | < 1
Se AS > 0 A distribuição é assimétrica positiva; • Assimetria Forte se: | AS | > 1
Se AS < 0 A distribuição é assimétrica negativa;
Quando estamos impossibilitados de calcular a média e o desvio-padrão ( s ) utilizamos a fórmula:
Segundo Coeficiente de Pearson
QQ
2Md-QQ
As
13
13
−
+
= Onde: Q3: 3º Quartil; Q1: 1º Quartil; Md: Mediana.
Medidas de Dispersão: é um conjunto de medidas (Amplitude, Variância e Desvio Padrão) utilizadas no estudo da variabilidade de uma
determinada distribuição, permitindo obter uma informação mais completa acerca da "forma" da mesma.
Medidas de Localização: É um conjunto de medidas (Média, Mediana, Moda e Quartis) que representam de uma forma global um conjunto
de dados.
Medidas de Tendência Central. Valores que, em estatística, caracterizam os valores médios.
Medidas de Tendência Central: - o mesmo que Medidas de Localização.
Mensuração: Uso de uma série de números no estágio da análise de dados da pesquisa.
Mesocúrtica: Característica de uma distribuição que nem tem pico muito acentuado, nem é muito achatada.
Moda [1]: Valor mais freqüente de uma distribuição. Numa representação gráfica, a moda é o valor correspondente ao ponto mais alto da
curva. Em outras palavras, é o valor que está na moda.
Moda [2]: observação que ocorre com maior freqüência numa amostra.
MODA [3]: o(s) elemento(s) que mais aparece(m) em uma distribuição.
Núvem de Pontos: - o mesmo que Diagrama de Dispersão.
Organização dos Dados: - consiste em "resumir" os dados através da sua contagem e agrupamento.
Padronização: Conjunto de operações capazes de garantir a um teste precisão, validade, normas padronizadas, instruções para sua
aplicação, avaliação e interpretação.
PARÂMETRO: uma característica numérica estabelecida para toda uma população.
Percentil: Cada um dos 99 valores da variável que dividem uma distribuição de freqüências em 100 intervalos iguais. O percentil é
representado pelo símbolo Pr, em que r representa a ordem percentil. Se, num grupo de estudantes, 60% obtêm valores inferiores a 80,
diz-se que o 60º percentil é 80 e que 60 é a ordem percentil correspondente a 80.
PICTOGRAMA: Representação gráfica através de figuras.
Polígono de Freqüência [1]: Representação gráfica de uma distribuição de freqüências resultante da união das interseções dos pontos
médios das classes (nas abscissas) e das freqüências respectivas (nas ordenadas).
Polígono de Freqüências [2]: é a representação gráfica de uma distribuição por meio de um polígono. (pequenas semi-retas)
Polígono de Freqüências [3]: São gráficos com aspecto de linhas quebradas. Constroem-se unindo por segmentos de recta os pontos
médios das bases superiores dos rectângulos de um histograma.
Polígono de freqüências [4]: Método gráfico em que as freqüências são indicadas por uma série de pontos colocados acima dos valores
dos escores, ou pontos médios de cada intervalo de classe, e ligados por uma linha reta que decai até a reta-base em ambas as
extremidades.
Polígono de freqüências acumuladas: Método gráfico que ilustra freqüências ou porcentagens acumuladas.
Polígono de Freqüência Acumulada ou OGIVA: Representação gráfica da (Fac ou Fad), frequência acumulada crescente ou decrescente.
PONTO MÉDIO [ Pm ] - [ Xi ] de uma classe [1]: a média aritmética entre o Li e o Ls da mesma [ (Li + Ls)/2 ].
Ponto Médio de Classe [2]: Ponto interior de uma classe, eqüidistante de seus limites de classes. Seu valor é igual à metade da soma
desses limites.
Ponto médio [3]: Escore mais central em um intervalo de classe.
População (universo) [1]: Qualquer conjunto de indivíduos que compartilham de ao menos uma característica.
População [2]: Conjunto formado pelas medidas que se fazem sobre elementos do Universo.
População [3]: é um conjunto de seres com uma dada característica em comum e com interesse para o estudo.
POPULAÇÃO [4]: conjunto de elementos em estudo que tem pelo menos uma característica em comum. (pessoas, coisas, objetos)
Porcentagem acumulada: Percentual de casos com determinado escore ou com um escore inferior.
Porcentagem de coluna: Em uma tabulação cruzada, o resultado da divisão da freqüência de uma cela pelo número de casos na coluna.
As porcentagens de coluna devem totalizar 100% para cada coluna em uma tabulação cruzada.
Porcentagem de linha: Em uma tabulação cruzada, o resultado da divisão de uma freqüência de cela pelo número de casos na linha. As
porcentagens de linha têm como soma 100% para cada linha de uma tabulação cruzada.
Porcentagem total: Em uma tabulação cruzada, o resultado da divisão de uma freqüência de cela pelo número total de casos na amostra.
As porcentagens totais têm por soma 100% para toda a tabulação cruzada.
Porcentagem: Método de padronização do tamanho que indica a freqüência de ocorrência de uma categoria em 100 casos.
Posto percentil: Nº único que indica a porcentagem de casos em uma distribuição que se situam em determinado escore ou abaixo dele.
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 16
Probabilidade [1]: Medida de incerteza dos fenômenos aleatórios. Traduz-se por um número real compreendido entre O e l, ou, o que é a
mesma coisa, entre 0 e 100%.
Probabilidade [2]: Freqüência relativa de ocorrência de um evento ou resultado. Número de vezes que um evento pode ocorrer em 100.
Produtório ( π ): representa, de forma abreviada, um produto.
Promédio. Termo genérico que expressa qualquer medida de tendência central. Exemplos: a média, a mediana e a moda de uma escala.
Quartil [1]: Cada um dos três valores que dividem uma distribuição de freqüências em quatro partes de freqüências iguais. O primeiro quartil
corresponde ao 25º percentil, o segundo à mediana e o terceiro ao 75º percentil.
Quartis ( Q1 e Q3 ) [2]: são os valores que dividem a distribuição em quatro partes iguais. [Fórmula]
QUARTIS [3]: Divide a amostra, distribuição, em quatro partes iguais.
Razão: Método de padronização do tamanho que compara o número de casos que se enquadram em uma categoria com o número de
casos que se enquadram em outra categoria.
Recenseamento: o mesmo que Censo.
Rol [1]: Arranjo dos dados brutos em ordem crescente ou decrescente.
ROL [2]: são dados organizados numericamente em ordem crescente ou decrescente.
SEPARATRIZES: São medidas que separam, dividem, a distribuição em partes iguais: mediana, quartis, decis e percentis.
SÉRIE CATEGÓRICA OU ESPECIFICATIVA: aquela em que o fato estudado em categorias.
Série Cronológica. Série estatística em que os dados são observados segundo a época de ocorrência. É também conhecida por Série
Temporal, Evolutiva ou Histórica.
Série Específica. Série estatística em que os dados são agrupados segundo a modalidade de ocorrência.
Série Geográfica. Série estatística em que os dados são observados segundo a localidade de ocorrência. É também chamada de Série de
Localização.
Série Regional ou Geográfica: aquela em que o fenômeno estudado em locais diferentes.
SÉRIES CRONOLÓGICA: aquela em que o fato estudado numa faixa de tempo.
Sigma ( Σ ). Palavra que expressa a letra do alfabeto grego que corresponde ao nosso s. A letra minúscula simboliza o desvio padrão e a
letra maiúscula significa o somatório.
Soma de quadrados dentro de grupos: Soma dos quadrados dos desvios de cada escore bruto em relação à média amostrai do grupo.
Soma de quadrados entre grupos: Soma dos quadrados dos desvios de cada média amostrai a contar da média total.
Soma de quadrados total: Soma dos quadrados dos desvios de cada escore a contar da média total do estudo.
Soma de quadrados: Soma dos quadrados dos desvios em relação à média.
Somatório ( Σ ): - representa, de forma abreviada, uma soma.
Tabela de Freqüências: - são tabelas onde se apresentam os dados por classes e as freqüências respectivas.
Tabulação cruzada: Tabela de freqüências e porcentagens de duas ou mais variáveis consideradas conjuntamente.
Tabulação. Apresentação dos dados estatísticos sob a forma de tabelas ou quadros.
Tamanho da Amostra: - é o número de elementos que constituem uma dada amostra.
Taxa: Tipo de razão que indica uma comparação entre o número de casos efetivos e o número de casos potenciais.
Tendência central: O que é médio ou típico de um conjunto de dados; um valor geralmente situado em torno do meio ou centro de uma
distribuição.
Variabilidade [1]: Grau de heterogeneidade de um grupo, medido pela amplitude, pela amplitude semi-interquartil ou pelo desvio-padrão. O
mesmo que dispersão.
Variabilidade [2]: Maneira como os escores se dispersam em torno do centro da distribuição. Conhecida também como dispersão.
Variância. Desvio-padrão elevado ao quadrado. É, como o desvio padrão, uma medida de dispersão. É também chamada de variança.
Variância: - é a medida que permite avaliar o grau de dispersão dos valores da variável em relação à média.
Variância: Média dos quadrados dos desvios em relação à média de uma distribuição. Medida de variabilidade em uma distribuição.
Variáveis Contínuas: são as variáveis que podem tomar qualquer valor de um determinado intervalo.
Variáveis Discretas: são as variáveis que podem tomar um número finito ou uma infinidade numerável de valores.
Variáveis Qualitativas: o mesmo que Atributos Qualitativos.
Variável Aleatória Contínua: Variável que pode assumir infinitos valores, mesmo dentro de um intervalo finito, resultando que a
probabilidade de certo valor (ponto) é nula.
Variável Aleatória Discreta: Variável que pode assumir, com probabilidade diferente de zero, um número finito de valores dentro de um
intervalo finito (caso típico é quando efetuamos contagens).
Variável Aleatória: Grandeza numérica que assume diferentes valores, estando cada um destes valores associado a uma certa
probabilidade.
Variável Contínua: Variável que pode assumir, teoricamente, qualquer valor em certo intervalo da reta real. Exemplo: a altura dos alunos
constitui uma variável contínua, pois, teoricamente, um aluno poderá possuir altura igual a 1,80 m, 1,81 m, 1,811 m, 1,812 m...
VARIÁVEL CONTÍNUA: a que pode, teoricamente, assumir qualquer valor entre 2 dados quaisquer.
Variável Dependente: Variável não controlada em um experimento, sendo, por definição, aleatórios seus valores.
Variável Discreta: Variável que assume valores em pontos da reta real. Exemplo: número de erros em um livro: 0, 1, 2, 3,...
VARIÁVEL DISCRETA: não existem valores intermediários entre 2 números consecutivos de um conjunto.
Variável Independente: Variável que pode ser controlada em um experimento. Em outras palavras, seus valores são exatos.
Variável: Qualquer característica que varia de um indivíduo para outro. As hipóteses, em geral, contêm uma variável independente (causa)
e uma variável dependente (efeito).
Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 17
ÍNDICES: são razões entre duas grandezas tais que uma não inclui a outra.
Exemplos:
100x
crâniodoallongitudindiâmetro
crâniodotransversodiâmetro
cefálicoÍndice =
ÍNDICES ECONÔMICOS:
∑
=
população
ProdutodototalValor
capita"per"Produto
∑
=
população
BemdoConsumo
capita"per"Consumo
COEFICIENTES: razões entre o n de ocorrências c/o n total (n de ocorrência e o n de ocorrências)
totalpopulação
snascimentodeNº
natalidadedeeCoeficient =
matrículasdeinicialnº
evadidosalunosdenº
escolarevasãodeeCoeficient =
Bibliografia utilizada
ALLEN, R. G. D. Estatística para Economistas. Rio de Janeiro : Zahar, 1979.
BOTTER, D.A. , PAULA, G.A., LEITE, J.G. e CORDANI, L.K. Noções de Estatística. São Paulo : IME/USP, 1996.
BUSSAB, Wilton O. & MORENTTIN, Pedro A. Estatística básica. São Paulo : Atual, s/d.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo : Saraiva, 1998.
FERREIRA, Wilson & TANAKA, Osvaldo K. Elementos de Estatística. São Paulo : McGraw-Hill, s/d.
FONSECA, Jairo Simon da & MARTINS, Gilberto de Andrade. Curso de estatística. São Paulo : Atlas, 1996.
GATTÁS, Reny Reis. Elementos de probabilidade e inferência. São Paulo : Atlas, 1978.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo : Lapponi Treinamento, 2000.
LEVIN, Jack. Estatística aplicada a ciências humanas. São Paulo: Harbra, s/d.
OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999.
MAGALHÃES, Marcos Nascimento e LIMA, Antônio Carlos Pedroso de. Noções de probabilidade e estatística. São Paulo :
IME/USP, 2001.
MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de estatística. São Paulo : Atlas, 1993.
MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo : Atlas, 2001.
MORETTIN, Luiz Gonzaga. Estatística básica - probabilidade. São Paulo : Makron Books, 1999. 2 v.
NAZARETH, Helenalda. Curso básico de estatística. São Paulo : Ática, 1987.
OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999.
SILVA NETO, Lauro Araújo. Opções: do tradicional ao exótico. 2. ed. São Paulo : Atlas, 1996.
SPIEGEL, Murray Ralph. Estatística. 2. ed. São Paulo : McGraw-Hill, 1995.
__________________. Probabilidade e Estatística. São Paulo : Pearson, 2004.
SPINELLI, Walter & SOUZA QUEIROZ, Maria Helena. Introdução à estatística. São Paulo : Ática, 1990.
TIBONI, Conceição Gentil Rebelo. Estatística básica para o curso de Turismo. São Paulo : Atlas, 2002.
TOLEDO, Geraldo Luciano & OVALLE, Ivo Isidoro. Estatística básica. São Paulo : Atlas, s/d.
UNIVERSIDADE DE SÃO PAULO – USP “IME - Instituto de Matemática e Estatística”. MAE-116, Noções de Estatística,
[Obtido em 15 dez. 2004]. Disponível em http://www.ime.usp.br/~mae116
VIEIRA, Sonia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo : Atlas, 1988.
______, Sonia & Wada Ronaldo. Estatística: introdução ilustrada. 2. ed. São Paulo : Atlas, 1992

Mais conteúdo relacionado

Mais procurados

Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
aldaalves
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
Anderson Pinho
 
Slide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à EducaçãoSlide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à Educação
Eduardo Alves dos Reis
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
Stefania Helena
 
Slides de estatística aplicada (3º bimestre.2012)
Slides de estatística aplicada (3º bimestre.2012)Slides de estatística aplicada (3º bimestre.2012)
Slides de estatística aplicada (3º bimestre.2012)
Enio José Bolognini
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
AleNiv
 
Trabalho de estatística
Trabalho de estatísticaTrabalho de estatística
Trabalho de estatística
1721lab
 

Mais procurados (20)

Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)Resumo aulas (daniela gomes)
Resumo aulas (daniela gomes)
 
Estatística básica
Estatística básicaEstatística básica
Estatística básica
 
Estatistica[1]
Estatistica[1]Estatistica[1]
Estatistica[1]
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Slide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à EducaçãoSlide de Estatística Aplicada à Educação
Slide de Estatística Aplicada à Educação
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
 
Slides de estatística aplicada (3º bimestre.2012)
Slides de estatística aplicada (3º bimestre.2012)Slides de estatística aplicada (3º bimestre.2012)
Slides de estatística aplicada (3º bimestre.2012)
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística
EstatísticaEstatística
Estatística
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimica
 
Apostila estatistica1
Apostila estatistica1Apostila estatistica1
Apostila estatistica1
 
Aula bioestatistica
Aula bioestatisticaAula bioestatistica
Aula bioestatistica
 
Aula de exercícios compelmetares
Aula de exercícios compelmetaresAula de exercícios compelmetares
Aula de exercícios compelmetares
 
Econometria
EconometriaEconometria
Econometria
 
Trabalho de estatística
Trabalho de estatísticaTrabalho de estatística
Trabalho de estatística
 
Estatc3adstica cap-01
Estatc3adstica cap-01Estatc3adstica cap-01
Estatc3adstica cap-01
 
A importância de Bioestatística
A importância de Bioestatística A importância de Bioestatística
A importância de Bioestatística
 
Bioestatistica
BioestatisticaBioestatistica
Bioestatistica
 

Destaque

Elizabeth torres actividad 1 mapa conceptual
Elizabeth torres actividad 1 mapa conceptualElizabeth torres actividad 1 mapa conceptual
Elizabeth torres actividad 1 mapa conceptual
licha2101
 

Destaque (12)

川崎 講演 消費税率アップにも負けない経営
川崎 講演 消費税率アップにも負けない経営 川崎 講演 消費税率アップにも負けない経営
川崎 講演 消費税率アップにも負けない経営
 
静岡 講演 クラウドの現状と今後の可能性IoT(Internet of Things)とビッグデータ~すぐに経営に使えるビッグデータを体験しよう!~
静岡 講演 クラウドの現状と今後の可能性IoT(Internet of Things)とビッグデータ~すぐに経営に使えるビッグデータを体験しよう!~ 静岡 講演 クラウドの現状と今後の可能性IoT(Internet of Things)とビッグデータ~すぐに経営に使えるビッグデータを体験しよう!~
静岡 講演 クラウドの現状と今後の可能性IoT(Internet of Things)とビッグデータ~すぐに経営に使えるビッグデータを体験しよう!~
 
Change2Micro Flanders-Bio 13-11-2015
Change2Micro Flanders-Bio 13-11-2015Change2Micro Flanders-Bio 13-11-2015
Change2Micro Flanders-Bio 13-11-2015
 
Penguat transistor
Penguat transistorPenguat transistor
Penguat transistor
 
my business ^_^
my business ^_^ my business ^_^
my business ^_^
 
会津若松 講演 ビジネスへの活用方法
会津若松 講演  ビジネスへの活用方法 会津若松 講演  ビジネスへの活用方法
会津若松 講演 ビジネスへの活用方法
 
RBC Heritage PGA Tour live
RBC Heritage PGA Tour liveRBC Heritage PGA Tour live
RBC Heritage PGA Tour live
 
Elizabeth torres actividad 1 mapa conceptual
Elizabeth torres actividad 1 mapa conceptualElizabeth torres actividad 1 mapa conceptual
Elizabeth torres actividad 1 mapa conceptual
 
会津 SNS塾講演 SNSの概要と自社に相応しいSNSの選択
会津 SNS塾講演 SNSの概要と自社に相応しいSNSの選択 会津 SNS塾講演 SNSの概要と自社に相応しいSNSの選択
会津 SNS塾講演 SNSの概要と自社に相応しいSNSの選択
 
Na palma da minha mao temas afro-brasileiros e questoes contemporaneas
 Na palma da minha mao  temas afro-brasileiros e questoes contemporaneas Na palma da minha mao  temas afro-brasileiros e questoes contemporaneas
Na palma da minha mao temas afro-brasileiros e questoes contemporaneas
 
Herramientas del software educativo
Herramientas del software educativoHerramientas del software educativo
Herramientas del software educativo
 
Historia del mercadeo
Historia del mercadeoHistoria del mercadeo
Historia del mercadeo
 

Semelhante a Apos est i_fev04_c1

Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva ii
simuladocontabil
 
Unidade i conceitos fundamentais de estatística
Unidade i   conceitos fundamentais de estatísticaUnidade i   conceitos fundamentais de estatística
Unidade i conceitos fundamentais de estatística
Cristiano Martinez
 
Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciais
con_seguir
 
Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1
carolineborba
 
Aprenda fazer uma distribuição de frequência, Estatistica
Aprenda fazer uma distribuição de frequência, EstatisticaAprenda fazer uma distribuição de frequência, Estatistica
Aprenda fazer uma distribuição de frequência, Estatistica
Pedro Kangombe
 

Semelhante a Apos est i_fev04_c1 (20)

Ou estatistica
Ou estatisticaOu estatistica
Ou estatistica
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva ii
 
EstatisticaConceitos.pptx
EstatisticaConceitos.pptxEstatisticaConceitos.pptx
EstatisticaConceitos.pptx
 
Unidade i conceitos fundamentais de estatística
Unidade i   conceitos fundamentais de estatísticaUnidade i   conceitos fundamentais de estatística
Unidade i conceitos fundamentais de estatística
 
Estatística aula 01
Estatística aula 01Estatística aula 01
Estatística aula 01
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciais
 
Aula de Estatística para 9º ano - Matemática
Aula de Estatística para 9º ano - MatemáticaAula de Estatística para 9º ano - Matemática
Aula de Estatística para 9º ano - Matemática
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1Profsidineiindoleonardo 6m1
Profsidineiindoleonardo 6m1
 
Capítulo 1 livro básico probabiliade
Capítulo 1  livro básico probabiliadeCapítulo 1  livro básico probabiliade
Capítulo 1 livro básico probabiliade
 
Aprenda fazer uma distribuição de frequência, Estatistica
Aprenda fazer uma distribuição de frequência, EstatisticaAprenda fazer uma distribuição de frequência, Estatistica
Aprenda fazer uma distribuição de frequência, Estatistica
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Libro de estastitica
Libro de estastiticaLibro de estastitica
Libro de estastitica
 
Livro estatistica
Livro estatisticaLivro estatistica
Livro estatistica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
ESTATISTICA.pptx
ESTATISTICA.pptxESTATISTICA.pptx
ESTATISTICA.pptx
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
1880799 estatistica-descritiva
1880799 estatistica-descritiva1880799 estatistica-descritiva
1880799 estatistica-descritiva
 

Último

01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
IANAHAAS
 
fratura e imobilização de membros superior e inferior
fratura e imobilização de membros superior e inferiorfratura e imobilização de membros superior e inferior
fratura e imobilização de membros superior e inferior
IvaneSales
 

Último (12)

Tecido_Nervoso.pptxsistema nervoso neuronios
Tecido_Nervoso.pptxsistema nervoso neuroniosTecido_Nervoso.pptxsistema nervoso neuronios
Tecido_Nervoso.pptxsistema nervoso neuronios
 
Apresentação Fispq.pptx apresentação sobre fispq fds
Apresentação Fispq.pptx apresentação sobre fispq fdsApresentação Fispq.pptx apresentação sobre fispq fds
Apresentação Fispq.pptx apresentação sobre fispq fds
 
Composição química da célula- Elementos químicos.ppt
Composição química da célula- Elementos químicos.pptComposição química da célula- Elementos químicos.ppt
Composição química da célula- Elementos químicos.ppt
 
Anatomia do Sistema Respiratorio função e movimentos musculares.
Anatomia do Sistema Respiratorio função e movimentos musculares.Anatomia do Sistema Respiratorio função e movimentos musculares.
Anatomia do Sistema Respiratorio função e movimentos musculares.
 
Aula 4 Técnica dietética aplicada para ATLETAS.ppt
Aula 4 Técnica dietética aplicada para  ATLETAS.pptAula 4 Técnica dietética aplicada para  ATLETAS.ppt
Aula 4 Técnica dietética aplicada para ATLETAS.ppt
 
01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
01 INTRODUÇÃO AO ESTUDO DA ANATOMIA HUMANA.pdf
 
TEORIA DE ENFERMAGEM DE IMOGENE M. KING.pptx
TEORIA DE ENFERMAGEM DE IMOGENE M. KING.pptxTEORIA DE ENFERMAGEM DE IMOGENE M. KING.pptx
TEORIA DE ENFERMAGEM DE IMOGENE M. KING.pptx
 
Humanização em enfermagem slides pptx...
Humanização em enfermagem slides pptx...Humanização em enfermagem slides pptx...
Humanização em enfermagem slides pptx...
 
Puerpério normal e patológico em obstetrícia
Puerpério normal e patológico em obstetríciaPuerpério normal e patológico em obstetrícia
Puerpério normal e patológico em obstetrícia
 
fratura e imobilização de membros superior e inferior
fratura e imobilização de membros superior e inferiorfratura e imobilização de membros superior e inferior
fratura e imobilização de membros superior e inferior
 
Primeiros Socorros.ppt estudo do meio 3 ano
Primeiros Socorros.ppt estudo do meio 3 anoPrimeiros Socorros.ppt estudo do meio 3 ano
Primeiros Socorros.ppt estudo do meio 3 ano
 
Noções básicas de Microscopia (Princípios) .pptx
Noções básicas de Microscopia (Princípios) .pptxNoções básicas de Microscopia (Princípios) .pptx
Noções básicas de Microscopia (Princípios) .pptx
 

Apos est i_fev04_c1

  • 1. PAULO VIEIRA NETO Estatística Descritiva: Conceitos Básicos São Paulo, Março/2004
  • 2. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 2 O que é Estatística: Estatística: é uma parte da Matemática Aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. Estatística: basicamente se divide em 3 áreas: 1. Descritiva; 2. Probabilidade; 3. Inferência Estatística. • Estatística descritiva utiliza-se de análise (Análise Exploratória). Objetivo: descrever e resumir os dados a fim de que possamos tirar conclusões a respeito de características de interesse. [ •1) Etapa inicial da análise de dados; •2) Tabelas; •3) Gráficos •4) Medidas resumo ] • Probabilidade: a ferramenta matemática que deduz a partir de um modelo as propriedades de um fenômeno aleatório. • Inferência: Conjunto de métodos que permite inferir o comportamento de uma população a partir do conhecimento da amostra. População e Amostra POPULAÇÃO: conjunto de elementos em estudo que tem pelo menos uma característica em comum. (pessoas, coisas, objetos etc.). Exemplo: População de carros da cidade de São Paulo. AMOSTRA: qualquer subconjunto, não vazio, de uma população. Fases do Método Estatístico: Podemos subdividi-las em: • Coleta de dados; • Apuração dos dados; • Apresentação dos dados • Análise, interpretação e conclusão dos dados. Coleta dos dados: Devemos separá-la em dois métodos: • Coleta de Dados Primários • Coleta de Dados Secundários Coleta de Dados Primários (Diretos), quando o pesquisador coleta os dados direto (na fonte originária). A coleta Direta de dados pode ser classificada ao fator tempo. • Contínua: (registro) - feitos continuamente, tal como a de nascimentos e óbitos, freqüência dos alunos às aulas. • Periódicos: feita em intervalos constantes de tempo: inflação mensal, censos (10 em 10 anos). • Ocasional: feita extemporaneamente, fins de atender uma conjuntura ou emergência, Exemplo.: praga que dizima uma colheita. Coleta de Dados Secundários (Indiretos), quando o pesquisador utiliza de outras fontes. Apuração dos dados: Assim que terminamos a coleta dos dados, torna-se mister sua apuração, ou contagem. Denominamo-la como Tabulação. De posse desses dados (sobre o mesmo fenômeno), devemos ordená-los mediante critérios de classificação. Essas classificações podem ser: manual, mecânica ou eletrônica. Apresentação dos dados: Depois de os tabularmos, ou apurá-los podemos apresentá-los em: a) Tabelas; b) Medidas Resumo; c) Gráficos. VARIÁVEL: convencionalmente, é o conjunto de resultados possíveis de um fenômeno. • Qualitativa: quando os valores forem expressos por atributos: sexo (masculino - feminino), cor da pele (branca, parda, amarela etc.). • Quantitativa: quando os valores forem expressos em números (salários dos operários, altura dos alunos de uma classe de aula etc.). VARIÁVEIS • Nominal (Sexo, Cor dos olhos....) Qualitativa • Ordinal (Grau de Instrução, Classe Social) • Contínua (Peso, Idade, Altura....) Quantitativa • Discreta (Número de Filhos, Número de carros...)
  • 3. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 3 FASES DO ESTUDO ESTATÍSTICO: Já nos ocupamos, anteriormente para falar do assunto. Vamos delinear as fases do estudo da estatística, limitando-nos à definição do problema, planejamento, coleta dos dados, apuração dos dados, apresentação dos dados através de tabulação (tabelas, gráficos) e, por último, a análise e interpretação dos dados. DEFINIÇÃO DO PROBLEMA: Estamos interessados em formar dois times de basquete para enfrentar outro time da faculdade vizinha, um masculino e outro feminino. Foi feito cartazes e afixados nos quadros de avisos de nossa Escola, para nossa surpresa só apareceram baixinhos e baixinhas. Nesta etapa devem-se ter claramente respostas às seguintes questões: • O quê? (objetivo da pesquisa, público alvo, metodologia , entre outros) • Onde:? (Local que será efetuado a pesquisa, uma sala de aula, um bairro, um município, estado etc.) • Quando? (Época que será efetuada a pesquisa, situação de tempo) PLANEJAMENTO: Definido o problema, torna-se mister como proceder para sua resolução. Como levantar as informações, como obtê-los? Como se deve obtê-los, pesquisa de campo, questionário via correio? - Em síntese, é preciso planejar. Em relação ao nosso problema, foram feitos novos cartazes, limitando à(os) candidatos(as), a altura mínima de 172,5cm. COLETA DE DADOS: Em nosso trabalho, apareceram diversos candidatos, os mesmos não tomaram conhecimento da condição exigida, apareceram 50 alunos com altura variando entre 150cm e 180cm. Aos dados coletados, à medida que vão chegando os candidatos, dá-se o nome de dados brutos. METODOLOGIA Método Científico Conhecimento: • VULGAR • CIENTÍFICO Vulgar: desconhece as verdadeiras causas dos fenômenos. Científico: obedece a um método nas investigações, nas análises, nas pesquisas etc. Método: conjunto de meios dispostos convenientemente para chegar a um fim que se deseja. Método científico: alguns pontos a destacar • Método Dedutivo; • Método Indutivo; • Método Experimental; • Método Estatístico. Método Dedutivo: É o que procede do geral para o particular. O raciocínio dedutivo parte de princípios gerais considerados como verdadeiros e indiscutíveis para chegar a conclusões de maneira puramente formal, i.e., em virtude unicamente de sua lógica. Método Indutivo: Procede inversamente ao dedutivo: parte do particular e coloca a generalização como um produto posterior do trabalho de coleta de dados particulares. Método Experimental: consiste em manter constantes todas as causas (variáveis), exceto uma, e varia esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Método Estatístico: face à impossibilidade em manter as demais variáveis constantes, admite todas essas variáveis (causas) presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Estatística: exprime por meio de números as observações que se fazem de elementos, com pelo menos, uma característica comum. (ex.: os alunos do sexo masculino de uma cidade), obtemos os chamados DADOS referentes a esses elementos. logo, Estatística: é uma parte da Matemática Aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. TABULAÇÃO A partir do momento que é feita a coleta e a crítica dos dados, e sua respectiva apuração, devemos efetuar a apresentação dos dados, que geralmente é feita através de tabelas e gráficos, pois permitem a síntese dos resultados. As tabelas devem obedecer ao seguinte postulado: "Obter um máximo de esclarecimentos com um mínimo de espaço e tempo." TABELA: é um quadro que resume um conjunto de informações, conforme o exemplo População residente no Brasil, segundo o sexo, de acordo com o censo demográfico de 1980 Sexo Freqüência Percentual Masculino 59 125 361 49,7 Feminino 59 879 345 50,3 Total 119 002 706 100,0 FONTE: IBGE (1983)
  • 4. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 4 Uma tabela compõe-se de: 1. Corpo: é o conjunto de linhas e colunas que contêm informações sobre a variável que estamos estudando; 2. Cabeçalho: parte superior da tabela que indica o conteúdo das colunas; 3. Coluna indicadora: parte da tabela que especifica o conteúdo das linhas; 4. Casa ou célula: espaço destinado a um só número; 5. Título: conjunto de informações, as mais completas possíveis, dando respostas às perguntas: O quê?, Quando?, Onde? Localizado no topo da tabela. Vide CRESPO, (1998:25-26) As tabelas devem apresentar o conjunto de informações de acordo com a Resolução 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística da Fundação IBGE. A tabela ou um gráfico, deve apresentar obrigatoriamente o cabeçalho, o corpo e o rodapé. focalizado no topo da tabela. Conforme modelo abaixo. As tabelas podem ser de : Entrada simples, entrada dupla ou de múltiplas entradas Exemplo de tabela de entrada simples: População residente no Brasil, segundo o sexo, de acordo com o censo demográfico de 1980 Sexo Freqüência Masculino 59 125 361 Feminino 59 879 345 Total 119 002 706 FONTE: IBGE (1983) Exemplo de uma tabela de dupla entrada: Exemplo: Entrada Dupla Alunos do 1º Grau matriculados na cidade ABC no ano de 19XX Escolas Masculino Feminino Santa Marina 250 200 Santa Brígida 200 300 São Cristóvão 450 400 Total 900 900 FONTE: Secretaria de Educação da Cidade ABC
  • 5. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 5 Exemplo: Entrada Múltipla População presente, segundo as Grandes Regiões e Unidades da Federação entre 1940 - 1980 Grandes Regiões População Presente Unidades da Federação 01/09/1940 01/07/1950 01/09/1960 01/09/1970 01/09/1980 BRASIL 41.236.315 51.944.397 70.070.457 93.139.037 119.070.865 NORTE 1.462.420 1.844.655 2.561.782 3.630.860 5.885.536 NORDESTE 14.434.080 17.973.413 22.181.880 28.111.927 34.855.469 SUDESTE 18.345.831 22.548.494 30.630.728 39.853.498 51.746.318 SUL 5.735.305 7.840.870 11.753.075 16.496.493 19.038.935 CENTRO-OESTE 1.258.679 1.736.965 2.942.992 5.073.259 7.544.607 FONTE: IBGE ESTRUTURAÇÃO Título: Título, é a apresentação do que a tabela está procurando representar, deve conter o suficiente para que sejam respondidas as seguintes questões: O QUÊ? (referente ao fato), ONDE? (relativo ao lugar), QUANDO? (correspondente ao tempo). Exemplo: Acidentes na rodovia dos Imigrantes em 1998. • O quê? - (fato): Acidentes • Onde? - (lugar): Rodovia dos Imigrantes • Quando? - (tempo): 1998 ESTRUTURA DA TABELA População residente no Brasil, segundo o sexo, de acordo com o censo demográfico de 1980 Sexo Freqüência Percentual Masculino 59 125 361 49,7 Feminino 59 879 345 50,3 Total 119 002 706 100 FONTE: IBGE (1983) Título Corpo da Tabela Cabeçalho Coluna Indicadora Cabeçalho: especifica a informação apresentada em cada coluna. Observe o exemplo de cabeçalho abaixo: Sexo Freqüência Percentual Corpo: é representado por um conjunto de linhas e colunas. Segundo o corpo, as tabelas podem ser: de simples entrada, de Dupla Entrada e de Múltipla Entrada. veja o exemplo abaixo sobre o Corpo da tabela: é formado pelos dados distribuídos em linhas e colunas: 59 125 361 49,7 59 879 345 50,3 119 002 706 100 Célula: o cruzamento de cada linha com uma coluna vem a constituir uma célula, exemplo: O número 59.879.345, primeira coluna com a segunda linha, é uma casa ou célula. 5599 887799 334455
  • 6. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 6 Coluna indicadora: parte da tabela que especifica o conteúdo que cada linha contém. Exemplo: Masculino Feminino Total Existem, na tabela, outros elementos complementares a serem considerados, tais como: fontes, notas e chamadas. Fonte: É a Instituição, a entidade responsável pelo fornecimento das informações, dos dados. Na tabela, em epígrafe, como indica a fonte, colocada no rodapé, os dados foram fornecidos pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE. Não se indica a fonte nos casos em que a tabela é apresentadas pelo próprio pesquisador ou pelo próprio instituto que obteve os dados. Notas: São as informações, que servem para esclarecer o conteúdo da tabela. Chamadas: são informações que servem para explicar ou conceituar determinados dados. SÉRIES ESTATÍSTICAS Chamamos de série estatística, toda tabela que apresenta uma distribuição de uma amostra ou população em função do tempo, do local e espécie. Tipos de Série Quando o observador está estudando um fenômeno, sua atenção poderá voltar-se mais para: O tempo, o espaço e categoria. • O tempo: o fenômeno é estudado em uma determinada faixa de tempo. É conhecida como (Séries temporais, cronológicas, evolutivas, históricas ou marchas 1 ). Produção de automóveis no Brasil no período de 1980-1982 Ano Número de automóveis 1980 600 706 1981 406 016 1982 475 112 FONTE: Fundação Getúlio Vargas (1986). • O espaço: o fenômeno é estudado em uma ou mais região. É conhecida como Séries geográficas, espaciais, territoriais ou de localização. Casamentos registrados no Brasil segundo a região, no ano 1983 Região Casamentos registrados Norte 30 485 Nordeste 211 162 Sudeste 408 271 Sul 160 566 Centro-Oeste 55 706 FONTE: IBGE (1984). • A categoria: o fenômeno é estudado, o tempo e o espaço são fixos, a categoria varia. É conhecida como Séries categóricas ou específicas. Ofertas de trabalho em São Paulo Semana de 13-06 a 19-06 de 1986 Área Especializada Número de Vagas Administração geral/Executivos 130 Marketing/Vendas 163 Finanças/Contábil 321 Informática 145 Produção/Materiais 739 Recursos Humanos 249 Total 1.747 FONTE: Data Folha 1 Este assunto está também em: PEREIRA e TANAKA (1990:40-42)
  • 7. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 7 TABELAS: As tabelas recebem nomes de acordo com o tipo de estudo do fenômeno que expressam: • Tabelas cronológicas: o fenômeno é estudado em uma faixa de tempo. • Tabelas regionais ou geográficas: o fenômeno é estudado em diferentes regiões. • Tabelas categóricas: o fenômeno é estudado por categorias. • O tempo: o fenômeno é estudado em uma determinada faixa de tempo. É conhecida como Série cronológica. Produção de automóveis no Brasil no período de 1980-19832 Ano Número de automóveis 1980 600 706 1981 406 016 1982 475 112 1983 576 356 FONTE: Fundação Getúlio Vargas (1986). • O espaço: o fenômeno é estudado em uma ou mais região. É também conhecida como Série geográfica. Casamentos registrados no Brasil segundo a região, no ano 1983 Região Casamentos registrados Norte 30 485 Nordeste 211 162 Sudeste 408 271 Sul 160 566 Centro-Oeste 55 706 FONTE: IBGE (1984). • A categoria: o fenômeno é estudado, o tempo e o espaço são fixos, a categoria varia. É conhecida como Série categórica. Ofertas de trabalho em São Paulo Semana de 13-06 a 19-06 de 1986 Área Especializada Número de Vagas Administração geral/Executivos 130 Marketing/Vendas 163 Finanças/Contábil 321 Informática 145 Produção/Materiais 739 Recursos Humanos 249 Total 1.747 FONTE: Data Folha ESTATÍSTICA GRÁFICA. Corresponde às representações dos dados estatísticos sob diferentes formas gráficas com o objetivo de permitir uma leitura rápida e global dos fenômenos estudados. Os dados estatísticos, apresentados em tabelas, também podem ser expostos em gráficos. Desde que não haja necessidade de grande precisão, os gráficos dão, melhor do que as tabelas, visão de tendências e ajudam a interpretar um fenômeno em estudo. Na apresentação gráfica deve tomar alguns cuidados, que são necessários: a) todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais através de um texto;. b) o titulo do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o titulo acima do gráfico; c) no eixo dos X, eixo das abscissas, a escala cresce da esquerda para a direita e escrita embaixo do eixo, como mostra o esquema abaixo: 0 1 2 3 4 5 6 7 8 9 10 2 O mesmo assunto é tratado em: VIEIRA e HOFFMANN (1988:28-29)
  • 8. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 8 d) no eixo das ordenadas, a escala cresce de baixo para cima e é escrita à esquerda do eixo. Veja o exemplo abaixo: 5 4 3 2 1 0 e) podem ser feitas setas para indicar a direção dos eixos; f) as variáveis representadas cm cada eixo devem ser claramente identificadas. No eixo das ordenadas escreve-se o nome da variável na extremidade do eixo. No eixo das abscissas escreve-se o nome da variável embaixo da escala: Porcentagem 40 30 20 10 0 150 160 180 190 500 Altura (cm) g) a escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos (como, por exemplo, 100, 101 etc.), deve ser feita urna interrupção no eixo, com indicação clara da posição do zero. 100 200 300 h) o sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar: Porcentagem 40 30 20 10 0 5 10 15 20 30
  • 9. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 9 Exemplo: Vendas de automóveis na Região C no ano de 199X. Vendas de automóveis na Região C – 199X Meses Qtide Jan 20 Fev 30 Mar 40 Abr 50 Maio 60 Jun 75 Jul 85 Ago 97 Set 103 Out 110 Nov 115 Dez 125 Fonte: Depto Vendas Representação gráfica das Vendas de Automóveis na Região C. Trata-se de uma série histórica, o gráfico adequado para representá-la é o gráfico de linha. Vendas de Automóveis na Região C no ano de 199X 0 20 40 60 80 100 120 Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez GRÁFICO EM COLUNAS E GRÁFICO EM BARRAS É a representação gráfica de uma série estatística através de retângulos: verticais (Gráfico em colunas); Horizontais (Gráfico em barras) GRÁFICO DE BARRAS O gráfico de barras é usado para apresentar séries cronológicas, geográficas e categóricas. Para entender como se faz um gráfico primeiro observe a série cronológica apresentada na tabela abaixo: População presente no Brasil, segundo o ano do censo demográfico Ano do censo Demográfico População 1940 41 236 315 1950 51 944 397 1960 70 191 370 1970 (1) 93 139 037 1980 (1) 119 002 706 Fonte: IBGE (1984) (1) População residente
  • 10. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 10 Para apresentar os dados da tabela acima, em um gráfico de barras, siga os seguintes passos: 1) trace um sistema de eixos cartesianos; 2) escreva os anos do censo no eixo X; a população no eixo Y, das ordenadas. Como mostra o esquema abaixo: População (em milhões) 120 90 60 30 0 1940 1950 1960 1970 1980 Ano do censo 3) construa barras retangulares para representar a população em cada ano de censo. As barras deverão Ter as bases de mesma largura, porém a altura será dada pela população de cada ano. 4) ponha o título na figura. Gráfico de colunas: Retângulos verticais. População Presente no Brasil, segundo o ano do censo demográfico 0 20 40 60 80 100 120 140 1940 1950 1960 1970 1980 Anos do censo A apresentação gráfica de séries geográficas e categóricas, por gráficos de barras, é feita de maneira análoga. Veja o exemplo: Exportações Brasileiras Março de 1995 ESTADOS VALOR – (US$ MILHÕES) São Paulo 1.344 Minas Gerais 542 Rio Grande do Sul 332 Espírito Santo 285 Paraná 250 Santa Catarina 202 Fonte: SECEX
  • 11. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 11 Gráfico de Barras: Retângulos horizontais. Exportações Brasileiras - Março/1995 0 500 1000 1500 SP MG RS ES PR SC Milhões de dólaresFonte: SECEX. Gráfico de Linhas: É usado para apresentar séries cronológicas. Veja o exemplo a seguir: (Utilizando a tabela População presente no Brasil, do IBGE). 1) trace um sistema de eixos cartesianos; 2) escreva no eixo das abscissas, os anos do censo (eixo X); E a população no eixo das ordenadas (eixo Y). 3) Faça corresponder um ponto para cada par de valores ( XY ) da série: 4) Una os pontos por segmentos de reta 5) Coloque um título na figura. População Residente no Brasil, segundo o ano do censo demográfico 0 20 40 60 80 100 120 140 1 2 3 4 5 6 Gráfico Retangular de composição: É usado para evidenciar a composição percentual de uma amostra ou de uma população. Veja o exemplo com dados fictícios: Distribuição de uma amostra de 50 alunos da Faculdade Montessori, - em 1999 - segundo o interesse em aprender Excel Interesse Número de Alunos Porcentagem Têm 25 50 Não têm 15 30 Não sabem 10 20 Total 50 100 Para fazer um gráfico retangular de composição: 1. Trace um retângulo, de comprimento conveniente, para representar o total. Neste exemplo vamos utilizar um retângulo de 7 cm de comprimento.
  • 12. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 12 2. se 50 alunos são representados por 7 cm, os 25 alunos com interesse em aprender Excel são representados por um comprimento x, tal que: 3,5x 50 25x7 x 25 x 50 7 =⇒=→= Da mesma forma, os 15 alunos que não têm interesse por Excel são representados pelo retângulo, pelo comprimento y, tal que: 2,1y 50 15x7 y 15 y 50 7 =⇒=→= Os 10 alunos sem definição, não sabem se têm interesse por Excel é representado pelo retângulo, pelo comprimento z, tal que: 1,4z 50 10x7 z 10 z 50 7 =⇒=→= Feito os cálculos, marque os valores obtidos dentro do retângulo, separando-os por traços Outros gráficos não citados [que poderemos vê-los] • RAMOS-E-FOLHAS; • GRÁFICO DE PONTOS (DOT PLOT); • BOX-PLOT • ETC., RESUMO DE ESTATÍSTICA AMOSTRA: qualquer subconjunto, não vazio, de uma população. AMOSTRAGEM ALEATÓRIA SIMPLES: sorteia-se para o estudo pelo menos 10% dos elementos da população AMOSTRAGEM ALEATÓRIA SISTEMÁTICA: sorteia-se de 1 a 10. Ele ser o primeiro elemento da amostra. Os demais elementos correspondentes aos outros elementos, são determinados em intervalos de 10 unidades. AMPLITUDE AMOSTRAL: AA = x(max) - x(min) {AA = Ls - Li, da amostra} AMPLITUDE TOTAL: AT = L(max) - L(min). {AT = Ls - Li, da distribuição} CARTOGRAMA: a representação sobre uma carta geográfica. CENTIS ou PERCENTIS: Dividem a distribuição, em cem partes iguais. Correlação: A intensidade e a direção do relacionamento entre duas variáveis. correlação curvilínea Relação entre X e Y que começa como positiva (ou negativa) e inverte a direção. Curtose [1]: Grau de achatamento de uma distribuição. Ela é medida em relação a uma curva normalmente achatada chamada mesocúrtica. Uma curva mais achatada que ela será denominada platicúrtica e uma menos achatada (ou mais afilada), leptocúrtica. Curtose [2]: O grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada CURVA NORMAL. Podem ser leptocúrtica (bastante pontiaguda ou alta), platicúrtica (quando são achatadas) ou mesocúrtica (quando não são nem muito pontiagudas nem muito achatadas). Curva assimétrica: Estas curvas, assimétrica positiva e assimétrica negativa, apresentam a cauda de ordenada máxima mais longa que a outra. Se a cauda é mais alongada à direita, é conhecida como assimétrica positiva ou inviesada à direita: moda > mediana > média. assimétrica negativa: média < mediana < moda. • Em uma distribuição simétrica a Média = Mediana = Moda (é o caso da Curva normal) • Em uma distribuição assimétrica positiva a Média > Mediana > Moda • Em uma distribuição assimétrica negativa a Média < Mediana < Moda Curva normal: Distribuição suave, simétrica, em forma de sino e unimodal. decis Postos percentis que dividem em décimos a escala de 100 unidades. desvio A distância e a direção de qualquer escore bruto em relação à média. Curva simétrica: Apresenta o valor máximo no ponto central e os pontos eqüidistantes desse ponto têm a mesma freqüência. (Medidas de Assimetria, Medidas de Curtose). CURVAS EM FORMA DE SINO: Caracterizam-se por ter um valor máximo na região central onde a média = mediana = moda. Distinguimos a curva em forma de sino simétrica e assimétrica. Curtose, Medida de: Medida de curtose, Entende-se por medida de curtose o grau de achatamento de uma distribuição. Curvas Leptocúrtica, Mesocúrtica e platicúrtica. Para medir o grau de curtose utilizaremos o coeficiente:
  • 13. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 13 Coeficiente de Curtose P10)2(P90 Q1Q3K − − = em que: P90 = 90º percentil; Q3 = 3º quartil P10 = 10º percentil; Q1 = 1º quartil • Se K = 0,263, dizemos que a curva correspondente à distribuição de freqüência é mesocúrtica; • Se K > 0,263, dizemos que a curva correspondente à distribuição de freqüência é platicúrtica; • Se K < 0,263, dizemos que a curva correspondente à distribuição de freqüência é leptocúrtica; Dado Estatístico: - é o resultado da observação de um atributo/variável qualitativa ou quantitativa. DADOS BRUTOS: são os dados coletados e ainda não organizados numericamente. Dados Simples: - vão valores associados a uma dada variável e cuja representação é feita através de uma tabela. DECIS: Dividem a amostra, distribuição, em dez partes iguais. Definição do Problema: - é a primeira fase do estudo estatístico e consiste na definição e formulação correcta do problema a ser estudado. Desvio médio: Soma dos desvios absolutos a contar da média dividida pelo número de escores em uma distribuição. Medida de variabilidade que indica a média dos desvios em relação à média. Desvio. Diferença entre um escore e a média aritmética. É equivalente à expressão afastamento, a qual, todavia, é menos empregada. Desvio-padrão. Medida de dispersão ou variabilidade de um conjunto de valores. É igual à raiz quadrada da soma dos desvios ao quadrado dividida pelo número de casos. Em outras palavras, é a raiz quadrada da média dos desvios elevados ao quadrado. Verifica-se que quanto maior for o desvio-padrão, maior será a flutuação da variável em torno da média DIAGRAMAS: são gráficos geométricos de, no máximo, duas dimensões, geralmente, para sua construção usamos o sistema cartesiano. Distribuição de freqüências agrupadas: Tabela que indica a freqüência da ocorrência de casos situados dentro de uma série de intervalos de classe. Distribuição de Freqüências [1]. Tabela que indica as freqüências com que ocorrem os casos correspondentes a cada intervalo de classe (ou valor individual da variável quando esta não estiver agrupada em classes). Distribuição de Freqüências [2]: - o mesmo que Tabela de Freqüências. Erro amostral: Diferença inevitável entre uma amostra aleatória e sua população, baseada apenas na chance. Erro de Amostragem. Diferença entre os valores obtidos numa amostra (estatísticas) e os valores da população (parâmetros). Se um escore for usado como estimador dos escores de toda a população, a diferença entre esse escore e a média de todos os valores registrados será um erro de amostragem. Erro padrão da diferença entre médias: Estimativa do desvio padrão da distribuição amostrai de diferenças baseada nos desvios padrão de duas amostras aleatórias. Erro padrão da média: Estimativa do desvio padrão da distribuição amostrai de médias com base no desvio padrão de uma única amostra aleatória. Erro Padrão da Medida. Erro padrão de qualquer medida, por causa das flutuações da amostragem ou dos erros de observação. Erro Padrão. Desvio-padrão da distribuição dos diversos valores de uma estatística, em conseqüência da flutuação das amostras. Se, de uma população, for tirado um grande número de amostras e calculadas as respectivas médias, haverá uma diferença entre cada média e a média da população. Se for computada a média de tais médias, seu desvio-padrão será o erro da amostragem (a margem de erro a ser esperada toda vez que se empregar tal processo de amostragem). Erro tipo I: Erro que consiste em rejeitar a hipótese nula quando ela é verdadeira. Erro tipo II: Erro que consiste em aceitar a hipótese nula quando ela é falsa. Espaço Amostral. Conjunto de todos os possíveis resultados de uma experiência aleatória, resultados esses que podem ser de natureza quantitativa ou qualitativa. Estatística Descritiva Indutiva: descreve e analisa os fenômenos. Estatística Descritiva[1]: Apuração, apresentação, análise e interpretação dos dados observados. Em outras palavras, descreve as amostras ou a população. Estatística Descritiva[2]: - ramo da Estatística que tem por finalidade descrever certas propriedades relativas a um conjunto de dados. ESTATÍSTICA Indutiva[1]: baseada na análise dos fatos, infere conclusões de sua validade. Estatística Indutiva [2]: Método que parte do particular para o geral, ou seja, o processo pelo qual são feitas generalizações para a população, com base nas amostras. E também conhecida por inferência estatística. Estatística Indutiva[3]: ramo da Estatística que procura inferir propriedades da população a partir de propriedades verificadas numa amostra da mesma. Estatística Indutiva [4]: baseada na análise dos fatos, infere conclusões de sua validade. Estatística[1]: Qualquer número usado para descrever um aspecto da amostra. Assim, a média, o desvio-padrão, o coeficiente de correlação entre dois conjuntos de medidas dos membros de uma amostra são exemplos de estatística. A cada estatística na amostra corresponde um parâmetro na população. As estatísticas são representadas por letras de nosso alfabeto, ao passo que os parâmetros são simbolizados pelas letras gregas correspondentes. Estatística[2]:é o método que ensina a recolher, classificar, apresentar e interpretar um conjunto de dados numéricos. Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através de cálculos de probabilidades. Estimador: uma característica numérica estabelecida para toda uma amostra. Fonte Primária: quando as informações são colhidas diretamente pelo pesquisador ou por seus auxiliares. Fonte Secundária: quando o pesquisador recorre a relatórios, revistas, livros ou dados coletados por instituições especializadas.
  • 14. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 14 FORMA DAS CURVAS DE FREQÜÊNCIAS: CURVAS EM FORMA DE SINO: Caracterizam-se por ter um valor máximo na região central onde a média = mediana = moda. Distinguimos a curva em forma de sino simétrica e assimétrica. Curva simétrica: Apresenta o valor máximo no ponto central e os pontos eqüidistantes desse ponto têm a mesma freqüência. (Medidas de Assimetria, Medidas de Curtose). Curtose: O grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada CURVA NORMAL. Podem ser leptocúrtica (bastante pontiaguda ou alta), platicúrtica (quando são achatadas) ou mesocúrtica (quando não são nem muito pontiagudas nem muito achatadas). CURVA NORMAL Curva em forma de jota: são relativas às distribuições extremamente assimétrica, apresenta o ponto de ordenada máxima em uma das extremidades, para o estudante de economia a curva da oferta é um exemplo. A curva em forma de jota invertido, outro bom exemplo é a curva da demanda. As curvas em forma de U apresentam ordenadas em ambas as extremidades. Freqüência. Número de ocorrências de determinado fenômeno. Freqüência Absoluta ( fi ): - é o número de vezes que o valor de determinada variável é observado. FREQÜÊNCIA ABSOLUTA ou simplesmente freqüência (Fi): o número de vezes que cada dado aparece no rol. Freqüência Absoluta Simples de Classe. Número de casos incluídos em determinada classe ou intervalo de uma distribuição de freqüências (ou valor individual da variável quando esta não estiver agrupada em classes). Freqüência Absoluta Acumulada (Fi) [1]: é a soma das freqüências absolutas anteriores com a freqüência absoluta deste valor. Freqüência Absoluta Acumulada (Fac) [2]: Soma da freqüência simples absoluta dessa classe (ou valor individual da variável quando esta não estiver agrupada em classes) com as freqüências simples absolutas das classes (ou valores individuais da variável) anteriores. FREQÜÊNCIA ACUMULADA [3]: a soma de cada freqüência com as que lhe são anteriores na distribuição. Freqüência Relativa ( fr ): - é o quociente entre a freqüência absoluta do valor da variável e o número total de observações. Freqüência Relativa Acumulada (Fri): - é a soma das freqüências relativas anteriores com a freqüência relativa desse valor. FREQÜÊNCIA RELATIVA: o quociente da freqüência absoluta pelo n total dados (Fi/N) "N = freqüência. total" Gráfico. Qualquer representação geométrica de um fenômeno quantitativo. Gráfico Circular: é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais à freqüência que lhe corresponde. Gráfico de barras (histograma): Método gráfico no qual barras retangulares representam as freqüências de uma faixa de valores de escores ou de categorias. Gráfico de Barras [1]: - é constituído por barras, horizontais ou verticais, de comprimento proporcional à freqüência. Gráfico em Barras [ 2]. Representação dos valores de determinado fenômeno por meio de barras de comprimentos proporcionais às respectivas freqüências. Quando as barras são verticais, chama-se gráfico de colunas. GRÁFICO EM COLUNAS OU EM BARRAS: representação de uma série por meio de retângulos, verticalmente (em colunas) ou horizontalmente (em barras). Gráfico de linhas: Gráfico de diferenças entre grupos ou tendências de alguma variável ao longo do tempo. Gráfico de setores [1]: Gráfico circular cujas partes têm por soma 100%. Gráfico em Setores. [2] Representação das freqüências de um fenômeno pelas áreas de setores de um círculo. Os setores correspondem a certa percentagem. Gráfico Polar. Representação de uma série por meio de um polígono. Geralmente, presta-se para apresentação de séries temporais. Para construí-lo, divide-se uma circunferência em tantos arcos iguais quantos forem os dados a representar e traçam-se raios pelas divisas. Histograma: é um gráfico de barras em que a área destas é proporcional à freqüência, não havendo espaço entre as mesmas. Só se utiliza em variáveis quantitativas contínuas. HISTOGRAMA: formado por um conjunto de retângulos justapostos, suas bases, coincidem com o eixo horizontal, de tal modo que seus PM coincidam com os PM dos intervalos de classe. Limite de classe: Ponto a meio caminho entre intervalos de classe adjacentes que serve para preencher a lacuna entre eles. LIMITE DE CLASSE: São os extremos de cada classe. LIMITE INFERIOR [Li]: o menor valor que a variável pode assumir. LIMITE SUPERIOR [Ls]: o maior valor que a variável pode assumir. Margem de erro: Extensão da imprecisão esperada quando estimamos a média ou proporção populacional; é o resultado da multiplicação do erro padrão pelo valor tabelado de z ou t. Média ponderada: A 'média de médias' que leva em conta diferenças nos tamanhos dos grupos. Média [1]: Em sua acepção mais ampla, qualquer promédio de uma distribuição de freqüência. Em sentido estrito, média aritmética. Média [2]: Soma de um conjunto de escores dividida pelo número total de escores no conjunto. É uma medida de tendência central. Média Aritmética Ponderada: é o quociente entre o somatório do produto de cada dado classificado pela sua freqüência absoluta e o número desses dados. Média Aritmética Simples: - é o quociente da soma de todos os dados não classificados pelo número desses dados. Média Aritmética. Soma de todos os valores dividida pelo número de valores. Mediana [1]: Medida de tendência central, através de seu valor, a distribuição de freqüências é dividida em duas partes de igual valor. Mediana [2]: é o valor da variável, para dados não classificados, que ocupa a posição central da distribuição. MEDIANA [3]: valor que ocupa a posição central da distribuição. Isto é, divide a amostra em duas partes iguais.
  • 15. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 15 Medida de Assimetria Primeiro Coeficiente de Pearson s Md)3(Me As − = Onde: Me: Média Aritmética; Md: Mediana; s: Desvio-Padrao. Se AS = 0 A distribuição é simétrica; • Assimetria moderada se: 0,15 < | AS | < 1 Se AS > 0 A distribuição é assimétrica positiva; • Assimetria Forte se: | AS | > 1 Se AS < 0 A distribuição é assimétrica negativa; Quando estamos impossibilitados de calcular a média e o desvio-padrão ( s ) utilizamos a fórmula: Segundo Coeficiente de Pearson QQ 2Md-QQ As 13 13 − + = Onde: Q3: 3º Quartil; Q1: 1º Quartil; Md: Mediana. Medidas de Dispersão: é um conjunto de medidas (Amplitude, Variância e Desvio Padrão) utilizadas no estudo da variabilidade de uma determinada distribuição, permitindo obter uma informação mais completa acerca da "forma" da mesma. Medidas de Localização: É um conjunto de medidas (Média, Mediana, Moda e Quartis) que representam de uma forma global um conjunto de dados. Medidas de Tendência Central. Valores que, em estatística, caracterizam os valores médios. Medidas de Tendência Central: - o mesmo que Medidas de Localização. Mensuração: Uso de uma série de números no estágio da análise de dados da pesquisa. Mesocúrtica: Característica de uma distribuição que nem tem pico muito acentuado, nem é muito achatada. Moda [1]: Valor mais freqüente de uma distribuição. Numa representação gráfica, a moda é o valor correspondente ao ponto mais alto da curva. Em outras palavras, é o valor que está na moda. Moda [2]: observação que ocorre com maior freqüência numa amostra. MODA [3]: o(s) elemento(s) que mais aparece(m) em uma distribuição. Núvem de Pontos: - o mesmo que Diagrama de Dispersão. Organização dos Dados: - consiste em "resumir" os dados através da sua contagem e agrupamento. Padronização: Conjunto de operações capazes de garantir a um teste precisão, validade, normas padronizadas, instruções para sua aplicação, avaliação e interpretação. PARÂMETRO: uma característica numérica estabelecida para toda uma população. Percentil: Cada um dos 99 valores da variável que dividem uma distribuição de freqüências em 100 intervalos iguais. O percentil é representado pelo símbolo Pr, em que r representa a ordem percentil. Se, num grupo de estudantes, 60% obtêm valores inferiores a 80, diz-se que o 60º percentil é 80 e que 60 é a ordem percentil correspondente a 80. PICTOGRAMA: Representação gráfica através de figuras. Polígono de Freqüência [1]: Representação gráfica de uma distribuição de freqüências resultante da união das interseções dos pontos médios das classes (nas abscissas) e das freqüências respectivas (nas ordenadas). Polígono de Freqüências [2]: é a representação gráfica de uma distribuição por meio de um polígono. (pequenas semi-retas) Polígono de Freqüências [3]: São gráficos com aspecto de linhas quebradas. Constroem-se unindo por segmentos de recta os pontos médios das bases superiores dos rectângulos de um histograma. Polígono de freqüências [4]: Método gráfico em que as freqüências são indicadas por uma série de pontos colocados acima dos valores dos escores, ou pontos médios de cada intervalo de classe, e ligados por uma linha reta que decai até a reta-base em ambas as extremidades. Polígono de freqüências acumuladas: Método gráfico que ilustra freqüências ou porcentagens acumuladas. Polígono de Freqüência Acumulada ou OGIVA: Representação gráfica da (Fac ou Fad), frequência acumulada crescente ou decrescente. PONTO MÉDIO [ Pm ] - [ Xi ] de uma classe [1]: a média aritmética entre o Li e o Ls da mesma [ (Li + Ls)/2 ]. Ponto Médio de Classe [2]: Ponto interior de uma classe, eqüidistante de seus limites de classes. Seu valor é igual à metade da soma desses limites. Ponto médio [3]: Escore mais central em um intervalo de classe. População (universo) [1]: Qualquer conjunto de indivíduos que compartilham de ao menos uma característica. População [2]: Conjunto formado pelas medidas que se fazem sobre elementos do Universo. População [3]: é um conjunto de seres com uma dada característica em comum e com interesse para o estudo. POPULAÇÃO [4]: conjunto de elementos em estudo que tem pelo menos uma característica em comum. (pessoas, coisas, objetos) Porcentagem acumulada: Percentual de casos com determinado escore ou com um escore inferior. Porcentagem de coluna: Em uma tabulação cruzada, o resultado da divisão da freqüência de uma cela pelo número de casos na coluna. As porcentagens de coluna devem totalizar 100% para cada coluna em uma tabulação cruzada. Porcentagem de linha: Em uma tabulação cruzada, o resultado da divisão de uma freqüência de cela pelo número de casos na linha. As porcentagens de linha têm como soma 100% para cada linha de uma tabulação cruzada. Porcentagem total: Em uma tabulação cruzada, o resultado da divisão de uma freqüência de cela pelo número total de casos na amostra. As porcentagens totais têm por soma 100% para toda a tabulação cruzada. Porcentagem: Método de padronização do tamanho que indica a freqüência de ocorrência de uma categoria em 100 casos. Posto percentil: Nº único que indica a porcentagem de casos em uma distribuição que se situam em determinado escore ou abaixo dele.
  • 16. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 16 Probabilidade [1]: Medida de incerteza dos fenômenos aleatórios. Traduz-se por um número real compreendido entre O e l, ou, o que é a mesma coisa, entre 0 e 100%. Probabilidade [2]: Freqüência relativa de ocorrência de um evento ou resultado. Número de vezes que um evento pode ocorrer em 100. Produtório ( π ): representa, de forma abreviada, um produto. Promédio. Termo genérico que expressa qualquer medida de tendência central. Exemplos: a média, a mediana e a moda de uma escala. Quartil [1]: Cada um dos três valores que dividem uma distribuição de freqüências em quatro partes de freqüências iguais. O primeiro quartil corresponde ao 25º percentil, o segundo à mediana e o terceiro ao 75º percentil. Quartis ( Q1 e Q3 ) [2]: são os valores que dividem a distribuição em quatro partes iguais. [Fórmula] QUARTIS [3]: Divide a amostra, distribuição, em quatro partes iguais. Razão: Método de padronização do tamanho que compara o número de casos que se enquadram em uma categoria com o número de casos que se enquadram em outra categoria. Recenseamento: o mesmo que Censo. Rol [1]: Arranjo dos dados brutos em ordem crescente ou decrescente. ROL [2]: são dados organizados numericamente em ordem crescente ou decrescente. SEPARATRIZES: São medidas que separam, dividem, a distribuição em partes iguais: mediana, quartis, decis e percentis. SÉRIE CATEGÓRICA OU ESPECIFICATIVA: aquela em que o fato estudado em categorias. Série Cronológica. Série estatística em que os dados são observados segundo a época de ocorrência. É também conhecida por Série Temporal, Evolutiva ou Histórica. Série Específica. Série estatística em que os dados são agrupados segundo a modalidade de ocorrência. Série Geográfica. Série estatística em que os dados são observados segundo a localidade de ocorrência. É também chamada de Série de Localização. Série Regional ou Geográfica: aquela em que o fenômeno estudado em locais diferentes. SÉRIES CRONOLÓGICA: aquela em que o fato estudado numa faixa de tempo. Sigma ( Σ ). Palavra que expressa a letra do alfabeto grego que corresponde ao nosso s. A letra minúscula simboliza o desvio padrão e a letra maiúscula significa o somatório. Soma de quadrados dentro de grupos: Soma dos quadrados dos desvios de cada escore bruto em relação à média amostrai do grupo. Soma de quadrados entre grupos: Soma dos quadrados dos desvios de cada média amostrai a contar da média total. Soma de quadrados total: Soma dos quadrados dos desvios de cada escore a contar da média total do estudo. Soma de quadrados: Soma dos quadrados dos desvios em relação à média. Somatório ( Σ ): - representa, de forma abreviada, uma soma. Tabela de Freqüências: - são tabelas onde se apresentam os dados por classes e as freqüências respectivas. Tabulação cruzada: Tabela de freqüências e porcentagens de duas ou mais variáveis consideradas conjuntamente. Tabulação. Apresentação dos dados estatísticos sob a forma de tabelas ou quadros. Tamanho da Amostra: - é o número de elementos que constituem uma dada amostra. Taxa: Tipo de razão que indica uma comparação entre o número de casos efetivos e o número de casos potenciais. Tendência central: O que é médio ou típico de um conjunto de dados; um valor geralmente situado em torno do meio ou centro de uma distribuição. Variabilidade [1]: Grau de heterogeneidade de um grupo, medido pela amplitude, pela amplitude semi-interquartil ou pelo desvio-padrão. O mesmo que dispersão. Variabilidade [2]: Maneira como os escores se dispersam em torno do centro da distribuição. Conhecida também como dispersão. Variância. Desvio-padrão elevado ao quadrado. É, como o desvio padrão, uma medida de dispersão. É também chamada de variança. Variância: - é a medida que permite avaliar o grau de dispersão dos valores da variável em relação à média. Variância: Média dos quadrados dos desvios em relação à média de uma distribuição. Medida de variabilidade em uma distribuição. Variáveis Contínuas: são as variáveis que podem tomar qualquer valor de um determinado intervalo. Variáveis Discretas: são as variáveis que podem tomar um número finito ou uma infinidade numerável de valores. Variáveis Qualitativas: o mesmo que Atributos Qualitativos. Variável Aleatória Contínua: Variável que pode assumir infinitos valores, mesmo dentro de um intervalo finito, resultando que a probabilidade de certo valor (ponto) é nula. Variável Aleatória Discreta: Variável que pode assumir, com probabilidade diferente de zero, um número finito de valores dentro de um intervalo finito (caso típico é quando efetuamos contagens). Variável Aleatória: Grandeza numérica que assume diferentes valores, estando cada um destes valores associado a uma certa probabilidade. Variável Contínua: Variável que pode assumir, teoricamente, qualquer valor em certo intervalo da reta real. Exemplo: a altura dos alunos constitui uma variável contínua, pois, teoricamente, um aluno poderá possuir altura igual a 1,80 m, 1,81 m, 1,811 m, 1,812 m... VARIÁVEL CONTÍNUA: a que pode, teoricamente, assumir qualquer valor entre 2 dados quaisquer. Variável Dependente: Variável não controlada em um experimento, sendo, por definição, aleatórios seus valores. Variável Discreta: Variável que assume valores em pontos da reta real. Exemplo: número de erros em um livro: 0, 1, 2, 3,... VARIÁVEL DISCRETA: não existem valores intermediários entre 2 números consecutivos de um conjunto. Variável Independente: Variável que pode ser controlada em um experimento. Em outras palavras, seus valores são exatos. Variável: Qualquer característica que varia de um indivíduo para outro. As hipóteses, em geral, contêm uma variável independente (causa) e uma variável dependente (efeito).
  • 17. Estatística Descritiva: Conceitos Básicos Paulo Vieira Neto - Mar./2004 17 ÍNDICES: são razões entre duas grandezas tais que uma não inclui a outra. Exemplos: 100x crâniodoallongitudindiâmetro crâniodotransversodiâmetro cefálicoÍndice = ÍNDICES ECONÔMICOS: ∑ = população ProdutodototalValor capita"per"Produto ∑ = população BemdoConsumo capita"per"Consumo COEFICIENTES: razões entre o n de ocorrências c/o n total (n de ocorrência e o n de ocorrências) totalpopulação snascimentodeNº natalidadedeeCoeficient = matrículasdeinicialnº evadidosalunosdenº escolarevasãodeeCoeficient = Bibliografia utilizada ALLEN, R. G. D. Estatística para Economistas. Rio de Janeiro : Zahar, 1979. BOTTER, D.A. , PAULA, G.A., LEITE, J.G. e CORDANI, L.K. Noções de Estatística. São Paulo : IME/USP, 1996. BUSSAB, Wilton O. & MORENTTIN, Pedro A. Estatística básica. São Paulo : Atual, s/d. CRESPO, Antônio Arnot. Estatística fácil. São Paulo : Saraiva, 1998. FERREIRA, Wilson & TANAKA, Osvaldo K. Elementos de Estatística. São Paulo : McGraw-Hill, s/d. FONSECA, Jairo Simon da & MARTINS, Gilberto de Andrade. Curso de estatística. São Paulo : Atlas, 1996. GATTÁS, Reny Reis. Elementos de probabilidade e inferência. São Paulo : Atlas, 1978. LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo : Lapponi Treinamento, 2000. LEVIN, Jack. Estatística aplicada a ciências humanas. São Paulo: Harbra, s/d. OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999. MAGALHÃES, Marcos Nascimento e LIMA, Antônio Carlos Pedroso de. Noções de probabilidade e estatística. São Paulo : IME/USP, 2001. MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de estatística. São Paulo : Atlas, 1993. MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo : Atlas, 2001. MORETTIN, Luiz Gonzaga. Estatística básica - probabilidade. São Paulo : Makron Books, 1999. 2 v. NAZARETH, Helenalda. Curso básico de estatística. São Paulo : Ática, 1987. OLIVEIRA, Francisco Estevam Martins de. Estatística e Probabilidade. 2. ed. São Paulo : Atlas, 1999. SILVA NETO, Lauro Araújo. Opções: do tradicional ao exótico. 2. ed. São Paulo : Atlas, 1996. SPIEGEL, Murray Ralph. Estatística. 2. ed. São Paulo : McGraw-Hill, 1995. __________________. Probabilidade e Estatística. São Paulo : Pearson, 2004. SPINELLI, Walter & SOUZA QUEIROZ, Maria Helena. Introdução à estatística. São Paulo : Ática, 1990. TIBONI, Conceição Gentil Rebelo. Estatística básica para o curso de Turismo. São Paulo : Atlas, 2002. TOLEDO, Geraldo Luciano & OVALLE, Ivo Isidoro. Estatística básica. São Paulo : Atlas, s/d. UNIVERSIDADE DE SÃO PAULO – USP “IME - Instituto de Matemática e Estatística”. MAE-116, Noções de Estatística, [Obtido em 15 dez. 2004]. Disponível em http://www.ime.usp.br/~mae116 VIEIRA, Sonia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo : Atlas, 1988. ______, Sonia & Wada Ronaldo. Estatística: introdução ilustrada. 2. ed. São Paulo : Atlas, 1992