2. Originou-se com a coleta e construção de tabelas de
dados para o governo. A situação evoluiu e esta
coleta de dados representa somente um dos aspectos
da Estatística.
Hoje em dia podemos adotar a seguinte definição
para a Estatística:
A Estatística é uma ciência (ou método) baseada na
Teoria das Probabilidades, cujo objetivo principal é
nos auxiliar a tomar decisões ou tirar conclusões em
situações de incerteza, a partir de informações
numéricas (dados).
3. Abrange a coleção, organização e interpretação
de dados de acordo com procedimentos bem
definidos
É o coração de toda disciplina científica, onde
necessitamos tirar conclusões sobre os assuntos
que estamos estudando .
4. São obtidos pela percepção através dos sentidos (observação)
ou resultantes de um processo de medição usando p.ex.
relógios, balanças, réguas, operações de contagem ou qualquer
outro procedimento ou instrumento de medição objetivamente
definido.
Essas observações respondem questões tais como :
◦ Qual tipo Podem ser
◦ Quanto representadas
◦ Quantas vezes por
◦ Quanto distante números
◦ Quanto frequente
◦ Etc...
5. Números sempre apresentam menos duvida
quanto a seu significado:
◦ Sem números:
A maioria dos pacientes sobrevive à determinada cirurgia.
◦ Com números:
99 em cada 100 sobrevivem à cirurgia
52 em cada 100 sobrevivem à cirurgia
6.
7. Observações do mundo são convertidas em
números.
Os números são manipulados e organizados e
então os resultados são interpretados e
reaplicados no mundo, que agora está mais
explicado e previsível que antes da análise de
dados.
8. A manipulação , organização e interpretação de
dados tem três principais aspectos :
A. Redução de Dados: Significa “sintetizar os dados“. De
uma grande quantidade de números desorganizados,
não conseguiremos tirar nenhuma conclusão.
Usaremos técnicas que reduzirão essa grande massa
de dados em um pequeno grupo de números capazes
de representar a essência de todo o conjunto. É a
chamada ESTATÍSTICA DESCRITIVA.
9. B. Inferência: Significa admitir que provavelmente algo é
verdadeiro, em função de informações já disponíveis.
Dificilmente conseguiremos estudar todos os
elementos de uma população. Ex.: A renda dos
eleitores da cidade de Santos.
A população à ser entrevistada é muito grande:
Entrevistar cada um dos 150.000 eleitores: caro, lento e
pode ser até pouco preciso.
10. Podemos escolher aleatoriamente (conceito de sorteio com olhos
vendados) uma certa quantidade de eleitores (por exemplo 1000
eleitores) e com base nessa “amostra” , tirar conclusões sobre a
renda de todos os eleitores “população”.
Obviamente, nunca a amostra será exatamente igual a
população, pois é somente uma parte dela, estando associado
sempre ao uso da inferência, um erro chamado de erro amostral.
Esse erro no entanto é conhecido e fará parte da apresentação
dos resultados.
Ex.:Pesquisa Eleitoral: O candidato A terá 40 % ± 3%. Esses 3%
estão relacionados ao erro amostral, porém é um valor conhecido
e considerado por todos na análise do eleitorado.
11. C. Identificação de Relações: Significa saber se há e no caso de
existir, descobrir qual é a relação entre dois grupos de
observações. Em outras palavras, o conhecimento de um
grupo de dados, permite-nos saber sobre o outro grupo de
dados?
Ex.: Há ligação entre a pressão sanguínea e as doenças
cardíacas? Se houver, como é essa relação?
Há dois tipos de associações descobertas pela análise estatística:
I. Não controlamos as variáveis. Simplesmente coletamos os dados e
descobrimos se há ou não associação.
II. Controlamos pelo menos uma das variáveis e acompanhamos o
resultado da outra variável.
12. Na maioria das vezes uma técnica é complemento da
outra.
Descobriu–se há um tempo atrás, que em um grupo de
pessoas com pressão arterial elevada, a percentagem de
pessoas com problemas cardíacos era elevada. Hoje em
dia controla–se a pressão em determinados níveis para
diminuir a chance de um infarto.
13. Introdução:
◦ Números por si só não representam nada. É necessário construir um
sistema para unir o mundo dos nossos sensos com o mundo dos números ⇒
correspondência entre os dois.
Objetos:
◦ Qualquer fonte de dados: indivíduos, coisas físicas, biológicas, localizações
geográficas, períodos de tempo, eventos, etc... Qualquer coisa onde
observações possam ser feitas.
Ex.: No mundo dos negócios:
Indivíduos: empregados ou consumidores
Coisas físicas: produtos
Localização geográfica: locais de venda ou de estocagem
Período de tempo: dias de trabalho ou período de vendas
Eventos: liquidações
14. Variáveis:
◦ Sendo os objetos nossa fonte de dados, o que iremos medir é(são)
alguma(s) característica(s) desse objeto. Um objeto nada mais é que um
grupo de características.
◦ Ex.: Estamos vendo uma criança brincando com uma bola vermelha.
A bola é na realidade um objeto com uma variedade de características:
O que estamos Alternativas
vendo?
Formato Esférico Elíptico
Cor Vermelha Azul, amarela
Composição Borracha Plástico
As características de um objeto que podem assumir dois10cmmais valores são
Diâmetro 30cm
ou
Peso 500g 200g
chamadas variáveis.
15. Escalas:
◦ Uma escala é um esquema para a representação numérica dos
valores de uma variável. Existem 4 tipos:
18. Escala Operações Estrutura Matemática do Estatísticas Exemplos Típicos
Empíricas Básicas Grupo Aplicáveis
(Invariantes)
Nominal Determinação da Grupo de permutações x' = Número de casos, Numeração de
Similitude f (x) onde f (x) modo, jogadores de futebol,
significa qualquer atribuição de número
correlação.
de classes.
substituição de um
elemento por outro
Ordinal Determinação de Grupo isotônico Mediana, Dureza de minerais,
maior ou menor. x' = f (x) onde f (x) significa percentil, correlação qualidade do couro,
qualquer função de ordem (Tipo 0). madeira, etc.
monotônica crescente
De Intervalos Determinação da Grupo linear geral x'= ax+b Média, Temperatura em
igualdade ou das desvio-padrão centígrados ou
diferenças de correlação de ordem Farenheit, energia,
intervalos. (tipo I) correlação de datas do calendário,
produto momento. escores padronizados
em testes de
aptidões.
De Razão Determinação da Grupo da Média geométrica, Longitude, peso,
igualdade de razões semelhança x' = ax coeficiente de resistência etc.,
variação. escala de altura dos
sons, graus de
Transformação de
inclinação.
decibéis.
19. Qualitativas × Quantitativas:
◦ Uma variável é quantitativa quando o resultado da observação é numérica
(representando uma quantidade) e qualitativa quando resulta em uma qualidade
ou atributo.
20. Discretas × Contínuas:
◦ Variáveis discretas são aquelas que assumem valores que podem ser associados aos
números naturais. O conjunto de valores pode ser finito ou infinito enumerável. Surge
naturalmente de contagens. Inclui–se nessa escala as variáveis em que a escala de medidas
consiste de um conjunto de categorias como p.ex. o tipo sanguíneo. Em alguns casos são
chamadas de variáveis categóricas.
◦ Um pequeno dado de seis lados, muito comum em jogos de tabuleiros, ele é o melhor
exemplo para uma Variável Aleatória Discreta Finita. Pois todas as vezes em que lançarmos
o dado, ele sempre nos dará um "valor" inteiro. Não existe a possibilidade que ele caia de
"lado" nos dando um valor surpreendente como 2,5555.
◦ O seu Espaço Amostral é {1,2,3,4,5,6} não havendo nenhum valor intermediário.
◦ Outro exemplo de Variável Aleatória Discreta Infinita, seria o número de carros que chegam
no pedágio, sabemos que virá infinitamente carros, no entanto, nunca chegará a metade de
um carro, não haverá "frações" no numero de carros. O resultado a princípio não é
completamente conhecido, mas sempre Descritível com facilidade.
21. Discretas × Contínuas:
◦ Variáveis contínuas têm conceitualmente um número ilimitado de valores. Basta que o
instrumento de medição tivesse precisão para tal. Na realidade os instrumentos tem precisão
limitada ( discreta ) porém o modelo contínuo é útil na prática.
◦ Uma Variável Aleatória que pode assumir QUALQUER VALOR NUMÉRICO em um
DETERMINADO intervalo ou coleção de intervalos é chamada de variável aleatória contínua.
◦ Imagine nas olimpíadas o lançamento do martelo (podendo ser o disco, lança ou outro), sabemos
de antemão que os valores do lançamento de martelo atingem no máximo a distancia de 60 metros
e a distancia mínima classificatória de 30. Ou seja, todos os lançamentos serão dentro desse
intervalo podendo assumir uma infinidade de possibilidades, pois sempre existirá uma fração para
medir as menor diferença possível entre um lançamento a outro, como 59 metros, 25 centímetros,
12milimetros e assim por diante.
◦ Neste caso x seria uma variável aleatória contínua que assume qualquer valor no intervalo 30
(maior igual a) x (menor ou igual a) 60
22. ◦ Exemplos de Variáveis Quantitativas
Altura em cm
Renda em R$
Peso em kg
Temperatura em ºC
Idade em dias
Tamanho da família em nº pessoas
◦ Exemplos de Variáveis Qualitativas
Temperatura : quente/morno/frio
Velocidade do vento : forte/médio/ fraco
Tipo de clima : quente/temperado/ frio
Notas: A/B/C/D/E
◦ Exemplos de Variáveis Qualitativas Nominais
Cidade de origem
Cor do cabelo
CEP
Partido político
23. Constantes :
Quando uma característica de um objeto pode assumir um único valor, ela é
chamada constante (não variável).
Ex.: Número de horas de um dia , etc...
Notação:
Frequentemente, usam–se letras para indicar variáveis. As letras mais usadas
são as últimas do alfabeto: (u, v, x, y e z).
Usamos índices para distinguir os valores obtidos dos vários objetos em
estudo.
Ex.: Os objetos estudados (1, 2, 3 e 4) apresentaram os seguintes valores nas
variáveis X e Y :
X1 , X2 , X3 , X4 , Y1 , Y2 , Y3 e Y4
X1 : valor que o objeto 1 apresenta na variável X
X2 : valor que o objeto 2 apresenta na variável X
Y4 : valor que o objeto 4 apresenta na variável Y
24. 1. Identifique cada dado abaixo como discreto ou contínuo:
a) Cada cigarro tem 16 ou13 mg de alcatrão
b) O altímetro do avião da TAM indica uma altitude de 21459 pés.
c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes da
revista Terra.
d) O radar indica que Rivaldo bateu a ultima falta a 98,5 km / hora.
e) De 1000 consumidores pesquisados , 930 reconheceram a marca de massas Adria.
f) O tempo total gasto no trânsito por um motorista de São Paulo é de 325 horas.
g) Ao completar um dia de treinamento, Ronaldinho pesava 2,5 Kg à menos que no
início do treino.
h) Preço de um litro de leite .
i) O tipo sanguíneo classificado como 1 para as pessoas que tenham sangue do tipo A.
j) O numero de pessoas da classe que nasceram em Santos.
25. 2. Determine a escala de mensuração mais adequada para cada uma das
variáveis (nominal, ordinal, de intervalo, de relação).
a) Conteúdo de nicotina (em mg) de um cigarro.
b) Numero do CPF dos contribuintes.
c) Temperatura ( em ºC ) de uma amostra de crianças com febre.
d) Graus finais {A, B, C, D, E} para estudantes do 1º grau.
e) Código de Endereçamento Postal de uma rua.
f) Rendas anuais das enfermeiras.
g) Carros classificados como pequeno, médio e grande.
h) Numero de sua conta corrente como um nome para a sua conta.
i) Saldo de sua conta corrente como uma medida da quantidade de dinheiro que você tem.
j) Saldo de sua conta corrente como uma medida de sua riqueza.
k) O numero que você pegou no balcão de uma loja (..., 25, 26, 27, ...) como uma medida do
instante que você chegou, com o propósito de atendimento em uma fila.