Aula 2 resumo de dados

15.780 visualizações

Publicada em

0 comentários
4 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
15.780
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
136
Comentários
0
Gostaram
4
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Aula 2 resumo de dados

  1. 1. Aula 2 Resumo de Dados Profa. Dra. Juliana Garcia Cespedes Dep. de Matemática e Computação UNIFEI - Itajubá
  2. 2. Problema Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos de uma empresa. Para isso, ele colheu seis informações sobre os 36 empregados: 1. Estado civil; 2. Grau de instrução; 3. Número de filhos; 4. Salário; 5. Idade; 6. Região de procedência.
  3. 3. Dados
  4. 4. Tipos de variáveis • Cada informação em estudo chama-se VARIÁVEL. • Para representar cada uma das variáveis em estudo atribui-se uma letra maiúscula, por exemplo, a letra X, para identificá-las. Variável Representação Estado civil X Grau de instrução Y Número de filhos Z Salário S Idade U Região de procedência V
  5. 5. Tipos de variáveis • As VARIÁVEIS são classificadas de acordo com o seu conteúdo e para cada tipo existe um tratamento estatístico diferente. Nominal Qualitativa Ordinal Variável Discreta Quantitativa Contínua
  6. 6. Tipos de variáveis • VARIÁVEL QUALITATIVA: – Apresentam como possíveis realizações uma qualidade (ou atributo) do indivíduo pesquisado, exemplo, sexo, educação, estado civil, etc. • Nominal: não existe nenhuma ordenação nas possíveis realizações. (sexo, estado civil) • Ordinal: existe uma ordem nos seus resultados. (educação, classe social) • VARIÁVEL QUANTITATIVA: – Apresentam como possíveis realizações números resultantes de uma contagem ou mensuração, exemplo, número de filhos, salário, idade, etc. • Discreta: os valores pertencem a um conjunto finito ou enumerável de números. (número de filhos) • Contínua: os valores pertencem a um intervalo de números reais. (peso, altura)
  7. 7. Tipos de variáveis • Classifique as variáveis da pesquisa socioeconômica: 1. Estado civil; 2. Grau de instrução; 3. Número de filhos; 4. Salário; 5. Idade; 6. Região de procedência.
  8. 8. Distribuição de frequências • Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. • É fácil analisar as variáveis, conhecer o seu comportamento, utilizando a Tabela 1?
  9. 9. Dados
  10. 10. Distribuição de frequências • Podemos resumir as informações contidas na Tabela 1 construindo tabelas de frequências para cada uma das variáveis pesquisadas. • Uma tabela de frequências possui informações sobre o número de pesquisados, a porcentagem, a proporção e a proporção acumulada de cada classe da variável analisada.
  11. 11. Distribuição de frequências • Tabela de frequências da variável grau de instrução: Grau de Frequência Frequência Frequência Porcentagem instrução relativa acumulada fi fri fai 100 fri Fundamental 12 12/36 =0,333 0,333 33,3% Médio 18 18/36 =0,500 0,833 50,0% Superior 6 6/36 =0,167 1,000 16,7% Total 36 36/36 =1,000 100%
  12. 12. Distribuição de frequências • Observando os resultados da segunda coluna, vê- se que dos 36 empregados da companhia, 12 têm ensino fundamental, 18 ensino médio e 6 possuem curso superior. • A frequência relativa e a porcentagem são bastante úteis quando decide-se comparar o resultado de pesquisas distintas, por exemplo, quando deseja-se pesquisar o total de empregados da companhia. • A frequência acumulada é utilizada para verificar onde encontra-se a maior parte da população pesquisada.
  13. 13. Distribuição de frequências • Construa a tabela de frequências para as variáveis estado civil, número de filhos e região de procedência :
  14. 14. Distribuição de frequências • Quando a variável é contínua, a construção da tabela de frequências exige certo cuidado. • Se indicarmos cada classe que aparece na variável salário em uma tabela de frequências, não resumiremos as 36 observações num grupo menor, pois não existem observações iguais. • A solução é agrupar os dados por faixas de salário.
  15. 15. Distribuição de frequências • Tabela de frequências dos salários dos empregados Classe de Frequência Frequência Frequência Porcentagem salários relativa acumulada fi fri fai 100 fi [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100%
  16. 16. Distribuição de frequências • Procedendo deste modo, perde-se alguma informação. Por exemplo, não sabemos quais são os oito salários da classe de 12 a 16, a não ser que investigamos a tabela original. • Uma forma de interpretação é dizer que todos os oito salários são iguais ao ponto médio, 14. • Sugere-se entre 5 a 15 classes da mesma amplitude.
  17. 17. Tabela de frequências conjunta • É muito comum estarmos interessados no comportamento conjunto de várias variáveis. • Por exemplo, uma pesquisa é feita entre alunos do primeiro ano da faculdade e perguntou-se aos alunos se trabalhavam (variável X) e o número de vestibulares prestados (variável Y). X não sim não não não sim sim não sim sim Y 1 1 2 1 1 2 3 1 1 1 X não não sim não sim não não não sim não Y 2 2 1 3 2 2 2 1 3 2
  18. 18. • Os dados são resumidos em tabelas de dupla entrada ( ou contingência). • Cada elemento do corpo da tabela dá a frequência observada das realizações simultâneas das duas variáveis.
  19. 19. • A variável X apresente somente dois valores, sim e não, que representaremos por sim e não. a variável Y apresenta valores inteiros 1,2 ou 3. • Podemos escrever a tabela de frequências conjunta de X e Y: (X,Y) Frequência Tabela de frequência marginal de X (sim,1) 4 XY 1 2 3 Total (sim,2) 2 sim 4 2 2 8 (sim,3) 2 nao 5 6 1 12 (nao,1) 5 (nao,2) 6 Total 9 8 3 20 (nao,3) 1 Total 20 Tabela de frequência marginal de Y
  20. 20. • Tabelas de frequências marginal ou individual X freq Y 1 2 3 Total sim 8 freq 9 8 3 20 nao 12 Total 20
  21. 21. Exercício • Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência. Fundamental Médio Superior Total proc. Capital 4 5 2 11 Interior 3 7 2 12 Outra 5 6 2 13 Total grau 12 18 6 36
  22. 22. Gráficos para variáveis qualitativas • Existem vários gráficos para representar variáveis qualitativas, os mais usados são: gráfico em barras e composição em setores, “pizza”. GRÁFICO EM BARRAS Consiste em construir retângulos ou barras, em que uma das dimensões é proporcional á magnitude a ser representada (frequência absoluta ou relativa) e a outra igual para todas as barras.
  23. 23. Gráficos para variáveis qualitativas 60% Superior 50% 40% Médio 30% 20% Fundamental 10% 0% Fundamental Médio Superior 0 5 10 15 20
  24. 24. Gráficos para variáveis qualitativas COMPOSIÇÃO EM SETORES Representa a composição, geralmente em porcentagem, de partes de um todo. Consiste de um círculo de raio arbitrário, dividido em setores, que correspondem às partes de maneira proporcional 6; 16,7% 12; 33,3% Fundamental Médio Superior 18; 50%
  25. 25. Gráficos para variáveis quantitativas Considera-se mais representações gráficas para variáveis quantitativas, tais como, gráfico de dispersão, ramo e folhas, histograma. GRÁFICOS DE DISPERSÃO UNIDIMENSIONAL 1) Valores representados por pontos ao longo da reta, valores repetidos são acompanhados de um número que indica as repetições; 2) Os pontos repetidos são empilhados um em cima do outro.
  26. 26. Gráficos para variáveis quantitativas 8 7 6 5 4 3 2 4 5 7 3 1 0 0 2 4 6 0 1 2 3 4 5 6
  27. 27. Gráficos para variáveis quantitativas HISTOGRAMA Gráfico de barras contínuas, com as bases proporcionais aos intervalos das classes e a área de cada retângulo proporcional à respectiva frequência. Pode-se considerar tanto a freq. absoluta como a relativa. Para que a área do retângulo seja proporcional a fi, a sua altura deve ser proporcional a fi/i, em que i representa a amplitude do i-ésimo intervalo.
  28. 28. Gráficos para variáveis quantitativas
  29. 29. Ramo e folhas • Tanto o histograma como os gráficos em barras dão uma idéia da forma da distribuição. • Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de obter uma idéia da forma de sua distribuição é o ramo e folhas. A vantagem é que não perde-se a informação sobre os dados.
  30. 30. • Não existe uma regra fixa para construir o gráfico, a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita. Para a variável salários as observações 4,00 e 4,56, o ramo é o 4 e 00 e 56 são as folhas.
  31. 31. 4 00 56 5 25 73 6 26 66 86 7 39 44 59 8 12 46 74 95 9 13 35 77 80 10 53 76 11 06 59 12 00 79 13 23 60 85 14 69 71 15 99 16 22 61 17 26 18 75 19 40 20 21 22 23 30
  32. 32. Exercício • Construa a tabela de frequências para as variáveis e represente-as graficamente: Estado Civil, Região de Procedência, Salário e Idade. • Construa a tabela de frequências conjunta para as variáveis grau de instrução e região de procedência e também para estado civil e número de filhos.

×