Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

1.097 visualizações

Publicada em

Material de aulas da disciplina "Introdução à Análise da Dados" do Centro de Informática da UFPB.

Assunto: Tipos Básicos de Dados

Publicada em: Educação
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.097
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
64
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

  1. 1. TIPOS BÁSICOS DE DADOS Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
  2. 2. OBJETIVOS DA AULA • Descrever os diferentes tipos básicos de dados • Entender para que cada um destes tipos serve • Ser capaz de escolher o tipo adequado para uma determinada necessidade
  3. 3. ESCALAS DE MEDIÇÃO • Nominal • Ordinal • Intervalo • Razão
  4. 4. ESCALA NOMINAL • Você está no supermercado coletando itens em diferentes seções • Na medida em que você anda pelos corredores vai coletando itens nas seções de frutas, verduras, laticínios e grãos e colocando em seu carrinho • Uma listagem contendo o nome da seção de cada um dos itens em seu carrinho utilizaria uma escala nominal
  5. 5. ESCALA NOMINAL Podemos contar e calcular percentuais utilizando dados nominais ! Não podemos calcular médias ou outras medidas similares utilizando dados nominais 9% 18% 27% 45% Frutas Verduras Latícinios Grãos
  6. 6. ESCALA ORDINAL • Na hora de pagar pelas compras você decide que quer sair o mais rápido possível do supermercado • Sem efetivamente contar, você classifica as filas para os caixas em pequenas, médias e longas • Este tipo de classificação permite uma ordenação natural das categorias, dai o nome de escala ordinal
  7. 7. ESCALA ORDINAL • Questões que solicitam que o participante escolha uma opção entre “concorda fortemente”, “concorda”, “neutro" , “discorda" e “discorda fortemente” são exemplos de coleta de dados ordinais • Categorias em uma escala ordinal não têm um valor matemático intrínseco mas podem ser mapeadas em números para facilitar a análise
  8. 8. ESCALA ORDINAL 1 Concorda fortemente 3 Concorda 2 Neutro 5 Discorda 4 Discorda fortemente 1 Concorda fortemente 2 Concorda 3 Neutro 4 Discorda 5 Discorda fortemente 5 Concorda fortemente 4 Concorda 3 Neutro 2 Discorda 1 Discorda fortemente
  9. 9. ESCALA ORDINAL Assim como ocorre com dados nominais, podemos contar dados ordinais e calcular porcentagens ! Porém, há uma diferença em relação ao cálculo de médias e de outras medidas! 9% 9% 18% 27% 36% Concorda fortemente Concorda Neutro Discorda Discorda fortemente
  10. 10. ESCALA ORDINAL • Em algumas áreas de estudo considera-se normal calcular médias entre valores atribuídos a categorias em uma escala ordinal, desde que: 1. As diferenças entre categorias consecutivas sejam as mesmas • Exemplo: A diferença entre “Concorda fortemente” e “Concorda" e entre “Discorda" e “Discorda fortemente” são iguais 2. Sejam utilizados números consecutivos para representar cada categoria • Em outras áreas essa prática é fortemente desencorajada. • Importante consultar trabalhos relacionados na área para identificar qual o o seu posicionamento!
  11. 11. ESCALA ORDINAL: EXEMPLO • O supermercado onde você está tem 30 caixas e você utilizou a seguinte escala ordinal para classificar as filas de cada um deles: "Muito longa”, “Longa”, “Média”, “Curta" e “Muito curta”, atribuindo valores de 1 até 5 para cada categoria respectivamente. • De acordo com sua classificação existem 5 filas “Muito longas”, 7 filas “Longas”, 5 filas “Médias”, 10 filas “Curtas" e 3 filas “Muito curtas” • Qual categoria melhor representa o conjunto de todas as filas do supermercado?
  12. 12. ESCALA DE INTERVALO • Após finalmente escolher uma das filas para os caixas, você começou a aguardar sua vez para ser atendido • Você entrou na fila às 11:15 e agora são 11:30 • Períodos de tempo sãos dados classificados como intervalares, recebendo esta denominação porque os valores obtidos entre quaisquer dois pontos consecutivos de medição são sempre iguais • Uma vez que cada minuto tem exatamente 60 segundos, a diferença entre 11:15 e 11:30 vale o mesmo que a diferença entre 12:20 e 12:35.
  13. 13. ESCALA DE INTERVALO • Dados intervalares são tipos numéricos, podendo ser utilizados em qualquer operação matemática • A principal característica desta escala é não possuir um significado específico para o valor 0 • O 0 não indica a ausência de algo que você está medindo. • Um valor 0 para tempo não significa a ausência de tempo • Um valor 0 para temperatura não significa a ausência de calor
  14. 14. ESCALA DE RAZÃO • Vendo que agora são 11:30 você logo conclui “Já estou na fila há 15 minutos!” • Quando começamos a pensar no tempo desta maneira passamos a utilizar dados segundo uma escala de razão e não mais de intervalo • A escala de razão é muito semelhante à escala de intervalos porém apresenta uma diferença fundamental: o 0 tem um significado intrínseco! • 0 minutos, 0 pessoas na fila, 0 produtos no carrinho de compras, etc • Em todos estes casos o 0 significa a ausência de algo
  15. 15. DISCRETO VS CONTÍNUO • Tanto a escala de intervalos quanto a escala de razão podem ser compostas por valores contínuos ou discretos • Uma escala discreta indica que existe um conjunto de valores específicos para o que se quer medir (geralmente números inteiros) e nenhum valor entre duas medidas consecutivas • Não é possível observar 2 pessoas e meia em uma fila!
  16. 16. DISCRETO VS CONTÍNUO • Uma escala contínua significa que os dados podem assumir qualquer valor no domínio (mas não qualquer valor!). • É possível comprar 1,5 KG de queijo ou esperar na fila por 0,5 horas. • É impossível comprar uma quantidade negativa de queijo ou esperar por uma quantidade negativa de tempo na fila.
  17. 17. RESUMINDO Item Seção Corredo r Quantidade Preco (R$) Laranja (KG) Frutas 4 2 6.60 Maçã (KG) Frutas 4 1 4.50 Queijo (KG) Laticínios 7 1.5 9.90 Leite (LT) Laticínios 7 2 4.50 Feijão (KG) Grãos 8 3 3.89 Pimentão (KG) Verduras 15 0.5 2.99 Arroz (KG) Grãos 8 2 3.12 Cebola (KG) Verduras 15 1 8.90 Cenoura (KG) Verduras 15 0.7 7.10
  18. 18. VARIÁVEL VS DADOS • Geralmente encontramos na literatura variáveis descritas como sendo de um determinado tipo de dado • É importante considerar que muitas vezes uma variável pertence a mais de um tipo de dado • O que geralmente determina o tipo de uma variável é a forma como os dados são coletados
  19. 19. VARIÁVEL VS DADOS • Considere, por exemplo, a variável idade • Idade é uma variável comumente associada a uma escala de razão • Porém, dependendo do mecanismo de coleta, a idade pode acabar assumindo uma escala ordinal • “A que grupo etário você pertence?”
  20. 20. VARIÁVEL VS DADOS • A regra geral é que sempre é possível descer na escalas de medição mas não é possível subir. • Se é possível coletar uma variável utilizando uma escala de intervalo ou razão sempre será possível coletá-la também com uma escala ordinal ou nominal • Porém, se uma variável é inerentemente nominal (seção no supermercado) não é possível coletá-la com escalas ordinal, de intervalo ou de razão.
  21. 21. VARIÁVEL VS DADOS Variável Ordinal Medida Intervalar ou de Razão correspondente Exemplo Classificação Medida na qual a classificação é baseada Armazenar o tempo de corrida de cada maratonista ao invés de sua posição de chegada Escala agrupada A medida propriamente dita Armazenar a idade exata ao invés de uma faixa etária Escala alternativa Medida original a partir da qual a escala foi criada Armazenar as notas exatas das provas ao invés de conceitos (A, B, etc)
  22. 22. “Você pode descer, mas não pode subir.” – Alexandre Duarte
  23. 23. DADOS CATEGÓRICOS • Já vimos que escalas nominais e ordinais são utilizadas para dividir os dados em categorias • Alguns autores consideram dados nominais ou ordinais simplesmente como dados categóricos
  24. 24. DADOS QUALITATIVOS E QUANTITATIVOS • Dados qualitativos, grosseiramente falando, se referem a dados não numéricos enquanto que dados quantitativos se referem a dados numéricos (quantificáveis) • Certos dados são sempre qualitativos pois requerem pré-processamento ou diferentes métodos de análise • Da mesma forma, dados intervales ou de razão são sempre quantitativos
  25. 25. DADOS QUALITATIVOS E QUANTITATIVOS • Porém, não há consenso em relação a dados nominais e ordinais • Alguns os consideram qualitativos ou vez que suas categorias representam uma descrição e não são verdadeiramente numéricas • Outros os consideram quantitativos uma vez que podem ser contados e utilizados para calcular porcentagens (e até mesmo médias)
  26. 26. DADOS QUALITATIVOS E QUANTITATIVOS • Para evitar confusão, utilizaremos apenas as 4 escalas de medição apresentadas nesta aula ao longo deste curso.
  27. 27. REFERÊNCIAS • Data + Design: A simple introduction to preparing an visualizing information, Tina Chiasson et al

×