1. TIPOS BÁSICOS DE DADOS
Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
2. OBJETIVOS DA AULA
• Descrever os diferentes tipos básicos de dados
• Entender para que cada um destes tipos serve
• Ser capaz de escolher o tipo adequado para uma
determinada necessidade
4. ESCALA NOMINAL
• Você está no supermercado coletando itens em
diferentes seções
• Na medida em que você anda pelos corredores vai
coletando itens nas seções de frutas, verduras, laticínios
e grãos e colocando em seu carrinho
• Uma listagem contendo o nome da seção de cada um
dos itens em seu carrinho utilizaria uma escala nominal
5. ESCALA
NOMINAL
Podemos contar e calcular
percentuais utilizando dados
nominais
!
Não podemos calcular médias
ou outras medidas similares
utilizando dados nominais
9%
18%
27%
45%
Frutas Verduras
Latícinios Grãos
6. ESCALA ORDINAL
• Na hora de pagar pelas compras você decide que
quer sair o mais rápido possível do supermercado
• Sem efetivamente contar, você classifica as filas para
os caixas em pequenas, médias e longas
• Este tipo de classificação permite uma ordenação
natural das categorias, dai o nome de escala ordinal
7. ESCALA ORDINAL
• Questões que solicitam que o participante escolha
uma opção entre “concorda fortemente”, “concorda”,
“neutro" , “discorda" e “discorda fortemente” são
exemplos de coleta de dados ordinais
• Categorias em uma escala ordinal não têm um valor
matemático intrínseco mas podem ser mapeadas em
números para facilitar a análise
9. ESCALA
ORDINAL
Assim como ocorre com dados
nominais, podemos contar dados
ordinais e calcular porcentagens
!
Porém, há uma diferença em
relação ao cálculo de médias e de
outras medidas!
9%
9%
18%
27%
36%
Concorda fortemente
Concorda
Neutro
Discorda
Discorda fortemente
10. ESCALA ORDINAL
• Em algumas áreas de estudo considera-se normal calcular médias entre valores
atribuídos a categorias em uma escala ordinal, desde que:
1. As diferenças entre categorias consecutivas sejam as mesmas
• Exemplo: A diferença entre “Concorda fortemente” e “Concorda" e entre
“Discorda" e “Discorda fortemente” são iguais
2. Sejam utilizados números consecutivos para representar cada categoria
• Em outras áreas essa prática é fortemente desencorajada.
• Importante consultar trabalhos relacionados na área para identificar qual o o seu
posicionamento!
11. ESCALA ORDINAL: EXEMPLO
• O supermercado onde você está tem 30 caixas e você utilizou a
seguinte escala ordinal para classificar as filas de cada um deles:
"Muito longa”, “Longa”, “Média”, “Curta" e “Muito curta”, atribuindo
valores de 1 até 5 para cada categoria respectivamente.
• De acordo com sua classificação existem 5 filas “Muito longas”, 7
filas “Longas”, 5 filas “Médias”, 10 filas “Curtas" e 3 filas “Muito
curtas”
• Qual categoria melhor representa o conjunto de todas as filas do
supermercado?
12. ESCALA DE INTERVALO
• Após finalmente escolher uma das filas para os caixas, você começou a
aguardar sua vez para ser atendido
• Você entrou na fila às 11:15 e agora são 11:30
• Períodos de tempo sãos dados classificados como intervalares,
recebendo esta denominação porque os valores obtidos entre
quaisquer dois pontos consecutivos de medição são sempre iguais
• Uma vez que cada minuto tem exatamente 60 segundos, a diferença
entre 11:15 e 11:30 vale o mesmo que a diferença entre 12:20 e 12:35.
13. ESCALA DE INTERVALO
• Dados intervalares são tipos numéricos, podendo ser utilizados
em qualquer operação matemática
• A principal característica desta escala é não possuir um significado
específico para o valor 0
• O 0 não indica a ausência de algo que você está medindo.
• Um valor 0 para tempo não significa a ausência de tempo
• Um valor 0 para temperatura não significa a ausência de calor
14. ESCALA DE RAZÃO
• Vendo que agora são 11:30 você logo conclui “Já estou na fila há 15
minutos!”
• Quando começamos a pensar no tempo desta maneira passamos a
utilizar dados segundo uma escala de razão e não mais de intervalo
• A escala de razão é muito semelhante à escala de intervalos porém
apresenta uma diferença fundamental: o 0 tem um significado intrínseco!
• 0 minutos, 0 pessoas na fila, 0 produtos no carrinho de compras, etc
• Em todos estes casos o 0 significa a ausência de algo
15. DISCRETO VS CONTÍNUO
• Tanto a escala de intervalos quanto a escala de razão
podem ser compostas por valores contínuos ou discretos
• Uma escala discreta indica que existe um conjunto de
valores específicos para o que se quer medir (geralmente
números inteiros) e nenhum valor entre duas medidas
consecutivas
• Não é possível observar 2 pessoas e meia em uma fila!
16. DISCRETO VS CONTÍNUO
• Uma escala contínua significa que os dados podem assumir
qualquer valor no domínio (mas não qualquer valor!).
• É possível comprar 1,5 KG de queijo ou esperar na fila
por 0,5 horas.
• É impossível comprar uma quantidade negativa de
queijo ou esperar por uma quantidade negativa de
tempo na fila.
18. VARIÁVEL VS DADOS
• Geralmente encontramos na literatura variáveis
descritas como sendo de um determinado tipo de
dado
• É importante considerar que muitas vezes uma
variável pertence a mais de um tipo de dado
• O que geralmente determina o tipo de uma variável é
a forma como os dados são coletados
19. VARIÁVEL VS DADOS
• Considere, por exemplo, a variável idade
• Idade é uma variável comumente associada a uma
escala de razão
• Porém, dependendo do mecanismo de coleta, a
idade pode acabar assumindo uma escala ordinal
• “A que grupo etário você pertence?”
20. VARIÁVEL VS DADOS
• A regra geral é que sempre é possível descer na escalas de
medição mas não é possível subir.
• Se é possível coletar uma variável utilizando uma escala de
intervalo ou razão sempre será possível coletá-la também
com uma escala ordinal ou nominal
• Porém, se uma variável é inerentemente nominal (seção
no supermercado) não é possível coletá-la com escalas
ordinal, de intervalo ou de razão.
21. VARIÁVEL VS DADOS
Variável
Ordinal
Medida Intervalar ou de
Razão correspondente
Exemplo
Classificação Medida na qual a
classificação é baseada
Armazenar o tempo de corrida de
cada maratonista ao invés de sua
posição de chegada
Escala
agrupada
A medida propriamente
dita
Armazenar a idade exata ao invés de
uma faixa etária
Escala
alternativa
Medida original a partir da
qual a escala foi criada
Armazenar as notas exatas das provas
ao invés de conceitos (A, B, etc)
23. DADOS CATEGÓRICOS
• Já vimos que escalas nominais e ordinais são
utilizadas para dividir os dados em categorias
• Alguns autores consideram dados nominais ou
ordinais simplesmente como dados categóricos
24. DADOS QUALITATIVOS E
QUANTITATIVOS
• Dados qualitativos, grosseiramente falando, se referem a
dados não numéricos enquanto que dados quantitativos
se referem a dados numéricos (quantificáveis)
• Certos dados são sempre qualitativos pois requerem
pré-processamento ou diferentes métodos de análise
• Da mesma forma, dados intervales ou de razão são
sempre quantitativos
25. DADOS QUALITATIVOS E
QUANTITATIVOS
• Porém, não há consenso em relação a dados nominais e
ordinais
• Alguns os consideram qualitativos ou vez que suas categorias
representam uma descrição e não são verdadeiramente
numéricas
• Outros os consideram quantitativos uma vez que podem ser
contados e utilizados para calcular porcentagens (e até
mesmo médias)
26. DADOS QUALITATIVOS E
QUANTITATIVOS
• Para evitar confusão, utilizaremos apenas as 4
escalas de medição apresentadas nesta aula ao
longo deste curso.
27. REFERÊNCIAS
• Data + Design: A simple introduction to preparing
an visualizing information, Tina Chiasson et al