Este documento discute variáveis em estudos científicos. Define variável como qualquer qualidade ou quantidade coletada de indivíduos em uma amostra. Classifica variáveis como dependentes, independentes ou covariáveis de acordo com sua função no estudo. Também distingue variáveis qualitativas e quantitativas e discute a categorização de variáveis.
1. VARIÁVEIS
Kenio Costa Lima
Ao se fazer qualquer tipo de estudo, sempre se parte de uma pergunta ou questão de
pesquisa, baseado, claro, em uma hipótese prévia. É necessário, portanto, testar a
hipótese que estamos propondo.
Para que se teste determinada hipótese ou hipóteses, partimos de algo que possua
uma plausibilidade biológica. Podemos, a partir daí, formular questões de relação
entre duas ou mais coisas, associação entre uma coisa e outra (ou entre várias coisas)
ou, ainda, buscar se há diferença significativa entre grupos em relação a alguma ou
algumas característica(s). Para tanto, faz-se necessário coletar dados da tal ou tais
coisas que estamos tentando relacionar, verificar diferença significativa ou buscar
associação. Esses dados pertencerão, portanto, a indivíduos quaisquer que sejam eles
que compõem uma amostra que foi extraída de uma população.
A essas qualidades ou quantidades coletadas de cada indivíduo chamamos variável,
uma vez que variam para cada um dos indivíduos arrolados para o estudo (Altman e
Bland, 1999). Como bem define Soares e Siqueira em 2001, variável é a quantificação
ou categorização da característica de interesse do estudo. Segundo comentário desses
mesmos autores, em Medicina, o termo parâmetro é usado para denominar uma
variável, o que é desaconselhado.
No campo científico, algumas vezes, coletamos dados referentes a um determinado
evento, composto por diversas variáveis com as quais trabalharemos, como por
exemplo, o evento classe social, composto das variáveis renda, ocupação, escolaridade
dos pais e número de bens duráveis. Nesses casos, o meu evento de interesse contém
as variáveis, cujos dados serão coletados primariamente. Caso seja necessário, após a
coleta de todas as variáveis que são parte do meu evento de interesse, pode-se
produzir uma variável mais geral que traduza o meu evento, a partir de somas,
ponderações ou mera classificação das variáveis primárias.
A ou as variáveis que aferem o meu interesse, ou seja, os desfechos do estudo que
estou propondo são denominados variáveis dependentes, por depender do meu olhar
de investigador sobre elas. São elas que eu estou aferindo de fato. As demais, que
guardam uma relação com as dependentes, mas que não dependem do meu olhar de
pesquisador, são classificadas, quanto à função no plano de análise dos meus dados,
como variáveis independentes. Torna-se óbvio que em muitos estudos haja uma
variável independente de interesse, isto é, a que é sustentada por minha hipótese e
que, de fato, eu estou testando sua relação com a variável dependente. As demais são
também independentes, mas serão classificadas como covariáveis ou variáveis de
2. controle ou confusão e que podem estar diretamente interferindo na relação entre a
minha variável independente de interesse (ou principal) e a dependente.
Seguindo o raciocínio da classificação de variáveis, após ter em mente quais são as
minhas variáveis dependentes e independentes, é de boa norma classificá-las quanto à
natureza dos dados por elas produzidas, ou como eu as coletei.
Para essa classificação as variáveis são divididas em dois grandes grupos, as
qualitativas ou categóricas e as quantitativas. As quantitativas são aquelas que podem
ser mensuradas através de contagens ou de escalas de grandezas variáveis. As que são
fruto de contagens e, portanto, somente assumem números inteiros são denominadas
quantitativas discretas. Aquelas, por outro lado, que assumem valores decimais e são
produto de medidas, são denominadas quantitativas contínuas. As categóricas são
variáveis que apresentam uma qualidade como definição e podem ser nominais ou
ordinais. As variáveis categóricas nominais dizem respeito a qualidades que não
pressupõem uma ordem entre elas e podem ser exaustivas ou mutuamente exclusivas.
As exaustivas produzem categorias nas quais os indivíduos podem estar classificados
em mais de uma delas, diferentemente das mutuamente exclusivas que partem da
premissa que um indivíduo só pode pertencer a uma única categoria.
Diferentemente do que foi enunciado para as qualitativas nominais, as ditas ordinais
possuem uma gradação entre elas, isto é, suas categorias guardam uma ordem, uma
hierarquia. Apesar disso, não se sabe quantas vezes uma categoria é melhor ou pior
que a outra e, portanto, não podem ser feitas operações matemáticas com elas, a
despeito delas serem traduzidas em escores numéricos (na maioria das vezes).
É importante durante a realização do projeto de um determinado estudo, elaborar um
quadro de variáveis, contendo a classificação das suas variáveis quanto à função no
plano de análise, à sua natureza e, ainda, quanto à Epidemiologia, se sócio-
demográficas, sociais, referentes ao estilo de vida, dentre tantas outras possibilidades.
Igualmente, é importante conceituar as variáveis que você propõe estudar, assim
como explicitar as suas categorias para que tenhamos a noção, se forem qualitativas,
de como você aferiu aquela variável, se de forma dicotômica (duas categorias) ou
policotômica (mais de duas categorias).
Acrescentar a esse quadro de variáveis mais duas colunas pode ser útil na confecção
do seu banco de dados. Lembre-se sempre que na maioria dos programas estatísticos
a leitura do seu banco é feita com as variáveis nas colunas e os casos nas linhas. Um
exemplo de variáveis contidas num banco de dados com suas respectivas
identificações e códigos é encontrada a seguir.
3. Quadro 1. Exemplo de variáveis contidas em um banco de dados com suas respectivas
identificações e códigos.
Variáveis Identificação no banco de dados
1) Número de identificação (“ID”)
2) SEXO: códigos
1 = homens; 2 = mulheres
(“SEXO”)
3) IDADE: anos completos (“IDADE”)
4) Idade (anos completos) em que
COMEÇOU A FUMAR
(“INICIO”)
5) Grau de DISPNEIA: códigos
0 = dispnéia após grandes
esforços; 1= dispnéia após
esforços medianos; 2= dispnéia
após pequenos esforços; 3=
dispnéia habitual em repouso
(“DISPNEIA”)
Algumas variáveis quantitativas por nós obtidas primariamente necessitam ser
transformadas e podem passar a qualitativas ordinais ou nominais. Esse processo
denomina-se categorização de uma variável. É óbvio que uma variável qualitativa que
já possui categorias bem distintas também pode ser recategorizada de acordo com o
interesse do estudo e com a própria distribuição dos dados após sua obtenção.
A categorização de uma variável quantitativa pode ser feita a partir de base teórica
que a justifique para seu estudo ou pode ser realizada a partir da própria distribuição
dos seus dados. Pode-se trabalhar com valores acima e abaixo da mediana ou da
média (se os seus dados possuírem distribuição normal) e pode ser necessário, ainda,
transformá-la em uma escala ordinal. Para isso, é de boa norma trabalharmos com
tercis, quartis ou quintis, desde que se busque uma ordem com três, quatro ou cinco
categorias, respectivamente. Caso contrário, estas poderão apenas representar
categorias como se fosse uma variável nominal.
REFERENCIAS BIBLIOGRÁFICAS
1. ALTMAN, D.GG.. BBLLAANNDD,, JJ..MM.. SSttaattiissttiiccss nnootteess:: vvaarriiaabblleess aanndd ppaarraammeetteerrss.. BBMMJJ 11999999;; 331188::
11666677..