2. Muitas vezes vamos utilizar o SPSS para analisar
bases muito grandes. Essas bases devem ter uma
chave, ou em determinados casos, mais de uma
variável que é a chave da base de dados.
A chave será extremamente importante para que
você possa unir sua base com outras que possam
ter mais variáveis que sejam interessante trabalhar.
Sendo assim vamos ver aqui uma maneira simples
de validar a chave de uma base de dados. Ou
seja, vamos rapidamente verificar através da syntax
do SPSS se essa chave é realmente única.
Lincoln T. Neves
Estatística, Marketing e suas aplicações
3. Suponha que sua chave, em uma base
de cliente, seja o CPF de cada cliente.
Você está com a base cadastral, e nela
cada cliente será identificado pelo seu
CPF e junto a essa informação existem
outras dezenas de variáveis sobre cada
um desses clientes.
Com o simples código ao lado será
possível ter certeza de que nessa base
Nesse código não existem números de CPFs repetidos.
vamos usar vários
comandos!
Ou seja, vamos validar a base e ter
certeza de que cada cliente está
realmente aparecendo uma única vez na
base de dados.
Lincoln T. Neves
Estatística, Marketing e suas aplicações
4. Em primeiro lugar é necessário ordenar a base de dados
pela variável chave, que nesse caso será o CPF.
Após isso vamos usar o comando TEMPORARY, que fará o
procedimento sem modificar nossa base principal.
Na sequência iniciamos o comando AGGREGATE. Nele
colocamos um asterisco (*) em OUTFILE, pois indica que a
base que deverá ser analisada já está aberta. Ainda no
AGGREGATE vamos colocar mais um item: o
PRESORTED. Esse indica que a base já está ordenada pela
variável que queremos analisar.
E agora o BREAK, que é nossa variável chave. Após o
BREAK, o que estamos fazendo é criar a variável REP. E
queremos saber nessa variável o número de repetições dos
registros do BREAK, que é o CPF.
Após isso colocamos a função FREQUENCIES para fazer
uma frequência da variável criada, que chamamos de REP.
Lincoln T. Neves
Estatística, Marketing e suas aplicações
5. Resultado das
frequência!
REP
Aparece apenas
1, indicando nesse casos
que existem 1.841.109
CPFs e cada um é único!
Após executar o comando teremos a saída do SPSS (Output)
como a imagem acima.
Lincoln T. Neves
Estatística, Marketing e suas aplicações
6. Surgiu a dúvida? Quer perguntar sobre
outros assuntos?
www.lincolntneves.wordpress/contato
Não perca tempo. Acesse o blog, vá em
contato e mande um email para coluna
Entenda sobre o que você precisa. Fica a
dica!
Ou envie um email direto para
lincoln.ltntreinamentos@gmail.com
Lincoln T. Neves
Estatística, Marketing e suas aplicações