SlideShare uma empresa Scribd logo
1 de 7
Entenda SPSS
Verifique repetições em uma
variável chave


                           Lincoln T. Neves
                      Estatística, Marketing e suas aplicações
Muitas vezes vamos utilizar o SPSS para analisar
bases muito grandes. Essas bases devem ter uma
chave, ou em determinados casos, mais de uma
variável que é a chave da base de dados.

A chave será extremamente importante para que
você possa unir sua base com outras que possam
ter mais variáveis que sejam interessante trabalhar.

Sendo assim vamos ver aqui uma maneira simples
de validar a chave de uma base de dados. Ou
seja, vamos rapidamente verificar através da syntax
do SPSS se essa chave é realmente única.




                                                            Lincoln T. Neves
                                                       Estatística, Marketing e suas aplicações
Suponha que sua chave, em uma base
                    de cliente, seja o CPF de cada cliente.

                    Você está com a base cadastral, e nela
                    cada cliente será identificado pelo seu
                    CPF e junto a essa informação existem
                    outras dezenas de variáveis sobre cada
                    um desses clientes.

                    Com o simples código ao lado será
                    possível ter certeza de que nessa base
  Nesse código      não existem números de CPFs repetidos.
vamos usar vários
   comandos!
                    Ou seja, vamos validar a base e ter
                    certeza de que cada cliente está
                    realmente aparecendo uma única vez na
                    base de dados.



                                                   Lincoln T. Neves
                                              Estatística, Marketing e suas aplicações
Em primeiro lugar é necessário ordenar a base de dados
pela variável chave, que nesse caso será o CPF.

Após isso vamos usar o comando TEMPORARY, que fará o
procedimento sem modificar nossa base principal.

Na sequência iniciamos o comando AGGREGATE. Nele
colocamos um asterisco (*) em OUTFILE, pois indica que a
base que deverá ser analisada já está aberta. Ainda no
AGGREGATE vamos colocar mais um item: o
PRESORTED. Esse indica que a base já está ordenada pela
variável que queremos analisar.

E agora o BREAK, que é nossa variável chave. Após o
BREAK, o que estamos fazendo é criar a variável REP. E
queremos saber nessa variável o número de repetições dos
registros do BREAK, que é o CPF.

Após isso colocamos a função FREQUENCIES para fazer
uma frequência da variável criada, que chamamos de REP.

                                               Lincoln T. Neves
                                          Estatística, Marketing e suas aplicações
Resultado das
                                 frequência!



                                     REP




     Aparece apenas
1, indicando nesse casos
 que existem 1.841.109
CPFs e cada um é único!




     Após executar o comando teremos a saída do SPSS (Output)
     como a imagem acima.




                                                              Lincoln T. Neves
                                                         Estatística, Marketing e suas aplicações
Surgiu a dúvida? Quer perguntar sobre
outros assuntos?
                                           www.lincolntneves.wordpress/contato

Não perca tempo. Acesse o blog, vá em
contato e mande um email para coluna
Entenda sobre o que você precisa. Fica a
dica!

Ou envie um email direto para
lincoln.ltntreinamentos@gmail.com




                                                                     Lincoln T. Neves
                                                                Estatística, Marketing e suas aplicações
Lincoln T. Neves
Estatística, Marketing e suas aplicações

Mais conteúdo relacionado

Semelhante a (08) entenda - spss

Qmeeting Pequenos_erros_grandes_problemas_Yuri
Qmeeting Pequenos_erros_grandes_problemas_YuriQmeeting Pequenos_erros_grandes_problemas_Yuri
Qmeeting Pequenos_erros_grandes_problemas_Yuri
Roberto Oliveira
 

Semelhante a (08) entenda - spss (14)

(09) entenda - spss
(09)   entenda - spss(09)   entenda - spss
(09) entenda - spss
 
(03) entenda - spss
(03)   entenda - spss(03)   entenda - spss
(03) entenda - spss
 
Modelagem e Análise de Dados em PPC - Search Masters Brasil 2013
Modelagem e Análise de Dados em PPC - Search Masters Brasil 2013Modelagem e Análise de Dados em PPC - Search Masters Brasil 2013
Modelagem e Análise de Dados em PPC - Search Masters Brasil 2013
 
Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013
 
Qmeeting Pequenos_erros_grandes_problemas_Yuri
Qmeeting Pequenos_erros_grandes_problemas_YuriQmeeting Pequenos_erros_grandes_problemas_Yuri
Qmeeting Pequenos_erros_grandes_problemas_Yuri
 
Inbound Marketing e Copywriting - Projeto Web 2022
Inbound Marketing e Copywriting - Projeto Web 2022Inbound Marketing e Copywriting - Projeto Web 2022
Inbound Marketing e Copywriting - Projeto Web 2022
 
Indicadores para APIs
Indicadores para APIsIndicadores para APIs
Indicadores para APIs
 
Indicadores para APIs
Indicadores para APIsIndicadores para APIs
Indicadores para APIs
 
Marketing por Conteúdo e SEO - Plataformas Digitais - Aulas 26 e 27 de 2020-01
Marketing por Conteúdo e SEO - Plataformas Digitais - Aulas 26 e 27 de 2020-01Marketing por Conteúdo e SEO - Plataformas Digitais - Aulas 26 e 27 de 2020-01
Marketing por Conteúdo e SEO - Plataformas Digitais - Aulas 26 e 27 de 2020-01
 
Apostila Intensivo Python - Desafio 2.pdf
Apostila Intensivo Python - Desafio 2.pdfApostila Intensivo Python - Desafio 2.pdf
Apostila Intensivo Python - Desafio 2.pdf
 
Mitos, (nem tão) verdades (assim) e aplicações de valuation
Mitos, (nem tão) verdades (assim) e aplicações de valuationMitos, (nem tão) verdades (assim) e aplicações de valuation
Mitos, (nem tão) verdades (assim) e aplicações de valuation
 
2832014 curso plsql
2832014 curso plsql2832014 curso plsql
2832014 curso plsql
 
Como pensar campanhas sem ter muito dinheiro para investir em em mídia
Como pensar campanhas sem ter muito dinheiro para investir em em mídiaComo pensar campanhas sem ter muito dinheiro para investir em em mídia
Como pensar campanhas sem ter muito dinheiro para investir em em mídia
 
BIMachine Training - Gerenciando seus Indicadores com o recurso de KPIs
BIMachine Training - Gerenciando seus Indicadores com o recurso de KPIsBIMachine Training - Gerenciando seus Indicadores com o recurso de KPIs
BIMachine Training - Gerenciando seus Indicadores com o recurso de KPIs
 

(08) entenda - spss

  • 1. Entenda SPSS Verifique repetições em uma variável chave Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 2. Muitas vezes vamos utilizar o SPSS para analisar bases muito grandes. Essas bases devem ter uma chave, ou em determinados casos, mais de uma variável que é a chave da base de dados. A chave será extremamente importante para que você possa unir sua base com outras que possam ter mais variáveis que sejam interessante trabalhar. Sendo assim vamos ver aqui uma maneira simples de validar a chave de uma base de dados. Ou seja, vamos rapidamente verificar através da syntax do SPSS se essa chave é realmente única. Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 3. Suponha que sua chave, em uma base de cliente, seja o CPF de cada cliente. Você está com a base cadastral, e nela cada cliente será identificado pelo seu CPF e junto a essa informação existem outras dezenas de variáveis sobre cada um desses clientes. Com o simples código ao lado será possível ter certeza de que nessa base Nesse código não existem números de CPFs repetidos. vamos usar vários comandos! Ou seja, vamos validar a base e ter certeza de que cada cliente está realmente aparecendo uma única vez na base de dados. Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 4. Em primeiro lugar é necessário ordenar a base de dados pela variável chave, que nesse caso será o CPF. Após isso vamos usar o comando TEMPORARY, que fará o procedimento sem modificar nossa base principal. Na sequência iniciamos o comando AGGREGATE. Nele colocamos um asterisco (*) em OUTFILE, pois indica que a base que deverá ser analisada já está aberta. Ainda no AGGREGATE vamos colocar mais um item: o PRESORTED. Esse indica que a base já está ordenada pela variável que queremos analisar. E agora o BREAK, que é nossa variável chave. Após o BREAK, o que estamos fazendo é criar a variável REP. E queremos saber nessa variável o número de repetições dos registros do BREAK, que é o CPF. Após isso colocamos a função FREQUENCIES para fazer uma frequência da variável criada, que chamamos de REP. Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 5. Resultado das frequência! REP Aparece apenas 1, indicando nesse casos que existem 1.841.109 CPFs e cada um é único! Após executar o comando teremos a saída do SPSS (Output) como a imagem acima. Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 6. Surgiu a dúvida? Quer perguntar sobre outros assuntos? www.lincolntneves.wordpress/contato Não perca tempo. Acesse o blog, vá em contato e mande um email para coluna Entenda sobre o que você precisa. Fica a dica! Ou envie um email direto para lincoln.ltntreinamentos@gmail.com Lincoln T. Neves Estatística, Marketing e suas aplicações
  • 7. Lincoln T. Neves Estatística, Marketing e suas aplicações