An´alise de correspondˆencia multivariada entre tipo de crime e
bairro de residˆencia de detentos em Santar´em-Pa
Marina R...
vari´avel disposta nas linhas e n´ıveis da vari´avel disposta nas colunas. Para realizar tal verifica¸c˜ao
utilizam-se test...
pij =
nij
n
, sendo que nij denota uma casela da tabela de contingˆencia e n o total de todas as
caselas.
Considere tamb´e...
segunda 11,8%. O valor da estat´ıstica qui-quadrado obtido foi significativo ao n´ıvel de 5%, pois
χ2
= 344(0, 471322) = 16...
A an´alise gr´afica permitiu identificar maior rela¸c˜ao entre tipos de crime e bairros de residˆencia
dos detentos, permiti...
Próximos SlideShares
Carregando em…5
×

Análise de correspondência multivariada entre tipo de crime e bairro de residência de detentos em Santarém-Pa

167 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
167
No SlideShare
0
A partir de incorporações
0
Número de incorporações
19
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análise de correspondência multivariada entre tipo de crime e bairro de residência de detentos em Santarém-Pa

  1. 1. An´alise de correspondˆencia multivariada entre tipo de crime e bairro de residˆencia de detentos em Santar´em-Pa Marina Rodrigues Maestre - ESALQ/USP1 2 Renata Alcarde - ESALQ/USP3 Edilan de Sant’Ana Quaresma - ESALQ/USP1 Simone Daniela Sartorio - ESALQ/USP1 Sˆonia Maria De Stefano Piedade - ESALQ/USP Jarsen Luis Castro Guimar˜aes - NAEA/UFPA Resumo: O presente trabalho teve como objetivo verificar se os tipos de crime (crime contra a vida, crime contra o patrimˆonio, crime contra os costumes e tr´afico de entorpecentes) est˜ao rela- cionados com os bairros de residˆencia de seus respectivos autores (bairro central, bairro perif´erico e bairros de outras cidades). Para tanto, 344 detentos da Penitenciaria Agr´ıcola S´ılvio Hall de Moura, situada no munic´ıpio de Santar´em, estado do Par´a, responderam question´arios sobre sua condi¸c˜ao s´ocio-econˆomica e sobre o crime cometido. Para estudar a dependˆencia entre as vari´aveis de interesse, utilizou-se o teste qui-quadrado, por meio do qual pˆode-se concluir que as vari´aveis estudadas s˜ao correlacionadas. Para verificar quais n´ıveis das vari´aveis tˆem maior rela¸c˜ao utilizou-se a t´ecnica multivariada de an´alise de correspondˆencia, que decomp˜oe a matriz de propor¸c˜oes, oriunda da tabela de contingˆencia, em valores singulares, os quais d˜ao origem `as coordenadas principais das linhas e das colunas da tabela. Estas coordenadas s˜ao representadas num gr´afico de correspondˆencia. Palavras-chave: Criminalidade, Fatores Sociais, T´ecnica Multivariada, An´alise de Corres- pondˆencia. 1 Introdu¸c˜ao A criminalidade ´e um grave problema da sociedade brasileira, em particular, no munic´ıpio de Santar´em, no Oeste paraense, esse ´ındice aumentou 134,52% entre 1999 e 2004, de acordo com dados da Pol´ıcia Civil do Par´a4. Por esse motivo, alguns professores da Universidade Federal do Par´a (UFPA) decidiram estudar, junto a detentos condenados, o relacionamento entre fatores s´ocio-econˆomicos, tais como, grau de instru¸c˜ao, rendas familiar, per-capita e individual, bairro onde reside, e diferentes tipos de crime. Informa¸c˜oes dessa natureza, ou seja, vari´aveis categ´oricas, podem dar origem `as tabelas de contingˆencia. Um dos principais interesses est´a em verificar a associa¸c˜ao entre n´ıveis da 1 Agradecimento a CAPES apoio financeiro 2 Contato: ninamaestre@yahoo.com.br 3 Agradecimento ao CNPq apoio financeiro 4 http://www.ufpa.br/beiradorio/arquivo/beira64/noticias/rep7.html
  2. 2. vari´avel disposta nas linhas e n´ıveis da vari´avel disposta nas colunas. Para realizar tal verifica¸c˜ao utilizam-se testes como qui-quadrado (MINGOTI, 2005). Uma outra abordagem para se verificar essa associa¸c˜ao ´e a an´alise de correspondˆencia, que pode ser considerada como um caso especial da an´alise de componentes principais (SARTORIO, 2008). De acordo com Greenacre e Hastie (1987), a an´alise de correspondˆencia ´e uma t´ecnica explorat´oria multivariada, que converte uma matriz de dados n˜ao negativos em um gr´afico. Neste as linhas e as colunas da matriz s˜ao representadas por pontos, ou seja, permite a an´alise de tabelas de dupla entrada ou tabelas de m´ultiplas entradas, levando em conta algumas medidas de correspondˆencia entre linhas e colunas. Ao contr´ario do teste qui-quadrado, a an´alise de correspondˆencia indica como as vari´aveis dis- postas em linhas e colunas est˜ao relacionadas e n˜ao somente se existe rela¸c˜ao (CZERMAINSKI, 2004). O objetivo deste trabalho ´e verificar a rela¸c˜ao existente entre o bairro em que o detento residia e o tipo de crime cometido, para isso utilizou-se o teste qui-quadrado e an´alise gr´afica, por meio da an´alise de correspondˆencia. Para a an´alise foi utilizado o software R (2011). 2 Material e M´etodos Os dados analisados neste trabalho (Tabela 1) foram coletados junto `a Penitenciaria Agr´ıcola S´ılvio Hall de Moura, situada no munic´ıpio de Santar´em, estado do Par´a. Estes foram obtidos no per´ıodo de novembro de 2004 `a abril de 2005, sendo que 344 detentos responderam a question´arios sobre sua condi¸c˜ao social no ato do crime. As vari´aveis de interesse foram tipo de crime cometido e bairro de residˆencia do detento, no ato do crime. Os crimes foram classificados em quatro categorias: crime contra a vida (Crime 1); crime contra o patrimˆonio (Crime 2); crime contra os costumes (Crime 3); e tr´afico de entorpecentes (Crime 4). Analogamente, os bairros foram discriminados em trˆes categorias: bairro central (Bairro 1), bairro perif´erico (Bairro 2); e bairros de outras cidades (Bairro 3). Tabela 1: Tabela de contingˆencia dos dados de criminalidade Bairro Residente Total Crime Centro Periferia Outros (Crime) Vida 2 71 72 145 Patrimˆonio 3 69 42 114 Costumes 2 19 17 38 Entorpecente 11 21 15 47 Total (Bairro) 18 180 146 344 2.1 An´alise de correspondˆencia A an´alise de correspondˆencia ´e realizada a partir de uma tabela de contingˆencia. Desta maneira, seja P uma matriz de dimens˜ao p × q, obtida desta tabela, em que p ´e o n´umero de linhas e q o n´umero de colunas. Considere seus elementos como as respectivas propor¸c˜oes
  3. 3. pij = nij n , sendo que nij denota uma casela da tabela de contingˆencia e n o total de todas as caselas. Considere tamb´em, P = P − rc′, com posto k = min(p − 1, q − 1), tal que r′ = ( n1· n n2· n . . . np· n ) e c′ = ( n·1 n n·2 n . . . n·p n ) . A matriz diagonal formada pelos elementos em r′ ´e denominada Matriz de perfil de linhas (Dr), e a matriz diagonal formada pelos elementos em c′ ´e denominada Matriz perfil de colunas (Dc). A matriz P pode ser decomposta em seus autovalores e autovetores, obtendo-se Pp×q = AΛB′ , em que, A = D 1 2 r Up×k, B = D 1 2 c Vq×k, sendo U e V matrizes ortogonais contendo os autovetores das matrizes PP′ e P′P, respectivamente. A matriz diagonal Λ tem dimens˜ao k ×k e ´e formada pelos autovalores de P. Logo, a matriz P pode ser reescrita em fun¸c˜ao dos autovalores e das coordenadas principais, tal que P = P − rc′ = k∑ i=1 ˆλiaib′ i, em que, ai e bi s˜ao, respectivamente, as i-´esimas colunas das matrizes A e B. Portanto, as coordenadas principais das linhas podem ser descritas como: Yp×k = D−1 r Ap×kΛk×k, e as coordenadas principais das colunas por Zq×k = D−1 c Bq×kΛk×k. As duas primeiras coordenadas principais das linhas e das colunas s˜ao as mais representativas, em termos da associa¸c˜ao total existente entre as vari´aveis X e Y . Essas est˜ao relacionadas aos maiores autovalores da matriz P. A varia¸c˜ao total no sistema, denominada in´ercia total, ´e dada por ∑k i=1 λ2 i e est´a relacionada com a estat´ıstica qui-quadrado. Desse modo, pode-se verificar a independˆencia entre as vari´aveis presentes nas linhas e nas colunas. A associa¸c˜ao entre as linhas e as colunas pode ser representada em um gr´afico denominado gr´afico de correspondˆencia. 3 Resultados e discuss˜ao Utilizando os dados das vari´aveis tipo de crime cometido e o bairro onde o detento residia, apresentados na Tabela 1, foram obtidos os autovalores 0,415649 e 0,055673, totalizando uma in´ercia de 0,471322. A primeira coordenada principal representa uma contribui¸c˜ao de 88,2% da in´ercia total e a
  4. 4. segunda 11,8%. O valor da estat´ıstica qui-quadrado obtido foi significativo ao n´ıvel de 5%, pois χ2 = 344(0, 471322) = 162, 1348 > χ2 (6) = 12, 59159, indicando existir associa¸c˜ao entre o tipo de crime cometido e o bairro onde o detento residia. Nas Tabelas 2 e 3 s˜ao apresentadas as duas coordenadas principais das vari´aveis crime (linhas) e bairro (colunas), respectivamente. Tabela 2: Coordenadas principais das linhas Coordenadas principais Perfil dos Crimes 1(Y1) 2(Y2) Crime 1 -0,894 -0,069 Crime 2 0,225 -0,229 Crime 3 0,756 0,164 Crime 4 -0,570 0,511 Tabela 3: Coordenadas principais das colunas Coordenadas principais Perfil dos Bairros 1(Z1) 2(Z2) Bairro 1 0,702 -0,088 Bairro 2 -0,723 -0,139 Bairro 3 -0,131 0,491 Por meio da Figura 1, pˆode-se observar que os n´ıveis das vari´aveis mais correlacionados foram: Crime contra a vida (c1) e o bairro da periferia (b2); tr´afico de entorpecentes (c4) com bairros de outras cidades (b3); o bairro central (b1) est´a relacionado tanto com o crime contra o patrimˆonio (c2), quanto com o crime contra os costumes (c3). −0.5 0.0 0.5 −0.6−0.4−0.20.00.20.40.60.8 c1 c2 c3 c4 b1 b2 b3 Figura 1: Gr´afico de correspondˆencia
  5. 5. A an´alise gr´afica permitiu identificar maior rela¸c˜ao entre tipos de crime e bairros de residˆencia dos detentos, permitindo `as autoridades de seguran¸ca p´ublica implementar a¸c˜oes direcionadas aos bairros, que minimizem a ocorrˆencia dos delitos naqueles lugares. 4 Conclus˜ao A t´ecnica multivariada, por meio da an´alise de correspondˆencia, mostrou-se muito eficiente para analisar dados de criminalidade no munic´ıpio de Santar´em-Pa, indicando maiores asso- cia¸c˜oes entre os diferentes tipos de crime e o bairro de residˆencia do detento. A realidade de centros urbanos justifica tais associa¸c˜oes pelas caracter´ısticas inerentes ao espa¸co onde a pesquisa foi realizada. Assim, flagrantes de tr´afico de entorpecentes, por exemplo, ocorrem com mais frequˆencia no trajeto entre munic´ıpios, caracterizado por bairros de outras cidades. Analogamente, crimes contra a vida ocorrem, historicamente, em bairros perif´ericos, onde se concentram maior n´umero de bares, casas noturnas e locais com deficiente saneamento urbano. Referˆencias [1] CZERMAINSKI, A.B.C., An´alise de correspondˆencia, Piracicaba, jul 2004. Semin´ario apresentado na disciplina An´alise Multivariada. [2] GREENACRE, M.; HASTIE, T., The Geometric Interpretation of Correspondence Analysis, Journal of the American Statistical Association, v. 82, p. 437-447, 1987. [3] LOPES, S., Pesquisa mostra causas da criminalidade. Dispon´ıvel em: <http://www.ufpa.br/beiradorio/arquivo/beira64/noticias/rep7.html>. Acesso em: 1 abr. 2011. [4] MINGOTI, S.A., An´alise de dados atrav´es de m´etodos de estat´ıstica multivariada, Belo Horizonte: UFMG, 2005. [5] R Development Core Team (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org/. [6] SARTORIO, S.D., Aplica¸c˜oes de t´ecnicas de an´alise multivariada em experimentos agropecu´arios usando o software R. 2008. 131p., Disserta¸c˜ao (Mestrado em Agronomia: Estat´ıstica e Experimenta¸c˜ao Agronˆomica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de S˜ao Paulo, Piracicaba, 2008.

×