Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Análise de correspondência entre crime e bairro de detentos
1. An´alise de correspondˆencia multivariada entre tipo de crime e
bairro de residˆencia de detentos em Santar´em-Pa
Marina Rodrigues Maestre - ESALQ/USP1 2
Renata Alcarde - ESALQ/USP3
Edilan de Sant’Ana Quaresma - ESALQ/USP1
Simone Daniela Sartorio - ESALQ/USP1
Sˆonia Maria De Stefano Piedade - ESALQ/USP
Jarsen Luis Castro Guimar˜aes - NAEA/UFPA
Resumo: O presente trabalho teve como objetivo verificar se os tipos de crime (crime contra a
vida, crime contra o patrimˆonio, crime contra os costumes e tr´afico de entorpecentes) est˜ao rela-
cionados com os bairros de residˆencia de seus respectivos autores (bairro central, bairro perif´erico
e bairros de outras cidades). Para tanto, 344 detentos da Penitenciaria Agr´ıcola S´ılvio Hall de
Moura, situada no munic´ıpio de Santar´em, estado do Par´a, responderam question´arios sobre
sua condi¸c˜ao s´ocio-econˆomica e sobre o crime cometido. Para estudar a dependˆencia entre as
vari´aveis de interesse, utilizou-se o teste qui-quadrado, por meio do qual pˆode-se concluir que
as vari´aveis estudadas s˜ao correlacionadas. Para verificar quais n´ıveis das vari´aveis tˆem maior
rela¸c˜ao utilizou-se a t´ecnica multivariada de an´alise de correspondˆencia, que decomp˜oe a matriz
de propor¸c˜oes, oriunda da tabela de contingˆencia, em valores singulares, os quais d˜ao origem `as
coordenadas principais das linhas e das colunas da tabela. Estas coordenadas s˜ao representadas
num gr´afico de correspondˆencia.
Palavras-chave: Criminalidade, Fatores Sociais, T´ecnica Multivariada, An´alise de Corres-
pondˆencia.
1 Introdu¸c˜ao
A criminalidade ´e um grave problema da sociedade brasileira, em particular, no munic´ıpio de
Santar´em, no Oeste paraense, esse ´ındice aumentou 134,52% entre 1999 e 2004, de acordo com
dados da Pol´ıcia Civil do Par´a4. Por esse motivo, alguns professores da Universidade Federal do
Par´a (UFPA) decidiram estudar, junto a detentos condenados, o relacionamento entre fatores
s´ocio-econˆomicos, tais como, grau de instru¸c˜ao, rendas familiar, per-capita e individual, bairro
onde reside, e diferentes tipos de crime.
Informa¸c˜oes dessa natureza, ou seja, vari´aveis categ´oricas, podem dar origem `as tabelas
de contingˆencia. Um dos principais interesses est´a em verificar a associa¸c˜ao entre n´ıveis da
1
Agradecimento a CAPES apoio financeiro
2
Contato: ninamaestre@yahoo.com.br
3
Agradecimento ao CNPq apoio financeiro
4
http://www.ufpa.br/beiradorio/arquivo/beira64/noticias/rep7.html
2. vari´avel disposta nas linhas e n´ıveis da vari´avel disposta nas colunas. Para realizar tal verifica¸c˜ao
utilizam-se testes como qui-quadrado (MINGOTI, 2005).
Uma outra abordagem para se verificar essa associa¸c˜ao ´e a an´alise de correspondˆencia, que
pode ser considerada como um caso especial da an´alise de componentes principais (SARTORIO,
2008). De acordo com Greenacre e Hastie (1987), a an´alise de correspondˆencia ´e uma t´ecnica
explorat´oria multivariada, que converte uma matriz de dados n˜ao negativos em um gr´afico.
Neste as linhas e as colunas da matriz s˜ao representadas por pontos, ou seja, permite a an´alise
de tabelas de dupla entrada ou tabelas de m´ultiplas entradas, levando em conta algumas medidas
de correspondˆencia entre linhas e colunas.
Ao contr´ario do teste qui-quadrado, a an´alise de correspondˆencia indica como as vari´aveis dis-
postas em linhas e colunas est˜ao relacionadas e n˜ao somente se existe rela¸c˜ao (CZERMAINSKI,
2004).
O objetivo deste trabalho ´e verificar a rela¸c˜ao existente entre o bairro em que o detento
residia e o tipo de crime cometido, para isso utilizou-se o teste qui-quadrado e an´alise gr´afica,
por meio da an´alise de correspondˆencia. Para a an´alise foi utilizado o software R (2011).
2 Material e M´etodos
Os dados analisados neste trabalho (Tabela 1) foram coletados junto `a Penitenciaria Agr´ıcola
S´ılvio Hall de Moura, situada no munic´ıpio de Santar´em, estado do Par´a. Estes foram obtidos no
per´ıodo de novembro de 2004 `a abril de 2005, sendo que 344 detentos responderam a question´arios
sobre sua condi¸c˜ao social no ato do crime.
As vari´aveis de interesse foram tipo de crime cometido e bairro de residˆencia do detento,
no ato do crime. Os crimes foram classificados em quatro categorias: crime contra a vida
(Crime 1); crime contra o patrimˆonio (Crime 2); crime contra os costumes (Crime 3); e tr´afico
de entorpecentes (Crime 4). Analogamente, os bairros foram discriminados em trˆes categorias:
bairro central (Bairro 1), bairro perif´erico (Bairro 2); e bairros de outras cidades (Bairro 3).
Tabela 1: Tabela de contingˆencia dos dados de criminalidade
Bairro Residente Total
Crime Centro Periferia Outros (Crime)
Vida 2 71 72 145
Patrimˆonio 3 69 42 114
Costumes 2 19 17 38
Entorpecente 11 21 15 47
Total (Bairro) 18 180 146 344
2.1 An´alise de correspondˆencia
A an´alise de correspondˆencia ´e realizada a partir de uma tabela de contingˆencia. Desta
maneira, seja P uma matriz de dimens˜ao p × q, obtida desta tabela, em que p ´e o n´umero
de linhas e q o n´umero de colunas. Considere seus elementos como as respectivas propor¸c˜oes
3. pij =
nij
n
, sendo que nij denota uma casela da tabela de contingˆencia e n o total de todas as
caselas.
Considere tamb´em, P = P − rc′, com posto k = min(p − 1, q − 1), tal que
r′ =
(
n1·
n
n2·
n . . .
np·
n
)
e c′ =
(
n·1
n
n·2
n . . .
n·p
n
)
.
A matriz diagonal formada pelos elementos em r′ ´e denominada Matriz de perfil de linhas
(Dr), e a matriz diagonal formada pelos elementos em c′ ´e denominada Matriz perfil de colunas
(Dc).
A matriz P pode ser decomposta em seus autovalores e autovetores, obtendo-se
Pp×q = AΛB′
,
em que, A = D
1
2
r Up×k, B = D
1
2
c Vq×k, sendo U e V matrizes ortogonais contendo os autovetores
das matrizes PP′ e P′P, respectivamente. A matriz diagonal Λ tem dimens˜ao k ×k e ´e formada
pelos autovalores de P.
Logo, a matriz P pode ser reescrita em fun¸c˜ao dos autovalores e das coordenadas principais,
tal que
P = P − rc′
=
k∑
i=1
ˆλiaib′
i,
em que, ai e bi s˜ao, respectivamente, as i-´esimas colunas das matrizes A e B.
Portanto, as coordenadas principais das linhas podem ser descritas como:
Yp×k = D−1
r Ap×kΛk×k,
e as coordenadas principais das colunas por
Zq×k = D−1
c Bq×kΛk×k.
As duas primeiras coordenadas principais das linhas e das colunas s˜ao as mais representativas,
em termos da associa¸c˜ao total existente entre as vari´aveis X e Y . Essas est˜ao relacionadas aos
maiores autovalores da matriz P.
A varia¸c˜ao total no sistema, denominada in´ercia total, ´e dada por
∑k
i=1 λ2
i e est´a relacionada
com a estat´ıstica qui-quadrado. Desse modo, pode-se verificar a independˆencia entre as vari´aveis
presentes nas linhas e nas colunas. A associa¸c˜ao entre as linhas e as colunas pode ser representada
em um gr´afico denominado gr´afico de correspondˆencia.
3 Resultados e discuss˜ao
Utilizando os dados das vari´aveis tipo de crime cometido e o bairro onde o detento residia,
apresentados na Tabela 1, foram obtidos os autovalores 0,415649 e 0,055673, totalizando uma
in´ercia de 0,471322.
A primeira coordenada principal representa uma contribui¸c˜ao de 88,2% da in´ercia total e a
4. segunda 11,8%. O valor da estat´ıstica qui-quadrado obtido foi significativo ao n´ıvel de 5%, pois
χ2
= 344(0, 471322) = 162, 1348 > χ2
(6) = 12, 59159,
indicando existir associa¸c˜ao entre o tipo de crime cometido e o bairro onde o detento residia.
Nas Tabelas 2 e 3 s˜ao apresentadas as duas coordenadas principais das vari´aveis crime (linhas)
e bairro (colunas), respectivamente.
Tabela 2: Coordenadas principais das
linhas
Coordenadas principais
Perfil dos Crimes 1(Y1) 2(Y2)
Crime 1 -0,894 -0,069
Crime 2 0,225 -0,229
Crime 3 0,756 0,164
Crime 4 -0,570 0,511
Tabela 3: Coordenadas principais das
colunas
Coordenadas principais
Perfil dos Bairros 1(Z1) 2(Z2)
Bairro 1 0,702 -0,088
Bairro 2 -0,723 -0,139
Bairro 3 -0,131 0,491
Por meio da Figura 1, pˆode-se observar que os n´ıveis das vari´aveis mais correlacionados
foram:
Crime contra a vida (c1) e o bairro da periferia (b2); tr´afico de entorpecentes (c4) com
bairros de outras cidades (b3); o bairro central (b1) est´a relacionado tanto com o crime contra
o patrimˆonio (c2), quanto com o crime contra os costumes (c3).
−0.5 0.0 0.5
−0.6−0.4−0.20.00.20.40.60.8
c1
c2
c3
c4
b1
b2
b3
Figura 1: Gr´afico de correspondˆencia
5. A an´alise gr´afica permitiu identificar maior rela¸c˜ao entre tipos de crime e bairros de residˆencia
dos detentos, permitindo `as autoridades de seguran¸ca p´ublica implementar a¸c˜oes direcionadas
aos bairros, que minimizem a ocorrˆencia dos delitos naqueles lugares.
4 Conclus˜ao
A t´ecnica multivariada, por meio da an´alise de correspondˆencia, mostrou-se muito eficiente
para analisar dados de criminalidade no munic´ıpio de Santar´em-Pa, indicando maiores asso-
cia¸c˜oes entre os diferentes tipos de crime e o bairro de residˆencia do detento.
A realidade de centros urbanos justifica tais associa¸c˜oes pelas caracter´ısticas inerentes ao
espa¸co onde a pesquisa foi realizada. Assim, flagrantes de tr´afico de entorpecentes, por exemplo,
ocorrem com mais frequˆencia no trajeto entre munic´ıpios, caracterizado por bairros de outras
cidades. Analogamente, crimes contra a vida ocorrem, historicamente, em bairros perif´ericos,
onde se concentram maior n´umero de bares, casas noturnas e locais com deficiente saneamento
urbano.
Referˆencias
[1] CZERMAINSKI, A.B.C., An´alise de correspondˆencia, Piracicaba, jul 2004. Semin´ario
apresentado na disciplina An´alise Multivariada.
[2] GREENACRE, M.; HASTIE, T., The Geometric Interpretation of Correspondence
Analysis, Journal of the American Statistical Association, v. 82, p. 437-447, 1987.
[3] LOPES, S., Pesquisa mostra causas da criminalidade. Dispon´ıvel em:
<http://www.ufpa.br/beiradorio/arquivo/beira64/noticias/rep7.html>. Acesso em: 1
abr. 2011.
[4] MINGOTI, S.A., An´alise de dados atrav´es de m´etodos de estat´ıstica multivariada, Belo
Horizonte: UFMG, 2005.
[5] R Development Core Team (2011). R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
URL http://www.R-project.org/.
[6] SARTORIO, S.D., Aplica¸c˜oes de t´ecnicas de an´alise multivariada em experimentos
agropecu´arios usando o software R. 2008. 131p., Disserta¸c˜ao (Mestrado em Agronomia:
Estat´ıstica e Experimenta¸c˜ao Agronˆomica) - Escola Superior de Agricultura “Luiz de
Queiroz”, Universidade de S˜ao Paulo, Piracicaba, 2008.