Crim presentacion

Estad´ıstica (30304007)
Grado en Criminolog´ıa y Seguridad
Departamento de Estad´ıstica e Investigaci´on Operativa
Curso 2012/13
Universidad de C´adiz
1

Contenidos:
(1) Fuentes de datos en criminolog´ıa
(2) Estudio descriptivo unidimensional de la actividad criminológica
(3) Estudio descriptivo bidimensional de la actividad criminológica
(4) Series temporales
(5) La utilización de la probabilidad en criminolog´ıa
(6) Modelos probabil´ısticos asociados a la criminolog´ıa
2

Cap´ıtulo 1: FUENTES DE DATOS EN CRIMINOLOG´IA
1.1.-Introducci´on
1.2.-Diversas fuentes de datos
3

Secci´on 1.1: Introducci´on
4

.
Without statistics, conducting research about crime
and justice would be virtually impossible (Weisburd, D.
& Britt, Ch. (2007). Statistics in Criminal Justice (Third
edition), New York: Springer)
Disponer de una buena información estad´ıstica y usarla
de una manera intensiva y eficiente es una necesidad
ineludible para la mejora de la gestión de la Justicia. Es
también una obligación de cara a la sociedad a la que se
debe rendir cuenta de su funcionamiento (Problemas
de la Estad´ıstica Judicial y propuestas de actuación. Consejo
General del Poder Judicial)
La subestimación de la información emp´ırica y, en par-
ticular, de la información estad´ıstica está todav´ıa muy
arraigada en la tradición jur´ıdica (Benito y Ben´ıtez de
Lugo, J.L. de & Pastor Prieto, S. (2001). La Estad´ıstica
como instrumento de la Pol´ıtica Judicial en Los proble-
mas de la investigación emp´ırica en criminolog´ıa: La situación
española, Valencia: Tirant Lo Blanch)
5

.
La palabra estad´ıstica suele emplearse con dos significa-
dos distintos:
estad´ısticas , en plural y, generalmente, escrita en minús-
culas, indicando colecciones de datos numéricos presen-
tados de forma ordenada y sistemática.
Estad´ıstica , en singular y, quizás escrita en mayúscu-
las, ciencia que estudia el comportamiento de los fenóme-
nos llamados de colectivo.
Las estad´ısticas reflejan el conocimiento de las institucio-
nes oficiales sobre determinados asuntos. Este conocimien-
to es, fundamentalmente, numérico. Por tanto el análisis
estad´ıstico nos proporciona, en general, un método cuan-
titativo para el análisis de aquellas situaciones que puedan
ser de nuestro interés.
Pueden realizarse estad´ısticas por instancias privadas, sin
embargo las más representativas son las oficiales.
6

Secci´on 1.2: Diversas fuentes de datos
7

Fuentes internacionales:
(a) Organismos e instituciones internacionales que ofrecen
exclusivamente información sobre algún aspecto de la jus-
ticia: Bureau of Justice Statistics (BJS)
(b) Organismos e instituciones internacionales que ofrecen
información de diferentes sectores, entre ellos el judicial:
Research Development and Statistics (RDS), Organización
de las Naciones Unidas (UN)
(c) Organismos y oficinas estad´ısticas que ofrecen todo ti-
po de información: Oficina Estad´ıstica de las Comunidades
Europeas (EUROSTAT),
8

BJS
(Bureau of Justice Statistics)
(http://www.ojp.usdoj.gov/bjs/)
Tiene como misi´on recoger, analizar, publicar y divulgar
informaci´on sobre el crimen, el delincuente, las v´ıctimas, y
las diferentes operaciones de los sistemas de justicia
9

RDS
(Research Development and Statistics)
(http://homeof f
ice.gov.uk/science-research/research-statistics/)
Country of origin
information service
British Crime Survey
–
Measuring crime for
25 years
Home Office
Recorded Crime
Counting Rules
Crime Statistics - An
independent review
Last updated 20 May 2008
© Crown Copyright 2008
RDS publica bajo la supervisión de cualificados
especialistas en estad´ıstica, investigación, economistas,
profesionales de la comunicación y cient´ıficos, trabajos e
informes que sirvan de ayuda al Parlamento y para el
conocimiento del público en general
11

UN
(Organización de las Naciones Unidas)
(http://www.un.org/spanish/)
(Derecho Internacional) Página 1 de 1
Entre los Órganos Principales de la ONU se encuentra la
Corte Internacional de Justicia que será el órgano judicial
principal de las Naciones Unidas (Art´ıculo 92 de la Carta
de las Naciones Unidas)
13

EUROSTAT
(Oficina Estad´ıstica de las Comunidades Europeas)
(http://epp.eurostat.ec.europa.eu/portal/page/
portal/eurostat/home/)
(Populations and social conditions Crime and criminal
justice)
La mision de Eurostat consiste en proporcionar un
servicio de información estad´ıstica de alta calidad a la
Unión Europea
15

Fuentes nacionales:
(a) Fuentes que ofrecen información jur´ıdica relacionada
con el estudio y la investigación del sector: Consejo general
del Poder Judicial (CGPJ)
(b) Fuentes que ofrecen todo tipo de información estad´ısti-
ca: Instituto Nacional de Estad´ıstica de España (INE), Ins-
tituto de Estad´ıstica de Andaluc´ıa (IEA)
17

CGPJ
(Consejo General del Poder Judicial)
(http://www.poderjudicial.es/eversuite/)
(Consejo General del Poder Judicial Estad´ıstica)
CENTRO DE DOCUMENTACIÓN JUDICIAL
CONSEJO GENERAL DEL PODER JUDICIAL
Disponer de una buena información estad´ıstica y usarla
de una manera intensiva y eficiente es una necesidad
ineludible para la mejora de la gestión de la Justicia. Es
también una obligación de cara a la sociedad a la que se
debe rendir cuenta de su funcionamiento
18

INE
(Instituto Nacional de Estad´ıstica de España)
(http://www.ine.es/)
(Sociedad Seguridad y Justicia)
Le corresponde la investigación, desarrollo,
perfeccionamiento y aplicación de la metodolog´ıa
estad´ıstica, en el marco del Plan Nacional de Investigación
Cient´ıfica y Desarrollo Tecnológico
20

IEA
(Instituto de Estad´ıstica de Andaluc´ıa)
(http://www.juntadeandalucia.es/
institutodeestadisticaycartograf ia/)
(Sociedad Justicia)
9
Instituto de Estadística de Andalucía
CONSEJERÍA DE ECONOMÍA Y HACIENDA
Andalucía y su población
Unión Eu
Fondo So
Es el responsable de la actividad estad´ıstica de la
Comunidad Aut´onoma de Andaluc´ıa
22

SEIC
(Sociedad Española de Investigación Criminológica)
(http://www.criminologia.net)
ESTATUTOS DE LA SEIC
Capítulo I. Denominación, fines, domicilio y ámbito
Capítulo II. Órganos de la asociación
Capítulo III. Asamblea general
Capítulo VI. Socios
Capítulo V. Recursos económicos
Capítulo VI. Disolución
Capítulo I. Denominación, fines, domicilio y ámbito
Artículo 1. Con la denominación de SOCIEDAD ESPAÑOLA
CRIMINOLÓGICA se constituye una Asociación que se acoge a lo dis
de 24 de Diciembre y normas complementarias del Decreto 14
careciendo de ánimo de lucro y por tiempo indefinido.
Artículo 2. La Asociación gozará de personalidad jurídica propia
asociados y su régimen se regirá por lo establecido en los prese
acuerdos adoptados por sus Órganos de Gobierno.
Esta asociación tiene como fin, entre otros, el promover
la investigación y los estudios criminológicos tanto en el
ámbito académico como en el institucional y en aquellos
otros que tengan interés en esta área de conocimiento
24

Otras webs de información criminológica y judicial:
(a) Instituto de Criminolog´ıa de la Universidad de Cambrid-
ge
(b) Centro de Criminolog´ıa de la Universidad de Oxford
(c) Instituto Australiano de Criminolog´ıa
(d) Sociedad Británica de Criminolog´ıa
26

SEIC
(Instituto de Criminolog´ıa de la Universidad de Cambridge)
(http://www.crim.cam.ac.uk)
M.St. in Applied Criminology, Penology and Manageme
Alumni Event 13 September 2012
Delegate Registration Form
Fee £60 (This includes the dinner and event attendance)
First name: Last name:
Telephone: Email:
Correspondence address:
Fundado hace 50 años fué uno de los primeros Institutos
Criminológicos de Europa. Alberga la biblioteca
Radzinowicz que contiene la más extensa colección de
criminolog´ıa del Reino Unido.
27

SEIC
(Centro de Criminolog´ıa de la Universidad de Oxford)
(http://www.crim.ox.ac.uk/Links/index.htm)
Emerging ACE Data: Further Analysis of
Needs and Risk
Simon Merrington
KEY POINTS
1. This bulletin provides a similar analysis of criminogenic needs to the one in
Bulletin 1, but for a much larger sample of cases - over 10,000. These are
all initial assessments, the great majority having been completed at PSR
stage.
2. ACE indicates a fairly similar pattern of problems and offending-related
problems across the country, in rural, urban and metropolitan areas. The
pattern of problems is also remarkably similar to the one provided two years
previously by Bulletin 1. It suggests that ACE is a stable assessment tool,
and that risk factors do not vary greatly between areas.
3. The data suggests that programmes such as Think First which target
impulsiveness, poor reasoning skills, difficulties with control over one's
actions, and poor victim awareness, should be extremely valuable. Not only
are these problems frequently judged to be offending-related, they were
also found in HORS 211 to be good predictors of reconviction.
4. Another group of problems are also frequently judged to be offending-
Probation Studies Unit
ACE Practitioner Bulletin 4
November 2001
Emerging ACE Data: Further Analysis of
Needs and Risk
Simon Merrington
KEY POINTS
1. This bulletin provides a similar analysis of criminogenic needs to the one in
Bulletin 1, but for a much larger sample of cases - over 10,000. These are
all initial assessments, the great majority having been completed at PSR
stage.
2. ACE indicates a fairly similar pattern of problems and offending-related
problems across the country, in rural, urban and metropolitan areas. The
pattern of problems is also remarkably similar to the one provided two years
previously by Bulletin 1. It suggests that ACE is a stable assessment tool,
and that risk factors do not vary greatly between areas.
3. The data suggests that programmes such as Think First which target
impulsiveness, poor reasoning skills, difficulties with control over one's
actions, and poor victim awareness, should be extremely valuable. Not only
are these problems frequently judged to be offending-related, they were
also found in HORS 211 to be good predictors of reconviction.
4. Another group of problems are also frequently judged to be offending-
related: the offender's own lifestyle, friends causing a risk, drugs and
alcohol. HORS 211 found that the first three were good reconviction
predictors. It is less clear how probation can effectively address lifestyle
and peer influence problems, but the need for drugs and alcohol
programmes is well accepted.
5. Finances were also among the most frequent offending-related problems,
and this too was a good predictor in HORS 211. There was surprisingly
little regional variation in the assessed problem level, but more variation in
financial status with 72% dependent on state benefits in Northumbria but
Probation Studies Unit
ACE Practitioner Bulletin 4
November 2001
Institute of Criminology
Centre for Criminology
University of Oxford
Institute of Criminology
University of OxfordInstitute of Criminology
University of OxfordEs uno de los centros de criminolog´ıa m´as destacados del
Reino Unido. Realiza publicaciones de sus investigaciones
de gran calidad.
29

AIC
(Instituto Australiano de Criminolog´ıa)
(http://www.aic.gov.au/en/statistics.aspx)
ds
uesminal justice
Financing of terrorism:
Es el centro nacional australiano de investigaci´on en
criminolog´ıa y justicia.
31

BSC
(Sociedad Británica de Criminolog´ıa)
(http://www.britsoccrim.org/links.htm)
Volume 9, 2009
www.britsoccrim.org/conferences.htm
Se propone fomentar el conocimiento tanto del personal
académico como profesional que están ligados de alguna
forma por trabajo o enseñanza, investigación o educación
pública sobre el crimen, el comportamiento criminal y los
sistemas de justicia criminal en el Reino Unido.
33

Cap´ıtulo 2: ESTUDIO DESCRIPTIVO
UNIDIMENSIONAL DE LA ACTIVIDAD
CRIMINOL ´OGICA
2.1.-Principales conceptos de Estad´ıstica Descriptiva
35

Secci´on 2.1: Principales conceptos de Estad´ıstica
Descriptiva
36

Se conocen como variables estad´ısticas a las caracter´ısticas
que poseen los elementos de una población y que van a ser
objeto de estudio estad´ıstico.
Ejemplo 1 Sea la población formada por los 4543 jueces
y magistrados en los diferentes órganos judiciales que for-
maban la plantilla a 1 de enero de 2007 (según datos del
CGPJ).
37

Las variables a analizar pueden ser de tres tipos:
Cualitativas ó atributos: no expresables numéricamente
(Ejemplo: Comunidad Autónoma de destino )
Ordinales: sus valores pueden ser ordenados (Ejemplo:
Satisfacción con la actual pol´ıtica judicial )
Cuantitativas: pueden ser expresadas numéricamente.
Las variables cuantitativas se subdividen en:
(i) Cuantitativas Discretas, si el conjunto de sus po-
sibles valores tiene cardinal finito o infinito numerable
(Ejemplo: Número de expedientes resueltos durante el
año 2006 )
(ii) Cuantitativas Continuas, si pueden tomar los infini-
tos valores de un intervalo (Ejemplo: Antigüedad en el
cuerpo )
38

Las variables estad´ısticas suelen representarse con letras
mayúsculas del final del alfabeto: X, Y , Z, ... Los valores
que toman (datos) los escribiremos con letras minúsculas:
x1, x2, x3, ... ; y1, y2, y3, ... ó z1, z2, z3, ...
Ejemplo 2
X= Número de expedientes resueltos durante el año
2006 por cada uno de los 4543 jueces y magistrados en
los diferentes órganos judiciales que formaban la plantilla
a 1 de enero de 2007
x1= 206 expedientes, x2= 124 expedientes, · · · x4543=
338 expedientes.
39

.
Distribuciones de frecuencias
A partir de un conjunto de datos queremos clasificarlos de
modo que la información contenida en ellos quede presen-
tada de forma clara, concisa y ordenada. Si representamos
por N al número total de datos, se conoce como frecuencia:
(a) Absoluta del valor xi, al número de veces que se pre-
senta dicho valor en el conjunto de datos. Se representa
por ni.
(b) Absoluta acumulada del valor xi, al número de datos
que hay iguales o inferiores a xi. Se representa por Ni.
(c) Relativa del valor xi, al cociente
ni
N
. Se representa por
fi.
(d) Relativa acumulada del valor xi, al cociente
Ni
N
. Se re-
presenta por Fi.
40

Llamaremos distribuci´on de frecuencias al conjunto de los
valores que presenta una variable estad´ıstica junto con sus
frecuencias. En general, escribiremos {(xi; ni)}i=1,2,...,k, don-
de ni es la frecuencia absoluta del valor xi y N =
k
i=1
ni es
la frecuencia total.
Para presentar los resultados se acostumbra a usar la lla-
mada tabla estad´ıstica, de la forma siguiente:
li−1 − li ni xi ci
l0 − l1 n1 x1 c1
l1 − l2 n2 x2 c2
... ... ... ...
lk−1 − lk nk xk ck
siendo xi =
li−1 + li
2
, la marca de clase ´o valor ideal del
intervalo, y ci = li − li−1 , la amplitud del intervalo.
41

Observaciones:
(a) El agrupamiento de los datos da lugar a cierta pérdida
de información pero con ello se gana en manejabilidad
de los mismos.
(b) El número de intervalos y las amplitudes de los mismos
deben ser escogidos convenientemente.
(c) En la práctica, es frecuente la elección de intervalos
de amplitud constante, ya que con ello se facilita el
cálculo de la mayor´ıa de las caracter´ısticas descriptivas
que analiza la estad´ıstica. Un criterio emp´ırico consiste
en considerar como número de intervalos, k, el dado
por la fórmula de Sturges, k = 1 + [3,3log10N], donde [x]
denota la parte entera de x.
42

Ejemplo 3 Sea la variable
X= Número de penados en los diferentes Centros Peni-
tenciarios españoles, en el año 2006
x1 = 1475 penados (A Lama, Pontevedra)
x2 = 299 penados (Albacete)
x3 = 1707 penados (Albolote)
...
x77 = 1400 penados (Villabona)
(Fuente: Anuario Estad´ıstico del Ministerio del Interior. 2006)
(k = 1 + [3,3log1077] = 1 + [6,2254] = 7)
min{xi} = 61 (Sta. Cruz de la Palma);
max{xi} = 2466 (Valencia)
c =
2466 − 61
7
= 343,5714 ≈ 360
43

li−1 − li xi ni Ni fi Fi
0 − 360 180 22 22 0,2857 0,2857
360 − 720 540 21 43 0,2727 0,5584
720 − 1080 900 8 51 0,1039 0,6623
1080 − 1440 1260 9 60 0,1169 0,7792
1440 − 1800 1620 13 73 0,1688 0,9480
1800 − 2160 1980 3 76 0,0390 0,9870
2160 − 2520 2340 1 77 0,0130 1
T otales N = 77 1
44

Representaciones gráficas
Consiste en presentar, a golpe de vista, el comportamiento
de la distribución. Se usan como complemento del traba-
jo estad´ıstico, y a veces, como punto de partida para un
posterior análisis.
Tipos de gráficos:
(a) Para variables cualitativas preferentemente: basan su
construcción en establecer proporcionalidad entre áreas
y frecuencias.
45

Ejemplo 4 Se considera el estudio de la variable lugar de
procedencia de los condenados en España durante el año
2008
Lugar de procedencia Número de condenados (ni)
España 137 872
Resto de Unión Europea 17 174
Resto de Europa 1 894
Resto del Mundo 39 040
N = 195 980
(Fuente: Explotación del INE del Registro Central de Penados)
46

Ejemplo 4a Diagrama de sectores:
Procedencia de los condenados en España durante el año 2008
España
Resto de Unión Europea
Resto de Europa
Resto del mundo
70,35%
8,76%
0,97%
19,92%
47

Ejemplo 4b Diagrama de rect´angulos:
Procedencia de los condenados en España durante el año 2008
0
3
6
9
12
15
(X 10000)
España
RestodeUniónEuropea
RestodeEuropa
Restodelmundo
48

(b) Para variables cuantitativas: Se realizan mediante un
sistema de ejes cartesianos representando en el eje de
abcisas los valores de la variable y en el de ordenadas
las frecuencias correspondientes.
49

Ejemplo 5 Se pretende estudiar la variable edad de la
poblaci´on reclusa penada en enero de 2010
li−1 − li ni ci hi
18 − 21 638 3 0, 00357
21 − 26 7 226 5 0, 02426
26 − 31 12 450 5 0, 04180
31 − 41 20 694 10 0, 03474
41 − 61 17 035 20 0, 01429
61 − 70 1 523 9 0, 00284
N = 59 566
hi =
ni
Nci
Fuente: Ministerio del Interior. Secretar´ıa General de Instituciones
Penitenciarias
50

Ejemplo 6 Pol´ıgono de frecuencias (Sólo para intervalos
de igual amplitud). Consideremos la variable edad de una
muestra correspondiente a 91 casos de alcoholemias posi-
tivas detectados por la Polic´ıa Local de Estepona en el año
2003
li−1 − li ni ci hi
15 − 25 17 10 0, 01868
25 − 35 28 10 0, 03077
35 − 45 22 10 0, 02417
45 − 55 18 10 0, 01978
55 − 65 5 10 0, 00549
65 − 75 1 10 0, 00109
N = 91
hi =
ni
Nci
FUENTE: Bolet´ın Criminológico. Instituto andaluz interuniversitario
de Criminolog´ıa. Número 80, junio-julio 2005
52

Ejemplo 6a Pol´ıgono de frecuencias:
53

.
Medidas de posición
Son valores que pretenden resumir las caracter´ısticas bási-
cas de la información disponible.
(a) Media aritmética: x =
k
i=1
xini
N
=
k
i=1
xifi
(b) Mediana: Me = li−1 +
N
2
− Ni−1
Ni − Ni−1
· ci
(c) Percentiles: Qr/k = li−1 +
r
k
· N − Ni−1
Ni − Ni−1
· ci
54

Ejemplo 7 (Datos correspondientes al Ejemplo 3)
li−1 − li xi ni Ni xini
0 − 360 180 22 22 3960
360 − 720 540 21 43 11340
720 − 1080 900 8 51 7200
1080 − 1440 1260 9 60 11340
1440 − 1800 1620 13 73 21060
1800 − 2160 1980 3 76 5940
2160 − 2520 2340 1 77 2340
T otales N = 77 63180
(a) x = 820,5195 penados (b) Me = 642,8571 penados
(c) Q70/100 = 1196 penados
55

.
Medidas de dispersión
Se entiende por dispersión estad´ıstica a la mayor o me-
nor separación de los valores (datos) respecto a otro que
pretende ser la s´ıntesis de ellos.
(a) Varianza: s2 =
k
i=1
(xi − x)2 ·
ni
N
=
k
i=1
x2
i ·
ni
N
− x2
(a’) A veces se usa también la cuasivarianza, definida por:
s2
c =
k
i=1
(xi − x)2 ·
ni
N − 1
. Evidentemente: s2 =
N − 1
N
· s2
c
(b) Desviación t´ıpica: s = +
√
s2 = +
k
i=1
x2
i ·
ni
N
− x2
(c) Coeficiente de variación de Pearson: V =
s
|x|
56

Ejemplo 8 (Datos correspondientes al Ejemplo 3)
li−1 − li xi ni xini x2
i ni
0 − 360 180 22 3960 712800
360 − 720 540 21 11340 6123600
720 − 1080 900 8 7200 6480000
1080 − 1440 1260 9 11340 14288400
1440 − 1800 1620 13 21060 34117200
1800 − 2160 1980 3 5940 11761200
2160 − 2520 2340 1 2340 5475600
T otales N = 77 63180 78958800
(a) s2 = 352 186,7431 penados2 (b) s2
c = 356 820,7792 penados2
(c) s = 593,4532 penados (d) V = 0,7233
57

Cap´ıtulo 3: ESTUDIO DESCRIPTIVO BIDIMENSIONAL
DE LA ACTIVIDAD CRIMINOL ÓGICA
3.1.-Introducción
3.2.-Independencia de variables estad´ısticas
3.3.-Enunciado del problema
3.4.-Regresión lineal
3.5.-Correlación
58

59

La mayor´ıa de las variables que interesan en el mundo cri-
minológico suelen estar relacionadas entre s´ı, en mayor o
menor medida. Una vez que hemos realizado el estudio
de las distribuciones unidimensionales, obtenidas al estu-
diar una determinada caracter´ıstica sobre los elementos de
una población, nos disponemos ahora a introducir las dis-
tribuciones bidimensionales, que surgen cuando analizamos
simultáneamente dos caracter´ısticas sobre cada elemento
de la población.
Como ejemplo podemos considerar el gasto en actividades
de ocio de un centro penitenciario y el número de reinci-
dencias de sus internos, ó el grado de calidad de sus insta-
laciones y el grado de conflictividad, etc.
60

Supongamos que tenemos una población cuyos elementos
son clasificados según dos caracter´ısticas cuantitativas, que
llamaremos X e Y . Sus diferentes valores los represen-
taremos por xi e yj, respectivamente, con i = 1, 2, ..., k y
j = 1, 2, ..., h.
Se denomina distribución bidimensional de frecuencias al
conjunto de valores {(xi, yj; nij)} i = 1, 2, ..., k
j = 1, 2, ..., h
, donde nij es la
frecuencia absoluta conjunta del par (xi, yj) y N =
k
i=1
h
j=1
nij
es la frecuencia total.
61

Para disponer los resultados podemos usar la llamada tabla
de correlaci´on, que es una tabla de doble entrada como la
siguiente:
yj
xi
y1 y2 · · · yj · · · yh ni·
x1 n11 n12 · · · n1j · · · n1h n1·
x2 n21 n22 · · · n2j · · · n2h n2·
... ... ... · · · ... · · · ... ...
xi ni1 ni2 · · · nij · · · nih ni·
... ... ... · · · ... · · · ... ...
xk nk1 nk2 · · · nkj · · · nkh nk·
n·j n·1 n·2 · · · n·j · · · n·h N
donde ni· =
h
j=1
nij ; n·j =
k
i=1
nij ; N =
k
i=1
ni· =
h
j=1
n·j
62

.
Observaciones:
(a) Si dividimos cada frecuencia de la tabla anterior en-
tre el número total de elementos observados, N, ob-
tendr´ıamos una nueva tabla, semejante a la primera,
salvo que reflejar´ıa las proporciones o frecuencias rela-
tivas. Llamaremos fij a la frecuencia relativa conjunta
del par (xi, yj), fij =
nij
N
. Análogamente se definicionnen
las frecuencias relativas marginales fi· =
ni·
N
=
h
j=1
fij y
f·j =
n·j
N
=
k
i=1
fij
(b) Como en el caso unidimensional, las distribuciones bidi-
mensionales pueden venir expresadas con valores de la
variable agrupados en intervalos o sin agrupar. También
puede ocurrir que las caracter´ısticas en estudio tengan
distinta naturaleza.
63

Ejemplo 9 Un criminólogo está interesado en encontrar
la posible relación existente entre la edad en la que un
delincuente juvenil comete su primer delito y su posterior
actividad criminal en la vida de adulto.
Concretamente está interesado en encontrar explicaciones
al número de arrestos en edad adulta, Y , conociendo la edad
del primer arresto juvenil, X.
Los datos recogidos se presentan en la tabla siguiente:
xi 14 12 15 13 16 17 13 15 16 16 17 16
yj 5 3 4 5 0 1 2 0 2 1 0 1
FUENTE: Datos no reales tomados de Elementary Statistics in Criminal
Justice Research
64

Escribiendo los datos en forma de una tabla de correlaci´on,
nos queda:
yj
xi
0 1 2 3 4 5 ni·
12 0 0 0 1 0 0 1
13 0 0 1 0 0 1 2
14 0 0 0 0 0 1 1
15 1 0 0 0 1 0 2
16 1 2 1 0 0 0 4
17 1 1 0 0 0 0 2
n·j 3 3 2 1 1 2 N = 12
65

.A veces interesa estudiar aisladamente cada una de las va-
riables. De esta forma obtendr´ıamos dos distribuciones uni-
dimensionales, que ser´ıan las correspondientes a cada una
de las variables X e Y . A estas distribuciones se les llama
distribuciones marginales.
La distribuci´on marginal de X es la distribuci´on que sigue la
variable X independientemente de los valores de la variable
Y .
xi ni· fi·
x1 n1· f1·
x2 n2· f2·
... ... ...
xi ni· fi·
... ... ...
xk nk· fk·
N 1
donde ni· =
h
j=1
nij y fi· =
ni·
N
son, respectivamente, las frecuen-
cias absolutas y relativas margi-
nales de la variable X, con i =
1, 2, ..., k.
66

Análogamente se define la distribución marginal de Y .
La distribución marginal de Y es la distribución que sigue la
variable Y independientemente de los valores de la variable
X.
yj n·j f·j
y1 n·1 f·1
y2 n·2 f·2
... ... ...
yj n·j f·j
... ... ...
yh n·h f·h
N 1
donde n·j =
k
i=1
nij y f·j =
n·j
N
son, respectivamente, las frecuen-
cias absolutas y relativas margi-
nales de la variable Y , con j =
1, 2, ..., h.
67

Las distribuciones marginales correspondientes a los datos
recogidos en el Ejemplo 9, son:
xi ni· fi·
12 1 0,083
13 2 0,16
14 1 0,083
15 2 0,16
16 4 0.3
17 2 0,16
N = 12 1
yj n·j f·j
0 3 0,25
1 3 0,25
2 2 0,16
3 1 0,083
4 1 0,083
5 2 0,16
N = 12 1
68

Otro tipo de distribuciones unidimensionales que se obtie-
nen a partir de las bidimensionales son las distribuciones
condicionadas. Son distribuciones que se obtienen mante-
niendo fijo un valor en una de las variables y considerando
los valores que toma la otra con sus respectivas frecuencias.
La distribución condicionada de X respecto de Y = yj es
la distribución que sigue la variable X cuando la variable Y
toma el valor yj.
69

xi/Y = yj ni/j fi/j
x1 n1j f1/j
x2 n2j f2/j
... ... ...
xi nij fi/j
... ... ...
xk nkj fk/j
n·j 1
Se han escrito las frecuencias condi-
cionadas absolutas como ni/j (= nij)
y las frecuencias condicionadas rela-
tivas como fi/j =
nij
n·j
(proporción de
valores, entre los que Y = yj, para
los cuales X = xi, con i = 1, 2, ..., k).
Obsérvese que las frecuencias de la
distribución X/Y = yj son las corres-
pondientes a la j-ésima columna de la
tabla de correlación.
70

De forma análoga se obtiene la distribución condicionada
de Y respecto de X = xi, distribución de los valores de Y
cuando X toma el valor xi.
La distribución condicionada de Y respecto de X = xi es
la distribución que sigue la variable Y cuando la variable X
toma el valor xi.
71

yj/X = xi nj/i fj/i
y1 ni1 f1/i
y2 ni2 f2/i
... ... ...
yj nij fj/i
... ... ...
yh nih fh/i
ni· 1
Se han escrito las frecuencias condi-
cionadas absolutas como nj/i (= nij)
y las frecuencias condicionadas rela-
tivas como fj/i =
nij
ni·
(proporción de
valores, entre los que X = xi, para
los cuales Y = yj, con j = 1, 2, ..., h).
Obsérvese que las frecuencias de la
distribución Y/X = xi son las corres-
pondientes a la i-ésima fila de la tabla
de correlación.
72

De entre todas las posibles distribuciones condicionadas co-
rrespondientes al Ejemplo 9, hemos seleccionado las dos
siguientes:
xi/Y = 2 ni/3 fi/3
12 0 0
13 1 0,5
14 0 0
15 0 0
16 1 0,5
17 0 0
n·3 = 2 1
yj/X = 16 nj/5 fj/5
0 1 0,25
1 2 0,5
2 1 0,25
3 0 0
4 0 0
5 0 0
n5· = 4 1
73

Secci´on 3.2: Independencia de variables estad´ısticas
74

Diremos que X e Y dependen funcionalmente si podemos
establecer una aplicación que nos transforme los valores de
una de las variables en los de la otra.
Diremos que X e Y dependen estad´ısticamente cuando la
variación de una de las variables influye en la distribución
de la otra.
75

Diremos que las variables X e Y son estad´ısticamente in-
dependientes si para todo (i, j) se verifica que
fij = fi·f·j
Si la igualdad no se verifica para algún par (i, j), diremos
que las variables son estad´ısticamente dependientes.
Para las variables X e Y del Ejemplo 9, como se verifica
que: f14 =
1
12
= f1·f·4 =
1
12
·
1
12
, deducimos que X e Y no
pueden considerarse independientes.
76

Secci´on 3.3: Enunciado del problema
77

Para medir la asociaci´on lineal entre dos variables, X e Y ,
se deﬁnicionne la covarianza como:
sXY =
k
i=1
h
j=1
(xi − x)(yj − y) ·
nij
N
=
k
i=1
h
j=1
xiyj ·
nij
N
− x · y
78

.
Si seguimos utilizando los datos del Ejemplo 9, para calcular
la sXY procedemos de la forma siguiente:
yj
xi
0 1 2 3 4 5 ni· xini·
h
j=1
xiyjnij
12 0 0 0 1 0 0 1 12 36
13 0 0 1 0 0 1 2 26 91
14 0 0 0 0 0 1 1 14 70
15 1 0 0 0 1 0 2 30 60
16 1 2 1 0 0 0 4 64 64
17 1 1 0 0 0 0 2 34 17
n·j 3 3 2 1 1 2 N = 12 180 338
yjn·j 0 3 4 3 4 10 24
y, por tanto, sXY =
k
i=1
h
j=1
xiyj ·
nij
N
− x · y =
338
12
−
180
12
·
24
12
=
= −1,83
79

Cuando X e Y var´ıan conjuntamente de forma lineal, gráfi-
cas (A) y (B), la covarianza será alta. Cuando no exista
relación entre X e Y , gráfica (C), o exista una relación
marcadamente no lineal, gráfica (D), la covarianza será ce-
ro.
(A) (B) (C) (D)
X
Y
0 4 8 12 16 20
3
5
7
9
11
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
X
Y
0 4 8 12 16 20
3
5
7
9
11
X
Y
0 10 20 30 40
0
4
8
12
16
20
24
80

Si sXY > 0 ⇒ X e Y var´ıan de forma lineal en el mismo
sentido y diremos que hay asociación lineal directa, (A).
Si sXY < 0 ⇒ X e Y var´ıan de forma lineal en sentido
opuesto, y presentan asociación lineal inversa, (B).
Cuando sXY = 0, es decir haya ausencia de asociación lineal,
diremos que las variables X e Y son incorreladas.
81

Como en nuestro ejemplo sXY = −1,83, podemos concluir
que las variables X e Y var´ıan de forma lineal en sentido
opuesto, y presentan asociación lineal inversa.
La representación gráfica nos confirma esta conclusión:
12 13 14 15 16 17
0
1
2
3
4
5
82

Secci´on 3.4: Regresi´on lineal
83

La regresión tiene por objeto poner de manifiesto, a par-
tir de la información de que se disponga, la estructura de
dependencia que mejor explique el comportamiento de una
variable Y (variable dependiente o explicada) a través de
un conjunto de variables X1, X2, . . . , Xp (variables indepen-
dientes o explicativas), con las que se supone que está re-
lacionada.
El caso que nos disponemos a estudiar es el más senci-
llo, utiliza una sola variable explicativa, y se conoce como
Regresión Simple.
84

Una vez confirmado que la observación de la nube de puntos
nos indica una cierta estructura de dependencia lineal entre
nuestros datos, la recta de regresión de Y sobre X es:
y = a + bx
b =
sXY
s2
X
a = y − bx
Por tanto, la ecuación de la recta que nos explicará el com-
portamiento de la variable Y conocido el de la X, puede ser
expresada como sigue:
rY/X ≡ y = y −
sXY
s2
X
· x
a
+
sXY
s2
X
b
·x
85

Ejemplo 10 Los datos que han dado lugar a la nube de
puntos
X
Y
0 4 8 12 16 20
3
5
7
9
11
proporcionan los valores siguientes:
x = 10,4104; y = 3,1791; sXY = 8,5085; s2
X = 29,3501
86

Por tanto, la ecuación de la recta que nos explicará el com-
portamiento de la variable Y conocido el de la X, recta de
regresión de Y sobre X, es:
rY/X ≡ y = a + bx = y −
sXY
s2
X
· x +
sXY
s2
X
· x
rY/X ≡ y = 0,1611 + 0,2898x
X
Y
0 4 8 12 16 20
3
5
7
9
11
87

Secci´on 3.5: Correlaci´on
88

La regresión nos ha proporcionado la forma funcional de la
relación entre dos variables. Pero es necesario analizar tam-
bién la intensidad de esa relación. El objetivo de la correla-
ción es estudiar el grado de asociación existente entre las
variables, es decir, proporcionar unos coeficientes que nos
midan el grado de dependencia mutua entre las variables.
Diremos que la dependencia es perfecta o que existe una
dependencia funcional entre las variables si todos los pun-
tos del diagrama de dispersión se encuentran sobre la l´ınea
de regresión.
Lineal intensa Lineal débil Lineal perfecta
X
Y
0 4 8 12 16 20
3
4
5
6
7
8
9
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
X
Y
0 2 4 6 8 10 12 14 16 18 20
3,6
5,6
7,6
9,6
89

.
Cuánto más lejos se encuentren dichos puntos de la l´ınea
de regresión, menor será la intensidad de la dependencia
entre las variables consideradas.
T
E
¨¨
¨¨¨
¨¨¨
¨¨¨¨
¨¨¨
¨¨¨
¨¨¨
¨¨¨¨
xi
ej
Valor teórico → y∗
j
Valor observado → yj
X
Y
•
•
•
•
•
•
•
•
*
•
Toda l´ınea de regresión debe ir acompañada de una medida
de la bondad ó representatividad .
90

.
La varianza residual es el coeficiente que mide la variabilidad
de los residuos o errores y viene dada por la expresión
s2
rY
=
k
i=1
h
j=1
(yj − y∗
j )2 ·
nij
N
=
k
i=1
h
j=1
e2
j ·
nij
N
siendo los valores ej = yj − y∗
j los residuos o errores.
(a) Valores grandes de s2
rY
indican que, en promedio, los
errores ej = yj − y∗
j son grandes, y como consecuencia,
la l´ınea de regresión es poco representativa.
(b) Valores pequeños de s2
rY
indicar´ıan que, en promedio, los
errores ej = yj − y∗
j son pequeños, y por tanto, la l´ınea
de regresión es representativa. La máxima representa-
tividad se tiene si ej = 0 para todo j, es decir, cuando
s2
rY
= 0, que es el m´ınimo valor que la varianza residual
puede alcanzar.
91

.
La varianza residual tiene el inconveniente de que depende
de las unidades de medida al cuadrado. Esto hace que no
sea posible comparar el grado de dependencia entre grupos
de variables expresadas en distintas unidades de medida.
Necesitamos por tanto una medida adimensional.
Se define el coeficiente de determinación como
R2 = 1 −
s2
rY
s2
Y
Al estar R2 definido por cociente entre varianzas es un
parámetro independiente de las unidades de medida. Es-
to nos permitirá comparar resultados entre las asociaciones
de diferentes grupos de variables.
Otra ventaja de este coeficiente es que su rango de va-
riación es acotado, 0 ≤ R2 ≤ 1, ya que se verifica que
0 ≤ s2
rY
≤ s2
Y .
92

.
(a) Si el ajuste es perfecto, es decir, todos los puntos del
diagrama de dispersión se sitúan sobre la curva calculada
(s2
rY
= 0), entones R2 = 1.
(b) Cuanto mayor sea la distancia de los puntos a la cur-
va, mayor es s2
rY
y menor R2. El valor m´ınimo de éste,
R2 = 0, se alcanza cuando s2
rY
= s2
Y , en cuyo caso no
se consigue ninguna explicación de la variable Y rela-
cionándola con la X mediante la curva considerada.
Cuando el coeficiente de determinación vale como m´ınimo
0,75, el modelo ajustado suele aceptarse. Si el coeficiente
es inferior a dicho valor, concluiremos que la relación ele-
gida no es adecuada, debiéndose ensayar con otro tipo de
función.
93

.
Se define el coeficiente de correlación lineal como
r =
sXY
sXsY
Este coeficiente nos proporciona el grado de asociación
lineal entre las variables, y el tipo de dicha relación.
Puede demostrarse que, en el caso lineal, se verifica que
R2 = r2.
Al verificarse que R2 = r2 y que 0 ≤ R2 ≤ 1, se tendrá que
−1 ≤ r ≤ 1. El signo hace alusión al tipo (lineal directa o
lineal inversa) y su valor en términos absolutos, a la inten-
sidad de la relación.
94

Interpretaci´on del valor de r
-1 -0.87 -0.5 0 0.5 0.87 1
F uerte
Inversa
↑
Escasa
Inversa
↑
Escasa
Directa
↑
F uerte
Directa
↑
↓
P erfecta
Inversa
↓
Incorreladas
↓
P erfecta
Directa
↓
Regular
Inversa
↓
Regular
Directa
95

Ejemplo 11 Comparemos los valores de R2 y r obtenidos
con los datos que nos han proporcionado las gr´aﬁcas si-
guientes:
Perfecta directa Fuerte directa Regular directa
X
Y
0 2 4 6 8 10 12 14 16 18 20
3,6
5,6
7,6
9,6
X
Y
0 4 8 12 16 20
3
4
5
6
7
8
9
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
R2 = 1 R2 = 0,9320 R2 = 0,6198
r = +1 r = +0,9654 r = +0,7872
96

Cap´ıtulo 4: SERIES TEMPORALES
4.1.-Introducción
4.2.-Análisis de la tendencia de una serie temporal
4.3.-Análisis de la estacionalidad
97

98

.
Llamamos serie temporal a una sucesión de observaciones
cuantitativas de un fenómeno, ordenadas en el tiempo.
En una serie temporal es esencial la ordenación que el tiem-
po induce en los datos. Esta ordenación no puede variarse.
Vamos a considerar una serie temporal como una variable
bidimensional (t, Yt), en la que una de las componentes, la
dependiente, es la magnitud que queremos analizar, mien-
tras que la independiente es el tiempo.
El análisis de una serie temporal debe iniciarse con una
representación gráfica en un sistema de ejes cartesianos.
Representaremos en el de abcisas el tiempo, t, y en el de
ordenadas la magnitud observada, Yt. Con esto se consi-
gue el diagrama de dispersión de la distribución (ti, yti
). La
unión mediante segmentos de sus puntos nos proporciona
un diagrama de sierra del cual extraeremos las conclusio-
nes iniciales sobre el comportamiento de nuestra serie.
99

Ejemplo 12 En la siguiente tabla se recogen las cifras re-
lativas a la poblaci´on reclusa existente en los diferentes
centros penitenciarios de Espa˜na (Fuente: INE)
Meses 2002 2003 2004 2005 2006
Enero 48 398 52 547 56 814 59 668 61 447
F ebrero 49 031 53 091 57 725 59 966 61 930
Marzo 49 685 53 525 58 068 60 078 62 426
Abril 50 107 53 633 58 547 60 602 62 794
Mayo 50 683 54 360 59 043 60 702 63 111
Junio 50 961 54 770 59 125 60 887 63 552
Julio 50 519 54 784 59 254 61 067 63 800
Agosto 51 161 55 244 59 249 61 269 64 120
Septiembre 51 454 55 477 59 385 61 156 64 233
Octubre 52 001 55 999 59 658 61 274 64 195
Noviembre 52 342 56 411 59 695 61 257 64 325
Diciembre 51 882 56 096 59 375 61 054 64 021
100

Poblacionreclusa
1/02 1/03 1/04 1/05 1/06 1/07
48
51
54
57
60
63
66
(X 1000)
Serie temporal de la poblaci´on reclusa existente en los
diferentes centros penitenciarios de Espa˜na
101

.
Supondremos que las series temporales están formadas por
cuatro componentes teóricas:
(a) Tendencia, Tt: evolución de la serie a largo plazo.
(b) Estacional, Et: fluctuaciones de la serie que se producen
en un periodo igual o inferior a un año, y que se repro-
ducen de manera reconocible en los diferentes años. Se
deben a efectos de la climatolog´ıa sobre la actividad
económica o a algunos hábitos sociales.
(c) C´ıclica, Ct: oscilaciones que se producen con un periodo
superior al año, debidas a la alternancia de etapas de
prosperidad y depresión.
(d) Residual, rt: movimientos originados por fenómenos im-
previsibles, como huelgas, catástrofes, etc., que afectan
a la variable de manera casual y no permanente.
102

¿Cómo se combinan las cuatro componentes teóricas para
formar la serie que observamos?. En el estudio clásico de
las series temporales se consideran los modelos siguientes:
(a) Modelo aditivo: Yt = Tt + Et + Ct + rt
(b) Modelo multiplicativo puro: Yt = Tt · Et · Ct · rt
(c) Modelo multiplicativo-aditivo: Yt = Tt · Et · Ct + rt
Para elegir uno u otro modelo existen varios métodos. En
el presente curso no vamos a profundizar en este tema y,
en todos los supuestos que vamos a estudiar se nos indi-
cará qué modelo debemos utilizar.
103

Secci´on 4.2: An´alisis de la tendencia de una serie
temporal
104

.
Para realizar un estudio de la tendencia en una serie tem-
poral, existen diferentes métodos. Vamos a desarrollar el
que se conoce como Método de las medias móviles
Consiste en el suavizado de la serie dada, promediando sus
observaciones con valores contiguos, anteriores y posterio-
res, con lo que se consigue eliminar la componente residual.
Para calcular medias móviles de orden o tamaño p se pro-
cede como sigue:
(a) La primera media móvil se obtiene calculando la media
aritmética de las p primeras observaciones.
(b) Para calcular las siguientes, vamos excluyendo la primera
observación del grupo anterior e incluyendo la posterior
a la última tomada.
(c) El proceso se repite hasta que no se puedan formar más
grupos que contengan p observaciones.
La tendencia será la l´ınea quebrada que une las sucesivas
medias móviles.
105

Ejemplo 13
Usando medias m´oviles de orden 3,
ti yti
T endencia
t1 yt1
t2 yt2
yt1 + yt2 + yt3
3
= yt2
t3 yt3
yt2 + yt3 + yt4
3
= yt3
t4 yt4
yt3 + yt4 + yt5
3
= yt4
t5 yt5
yt4 + yt5 + yt6
3
= yt5
t6 yt6
La tendencia es la l´ınea quebrada que une los puntos
(t2, yt2
), (t3, yt3
), (t4, yt4
) y (t5, yt5
).
106

Debemos tener en cuenta que:
(a) Existen observaciones para las que no se dispone de
medias móviles.
(b) La elección del orden de las medias móviles no es fácil, y
está ligado a las periodicidades de las fluctuaciones que
se desean suavizar. Si los datos se refieren a per´ıodos
inferiores al año, se aconseja tomar como valor de p
el número de dichos per´ıodos. Cuando los datos de la
serie son anuales, y por tanto no existe componente
estacional, debemos tomar como orden el número de
años que comprenda un ciclo.
107

(c) A mayor orden de las medias móviles, mayor suaviza-
do, pero menor número de observaciones para cálculos
posteriores.
(d) Cuando se calculen medias móviles de orden par, las ob-
servaciones no quedarán centradas en el tiempo. Por ello
deberemos repetir el proceso a los promedios obtenidos
inicialmente, utilizando el orden 2.
108

Ejemplo 14
Usando medias m´oviles de orden 4,
ti yti
yti
T endencia
t1 yt1
t2 yt2
yt3
t3 yt3 yt3
=
yt3
+ yt4
2
yt4
t4 yt4 yt4
=
yt4
+ yt5
2
yt5
t5 yt5
t6 yt6
La tendencia es la l´ınea que une los puntos (t3, yt3
) y (t4, yt4
).
109

Ejemplo 15 Durante el per´ıodo 1975-1986, la inversión en
instalaciones penitenciarias, expresada en millones de u.m.,
en cierto pa´ıs fue la siguiente:
Años 1975 1976 1977 1978 1979 1980
Inversión 600 800 750 400 350 500
Años 1981 1982 1983 1984 1985 1986
Inversión 1 000 950 810 540 720 1 160
Suponiendo que la inversión considerada se comporta c´ıcli-
camente con per´ıodo de 4 años, calcúlese la tendencia.
110

.
Según se nos indica en el enunciado, debemos tomar como
valor de p el número de años que se supone comprende un
ciclo, es decir 4.
ti 1975 1976 1977 1978 1979 1980
yti
− − 606,25 537,5 531,25 631,25
ti 1981 1982 1983 1984 1985 1986
yti
757,5 820 790 781,25 − −
111

Si el tama˜no del ciclo fuese 5, las medias m´oviles deber´ıan
calcularse de orden 5.
ti 1975 1976 1977 1978 1979 1980
yti
− − 580 560 600 640
ti 1981 1982 1983 1984 1985 1986
yti
722 760 804 836 − −
112

Secci´on 4.3: An´alisis de la estacionalidad
113

En la gran mayor´ıa de las series temporales las fluctuacio-
nes debidas a la componente estacional, pueden provocar
una distorsión sobre la evolución real de la misma. Debe-
mos, por tanto, identificar la componente estacional y a
continuación eliminarla. A este procedimiento se la llama
desestacionalización. De igual manera que para el estudio
de la tendencia, para el análisis de la estacionalidad tam-
bién existen varios métodos. Nosotros usaremos el de las
medias móviles o método mecánico
114

.
Consta de los siguientes pasos:
(a) Determinamos la tendencia calculando las medias mó-
viles centradas en los per´ıodos, yti
ó yti
. Para ello es-
cogeremos como orden de la media móvil, p , el número
de per´ıodos estacionales en que se divide el año.
(b) Eliminamos de forma conjunta la tendencia y la compo-
nente c´ıclica de los datos originales yti
.
(i) Si el modelo es aditivo, por diferencia:
yti
− yti
ó yti
− yti
(ii) Si el modelo es multiplicativo-aditivo, por cociente:
yti
yti
ó
yti
yti
115

(c) Eliminamos la componente residual calculando los pro-
medios de los valores obtenidos en el apartado (b) para
cada per´ıodo estacional:
(i) Si el modelo es aditivo:
yej
=
1
qj
qj
i=1
(y
(j)
ti
− y
(j)
ti
) ó yej
=
1
qj
qj
i=1
(y
(j)
ti
− y
(j)
ti
)
donde qj es el número de datos a promediar para el
j-ésimo per´ıodo estacional y los sumandos son los va-
lores obtenidos en el apartado (b) para dicho per´ıodo.
Estos promedios son ya las diferentes componentes
estacionales. Es decir, ej = yej
.
116

.
(ii) Si el modelo es multiplicativo-aditivo:
yej
=
1
qj
qj
i=1
y
(j)
ti
y
(j)
ti
ó yej
=
1
qj
qj
i=1
y
(j)
ti
y
(j)
ti
siendo qj es el número de datos a promediar para el
j-ésimo per´ıodo estacional y los sumandos son los va-
lores obtenidos en el apartado (b) para dicho per´ıodo.
Para obtener las componentes estacionales obtenemos
la base, media aritmética de los valores anteriores, con
la que efectuaremos las comparaciones:
y =
ye1
+ ye2
+ . . . + yep
p
As´ı, las componentes estacionales serán
ej =
yej
y
,
llamadas también ´ındices de variación estacional (IVE).
117

Ejemplo 16 La siguiente tabla recoge información sobre
el consumo de materia prima realizado por los estableci-
mientos penitenciarios de cierta Comunidad Autónoma en
el per´ıodo 1998-2003. Calcúlense las componentes estacio-
nales.
1998 1999 2000 2001 2002 2003
Trimestre 1 310 330 339 365 370 460
Trimestre 2 290 305 320 355 375 401
Trimestre 3 285 310 325 365 379 450
Trimestre 4 330 345 360 390 400 500
118

(a) Determinamos la tendencia por el método de las medias
móviles de orden igual a 4, calculando las medias móviles
centradas, yti
.
En un primer paso calculamos las medias móviles de
tamaño 4 no centradas.
1998 1999 2000 2001 2002 2003
Trimestre 1
318,75 332,25 361,25 378,50 427,75
Trimestre 2
303,75 322,50 336,00 368,75 381,00 452,75
Trimestre 3
308,75 324,75 342,50 370,00 403,50
Trimestre 4
312,50 328,50 351,25 375,00 410,00
119

En un segundo paso calculamos las medias m´oviles de ta-
ma˜no 4 centradas, yti
.
1998 1999 2000 2001 2002 2003
Trimestre 1 315,625 330,375 356,250 376,750 418,875
Trimestre 2 320,625 334,125 365,000 379,750 440,250
Trimestre 3 306,250 323,625 339,250 369,375 392,250
Trimestre 4 310,625 326,625 346,875 372,500 406,750
120

.
(b) Eliminamos la tendencia y la componente c´ıclica de los
datos originales:
(i) Si el modelo es aditivo, haremos:
yti
− yti
1998 1999 2000 2001 2002 2003
T1 14,375 8,625 8,750 −6,750 41,125
T2 −15,625 −14,125 −10,000 −4,750 −39,250
T3 −21,250 −13,625 −14,000 −4,375 −13,250
T4 19,375 18,375 13,125 17,500 −6,750
(ii) Si el modelo es multiplicativo-aditivo, calcularemos:
yti
yti
1998 1999 2000 2001 2002 2003
T1 1,04554 1,02610 1,02456 0,98208 1,09817
T2 0,95126 0,95765 0,97260 0,98749 0,91084
T3 0,93061 0,95789 0,95799 0,98815 0,96622
T4 1,06237 1,05625 1,03783 1,04697 0,98340
121

.
(c) Eliminamos la componente residual calculando los pro-
medios de los valores obtenidos en el apartado (b) para
cada per´ıodo estacional, es decir, para cada trimestre:
Componente estacional: ej = yej
Trimestre 1 13,225
Trimestre 2 −16,750
Trimestre 3 −13,300
Trimestre 4 12,325
Si se supone que el incremento medio registrado en
un trimestre considerado como normal es 0 , en-
tonces el consumo de materia prima por parte de la
Comunidad por el concepto considerado se ve incre-
mentado en 13,225 unidades en los trimestres primeros
y 12,325 unidades en los trimestres cuartos de cada
a˜no. Por contra, en los trimestres segundo y tercero
de cada a˜no el consumo de materia prima desciende
en 16,750 y 13,3 unidades, respectivamente.
122

.
Medias trimestrales: yej
Trimestre 1 1,03529
Trimestre 2 0,95596
Trimestre 3 0,96017
Trimestre 4 1,03736
A continuaci´on obtenemos la base, es decir, la media
de todos los valores anteriores:
y =
ye1
+ ye2
+ ye3
+ ye4
p
=
3,98878
4
= 0,9971
Por ´ultimo calcularemos las componentes estaciona-
les
ej =
yej
y
Componente estacional: ej
Trimestre 1 1,038202
123

.
Multiplicadas por cien, obtenemos la expresión porcentual
de más fácil interpretación:
e1 : 103,8202 %; e2 : 95,8648 %
e3 : 96,2870 %; e4 : 104,0277 %
El consumo de materia prima por parte de los estableci-
mientos de la Comunidad se ve incrementado en un 3,8202 %
en los primeros trimestres y en un 4,0277 % en los trimestres
cuartos de cada año. Por contra, en los trimestres segundo y
tercero de cada año el consumo de materia prima desciende
en un 4,1352 % y en un 3,713 % , respectivamente.
124

Obtenidas las componentes estacionales, podemos deses-
tacionalizar la serie rest´andole a cada dato original de la
correspondiente estaci´on el valor de su componente estacio-
nal, si el modelo es aditivo, y dividiendo cada dato original
entre la correspondiente componente estacional expresada
en tantos por uno, en el caso multiplicativo-aditivo.
1998 1999 2000 2001 2002 2003
T1 296,775 316,775 325,775 351,775 356,755 446,775
T2 306,750 321,750 336,750 371,750 391,750 417,750
T3 298,300 323,300 338,300 378,300 392,300 463,300
T4 317,675 332,675 347,675 377,675 387,675 487,675
125

1998 1999 2000 2001 2002 2003
T1 298,593 317,857 326,526 351,569 356,385 443,073
T2 302,509 318,156 333,803 370,312 391,175 418,297
T3 295,989 321,953 337,532 379,074 393,614 467,352
T4 317,222 331,642 346,061 374,899 384,512 480,640
126

Serie desestacionalizada bajo el modelo
multiplicativo-aditivo
127

Cap´ıtulo 5: LA UTILIZACI ÓN DE LA PROBABILIDAD
EN CRIMINOLOGÍA
5.1.-Experimentos aleatorios. Definiciones
5.2.-Diversas concepciones de probabilidad
5.3.-Probabilidad condicionada
5.4.-Sucesos dependientes e independientes
128

Los protagonistas
Daniel Bernoulli (1700 - 1782)
Perteneció a una de las familias más singulares de
la historia de las ciencias. Al menos ochos de sus miembros
brillaron en diferentes campos de las matemáticas. Daniel
destacó en ecuaciones diferenciales, cálculo de probabilida-
des, mecánica, náutica, etc.
129

Blas Pascal (1623 - 1662)
Fué un genio precoz a quien su padre inició muy
pronto en la geometr´ıa. Destacó en filosof´ıa, f´ısica y ma-
temáticas. Junto con Fermat, se considera iniciador de los
estudios de probabilidad tal y como los entendemos hoy en
d´ıa.
130

Pierre Fermat (1601 - 1665)
Matemático de gran importancia en el desarrollo
de la Teor´ıa de Números. En su correspondencia con Pascal
se situa el inicio del moderno cálculo de probabilidades.
131

Andrei N. Kolmogorov (1903 - 1987)
Estableci´o las bases modernas de la teor´ıa axiom´ati-
ca de la probabilidad.
132

Secci´on 5.1: Experimentos aleatorios. Deﬁniciones
133

Definición Los fenómenos aleatorios son aquellos en los
que no se puede predecir el resultado final incluso realizándo-
se en las mismas condiciones.
Ejemplo 17 Son ejemplos de experimentos aleatorios el
lanzamiento de un dado equilibrado, la elección al azar de
un número entre 0 y 1, consumo diario de agua de una
ciudad, etc...
Definición La Teor´ıa de la Probabilidad estudia los méto-
dos de análisis que son comunes en el tratamiento de los
fenómenos aleatorios, cualquiera que sea el área en que
éstos se presenten.
134

La correspondencia de Fermat con Pascal, consistente en
7 cartas entre julio y octubre de 1654, se considera el co-
mienzo del Cálculo de Probabilidades. Concretamente las
misivas resolvieron el llamado Problema del Reparto:
Un jugador juega a que saca un seis de ocho tiradas,
pero después de tres tiradas no lo ha conseguido y
la partida no se continúa. ¿Qué proporción de la
apuesta total debe recibir?
135

Definición Se llama espacio muestral asociado a un experi-
mento aleatorio al conjunto formado por todos los posibles
resultados del experimento aleatorio. Suele representarse
por Ω.
Ejemplo 18 Consideremos el experimento aleatorio consis-
tente en lanzar un dado equilibrado de seis caras al aire y ob-
servar el número de puntos que figuran en la cara superior.
Su correspondiente espacio muestral será Ω = {1, 2, 3, 4, 5, 6}.
Definición Se denomina suceso a todo subconjunto A del
espacio muestral, (A ⊆ Ω). Es un resultado en que se con-
creta el experimento.
136

Los sucesos suelen representarse por letras mayúsculas: A,
B, C,...
Ejemplo 19 En el lanzamiento de un dado, son sucesos:
A= sacar puntuación par = {2, 4, 6};
B= sacar puntuación 2 = {2}.
137

Existen distintos tipos de sucesos:
(a) Suceso imposible es aquel que no ocurre nunca. Se re-
presenta por ∅.
(b) Suceso seguro es aquel que ocurre siempre. Se repre-
senta por Ω.
(c) Suceso elemental es el formado por un s´olo punto mues-
tral.
(d) Suceso compuesto es el formado por m´as de un punto
muestral.
138

.
Definición Se llama espacio de sucesos, S, al conjunto
formado por todos los sucesos asociados al experimento
aleatorio en cuestión.
Ejemplo 20 Ω = {1, 2, 3, 4, 5, 6} es el espacio muestral en el
lanzamiento de un dado de seis caras, entonces el espacio
de sucesos será:
S = P (Ω) = {∅, {1}, . . . , {6}, {1, 2}, . . . , {5, 6},
{1, 2, 3}, . . . , {3, 4, 5, 6}, . . . , {2, 3, 4, 5, 6}, Ω}
Un suceso elemental es B= sacar puntuación 2 = {2}.
Un suceso compuesto es A= sacar puntuación par =
{2, 4, 6}.
139

.
Hemos establecido una correspondencia entre sucesos y
conjuntos. Vamos a recordar algunas operaciones y rela-
ciones entre conjuntos, que ahora, serán de interés para
trasladarlas a los sucesos.
Definición Dado el suceso A de un espacio muestral Ω,
definimos suceso complementario de A, que se denota por
A, al suceso formado por todos los puntos muestrales que
no pertenecen a A.
A = {ω ∈ Ω/ω /∈ A}
El suceso A ocurre si y sólo si no ocurre A.
Ejemplo 21 En el lanzamiento de un dado de seis caras
⇒ Ω = {1, 2, 3, 4, 5, 6}. Entonces:
A= sacar puntuación par = {2, 4, 6} ⇒ A= sacar pun-
tuación impar = {1, 3, 5}
140

.
Definición Dados los sucesos A y B de un espacio muestral
Ω, la unión de ambos, que se denota por A∪B, es el suceso
formado por todos los puntos muestrales que pertenecen
al menos a uno de los sucesos.
A ∪ B = {ω ∈ Ω/ω ∈ A ó ω ∈ B}
El suceso A∪B ocurre siempre que ocurra A ó B ó ambos.
Ejemplo 22 En el lanzamiento de un dado de seis caras,
sean los sucesos A y B siguientes:
A= sacar puntuación par = {2, 4, 6}
B= sacar puntuación mayor que 4 = {5, 6}
Entonces
A ∪ B =
sacar puntuación par ó puntuación mayor que 4 = {2, 4, 5, 6}
141

.
Definición Dados los sucesos A y B de un espacio muestral
Ω, la intersección de ambos, que denotamos por A ∩ B,
es el suceso formado por todos los puntos muestrales que
pertenecen a ambos sucesos.
A ∩ B = {ω ∈ Ω/ω ∈ A y ω ∈ B}
El suceso A ∩ B ocurre siempre que ocurran A y B.
sean los sucesos A y B siguientes:
A= sacar puntuación par = {2, 4, 6}
B= sacar puntuación mayor que 4 = {5, 6}
Entonces
A∩B = sacar puntuación par y puntuación mayor que 4 = {6}
142

.
Definición A y B son sucesos incompatibles o mutuamente
excluyentes, si la ocurrencia simultánea de ambos es impo-
sible, es decir: A ∩ B = ∅.
son incompatibles los sucesos:
A= sacar puntuación menor que 3 = {1, 2} y B= sacar
puntuación mayor que 4 = {5, 6}
Observación Un suceso y su complementario son siempre
sucesos incompatibles.
Leyes de De Morgan
(a) A ∪ B = A ∩ B
(b) A ∩ B = A ∪ B
143

Secci´on 5.2: Diversas concepciones de probabilidad
144

.
Dado un suceso, A, perteneciente al espacio de sucesos
S asociado al espacio muestral Ω, la probabilidad trata de
asignar a A una medida teórica de la ocurrencia de A.
(a) DEFINICI ÓN CLÁSICA Ó DE LAPLACE (1812)
Deben establecerse dos hipótesis necesarias:
(i) El espacio muestral ha de ser finito, y
(ii) Todos los sucesos elementales han de ser igualmente
favorables
entonces se define la probabilidad del suceso A como
p(A) =
número de casos favorables a A
número total de sucesos elementales posibles
=
(A)
(Ω)
145

Ejemplo 25 En el lanzamiento de un dado de seis caras
no cargado, consideremos Ω = {1, 2, 3, 4, 5, 6}. Sea el suceso
A= sacar puntuaci´on menor que 3 = {1, 2}, entonces:
p(A) =
(A)
(Ω)
=
2
6
= 0.3
146

.
(b) DEFINICI ÓN FRECUENCIALISTA O DE VON MISES
(1919)
Si repetimos un experimento N veces, llamamos fre-
cuencia relativa del suceso A, que denotamos por f(A),
al cociente entre el número de veces que éste se pre-
senta y el total de pruebas. La frecuencia relativa no es
más que una medida relativa y emp´ırica de la ocurrencia
de un suceso.
Es un hecho comprobado emp´ıricamente que, la fre-
cuencia relativa de un suceso tiende a estabilizarse cuan-
do el número de pruebas aumenta. La definición fre-
cuencialista de probabilidad se basa en este hecho, y
asigna como probabilidad al suceso A el número:
p(A) = l´ım
N→∞
f(A) = l´ım
N→∞
n(A)
N
=
= l´ım
N→∞
frecuencia absoluta de A
número total de pruebas
147

Estas conclusiones llevan el nombre de Primera Ley de los
Grandes Números: Cuando el número de realizaciones de un
experimento aleatorio crece mucho, la frecuencia relativa
del suceso asociado se va acercando cada vez más hacia un
cierto valor. Este valor se llama probabilidad del suceso.
148

(c) DEFINICI ÓN AXIOMÁTICA O DE KOLMOGOROV
(1933)
Dado el espacio de sucesos S asociado a un espacio
muestral Ω, se define una medida de probabilidad, p,
como una función:
p : S → [0, 1]
que verifique los siguientes axiomas:
Axioma 1: p(A) ≥ 0, ∀A ∈ S
Axioma 2: p(Ω) = 1
Axioma 3: p


i
Ai

 =
i
p(Ai), ∀Ai ∈ S, Ai ∩ Aj = ∅, i = j
149

Observación Los axiomas anteriores permiten demostrar
las dos propiedades siguientes:
(a) p(A) = 1 − p(A)
(b) p(A ∪ B) = p(A) + p(B) − p(A ∩ B)
Definición Se denomina espacio probabil´ıstico a la terna
(Ω, S, p), donde S es el espacio de sucesos asociado al es-
pacio muestral Ω, y p es una medida de probabilidad.
150

Caso 1 El ciudadano norteamericano Wayne Williams fue
acusado de las muertes de dos hombres negros en Atlan-
ta, Georgia. La evidencia contra Williams consist´ıa en un
número de fibras de moqueta encontradas sobre los cuer-
pos, que se parec´ıan a las fibras encontradas en su entorno.
Estas fibras pertenecen a un tipo de moqueta poco usual.
Un experto concluye que ese tipo de fibra sólo se encuentra
en 10 áreas del Estado. Asumiendo que las ventas han sido
iguales en las 10 áreas y que sólo se ha enmoquetado una
habitación por casa, el experto cifra, por la cantidad de mo-
queta vendida, que sólo 81 casas de Atlanta conten´ıan esa
fibra de 638992, luego si llamamos al suceso A= la casa
seleccionada tiene la moqueta considerada entonces:
p(A) =
81
638992
= 0,0001267
1
8000
151

La habitación de Wayne Williams ten´ıa moqueta con esa
fibra y el fiscal arguyó que hab´ıa sólo una posibilidad so-
bre 8000 de que hubiera otra casa en Atlanta que tuviera
la misma moqueta que la casa de Williams . El acusado
finalmente ser´ıa declarado culpable.
152

Secci´on 5.3: Probabilidad condicionada
153

En los ejemplos que hemos planteado hasta ahora, siem-
pre hemos supuesto que cualquiera de los resultados puede
ocurrir en el experimento. La incorporaci´on de una infor-
maci´on adicional, como por ejemplo, el conocimiento de la
ocurrencia de otro suceso, puede hacer que determinados
resultados no puedan ocurrir, con lo que el espacio muestral
cambia y cambian las probabilidades.
154

.
Ejemplo 26 Supongamos el experimento consistente la ex-
tracción de una bola de un bolsa que contiene seis bolas
numeradas del uno al seis y observar el resultado obtenido.
El correspondiente espacio muestral es Ω = {1, 2, 3, 4, 5, 6}, y
la probabilidad inicial del suceso A= sacar número primo
= {2, 3, 5} es:
p(A) =
3
6
=
1
2
Observación Dado un número entero n > 1, diremos que
n es un número primo, si 1 y n son los únicos divisores
positivos de n. Por tanto los primeros números primos son
2, 3, 5, 7, 11, etc.
155

Supongamos ahora que las bolas correspondientes a los
números pares han sido introducidas en una bolsa de color
rojo y las correspondientes a los impares en una de color
amarillo. Seleccionamos al azar una de las dos bolsas re-
sultando seleccionada la roja. Si a continuación extraemos
una bola de dicha bolsa, ¿qué probabilidad hay de que la
cifra obtenida sea número primo?
156

La información del color de la bolsa produce, en este caso,
una reducción del espacio muestral a:
Ωroja = Ωpar = {2, 4, 6}
con lo que,
p(A si se elegió bolsa roja) = p(A/puntuación par) =
1
3
Como vemos, en este caso, la información disponible ha
hecho disminuir la probabilidad.
157

Otras veces una información adicional aumenta dicha pro-
babilidad. Supongamos que el color de la bolsa seleccionada
hubiese sido amarilla, entonces:
Ωamarilla = Ωimpar = {1, 3, 5}
y, por tanto,
p(A si se eligió bolsa amarilla) = p(A/puntuación impar) =
2
3
158

Deﬁnici´on Cuando consideremos la probabilidad de ocu-
rrencia de un suceso A perteneciente a un espacio de su-
cesos sabiendo que ha acontecido otro suceso B, diremos
que estamos calculando la probabilidad de A condiciona-
da a B. Lo denotamos por p(A/B), donde A es el suceso
condicionado y B es el suceso condicionante.
159

En el ejemplo anterior podemos expresar la probabilidad de
obtener número primo, habiendo obtenido cifra par como:
p(A/puntuación par) =
1
3
=
1
6
3
6
=
p(A ∩ puntuación par)
p(puntuación par)
y, la probabilidad de obtener número primo, habiendo ob-
tenido cifra impar como:
p(A/puntuación impar) =
2
3
=
2
6
3
6
=
p(A ∩ puntuación impar)
p(puntuación impar)
160

Deﬁnici´on Sea (Ω, S, p) un espacio probabil´ıstico y B un
suceso de S con probabilidad no nula, p(B) > 0. Sea A un
suceso cualquiera de S, llamaremos probabilidad del suce-
so A condicionada porque haya acontecido otro suceso B
o, sencillamente, probabilidad de A condicionada por B, al
cociente
p(A/B) =
p(A ∩ B)
p(B)
161

Teorema Sean A1, A2, . . . , An ∈ S tales que p(A1 ∩ A2 ∩ . . . ∩
An−1) = 0 entonces
p(A1 ∩ A2 ∩ . . . ∩ An) =
= p(A1) · p(A2/A1) · p(A3/A1 ∩ A2) · · · p(An/A1 ∩ A2 ∩ · · · ∩ An−1)
162

Ejemplo 27 De un lote de doce art´ıculos, de los cuales
cuatro son defectuosos, se toman tres art´ıculos escogidos
al azar uno tras otro sin reemplazamiento. Calcula la proba-
bilidad de que los tres art´ıculos sean no defectuosos. Sean
los sucesos
A1= el primer art´ıculo seleccionado es no defectuoso
A2= el segundo art´ıculo seleccionado es no defectuoso
A3= el tercer art´ıculo seleccionado es no defectuoso
Entonces:
p(A1∩A2∩A3) = p(A1)·p(A2/A1)·p(A3/A1∩A2) =
8
12
·
7
11
·
6
10
=
14
55
163

Secci´on 5.4: Sucesos dependientes e independientes
164

.
Ejemplo 28 Consideremos el experimento consistente en
lanzar un dado no cargado y sean los sucesos A y B siguien-
tes:
A= obtener cifra mayor que 2 = {3, 4, 5, 6} ⇒ p(A) =
4
6
B= obtener cifra par = {2, 4, 6} ⇒ p(B) =
3
6
A ∩ B= obtener cifra par mayor que 2 = {4, 6} ⇒
p(A ∩ B) =
2
6
, entonces
p(A/B) =
p(A ∩ B)
p(B)
=
2
6
3
6
=
2
3
= p(A)
p(B/A) =
p(B ∩ A)
p(A)
=
2
6
4
6
=
2
4
= p(B)
165

Como observamos, la información suministrada por el suce-
so condicionante resulta indiferente en cuanto a la proba-
bilidad de ocurrencia del suceso condicionado. Los sucesos
A y B se dirán independientes.
Definición Sea el espacio probabil´ıstico (Ω, S, p) y sean A y
B sucesos de S con p(B) > 0. Diremos que los sucesos A y
B son independientes si se verifica que
p(A/B) = p(A)
O dicho de otra forma:
Definición Diremos que dos sucesos A y B son indepen-
dientes si y sólo si se verifica que:
p(A ∩ B) = p(A) · p(B)
166

Caso 2 En Miller v. State, 240 Ark. 340, 399 S.W.2d 268
(1966), un experto testificó basado en las probabilidades
de los siguientes sucesos:
1. A1= Encontrar al azar una fibra de un determinado
color , p(A1) = 1/10,
2. A2= Encontrar al azar una fibra de una determinada
textura , p(A2) = 1/100 y
3. A3= Encontrar al azar una fibra de una determinada
densidad , p(A3) = 1/1000
luego
p(A1 ∩ A2 ∩ A3) = p(A1) · p(A2) · p(A3) =
1
10
·
1
100
·
1
1000
=
1
1000000
167

por tanto, el acusado fue condenado en base a que la pro-
babilidad de encontrar al azar una ﬁbra incriminatoria como
la encontrada sobre su ropa era de 1/1000000=0.000001.
En la corte de apelaci´on, la condena fue revocada por no
considerar adecuada tal probabilidad.
168

Caso 3 En Collidge v. State, 109 N.H. 403, 260 A. 2d 547
(1969). Un experto obtuvo fibras del vestido de la v´ıctima,
de la ropa del acusado y del automóvil donde se cre´ıa que un
crimen se hab´ıa perpetrado. Estudios previos indican que la
probabilidad de encontrar part´ıculas similares en rastreos de
una serie de automóviles era de 1/10. El experto concluye
que si llamamos
A= Encontrar 27 part´ıculas similares , entonces
p(A) =
1
1027
Otro experto sostuvo que las 27 part´ıculas pueden no ser
independientes unas de otras, pero la corte opta por la
condena del acusado.
169

Teorema de la probabilidad total Dado un espacio proba-
bil´ıstico (Ω, S, p), si A1, A2, . . . , An ∈ S es una colecci´on de
sucesos mutuamente excluyentes, todos con probabilidades
no nulas, y tales que Ω =
n
i=1
Ai, se veriﬁca para todo B ∈ S:
p(B) =
n
i=1
p(B/Ai) · p(Ai)
170

.
Teorema de Bayes Dado un espacio probabil´ıstico (Ω, S, p),
si A1, A2, . . . , An ∈ S es una colección de sucesos mutuamen-
te excluyentes, todos con probabilidades no nulas, y tales
que Ω =
n
i=1
Ai, se verifica para todo B ∈ S:
p(Aj/B) =
p(Aj ∩ B)
p(B)
=
p(B/Aj) · p(Aj)
n
i=1
p(B/Ai) · p(Ai)
, con j = 1, 2, . . . , n.
A las probabilidades p(Aj) se les llama probabilidades a prio-
ri, y son las probabilidades iniciales que tenemos de los su-
cesos Aj. Ante una determinada evidencia experimental, B,
corregimos el grado de creencia de las Aj obteniendo unas
nuevas probabilidades, p(Aj/B), llamadas probabilidades a
posteriori, a través de las verosimilitudes, p(B/Aj).
171

.
Caso 4 US v. López, 328 F. Supp. 1077 (EDNY 1971). En
1980 la administración americana introduce un programa
para ayudar a identificar pasajeros con sustancias ilegales
en los aviones. Consideremos el suceso:
A= Una persona elegida al azar lleva sustancias ilegales
Supongamos que, aproximadamente, una persona de cada
25000 viajeros lleva una sustancia ilegal. Es decir que se
tiene que p(A) =
1
25000
= 0,00004, probabilidad llamada a
priori.
Para confirmar tal suposición, usamos un test o prueba
que previamente ha sido evaluada sobre dos grupos de in-
dividuos, unos que llamaremos afectados (con sustancias
ilegales, en este caso) y otros que no.
172

As´ı, se ha estimado de modo frecuencialista que el test tiene
una sensibilidad del 90 % y una especificidad del 99.95 %.
La sensibilidad de un test es la proporción de individuos
afectados que son dados como positivos, correctamente,
por el test, es decir, p(+/A) = 0,90.
El término tasa de falsos negativos hace referencia al com-
plementario de la sensibilidad.
Tasa de falsos negativos=1- sensibilidad=p(−/A) = 0,10
173

La especificidad de un test es la proporción de individuos
de entre los no afectados que son dados como negativos,
correctamente, por el test, es decir, p(−/A) = 0,9995.
El término tasa de falsos positivos hace referencia al com-
plementario de la especificidad.
Tasa de falsos positivos=1- especificidad=p(+/A) = 0,0005
A partir de lo anterior y usando el Teorema de Bayes, po-
demos calcular las probabilidades a posteriori (en función
de los resultados del test): los llamados valores predictivos
positivo y negativo.
Valor predictivo positivo=p(A/+)
Valor predictivo negativo=p(A/−)
174

.
Dos pasajeros muestran el perfil sospechoso. Son cachea-
dos, se les encuentra hero´ına y son arrestados. La pregunta
que hace la defensa es cuál es la proporción de personas
que llevan una sustancia ilegal supuesto que que el test los
ha calificado de alto riesgo , es decir, supuesto que el test
ha sido positivo.
Aplicando el teorema de Bayes dicha probabilidad será
p(A/+) =
p(+/A) · p(A)
p(+/A) · p(A) + p(+/A) · p(A)
=
=
0,90 · 0,00004
0,90 · 0,00004 + 0,0005 · 0,99996
= 0,067
es decir, un 6.7 % de individuos calificados como de alto
riesgo lleva sustancias ilegales.
175

Luego nuestra suposición de que un 0,004 % de pasajeros
llevaban sustancias ilegales, es del 6,7 % una vez realizada
la prueba. Nuestra opinión a priori ha sido modificada por
el resultado del experimento.
La defensa arguye que esta proporción es demasiado baja
para justificar un breve arresto de los detenidos.
176

.
Caso 5 En 1986 la administración de Reagan declara el uso
de drogas incompatible con un empleo en la administración
estadounidense y autoriza la realización de un test de orina
para los nuevos aspirantes a funcionarios o para los ya fun-
cionarios de los que se sospeche que consumen drogas. En
la orden se asegura que el test debe tener una sensibilidad
del 98 %, una especificidad del 95 % y se supone que el 1 %
de la población laboral toma drogas.
Consideremos los sucesos
A= una persona elegida aleatoriamente toma drogas
A= una persona elegida aleatoriamente no toma drogas
+= en una persona elegida al azar el test da positivo
−= en una persona elegida al azar el test da negativo
177

De estos sucesos conocemos
Las probabilidades a priori, que son p(A) = 0,01; p(A) = 0,99
La sensibilidad p(+/A) = 0,98;
La tasa de falsos negativos p(−/A) = 0,02;
La especiﬁcidad p(−/A) = 0,95;
La tasa de falsos positivos p(+/A) = 0,05.
178

.
El valor predictivo positivo del test, es decir, la proporci´on
sobre todos los tests positivos que realmente se correspon-
den con personas consumidoras de droga es de
p(A/+) =
p(+/A) · p(A)
p(+/A) · p(A) + p(+/A) · p(A)
=
=
0,98 · 0,01
0,98 · 0,01 + 0,05 · 0,99
= 0,1652
El valor predictivo negativo es de
p(A/−) =
p(−/A) · p(A)
p(−/A) · p(A) + p(−/A) · p(A)
=
=
0,95 · 0,99
0,95 · 0,99 + 0,02 · 0,01
= 0,9997
179

Cap´ıtulo 6: MODELOS PROBABIL´ISTICOS
ASOCIADOS A LA CRIMINOLOG´IA
6.1.-Variables aleatorias
6.2.-Caracter´ısticas de las variables aleatorias
6.3.-Modelos probabil´ısticos
180

Secci´on 6.1: Variables aleatorias
181

Ejemplo 29 Cierto establecimiento penitenciario contabili-
za el número de accidentes laborales diarios. Los datos del
último mes fueron:
Número de accidentes 0 1 2 3 4
Número de d´ıas 10 12 5 2 1
Considerando la variable estad´ıstica
X = N0 de accidentes diarios ,
puede considerarse la distribución de frecuencias:
xi 0 1 2 3 4
ni 10 12 5 2 1
fi 1/3 2/5 1/6 1/15 1/30
182

Para dicha distribución podemos calcular una serie de coe-
ficientes como por ejemplo x, Me, s2, etc... Estas medidas
emp´ıricas tienen su fundamento en las frecuencias observa-
das de los valores de la variable.
Después de observar el comportamiento de dicha variable
durante un número elevado de meses, las regularidades ob-
servadas en las frecuencias relativas permiten la definición
de una distribución de probabilidad que trate de explicar el
comportamiento futuro del fenómeno.
xi 0 1 2 3 4
pX (xi) 1/3 2/5 1/6 1/15 1/30
183

De forma análoga al caso de la variable estad´ıstica podemos
resumir los aspectos más relevantes de esta distribución me-
diante una serie de medidas teóricas como por ejemplo la
esperanza, la mediana, la varianza, etc... As´ı podemos rela-
cionar conceptos como los que se muestran en la siguiente
tabla:
Medidas Emp´ıricas Medidas Teóricas
Frecuencia relativa Probabilidad
Frecuencia relativa acumulada Función de distribución
Variable estad´ıstica Variable aleatoria
Media aritmética (x) Esperanza matemática (µ)
Varianza (s2) Varianza (σ2)
184

Ejemplo 30 Realicemos el experimento consistente en lan-
zar una moneda no cargada dos veces. Su espacio muestral
será:
Ω = {(c, c), (c, +), (+, c), (+, +)}
donde todos los puntos muestrales son equiprobables.
Nos fijaremos en una determinada caracter´ıstica numérica
del experimento, como por ejemplo,
X= número de caras obtenidas en los dos lanzamientos .
Podemos considerar X como una aplicación que asocia a
cada resultado del espacio muestral un valor numérico
X : Ω −→ R
(c, c) −→ 2
(c, +) −→ 1
(+, c) −→ 1
(+, +) −→ 0
185

Además, cada uno de estos valores se toma con una cierta
probabilidad inducida por la aleatoridad del fenómeno al que
está asociado. As´ı, podemos escribir, por ejemplo:
p[X = 0] = p[(+, +)] =
1
4
p[X = 1] = p[(c, +) ∪ (+, c)] =
1
4
+
1
4
=
1
2
p[X = 2] = p[(c, c)] =
1
4
186

La noción de variable aleatoria es la de una función que
asigna un valor numérico a cada suceso elemental. De este
modo trasladamos la probabilidad definida sobre sucesos a
subconjuntos de la recta real.
Definición Sea (Ω, S, p) un espacio probabil´ıstico, se deno-
mina variable aleatoria (v.a.) a una aplicación:
X : Ω −→ R
w ∈ Ω −→ X(w) ∈ R
187

Definición Se denomina función de distribución (f.d.D.)
de una variable aleatoria X a la función FX definida como
sigue:
FX : R −→ [0, 1]
FX (x) = p [X ≤ x] , ∀x ∈ R.
La función de distribución de la variable aleatoria X describe
la acumulación de probabilidad por la variable a lo largo de
la recta real. Tiene su antecedente en la frecuencia relativa
acumulada.
188

Definición Una variable aleatoria X es discreta si el con-
junto de valores que puede tomar X con probabilidad no
nula es discreto (finito ó infinito numerable)
Si la variable es discreta y toma pocos valores distintos,
podemos dar esos valores con sus probabilidades de for-
ma expl´ıcita, pero si presenta muchos valores diferentes o
es de otro tipo, debemos apoyarnos en funciones que nos
resuman sus caracter´ısticas esenciales.
189

Definición Se conoce como función de masa de proba-
bilidad ó función de probabilidad de una variable aleatoria
discreta X que toma los valores x1, x2, . . . , xn, . . . con proba-
bilidades no nulas a la función
pX : R → [0, 1]
definida por:
pX (x) =
p[X = xk], si x = xk, k = 1, 2, . . . , n, . . .
0, en otro caso.
190

Sea X una variable aleatoria discreta que toma los valores
x1, x2, . . . , xn, . . . entonces se veriﬁcan las siguientes propie-
dades:
(a) 0 ≤ pX (xk) ≤ 1 para todo k.
(b)
k
pX (xk) = 1.
(c) FX (x) = p[X ≤ x] =
xk≤x
pX (xk).
(d) pX (xk) = FX (xk) − FX (xk−1).
191

Ejemplo 31 Consideremos el Ejemplo 30, y sea X= núme-
ro de caras obtenidas en dos lanzamientos de la moneda .
Sus posibles valores son X = {0, 1, 2}. Calculemos primero
FX en los posibles valores de X:
FX (0) = p [X ≤ 0] = p [X = 0] =
1
4
FX (1) = p [X ≤ 1] = p [X = 0] + p [X = 1] =
3
4
FX (2) = p [X ≤ 2] = p [X = 0] + p [X = 1] + p [X = 2] = 1
Observemos que FX está definida en todo el conjunto de
los números reales, por tanto:
FX (x) =



0, si x < 0
1/4, si 0 ≤ x < 1
3/4, si 1 ≤ x < 2
1, si x ≥ 2
192

.
La representación gráfica de FX es la siguiente:
T
E
1 2
0.25
0.75
1
E
E
E
E
e
e
e
e
Observemos que los saltos de la función de distribución se
producen justamente en los valores que toma la variable y
son de amplitud igual a las probabilidades con que los toma.
Es decir,
p[X = 0] = 0,25
p[X = 1] = 0,5
p [X = 2] = 0,25
193

Definición Una variable aleatoria X con función de distri-
bución FX se dice que es continua, si existe una función
fX (x) ≥ 0 tal que:
FX (x) = p [X ≤ x] =
x
−∞
fX (t) dt, ∀x ∈ R.
A fX (x) se le denomina función de densidad (f.d.d.) de la
variable aleatoria continua X.
194

Asociadas a la funci´on de densidad tenemos las siguientes
propiedades:
(a)
+∞
−∞
fX (t) dt = 1, (FX (+∞) = 1)
(b) fX (x) = FX
(x) , es decir, la f.d.d. puede obtenerse a
trav´es de la f.d.D.
(c) p[X = a] = 0, ∀a ∈ R. (Como FX es continua, no tiene
saltos)
(d) p[X ≤ b] = p[X < b] =



FX (b)
b
−∞
fX (t) dt
195

(e) p[X > a] = p[X ≥ a] =



1 − FX (a)
+∞
a
fX (t) dt
(f) p[a < X ≤ b] = p[a ≤ X < b] = p[a < X < b] =
= p[a ≤ X ≤ b] =



FX (b) − FX (a)
b
a
fX (t) dt
196

Secci´on 6.2: Caracter´ısticas de las variables aleatorias
197

Definición Sea X una variable aleatoria discreta que to-
ma los valores x1, x2, . . . , xn, . . . con probabilidades pX (xi) >
0. Llamaremos esperanza matemática, media, valor medio
ó valor esperado de X, E[X], a:
E[X] =
∞
i=1
xi pX (xi) =
∞
i=1
xi p[X = xi]
Definición Sea X una variable aleatoria continua con fun-
ción de densidad fX (x). Se llama esperanza matemática,
media, valor medio ó valor esperado de X, E[X], a:
E[X] =
+∞
−∞
x fX (x) dx.
198

Definición Sea X una variable aleatoria con media µ, con-
tinua con función de densidad fX (x) ó discreta con función
de probabilidad pX (x). Se llama varianza de X a
V ar [X] =



∞
i=1
(xi − µ)2
pX (xi), si X es discreta
+∞
−∞
(x − µ)2
fX (x) dx, si X es continua
199

Ejemplo 32 Un concesionario de automóviles, A, vende
2 coches la mitad de los d´ıas y 16 la otra mitad. Otro
concesionario, B, vende 8 coches la mitad de los d´ıas y 10
la otra mitad. Queremos calcular el número de coches que
se espera que vendan cada uno de los concesionarios un d´ıa
cualquiera y dar una medida de la representatividad de la
citada medida.
Sean XA = número de coches que vende el concesionario
A en un d´ıa y XB = número de coches que vende el
concesionario B en un d´ıa .
xi 2 16
pXA
(xi) 0.5 0.5
xi 8 10
pXB
(xi) 0.5 0.5
200

Calculemos la esperanza y la varianza de cada variable:
E[XA] = 2 · 0,5 + 16 · 0,5 = 9
E[XB] = 8 · 0,5 + 10 · 0,5 = 9
V ar[XA] = (−7)2 · 0,5 + 72 · 0,5 = 49
V ar[XB] = (−1)2 · 0,5 + 12 · 0,5 = 1
Ambos concesionarios venden por término medio el mismo
número de coches al d´ıa, pero para el concesionario B es-
te promedio puede considerarse más representativo ya que
tiene una menor dispersión.
201

Secci´on 6.3: Modelos probabil´ısticos
202

Una de las preocupaciones de los cient´ıficos dedicados al
Cálculo de Probabilidades ha sido construir modelos de dis-
tribuciones de probabilidad que pudieran representar el com-
portamiento teórico de diferentes fenómenos aleatorios que
aparecen en el mundo real. Se puede observar como dife-
rentes distribuciones de probabilidad tienen una estructura
matemática parecida, es decir, responden a un mismo mo-
delo.
Una distribución de probabilidad queda definida mediante
la especificación de la variable, su campo de variación y la
determinación de sus probabilidades.
203

Si un conjunto de distribuciones tienen sus funciones de
definición (función de distribución, de densidad, de pro-
babilidad) con la misma estructura funcional, diremos que
pertenecen a la misma familia de distribuciones o al mismo
modelo de probabilidad.
La estructura matemática de las funciones de definición de
las distribuciones de la misma familia, suele depender de
uno o varios parámetros a los que llamaremos parámetros
de la distribución.
Las ventajas de trabajar con modelos es que podemos apli-
car unas fórmulas matemáticas que permiten fácilmente
calcular probabilidades.
204

La distribución o modelo Binomial
Consideremos un experimento aleatorio que puede dar lu-
gar únicamente a dos resultados, A (llamado habitualmente
éxito) y A (llamado habitualmente fracaso), con probabili-
dades de ocurrencia respectivas p y q (p + q = 1).
Definición Un experimento como el anterior recibe el nom-
bre de experimento de Bernouilli.
205

Supongamos que se realizan n repeticiones independientes
de un experimento de Bernouilli con probabilidades de éxito
y fracaso respectivas p y q que permanecen invariantes a lo
largo de todo el proceso. Si estamos interesados en estudiar
el número de veces que ocurre el suceso A (éxito) en las
n repeticiones del experimento, podemos definir la variable
aleatoria siguiente:
X = número de éxitos que ocurren en las n pruebas
independientes
Esta variable tiene como posibles valores
X = { 0, 1, 2, . . . , n}
y su correspondiente función de probabilidad es
p[X = k] =
n
k
pkqn−k, para k = 0, 1, 2, . . . , n
206

A la distribución de la variable anterior se la conoce con el
nombre de distribución Binomial de parámetros n y p , que,
simbólicamente representaremos por:
X B(n, p)
Sus principales caracter´ısticas son:
(a) E[X] = np
(b) V ar[X] = npq
207

Caso 6 La llamada Sexta Enmienda de la Constitución de
los Estados Unidos expresa que:
Los paneles de jurados deben ser seleccionados de
una fuente representando una sección cruzada justa
de la comunidad de la que el acusado forma parte.
En Whitus v. Georgia, 385 US 545 (1967), la población de
raza negra constitu´ıa el 27 % de donde se selecciona el ju-
rado. De una lista inicial se seleccionan al final 90 personas
que sólo incluye a 7 personas de color. Se plantea cuál es
la probabilidad de que se dé tal hecho y si se ha producido
una rotura de la representación racial.
208

Sea X = n´umero de panelistas de raza negra de 90
B(90, 0,27)
p[X = 7] = 0,000003
Se hace notar que el jurado, que ﬁnalmente condena al
acusado, no tiene ninguna persona de color.
209

.
Caso 7 En Alexander v. Louisiana, 405 US 625 (1972),
para elegir un panel de jurados se repartieron una serie de
cuestionarios. De los 7374 que se devuelven, 1015 corres-
ponden a personas de color, es decir, sólo un 13.76 %. Con
dichos cuestionarios se crea un panel revisado de posibles
jurados compuesto por 400 personas de las que sólo 27 son
de raza negra.
Se considera la variable aleatoria:
X = número de panelistas de raza negra de 400
Teniendo en cuenta que X B(400, 0,1376), la corte calcula
la probabilidad de que el número de personas de color se-
leccionadas sea menor o igual que 27 de una lista de 400,
cifrándose ésta en:
p[X ≤ 27] = p[X = 0] + p[X = 1] + · · · + p[X = 27] = 0,0000069511
210

.
La distribución o modelo de Poisson
Supongamos que se realiza un experimento consistente en
observar la aparición de ciertos acontecimientos puntuales
o éxitos que ocurren sobre un soporte continuo (tiempo,
espacio, longitud, etc...) con las siguientes condiciones:
(a) El número medio de éxitos a largo plazo es constante.
(b) Los éxitos ocurren aleatoriamente de forma indepen-
diente.
A este tipo de experimentos se les llama procesos de Pois-
son y son ejemplos del mismo la llegada de clientes a cierta
ventanilla de un banco en una hora, los defectos que apa-
recen en cada rollo de cable, etc.
211

Para este tipo de procesos, podemos definir la variable:
X= número de éxitos en un intervalo de amplitud
determinada
que puede tomar como posibles valores
X = {0, 1, 2 . . .}
con función de probabilidad
p[X = k] = e−λ ·
λk
k!
, para k = 0, 1, 2 . . .
212

Diremos que una variable de este tipo sigue una distribuci´on
de Poisson de par´ametro λ (λ > 0) y escribiremos
X P(λ)
(a) E[X] = λ
(b) V ar[X] = λ
213

Aproximación de Poisson a la distribución
Binomial
Teorema Sea X una variable aleatoria con distribución
B(n, p) se verifica que si
p ≤ 0,1 y np = λ < 5
la distribución de X tiende a ser P(np).
214

.
Caso 8 En Avery v. Georgia, 345 US 559 (1953), un acu-
sado de raza negra era condenado por un jurado compuesto
todo por personas de raza blanca extra´ıdo de un panel de
60 personas también todas blancas. Los nombres de estos
panelistas son sacados de una caja que contienen papele-
tas amarillas para las personas de color y papeletas blancas
para los blancos. El 5 % de las papeletas son amarillas y
no es seleccionado para el panel ninguna papeleta amarilla.
¿Cuál es la probabilidad de que se dé tal hecho?
Sea X = número de panelistas de raza negra de 60
B(60, 0,05) P(3)(aprox)
p[X = 0] =
0,046069, usando B(60, 0,05)
0,049787, usando P(3)
En tal sentido un juez escribió: No solamente los ojos, sino
también la mente de la justicia, debe ser ciega para atribuir
esta situación a un mero hecho fortuito
215

.
La distribución o modelo Normal
Podemos resumir la importancia de la distribución Normal
diciendo que:
(a) Un gran número de fenómenos reales pueden modelizar-
se con ella. Por ejemplo, las medidas f´ısicas del cuerpo
humano en una población, las caracter´ısticas ps´ıquicas
medidas por tests de inteligencia o personalidad, las me-
didas de calidad en muchos procesos industriales, etc.
(b) Muchas otras distribuciones pueden aproximarse me-
diante la distribución Normal.
(c) Todas aquellas variables que puedan considerarse cau-
sadas por un gran número de pequeños efectos tienden
a distribuirse como una distribución Normal.
216

Definición Se dirá que la variable aleatoria X sigue una
distribución Normal de parámetros µ y σ si su función de
densidad es de la forma:
fX (x) =
1
σ
√
2π
· e
−1
2
x − µ
σ
2
x ∈ R, σ > 0, µ ∈ R
Simbólicamente escribiremos
X N (µ, σ)
(a) E[X] = µ
(b) V ar[X] = σ2
217

Algunas aproximaciones mediante la dis-
tribución Normal
(a) Aproximación de la distribución binomial mediante la
distribución Normal.
Teorema de De Moivre-Laplace Sea X una variable alea-
toria con distribución B(n, p). Se verifica que si
p < 0,1 y np > 5 ó 0,1 < p < 0,9 y n > 30
la distribución de X tiende a ser N np,
√
npq .
218

(b) Aproximación de la distribución de Poisson mediante la
distribución Normal.
Teorema Sea X una variable aleatoria con distribución
P(λ). Se verifica que si
λ > 10
la distribución de X tiende a ser N λ,
√
λ .
219

Crim presentacion

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (10)

Similar a Crim presentacion

Similar a Crim presentacion (20)

Crim presentacion