Without You Air Supply Song

Song : without you by air supply

Estadística

Introducción a la estadística

Estadistica (2003 – 2004) – UNFV-

¿Para qué sirve la estadística?
 La Ciencia se ocupa en general de fenómenos observables

 La Ciencia se desarrolla observando hechos, formulando leyes que los
explican y realizando experimentos para validar o rechazar dichas leyes

 Los modelos que crea la ciencia son de tipo determinista o aleatorio
(estocástico)

 La Estadística se utiliza como tecnología al servicio de las ciencias
donde la variabilidad y la incertidumbre forman parte de su naturaleza

 “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de
las Ciencias de la Vida donde la variablidad no es la excepción sino la
regla”

Definición
La Estadística es la Ciencia de la

• Sistematización, recogida, ordenación y
a
tiv presentación de los datos referentes a un fenómeno
rip que presenta variabilidad o incertidumbre para su
sc
De estudio metódico, con objeto de

• ddeducir las leyes que rigen esos fenómenos,
ad
b ili
b a
Pro

• ia y poder de esa forma hacer previsiones sobre los
c
en mismos, tomar decisiones u obtener conclusiones.
er
f
In

post-grado en administración - 2004 -

Pasos en un estudio estadístico
 Plantear hipótesis sobre una población
 Los fumadores tienen “más bajas” laborales que los no fumadores
 ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

 Decidir qué datos recoger (diseño de experimentos)
 Qué individuos pertenecerán al estudio (muestras)
 Fumadores y no fumadores en edad laboral.
 Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
enfermedades crónicas?
 Qué datos recoger de los mismos (variables)
 Número de bajas
 Tiempo de duración de cada baja
 ¿Sexo? ¿Sector laboral? ¿Otros factores?
No tenéis que
 Recoger los datos (muestreo) entenderlo (aún)
 ¿Estratificado? ¿Sistemáticamente?

 Describir (resumir) los datos obtenidos
 tiempo medio de baja en fumadores y no (estadísticos)
 % de bajas por fumadores y sexo (frecuencias), gráficos,...

 Realizar una inferencia sobre la población
 Los fumadores están de baja al menos 10 días/año más de media que los no
fumadores.

 Cuantificar la confianza en la inferencia
 Nivel de confianza del 95%
 Significación del contraste: p=2%

Método científico y estadística

Plantear Diseñar
hipótesis experimento

Obtener Recoger datos
conclusiones y analizarlos

Población y muestra
 Población (‘population’) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
 Normalmente es demasiado grande para poder abarcarlo.

 Muestra (‘sample’) es un subconjunto suyo al que tenemos
acceso y sobre el que realmente hacemos las observaciones
(mediciones)
 Debería ser “representativo”
 Esta formado por miembros “seleccionados” de la población
(individuos, unidades experimentales).

maestría en administración - 2004 -

Variables
 Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.

 En los individuos de la población española, de uno
a otro es variable:

 El grupo sanguíneo
 {A, B, AB, O}  Var. Cualitativa
 Su nivel de felicidad “declarado”
 {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
 El número de hijos
 {0,1,2,3,...}  Var. Numérica discreta
 La altura
 {1’62 ; 1’74; ...}  Var. Numérica continua

jfgt

Tipos de variables
 Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)

 Nominales: Si sus valores no se pueden ordenar
 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar
 Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)

 Discretas: Si toma valores enteros
 Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
 Altura, Presión intraocular, Dosis de medicamento administrado, edad

 Es buena idea codificar las variables
como números para poder procesarlas
con facilidad en un ordenador.
 Es conveniente asignar “etiquetas” a
los valores de las variables para
recordar qué significan los códigos
numéricos.
 Sexo (Cualit: Códigos arbitrarios)
 1 = Hombre
 2 = Mujer
 Raza (Cualit: Códigos arbitrarios)
 1 = Blanca
 2 = Negra,...
 Felicidad Ordinal: Respetar un orden al
codificar.
 1 = Muy feliz
 2 = Bastante feliz
 3 = No demasiado feliz
 Se pueden asignar códigos a
respuestas especiales como
 0 = No sabe
 99 = No contesta...
 Estas situaciones deberán ser tenidas
en cuentas en el análisis. Datos
perdidos (‘missing data’)

 Aunque se codifiquen como números, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de cálculo estadístico.
 No todo está permitido con cualquier tipo de variable.

 Los posibles valores de una variable suelen denominarse modalidades.

 Las modalidades pueden agruparse en clases (intervalos)
 Edades:
 Menos de 20 años, de 20 a 50 años, más de 50 años
 Hijos:
 Menos de 3 hijos, De 3 a 5, 6 o más hijos

 Las modalidades/clases deben forman un sistema exhaustivo y
excluyente
 Exhaustivo: No podemos olvidar ningún posible valor de la variable
 Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
 Bien: ¿Cuál es su grupo sanguíneo?
 Excluyente: Nadie puede presentar dos valores
simultáneos de la variable
 Estudio sobre el ocio
 Mal: De los siguientes, qué le gusta: (deporte, cine)
 Bien: Le gusta el deporte: (Sí, No)
 Bien: Le gusta el cine: (Sí, No)
 Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)

Presentación ordenada de datos
7

6
Género Frec.
5
Hombre 4 4

3

2
Mujer 6
1

0
Hom bre Mujer

 Las tablas de frecuencias y las representaciones
gráficas son dos maneras equivalentes de presentar la
información. Las dos exponen ordenadamente la
información recogida en una muestra.

jfgt

Tablas de frecuencia
 Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).

 Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad

 Frecuencias relativas (porcentajes): Idem, pero dividido por el total

 Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas
 Muy útiles para calcular cuantiles (ver más adelante)
 ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
 ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

Sexo del encuestado
Número de hijos
Porcentaje
Porcentaje Porcentaje
Frecuencia Porcentaje válido
Frecuencia Porcentaje válido acumulado
Válidos Hombre 636 41,9 41,9
Válidos 0 419 27,6 27,8 27,8
Mujer 881 58,1 58,1
1 255 16,8 16,9 44,7
Total 1517 100,0 100,0
2 375 24,7 24,9 69,5
3 215 14,2 14,2 83,8
Nivel de felicidad
4 127 8,4 8,4 92,2
Porcentaje Porcentaje 5 54 3,6 3,6 95,8
Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3
Válidos Muy feliz 467 30,8 31,1 31,1
7 23 1,5 1,5 98,9
Bastante feliz 872 57,5 58,0 89,0
Ocho o más 17 1,1 1,1 100,0
No demasiado feliz 165 10,9 11,0 100,0
Total 1509 99,5 100,0
Total 1504 99,1 100,0
Perdidos No contesta
Perdidos No contesta 8 ,5
13 ,9
Total 1517 100,0 Total 1517 100,0

Datos desordenados y ordenados en tablas
Género Frec. Frec. relat.
 Variable: Género
porcentaje
 Modalidades:
Hombre 4 4/10=0,4=40%
 H = Hombre
 M = Mujer Mujer 6 6/10=0,6=60%

10=tamaño
muestral
 Muestra:

MHHMMHMMMH

 equivale a
HHHH MMMMMM

Ejemplo
 ¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
 frec. indiv. sin hijos Porcent. Porcent.
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255 1 255 16,9 44,7
= 674 individuos 2 375 24,9 69,5 ≥50%
3 215 14,2 83,8
 ¿Qué porcentaje de individuos 4 127 8,4 92,2
tiene 6 hijos o menos? 5 54 3,6 95,8
 97,3%
6 24 1,6 97,3
7 23 1,5 98,9
 ¿Qué cantidad de hijos es tal Ocho+ 17 1,1 100,0
que al menos el 50% de la
población tiene una cantidad Total 1509 100,0
inferior o igual?
 2 hijos

Gráficos para v. cualitativas
 Diagramas de barras
 Alturas proporcionales a las frecuencias (abs. o
rel.)
 Se pueden aplicar también a variables discretas

 Diagramas de sectores (tartas, polares)
 No usarlo con variables ordinales.
 El área de cada sector es proporcional a su
frecuencia (abs. o rel.)

 Pictogramas
 Fáciles de entender.
 El área de cada modalidad debe ser proporcional a
la frecuencia. ¿De los dos, cuál es incorrecto?.

Gráficos diferenciales para variables numéricas 419
400 375

 Son diferentes en función de que las
300

255

Recuento
215

variables sean discretas o continuas. 200

127

Valen con frec. absolutas o relativas. 100

54
24 23
 Diagramas barras para v. discretas
17

0 1 2 3 4 5 6 7 Ocho o más

 Se deja un hueco entre barras para indicar Número de hijos

los valores que no son posibles
250

 Histogramas para v. continuas
200

Recuento
 El área que hay bajo el histograma entre 150

dos puntos cualesquiera indica la cantidad 100

(porcentaje o frecuencia) de individuos en 50

el intervalo.
20 40 60 80

Edad del encuestado

Diagramas integrales
 Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por
derivación (en un sentido más general del que visteis en bachillerato.)

¿Qué hemos visto?
 Definición de estadística
 Población
 Muestra
 Variables
 Cualitativas
 Numéricas
 Presentación ordenada de datos
 Tablas de frecuencias
 absolutas
 relativas
 acumuladas
 Representaciones gráficas
 Cualitativas
 Numéricas
 Diferenciales
 Integrales

Song : big in japan by Alphaville

Inferencia estadística
1.- Principales conceptos. Muestreo.
Distribución muestral de un estadístico.
Principales distribuciones muestrales.

Maestria en Administración ––
Maestria en Administración
(2003- 2004 ) )- -UNFV --
(2003- 2004 UNFV

Principales conceptos en inferencia estadística

Idea básica: Hacer inferencias sobre la población a
partir de la muestra que hemos extraído de la misma.
Ello nos lleva a tratar (brevemente) el tema del muestreo.
Pensemos que la muestra habrá de ser representativa de la
población, para que podamos efectuar inferencias que tengan
sentido.

Muestreo
Definición: Proceso que nos permite la extracción de una
muestra a partir de una población

Hay dos tipos básicos de muestreo:
1. Muestreo probabilístico. En este tipo de muestreo, la probabilidad de
aparición en una muestra de cualquier elemento de la población es conocida
(o calculable). Es el único científicamente válido, y es sobre el que nos
extenderemos especialmente.
2. Muestreo no probabilístico. Es aquel en el que la selección de los elementos
de la muestra no se hacen al azar.

Muestreo probabilístico
Este muestreo garantiza que, a la larga, las muestras que se van obteniendo de
la población sean representativas de la misma. Vamos a ver varios tipos de
muestreo probabilístico.

140
M eta 2002 Normalizada
120
100
80
60

%
40

0
8
.
20
p

<

N
l

s

G
o

3
o
0
tr

T
H

T
3
to

A
n

P
A

T
o

s
o
r

D

D
IR

P

a
e
a

C

E

n
N

D
P

t
r

u
.
to

t

e

c
r

b

a
o
4

o

V
M

c
i
n
u
Obs 2000 M eta 2001 M eta 2000
1. Muestreo aleatorio simple

M
2. Muestreo estratificado
3. Muestreo por conglomerados
4. Muestreo por etapas (o polietápico)
5. Muestreo sistemático (?)


1. Muestreo aleatorio simple

Es aquel en el que, a priori, todos los elementos de la muestra tienen la misma
probabilidad de aparición.
Supongamos que tengamos una población de 50.000 individuos, y que
tenemos un listado con sus nombres. Si queremos elegir 100 personas, lo que
necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.


2. Muestreo estratificado

En el muestreo estratificado, los investigadores han de dividir a
los sujetos en diferentes subpoblaciones (o estratos), en función de
cierta característica relevante, y después lo que hacen es un muestro
aleatorio simple de cada estrato.
Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno),
y cada individuo del estrato habrá de tener la misma probabilidad de ser
escogido como parte de la muestra.
Ejemplo: Supongamos que, en Cajamarca, 70% de los niños de primaria
van a escuela pública y el 30% a concertada. Si queremos 1,000 niños, lo
que haremos es dividir los alumnos en 2 estratos (pública y concertada) y
se eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 de
la concertada.


3. Muestreo por conglomerados

En el muestreo por conglomerados, en lugar de considerar cada
elemento de la población, lo que consideramos son
“conglomerados de elementos”. El proceso es elegir
aleatoriamente uno o varios conglomerados y la muestra estará
formada por TODOS los elementos de los conglomerados.

Ejemplos:
-En las encuestas durante las elecciones, los conglomerados
pueden ser las mesas electorales, y lo que se hace es escoger
algunas mesas al azar (y de ahí se toman todos los votos de las
mesas seleccionadas).
-En otros ejemplos, los conglomerados pueden ser los bloques
de viviendas, los municipios, etc.


4. Muestreo por etapas

En este caso se combina el muestreo aleatorio
simple con el muestreo por conglomerados:
Primero se realiza un muestreo por conglomerados (v.g., si los
conglomerados son colegios en Lince, se seleccionan aleatoriamente
varios de ellos).

Segundo, no se eligen todos los alumnos (como ocurriría en un muestro
por conglomerados), sino que se elige una muestra aleatoria. (Dicha
muestra puede ser obtenida por muestreo aleatorio simple o puede ser
estratificado.)
Es decir, hemos tenido 2 etapas de muestreo. Y claro está, es posible
tener más de 2 etapas...


5. Muestreo aleatorio sistemático

Supongamos que tengamos una lista de N elementos (e.g.,
estudiantes de secundaria) y queramos una muestra de
tamaño “n”. En este caso, lo que se hace es ordenarlos
(v.g., en función de los apellidos) y después se elige
aleatoriamente un elemento entre los N/n=k primeros, y
luego se elige de manera sistemática el que esté k lugares
después del primer elemento, y así sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una lista) y
queremos obtener una muestra de 100 estudiantes.
Primero elegimos al azar un estudiante entre los
10000/100=100 primeros (supongamos que salga el 26), el
segundo elemento será el estudiante 100+26 (126), el
siguiente será el 226, luego el 326, etc.

Muestreo no probabilístico

1. Muestreo sin norma (o de conveniencia)
Se elige a una muestra por ser conveniente, fácil,
económica. Pero no se hace en base a un criterio de
aleatoridad.
Ejemplo: las encuestas en los periódicos electrónicos;
el muestreo habitual en los trabajos en psicología.

2. Muestreo intencional
En este caso, si bien el muestreo no es probabilístico, los
investigadores procuran que se garantice la
representatividad de la muestra

Distribución muestral de un estadístico

Supongamos que tenemos una variable aleatoria, cuya

distribución es f ( x)
Supongamos, por simplicidad, que obtenemos una
muestra aleatoria simple con tamaño n = X1, X2, ... Xn
Entonces, un estadístico es cualquier función h definida sobre X1,
X2, ... Xn y que no incluye parámetro desconocido alguno:

Y=h(X1, X2, ... Xn)
La distribución de dicho estadístico Y la vamos a denominar g(y)

Distribución muestral de un estadístico
Observad:

f(x) es la distribución de la v.a. bajo estudio
g(y) es la distribución del estadístico que tenemos
Es vital conocer la distribución muestral del estadístico
de interés para poder efectuar inferencias sobre el
parámetro correspondiente.

Esto es, para efectuar inferencias sobre la media
poblacional µ, necesitamos conocer la distribución
muestral de X

Distribución muestral de la media

Veremos primero el caso de que la distribución
subyacente sea normal, con media µ y varianza σ 2

La media de la distribución muestral de medias es µ
La varianza de la distribución muestral de medias esσ 2
/n

La forma de la distribución muestral de la media es normal.

Nota: La desviación típica de la distribución muestral suele ser denominada: error típico
Nota: La desviación típica de la distribución muestral suele ser denominada: error típico
de tal estadístico (v.g., “error típico de la media”, etc.)
de tal estadístico (v.g., “error típico de la media”, etc.)

Distribución muestral de la media. Ejemplo 1

400 La línea (en este y sucesivos ejemplos) es una curva normal

Distribución poblacional
subyacente (dist. Normal):
300
Media=100
(Varianza=225)
200
Desv.Típica=15

Distribución muestral de la
100 media:
media:
Desv. típ. = 4.75 Tamaño muestral=10
Tamaño muestral=10
Media = 99.9
0 N = 3600.00 Media=100
Media=100
(Varianza=225/10=22.5)
82
84
86
88
90
92
94
96
98
10
10 .0
10 .0
10 .0
10 .0
11 .0
11 .0
11 .0
11 .0

(Varianza=225/10=22.5)
.0

.0

8

6.
.0

.0
.0
.0

.0
.0
.0
0
2
4
6

0
2
4

0

N10
En este y sucesivos gráficos: Número de réplicas Desv.típica= 22.5 = 4.74
Desv.típica=


500

400
300
Media=100
Desv.Típica=15
200

100 media:
media:
Desv. típ. = 3.36
Media = 100.0 Tamaño muestral=20
Tamaño muestral=20
0 N = 3600.00
Media=100
Media=100
88

90

92

94

96

98

10

10

10

10

10

11

11

11

(Varianza=225/20=11.3)
.0

0.

4.

2.

4.
.0

.0

.0

.0

.0

2.

6.

8.

0.

(Varianza=225/20=11.3)
0
0

0

0

0

0

0

0

N20 Desv.típica=3.35
Desv.típica=3.35


700

600

500
400 Media=100

300
Desv.Típica=15

200 Distribución muestral de la
media:
media:
100 Desv. típ. = 2.12
Media = 99.95 Tamaño muestral=50
Tamaño muestral=50
0 N = 3600.00
Media=100
Media=100
93

95

97

99

10

10

10

10

10
.2

.2

1.

3.

5.

7.
.2

.2

9.

(Varianza=225/50=4.5)
5

25

25

25

(Varianza=225/50=4.5)
5

5

5

25

25

N50 Desv.típica=2.12
Desv.típica=2.12

Distribución muestral de la media

Veremos ahora el caso de que la distribución subyacente
sea arbitraria, si bien sabemos que la media es y la
varianza sea σ 2
La media de la distribución muestral de medias es µµ
La varianza de la distribución muestral de medias es σ 2 /n

La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En
La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En
concreto, la distribución muestral se acercará más yymás a la distribución normal
concreto, la distribución muestral se acercará más más a la distribución normal
(media µ yyvarianza σ2/n) a medida que se aumente el tamaño de cada muestra.
(media µ varianza σ2/n) a medida que se aumente el tamaño de cada muestra.


subyacente (dist. GAMMA):
p 100 La distribución GAMMA tiene 2 parámetros:
Media=100= = = 100
λ 1
p 100 λ que es un parámetro de escala (1)
Varianza=100= = = 100
λ 2 12 p que es un parámetro de forma (100)

0.045
0.04
0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
80 85 90 95 100 105 110 115 120


500
subyacente (dist. GAMMA):
400
Media=100
300 Varianza=100

200
media:
100
Desv. típ. = 3.12 Tamaño muestral=10
Media = 100.0
0 N = 3600.00 Media=100
90

92

94

96

98

10

10

10

10

10

11

(Varianza=100/10=10)
.0

.0

.0

.0

.0

0.

2.

4.

6.

8.

0.
0

0

0

0

0

0

DISGAMMA Desv.típica= 10 = 3.16


Distribución poblacional (dist.
EXPONENCIAL): La distribución EXPONENCIAL tiene 1
Media=0.1=1/λ parámetro: λ (en el ejemplo: 10)

Varianza=0.01=1/λ2

12

10

8

6

4

2

0
0 0.1 0.2 0.3 0.4 0.5 0.6

Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2 pulsaciones
de una rata en una caja de Skinner.

Distribución muestral de la media. Ejemplo 5a

400

300 Distribución poblacional (dist.
EXPONENCIAL):
Media=0.1=1/λ
200
Varianza=0.01=1/λ2

100
Desv. típ. = .03 media:
Media = .100
0 N = 3600.00 Tamaño muestral=10
.0
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.1
.1
.1
.2
.2
.2
.2

Media=.100
69

69

94
31
44
56

81
94
06
19
31
44
56

81

06
19
31
44

EXPON10 (Varianza=0.01/10=.001)

Observad que la dist. muestral se aproxima a la normal Desv.típica=.03

Distribución muestral de la media. Ejemplo 5b
500

400

Distribución poblacional (dist.
300
EXPONENCIAL):

200
Media=0.1=1/λ
Varianza=0.01=1/λ2
100
Desv. típ. = .02
Media = .099 Distribución muestral de la
0 N = 3600.00 media:
.0

.0

.0

.0

.0

.1

.1

.1

.1

.1

.1

.1

.1

Tamaño muestral=20
44

56

69

81

94

06

19

31

44

56

69

81

94

EXPON20 Media=.100

Observad que la distribución muestral se aproxima más a
(Varianza=0.01/20=.0005)
la normal (al elevar el tamaño muestral). Desv.típica=.022

OTRAS DISTRIBUCIONES MUESTRALES (1)

Distribución muestral de X− µ
s/ n
%
Cuando la distribución de la que obtenemos las medias muestrales es
gaussiana (“distr.normal”), la expresión anterior se distribuye según la
distribución t de Student con tn-1 grados de libertad. (Esta distribución es
básica para efectuar inferencias entre dos medias.)

s12
% Asumiendo varianzas
Distribución muestral de 2
s
% poblacionales iguales
2

Cuando las distribuciones de la que obtenemos las varianzas muestrales son
gaussianas, la expresión anterior se distribuye según la distribución F de
Fisher con n1-1 grados de libertad en el numerador y n2-1 grados de libertad en
el denominador. (Recordad que la distribución F es básica para la razón de
varianzas: ANOVA.)

OTRAS DISTRIBUCIONES MUESTRALES (2)

Distribución muestral de ns 2 / σ 2

Cuando las distribución de la que obtenemos la varianza muestral
es gaussiana, la anterior expresión se distribuye según la
distribución chi-cuadrado con n-1 grados de libertad.

jfgt

Song . California dreaming by The mamas and the papas.

Simulación a
eventos discretos

Independencia de las muestras
Los resultados de una corrida de simulación, son muestras de
alguna distribución.

Esos resultados los llamamos "respuestas".
Las respuestas pueden ser: promedios de valores recolectados en
toda o parte de la corrida, o simplemente una única medida (ej.
largo de la cola al final de la corrida).

Las respuestas son muestras de distribuciones, por lo tanto pueden
variar de una corrida a otra o en la misma corrida.

El promedio de la distribución de respuestas la notamos µ y lo
llamamos la media (valor medio) de la distribución.

Independencia de las
muestras
Cuando los resultados son promedios de valores recolectados en
estado estacionario, una sola respuesta “puede” ser usada como
la estimación de la media de la distribución.

En sistemas terminales o no estacionarios siempre deben
realizarse varias corridas, de modo de obtener varias muestras
como respuestas, tanto para calcular la media como para
calcular la varianza,

Dispersión de la muestra
La dispersión de la variable aleatoria respecto de su media, se
mide mediante la desviación estándar σ o la varianza σ2.

Si la varianza es grande quiere decir que no todos los valores
que toma la V.A. están cerca de la media.

Para calcular la varianza de la distribución muestreada es
necesario obtener varias respuestas independientes.

Análisis de resultados
En general es aconsejable realizar varias corridas
independientes para tomar varias muestras como respuestas
tanto para calcular la media como la varianza (y la desviación
estándar).

Por lo tanto....
El análisis estadístico de los experimentos de simulación
requieren de varias respuestas independientes x1, ...,xn.

Cada una de estas muestras se obtienen a partir de alguno de los
siguientes métodos.

Métodos muestreo resultados
(1)
1.-

Se realizan n corridas que generan x1, ..., xn.

Cada corrida con torrentes de números aleatorios
diferentes e independientes.

Cada corrida es una replicación.

Se pueden registrar resultados solamente en
determinados períodos de interés.

(2)
2.-

El método de replicación en sistemas estacionarios.

Los datos se toman solamente en el período
estacionario, la muestra o resultado es un promedio
de los datos obtenidos durante la corrida o
replicación.

(3)
3.-

Método batch means, usado en simulaciones de
estado estacionario, aquellos que llevan mucho
tiempo en alcanzar ese estado.

Se corre el período run-in una sola vez; a partir de allí
se registran valores de xi en intervalos
sucesivos de tiempo de igual longitud, 1 ... n.

Riesgo: correlación entre resultados sucesivos.

Métodos muestreo
resultados (4)
4.-
El método regenerativo se utiliza cuando nos interesan
medidas en períodos o instantes específicos
(particulares) del tiempo.

Por ejemplo nos interesa el largo de la cola cuando se
rompe una máquina (cantidad de máquinas rotas en esa
ocasión).

Entonces consideramos un punto regenerativo (la
ruptura de la máquina), y se registra una muestra
independiente inmediatamente después de cada
ruptura.

Cálculo media y varianza
Media, Varianza son los parámetros que mas
interesan calcular.

Si xi es la i-ésima respuesta de n replicaciones o
batches entonces podemos estimar la media µ,

n n

∑ ∑ (x − X)
2
xi
1  n 2 1 n  
i 2

X= i= 1
s2 = i= 1
=  ∑ xi −  ∑ xi  
n n− 1 n − 1  i= 1 n  i= 1  
  


s2 un estimador sin sesgo de la varianza σ2 de las
respuestas.

Intervalo de confianza
Nos interesa saber con qué grado de seguridad estamos
estimando el valor medio de la distribución.

La estimación es el promedio muestreado de un conjunto de
respuestas, entonces el intervalo de confianza nos brinda una
medida de la confianza que le podemos tener a esa
estimación;
Los límites de un 95% de confianza son los puntos extremos
de un intervalo alrededor de la media de la muestra; significa
que la media de la distribución se muestreará con una
probabilidad de 0.95.

Intervalo de Confianza
La varianza de la media de la muestra de tamaño n es

σ 2 s2 2
estimada mediante = sx
n n

n

∑ (x − X)
2
i
1  n 2 1 n  
2

s2 = i= 1
=  ∑ xi −  ∑ xi  
n− 1 n − 1  i= 1 n  i= 1  
  


Los límites del 95% del intervalo de confianza se pueden
calcular de tablas de distribución Student para
muestras pequeñas y de tablas de la distribución
Normal para muestras grandes .

Para la Normal los límites de un intervalo de confianza
de 95% son

X ± 1.96 s x

P  x − λ α D < m < x + λ α D  = 1 − α = 0.95
 
 2 2 

λ α = 1.96 D = sx
2

Otras técnicas de análisis
La Técnica predictiva se usa en simulaciones no terminales que
no alcanzan estado estacionario.
Se toma una medida de la media xt en un intervalo de tiempo t y
se grafican los valores tomados (xt vs t) para tener una idea de
como varían los valores con el tiempo.
Si queremos una idea mas precisa, se pueden realizar varias y
diferentes corridas y tomar promedios de ellas.
También se puede usar técnicas de regresión múltiple para
ajustar los valores obtenidos a algún tipo de curva, aunque a
veces el patrón de conducta de xt puede ser complejo, lo que
dificulta el análisis de la misma.

Verificación de hipótesis
Esta técnica se usa para determinar cuando las respuestas de simulaciones
comparativas son significantes estadísticamente.
Si x es una respuesta de una v.a de media µx de una corrida e y ( media µy) es
la respuesta de la corrida con valores cambiados de las var. de decisión,
entonces la hipótesis a verificar es µx = µy.

Si realizamos n corridas para un conjunto de valores de las variables de
decisión y repetimos el mismo número de corridas para los valores
cambiados, entonces la media muestreada de la primera experiencia es X y
de la segunda es Y.
La verificación se basa en la diferencia entre X e Y y cuánto se aleja la
desviación estándar de la media.
El cálculo de la desviación estándar dependerá de cuan independientes son
los valores xi e yi de las corridas realizadas (distribución t o Normal).

Análisis de factores (1)
Esta técnica estadística se utiliza para evaluar o
determinar los efectos que los cambios en las
variables de decisión producen en las salidas o
resultados de la simulación.

Las variables de decisión se llaman factores, por lo
tanto corremos la simulación con distintos valores
asignados a los factores (niveles) para medir cuánto
afecta a los resultados de la simulación, los distintos
factores ya sea individualmente como interactuando
uno con otro.

La complejidad del análisis crece
exponencialmente con la cantidad de factores,
ya que si tenemos n factores y nos interesa el
factor i medido en el nivel mi,
tenemos Π mi diferentes posibles formas de
hacerlo.

Esto además se complica mas, si existe mas de
una salida a considerar.

Esta técnica es usable para simulaciones con muchos
factores a ser testeados en varios niveles.
Pero es una técnica muy costosa en tiempo y por lo
tanto muchos test estadísticos no pueden ser
terminados.
De todos modos es valiosa para tener una idea o
imágen de los efectos ocasionados por distintos
cambios en los factores de la simulación. (Law y
Kelton 82).
Depende tambien de la cantidad de torrentes
accesibles

Resumen cap. 5

Simulación terminal , estacionaria.

Detección estado estacionario.

Parámetros interesantes
como registrarlos y presentarlos.

Facilidades de PascalSIM.

Técnicas de Análisis de resultados

Modelo de simulación
Producir un modelo de simulación no es solamente
escribir código.

La estructura de la simulación y sus distribuciones
se derivarán de :

OBJETIVOS
HIPOTESIS DE TRABAJO
RESPUESTAS
VARIABLES DE DECISION

El modelo se compone de:

+ Objetivos, hipótesis,
variables de decisión y
respuestas,
+ diagramas de actividades
+ especificación
+ pesudocódigo
+ código


OBJETIVOS

deben ser claros, subjetivos o muy detallados, pero
determinarán:

i) las variables de decisión,
ii) cuándo es necesaria una salida visual, un
detallado tratamiento estadístico o ambos y
iii) qué salidas son importantes.

HIPOTESIS DE TRABAJO.

Existen hipótesis implícitas al modelo y otras explícitas.
Ambas deben ser documentadas.

Los programas deben ser diseñados de forma de
permitir cambios en etapas posteriores del proyecto.
(reducen la complejidad del modelo)


RESPUESTAS
tipos de parámetros y medidas de interés,
así como estadísticas y datos a recolectar para el
análisis.

VARIABLES DE DECISION.
Los objetivos indicarán cuáles serán fijos y cuáles
cambiables.

Especificación Sala internación
El sistema es una simplificación del problema real (describirlo).

La especificación del problema está dada por el detalle de
los objetivos,
las hipótesis de trabajo,
las variables de decisión,
las respuestas y las duraciones de las distintas
actividades (tabla 6.1)
y el diagrama de actividades (fig 2.2).

Especificación Sala internación
Aclaración de hipótesis:
a) El arribo de los pacientes se describe mediante Proceso
Poisson de tasa constante (aproximación burda pero inicial)
b) El sistema opera continuamente, cuando en realidad
pacientes agendados para operación no arriban por la
noche.
Consideraremos el sistema en estado estacionario, por lo tanto
investigaremos el efecto de cambiar valores de las variables
de decisión en parámetros estables. (estudio completo cap
8).
Medidas importantes: utilización de camas y tiempos de
espera.

Programa

Se programa según algún método elegido.

La sala de operaciones es agendada por dos tipos de eventos:
fin de operación, y tiempo en que está cerrada.

Se define una variable booleana que controla esas condiciones
en la entidad "sala de operaciones" que siempre está en el
calendario
(ver record en libro pag 107).

Las variables de decisión se declaran como constante globales.

Programa
El unidad de tiempo de la simulación es la hora.

q4 es una cola ficticia, ventaja:
cada actividad está compuesta por el par de
eventos C y B, lo que facilita la modificación
posterior del programa.

Los histogramas se declaran y
nuevos valores son ingresados cada vez que haya
un cambio en algún tipo de evento C o B.

Período Run-in

Simulación del Hospital es de tipo "Estacionaria",
debemos determinar cuando comenzar a tomar
datos para procesar.

Utilizamos el método de promedios acumulados
(tabla 6.2) se agrega código en la fase B del
ejecutivo para producir promedios de las
respuestas cada 49 hs simuladas.
La Fig 6.1 grafica los datos obtenidos.

Período Run-in
Observar que: la cola de solo internados y el tiempo de
espera para operación alcanzan el estado estable
rápidamente ( se admite para operación si no hay
pacientes tipo solo internación).
La estabilidad se alcanza alrededor de las 720 hs.

En un proyecto real, se deben obtener un cierto número
considerable de promedios acumulados de respuestas,
usando diferentes torrentes de números para asegurarse
de que realmente se ha alcanzado el estado estacionario.

Resultados
Se simularon 14 días luego de alcanzada la estabilidad. Se
utilizaron números distintos que los utilizados para determinar el
período run-in.
Observar:
- La distribución de las filas de "solo internados" y
pacientes a operar, tienen una varianza grande.
- Las camas han tenido un gran porcentaje de utilización
( 20 en 318 hs de 336 simuladas)
- 26 pacientes fueron operados y su tiempo de espera fue
muy variado.
Cada corrida con un conjunto de diferentes torrentes
producen una replicación. Se necesitan varias replicaciones para
obtener datos mas acertados. Los datos ameritan reducción de
varianza.

Taller de reparaciones

Simulación terminal. Alcanza estabilidad
enseguida. Se toman datos durante toda la
simulación.
Se podrían considerar las máquinas como
variables de decisión. La lógica del programa
se presta para adecuarlo a este cambio.
A tener en cuenta: cómo continuar luego de
teminada la jornada de trabajo (estudienlo!).

Taller de reparaciones (2)
Buena práctica: declarar los niveles de recursos
y torrentes de número como constantes globales.
Fácil de alterar durante la experimentación.
Resultados: el número de máquinas rotas varió
entre 0 y 10. La utilización de mecánicos fue
mayor que la de equipos (84.25% vs 68.7%).
Durante un gran período de tiempo los
mecánincos estuvieron todos ocupados.

IMPORTANTE
4.5
4
Maestristas a nivel
3.5
nacional en
3
administración
2.5
2
1.5
1
0.5
0
1998 1999 2000

Ejecutado

MUESTREO

POBLACIÓN DE TAMAÑO N

MUESTRA DE TAMAÑO n

Censo Muestreo

Conocer parámetros Estimar parámetros
+ Tiempo para realizarlo - Tiempo para realizarlo
+ Costo -Costo
Personal profesional

Promedio µ x
Proporción P p
Total
T t

MUESTREO

ALEATORIO IRRESTRICTO (MAI; MSA)

MUESTREO SISTEMÁTICO

DISEÑOS DE IGUAL
MUESTREO ESTRATIFICADO PROPORCIONAL
ESTADÍSTICO NEYMAN
ÓPTIMA
POLIETÁPICO

POR CONGLOMERADOS

MUESTREO

ESTUDIO DE QUE DISEÑO DE MUESTREO SE DEBE UTILIZAR
MUESTREO
CUAL ES EL TAMAÑO ÓPTIMO DE LA MUESTRA

QUE CARACTERÍSTICAS DE LA POBLACIÓN
DISEÑO

DISEÑO DE MUESTREO

PARÁMETRO A ESTIMAR (PROMEDIO, PROPORCIÓN, TOTAL
TAMAÑO DE
LA MUESTRA TAMAÑO DE LA POBLACIÓN N
GRADO DE VARIABILIDAD σ
NIVEL DE PRECISIÓN σ 2

NIVEL DE CONFIABILIDAD d t (TABLAS)

MUESTREO SIMPLE ALEATORIO

POBLACIÓN DE TAMAÑO N

MUESTRA DE TAMAÑO n
EN FORMA ALEATORIA

PARA QUE SE UTILIZA: PARA ESTIMAR EL VALOR DE
PARÁMETROS DE INTERÉS

CUANDO LA VARIABILIDAD DE
CUANDO SE UTILIZA: LOS ELEMENTOS DE LA
POBLACIÓN BAJO ESTUDIO,
SEA MÍNIMA

SUGERENCIA CUANDO EL COEFICIENTE DE
PRÁCTICA VARIACIÓN < 15 %

ETAPAS EN UN ESTUDIO DE MUESTREO:

1. OBJETIVOS DEL ESTUDIO
2. DEFINICIÓN DE LA POBLACIÓN BAJO ESTUDIO
3. ESTABLECIMIENTO DEL MARCO DE MUESTREO
4. DEFINIR PARAMETROS A ESTIMAR
5. MUESTREO PRELIMINAR
6. DEFINIR EL DISEÑO DE MUESTREO
7. DETERMINAR CONFIABILIDAD Y PRECISIÓN
8. DETERMINAR EL TAMAÑO DE LA MUESTRA
9. DEFINIR LAS VARIABLES BAJO ESTUDIO
10.ESTRUCTURACIÓN DEL CUESTIONARIO
11.PRUEBA DEL CUESTIONARIO
12.REALIZACIÓN DEL TRABAJO DE CAMPO

DETERMINACIÓN DEL TAMAÑO ÓPTIMO DE LA MUESTRA

Ns
n= 2
 d
N − 1  + s
ENDSA
Indicadores 1989 1994 1998
z  Tasa de mortalidad infantil (por
  1000 nacidos vivos)
Tasa global de fecundidad
99

5.6
75

4.8
67

4.2

Npq % de mujeres que usan

n=
12.2 17.8 25.3
anticonceptivos modernos
2
 d
% de niños menores de 5 años
13.3 15.7 7.6
con desnutrición moderada

N − 1  + pq
 z 
Cobertura de Parto Institucional 37,6 42.3 59.2

  Cobertura de IRA
Cobertura de EDA
28.7
24
43.4
32.4
47.2
36.2
PAI
Ns
n= 2
DPT 3
Sarampión
28.4
57.5
42.8
55.7
48.6
50.8
 d
N − 1  + s
Polio 37.8 47.5 39.1
Elaboración: Unidad de Reforma de Salud - MSyPS 1998

z 
* Informe Preliminar

 

UNIDAD 5: TEORIA DEL MUESTREO
EL MUESTREO
Por ser la técnica del muestreo de aplicación casi general en las
investigaciones sociales, es evidente la importancia que tiene su estudio y la
necesidad en que se halla en investigador social de conocer por lo menos sus
principios y prácticas básicos, aunque se trate de una materia basada en las
leyes de azar y el cálculo de probabilidades, que pertenece al campo
matemático de la estadística.
Una muestra es una parte representativa de un conjunto, población o universo,
cuyas características debe reproducir en pequeño lo más exactamente posible.
De momo más científico, se pueden definir las muestras como una parte de un
conjunto o población debidamente elegida, que se somete a observación
científica en representación del conjunto, con el propósito de obtener resultados
válidos, también para el universo total investigado.
Las muestras tienen un fundamento matemático-estadístico. Este consiste en
que obtenidos de una muestra, elegida correctamente y en proporción
adecuada, unos determinados resultados, se puede hacer la inferencia o
generalización, fundada matemáticamente, de que dichos resultados son
válidos para el universo del que se ha extraído la muestra, dentro de unos
límites de error y probabilidad, que se pueden determinar estadísticamente en
cada caso.

UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO
Las muestras presentan las siguientes ventajas:
1. Mediante ellas, con una muestra relativamente reducida con relación al
universo, se pueden encuestar grandes poblaciones y núcleos humanos,
que de otra manera sería muy difícil o prácticamente imposible investigar.
2. Las muestras suponen una gran economía en las encuestas y la posibilidad
de mayor rapidez en su ejecución.
3. Una muestra puede ofrecer resultados más precisos que una encuesta total,
aunque esté afectada del error que resulta de limitar el todo a una parte.

La condiciones de las muestras son:
1. Que comprendan parte del universo y no la totalidad de este.
2. Que su amplitud sea estadísticamente proporcionada a la magnitud del
universo. Esta condición e halla en relación con el punto práctico de
determinación del tamaño de la muestra y sirve para decidir si, según las
unidades que comprende respecto al universo, una muestra es o no
admisible.
3. La ausencia de distorsión en la elección de los elementos de la muestra. Si
esta elección presenta alguna anomalía, la muestra resultará por este
mismo viciada.

EL MUESTREO
• La selección de las unidades de observación es un paso primordial en toda
investigación. De cómo se realice dicha operación dependerá la calidad de los
resultados de la investigación.
• Una de las primeras decisiones a tomar es la especificación y acotación de la población
a analizar. Esta depende de cuál sea el problema y los objetivos principales de la
investigación.
• Universo o Población se refieren al conjunto total de elementos que constituyen un área
de interés analítico. Comúnmente se entiende como un conjunto de unidades sobre las
cuales se desea obtener información.
• Las unidades pueden ser personas, familias, viviendas, organizaciones, artículos de
prensa, etc.
• Lo que constituye la población total está definido por problemáticas de tipo teórico. El
universo puede ser la población total de la humanidad, la población de un país, de una
región, etc.
• En la definición y acotación de la población se deben mencionar ls características
esenciales que la ubiquen en un espacio y tiempo concreto. Ej. En una investigación
sobre la ocupación del tiempo luego de jubilar, una posible definición del universo de
estudio sería la siguiente: Población de 65 años y màs que residen en la V región.

UNIDAD 5: TEORIA DEL MUESTREO . EL MUESTREO
Una vez definida la población, se procede al diseño de la muestra: la selección
de unas unidades concretas de dicha población.
Aunque el universo sea de pequeña dimensión, por razones de economía (en
tiempo y dinero), rara vez se observa a cada una de las unidades que lo
forman. Por el contrario, se decide la extracción de una muestra de entre los
integrantes del universo.
La representatividad depende del tamaño de la muestra y del procedimiento
seguido para la selección de las unidades muestrales.
Si a partir de los datos obtenidos en una muestra, quieren inferirse las
características correspondientes de la población (parámetros poblacionales), es
necesario diseñar una muestra que constituya una representación a pequeña
escala de la población a la que pertenece.
Los diseños muestrales probabilísticos se fundamentan en la Estadística
Inferencial configurada a partir de la Teoría de las Probabilidades.
Cualquier diseño muestral comienza con la búsqueda de documentación que
ayude a la identificación de la población de estudio.
Con el término marco se hace referencia al “listado que comprende las
unidades de la población”. Puede ser un Censo general de la población, un
registro de individuos o cualquier otro procedimiento que lleve a la identificación
de los miembros de una población.

UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO
Los elementos principales de la muestra son la base y la unidad de la misma.
La base de la muestra es la población de la que se obtiene o saca la muestra.
La importancia de la base de la muestra se deriva de que esa, operativamente, es el
resultado de la elección de unidades dentro de una población o conjunto
previamente determinado de aquellas. Por ello, fundamento básico de la muestra,
es la existencia de un registro de dicho conjunto, en el que aparezcan
individualizadas todas sus unidades y permita realizar la elección mediante un
sorteo riguroso.
Esta concreción individualizada de las unidades del universo es el punto de partida
y el fundamento necesario para realizar con rigor al elección en que consiste la
muestra y por ello se dice que constituye la base de la muestra en sentido estricto.
Esta puede consistir en un Censo, un registro, una lista, un fichero, un catálogo, un
mapa, un plano, etc.
En la base de la muestra deben figurar individualizadas todas las unidades que
forman la población con expresión de su número en el universo, nombre, domicilio
en su caso, etc.
La base de la muestra hace posible la identificación de los elementos que se hayan
seleccionado mediante la muestra y su encuesta posterior.
La base de la muestra no siempre existe. Ej. Público que circula por las calles ni los
asistentes a un espectáculo. Aquí se elige una muestra con un procedimiento
aleatorio imperfecto como encuestar uno de cada cinco que se encuentren en la

UNIDAD 5: TEORIA DEL MUESTREO: REQUISITOS DEL MARCO
MUESTRAL
El marco muestral debe cumplir los siguientes requisitos para que sea un descriptor
válido de la población:
1. Debe ser lo más completo posible. La muestra escogida sólo podrá considerarse
representativa de la población comprendida en el marco de muestreo elegido, es
decir, a aquellos que han tenido la probabilidad de ser elegidos para participar en la
muestra. Por esta razón, la comprehensividad se convierte en una exigencia básica
de todo marco muestral.
2. La comprehensividad del marco muestral conlleva la exigencia de su actualización.
En la medida que el marco muestral se halle actualizado las posibilidades de
omisiones se restringen. Por el contrario, aumenta la probabilidad de que éste
contenga a los miembros reales de la población que representa.
3. Cuando la investigación persigue la generalización de los datos muestrales (a la
población que conforma el marco muestral) es preciso que cada componente de la
población esté igualmente representado en el marco de muestreo. Es decir, no
deben haber duplicidades.
4. El marco muestral no debe incluir unidades que no correspondan a la población que
se analiza. La inclusión de estas unidades reduce la probabilidad de elección de las
unidades que sí pertenecen a la población.
5. El marco muestral debe contener información suplementaria que ayude a la
localización de las unidades seleccionadas: teléfono y dirección.

EJEMPLOS DE MARCOS MUESTRALES
Ejemplo de comprehensividad del marco de muestreo:
La Guía Telefónica es un marco de muestreo habitual en una encuesta
telefónica. Pero tiene restricciones porque limita la población a las personas con
un número de teléfono registrado y excluye a aquellos que no tienen teléfono.
Por otro lado, generalmente el número está registrado a nombre del jefe de
hogar, apareciendo la mayoría hombres.
Si la finalidad de la investigación fuese conocer la opinión de los psicólogos
españoles sobre su actividad profesional, un marco de muestreo idóneo sería el
directorio de psicólogos colegiados. Pero la muestra sólo será representativa de
los psicólogos colegiados y no de la totalidad de los psicólogos españoles.
Tampoco incluye a los psicólogos que se han inscrito recientemente.

Ejemplo de supresión en un marco de muetreo:
Si se hiciera una encuesta a la población mayor de 40 años, habría que
circunscribir la población a esta cuota de edad. Las personas de 40 años y
menos deberían eliminarse del marco muestral. Esto podría hacerse a priori
(antes de proceder a la extracción de la muestra) o a posteriori (una vez que la
muestra ha sido seleccionada). Aquí, de la muestra obtenida, se sustraen
aquellas unidades que no pertenezcan a la población de interés.

93

ELECCION DE LA MUESTRA

 Operativamente la muestra es una selección de unidades dentro de un conjunto,
que no es otro que la base de la muestra. Esta es, entonces, el resultado de una
elección y por tanto, su bondad depende de la bondad de la elección.
 La bondad de esta elección depende de dos condiciones fundamentales: una
estadística y otra teórica.
 De acuerdo con la primera, debe ser válida la generalización de los resultados
obtenidos en la muestra a la población.
 Según la teórica, la muestra elegida debe ser adecuada para el logro de la
investigación y la prueba de las hipótesis teóricas que constituyan su razón de
ser.
 Estadísticamente, el principio básico de elección de la muestra es
que ésta se haga, siempre que sea posible, de tal modo que cada
elemento de la población tenga la misma probabilidad de ser
elegido.
 Esto se cumple si la elección tiene lugar por un procedimiento
aleatorio riguroso.
 Pero no siempre es posible realizarlo así, de aquí que existen diversos
procedimientos de elección de la muestra que se pueden clasificar según se
conozca o no la probabilidad de elección de cada unidad. 94

EJERCICIOS MUESTREO
Dadas las investigaciones que se encuentran a continuación, determine
razonablemente si se basan en una muestra del universo correspondiente y si, en
caso afirmativo, la muestra es correcta.

Para realizar el sociograma de una clase, se pide a todos los alumnos que
expresen en una papeleta los nombres de sus compañeros de clase que les
gustaría tener sentados a su lado y aquellos que no.

Respuesta: No es muestra pues fueron encuestados todos los alumnos de la
clase.

Para estudiar las prácticas sexuales de los varones en una prisión se entrevistó a
todos los que se presentaron voluntariamente a responder el cuestionario que se
había preparado.

Respuesta: Genéricamente se puede decir que hay una muestra ya que se hizo la
encuesta a sólo una parte del universo. Sin embargo, se trata de una muestra
viciada, basada en un sistema de elección inadecuado, por lo que no se puede
considerar representativa del universo ni sus resultados extensibles a este.

EJERCICIOS MUESTREO

Un antropólogo social ha convivido durante dos años con una familia típica de
una localidad de Chile, se ha ganado su confianza y ha logrado que sus
miembros le expusieran los aspectos de su vida de interés para su investigación.

Respuesta: Este estudio, aunque se diga que se basa en una familia típica, no
se puede considerar como muestra, pues un solo caso no es suficiente.

Para estudiar las infracciones de circulación cometidas por no detención ante el
signo PARE, un equipo permaneció de 8 de la mañana a 8 de la noche ante la
señal durante tres días de la semana consecutivos.

Respuesta: El universo son todas las infracciones. Como sólo se investiga una
parte, se puede hablar de una muestra de todas ellas. Pero esta muestra es
desviada y no representativa del universo porque sólo proporciona información
de unas horas determinadas y de sólo tres días de la semana.

post-grado en administración UNFV

EJERCICIOS MUESTREO

Para predecir los resultados de elección municipal en una comunidad,
el encuestador preguntó su candidato preferido a todos los hombres y
mujeres con derecho a voto.

Respuesta: No existe muestra pues se consulta a todo el universo y no
parte de ellos.

En otra elección a diputados en que se presentaba un candidato de
derecha y otro de izquierda, se realizó el sondeo de opinión a una
muestra elegida al azar con base en la lista telefónica, por medio del
teléfono. Se obtuvo un resultado favorable al candidato de derecha,
aunque fue elegido luego el de izquierda.

Respuesta: En este sondeo, la muestra tampoco es representativa,
aunque se halla escogido al azar. Presenta la distorsión que supone el
hecho de que los que poseen teléfono son de un cierto nivel económico.

EJERCICIOS MUESTREO

Para estudiar las actitudes políticas de una sociedad cultural que agrupa 5.000
miembros se ha decidido realizar una encuesta por cuestionario a 500 de ellos
elegidos arbitrariamente, además de 200 entrevistas a otros tantos socios
elegidos al azar, si bien en la realidad los entrevistadores se permitieron sustituir
frecuentemente los socios elegidos por otros.

Respuesta: Hay en los dos casos, en principio, muestra del universo. Sin
embargo, la primera es inadmisible por cuanto no reúne la condición de basarse
la elección en un procedimiento racional, si es posible al azar, y además se
opone al principio de que dicha elección no debe ser arbitraria, pues hay un gran
peligro de que prevalezcan criterios subjetivos en ella.

En el segundo caso, la muestra correcta inicialmente ha resultado viciada en la
realidad por la sustitución personal y, por tanto, subjetiva que los entrevistadores
se han permitido.

UNIDAD 5: TEORIA DEL MUESTREO: EJERCICIOS
MUESTREO
Supuestos los siguientes estudios que se ha pensado realizar por encuesta muestral, se
pide indicar la base y la unidad de la muestra.

Un estudio sobre las condiciones estructurales y funcionales de las asociaciones voluntarias
privadas de España, con exclusión de las económicas, religiosas, políticas y sindicales.

Respuesta: La base de la muestra es el registro oficial de asociaciones. La unidad es cada
aosciación.

Una investigación sobre la relación entre la estabilidad familiar y la clase social en una ciudad
pequeña.

Respuesta: La Base sería el Censo o padrón de vecinos de la ciudad. La unidad sería la
familia.

Un estudio sobre las condiciones de vivienda familiares de la zona madrileña de Vallecas.

Respuesta: La base sería el plano de la zona. Las manzanas serían la unidad de la muestra

Que tengas un buen día..

Without You Air Supply Song

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (9)

Semelhante a Without You Air Supply Song

Semelhante a Without You Air Supply Song (20)

Mais de juanchojuancho

Mais de juanchojuancho (20)

Without You Air Supply Song