SlideShare uma empresa Scribd logo
1 de 99
Baixar para ler offline
Song : without you by air supply




                       Estadística


      Introducción a la estadística

Estadistica (2003 – 2004) – UNFV-
¿Para qué sirve la estadística?
   La Ciencia se ocupa en general de fenómenos observables

   La Ciencia se desarrolla observando hechos, formulando leyes que los
    explican y realizando experimentos para validar o rechazar dichas leyes

   Los modelos que crea la ciencia son de tipo determinista o aleatorio
    (estocástico)

   La Estadística se utiliza como tecnología al servicio de las ciencias
    donde la variabilidad y la incertidumbre forman parte de su naturaleza

   “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de
    las Ciencias de la Vida donde la variablidad no es la excepción sino la
    regla”
Definición
                 La Estadística es la Ciencia de la

           • Sistematización, recogida, ordenación y
            a
         tiv presentación de los datos referentes a un fenómeno
      rip     que presenta variabilidad o incertidumbre para su
   sc
De            estudio metódico, con objeto de

                 • ddeducir las leyes que rigen esos fenómenos,
                  ad
              b ili
    b     a
Pro

           • ia y poder de esa forma hacer previsiones sobre los
           c
         en mismos, tomar decisiones u obtener conclusiones.
      er
      f
 In

                                                post-grado en administración - 2004 -
Pasos en un estudio estadístico
   Plantear hipótesis sobre una población
           Los fumadores tienen “más bajas” laborales que los no fumadores
           ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?


   Decidir qué datos recoger (diseño de experimentos)
        Qué individuos pertenecerán al estudio (muestras)
              Fumadores y no fumadores en edad laboral.
              Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
               enfermedades crónicas?
        Qué datos recoger de los mismos (variables)
              Número de bajas
              Tiempo de duración de cada baja
              ¿Sexo? ¿Sector laboral? ¿Otros factores?
                                                                                       No tenéis que
   Recoger los datos (muestreo)                                                      entenderlo (aún)
        ¿Estratificado? ¿Sistemáticamente?

   Describir (resumir) los datos obtenidos
           tiempo medio de baja en fumadores y no (estadísticos)
           % de bajas por fumadores y sexo (frecuencias), gráficos,...


   Realizar una inferencia sobre la población
            Los fumadores están de baja al menos 10 días/año más de media que los no
              fumadores.

   Cuantificar la confianza en la inferencia
        Nivel de confianza del 95%
        Significación del contraste: p=2%
Método científico y estadística

           Plantear         Diseñar
           hipótesis      experimento




            Obtener      Recoger datos
          conclusiones    y analizarlos
Población y muestra
   Población (‘population’) es el conjunto sobre el que estamos
    interesados en obtener conclusiones (hacer inferencia).
       Normalmente es demasiado grande para poder abarcarlo.




   Muestra (‘sample’) es un subconjunto suyo al que tenemos
    acceso y sobre el que realmente hacemos las observaciones
    (mediciones)
      Debería ser “representativo”
      Esta formado por miembros “seleccionados” de la población
        (individuos, unidades experimentales).




                                                     maestría en administración - 2004 -
Variables
     Una variable es una característica observable que varía entre los
      diferentes individuos de una población. La información que disponemos
      de cada individuo es resumida en variables.

    En los individuos de la población española, de uno
     a otro es variable:

          El grupo sanguíneo
               {A, B, AB, O}  Var. Cualitativa
          Su nivel de felicidad “declarado”
               {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
          El número de hijos
               {0,1,2,3,...}  Var. Numérica discreta
          La altura
               {1’62 ; 1’74; ...}  Var. Numérica continua




    jfgt
Tipos de variables
   Cualitativas
    Si sus valores (modalidades) no se pueden asociar naturalmente a un
    número (no se pueden hacer operaciones algebraicas con ellos)

        Nominales: Si sus valores no se pueden ordenar
             Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

        Ordinales: Si sus valores se pueden ordenar
             Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

   Cuantitativas o Numéricas
    Si sus valores son numéricos (tiene sentido hacer operaciones
    algebraicas con ellos)

        Discretas: Si toma valores enteros
             Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

        Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
             Altura, Presión intraocular, Dosis de medicamento administrado, edad
   Es buena idea codificar las variables
    como números para poder procesarlas
    con facilidad en un ordenador.
   Es conveniente asignar “etiquetas” a
    los valores de las variables para
    recordar qué significan los códigos
    numéricos.
        Sexo (Cualit: Códigos arbitrarios)
              1 = Hombre
              2 = Mujer
        Raza (Cualit: Códigos arbitrarios)
              1 = Blanca
              2 = Negra,...
        Felicidad Ordinal: Respetar un orden al
         codificar.
              1 = Muy feliz
              2 = Bastante feliz
              3 = No demasiado feliz
   Se pueden asignar códigos a
    respuestas especiales como
              0 = No sabe
              99 = No contesta...
   Estas situaciones deberán ser tenidas
    en cuentas en el análisis. Datos
    perdidos (‘missing data’)
   Aunque se codifiquen como números, debemos recordar siempre el
    verdadero tipo de las variables y su significado cuando vayamos a
    usar programas de cálculo estadístico.
   No todo está permitido con cualquier tipo de variable.
   Los posibles valores de una variable suelen denominarse modalidades.

   Las modalidades pueden agruparse en clases (intervalos)
      Edades:
             Menos de 20 años, de 20 a 50 años, más de 50 años
        Hijos:
             Menos de 3 hijos, De 3 a 5, 6 o más hijos

   Las modalidades/clases deben forman un sistema exhaustivo y
    excluyente
      Exhaustivo: No podemos olvidar ningún posible valor de la variable
                     Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
                     Bien: ¿Cuál es su grupo sanguíneo?
        Excluyente: Nadie puede presentar dos valores
         simultáneos de la variable
             Estudio sobre el ocio
                     Mal: De los siguientes, qué le gusta: (deporte, cine)
                     Bien: Le gusta el deporte: (Sí, No)
                     Bien: Le gusta el cine: (Sí, No)
                     Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
Presentación ordenada de datos
                                         7

                                         6
Género       Frec.
                                         5
Hombre       4                           4

                                         3

                                         2
Mujer        6
                                         1

                                         0
                                             Hom bre    Mujer




      Las tablas de frecuencias y las representaciones
       gráficas son dos maneras equivalentes de presentar la
       información. Las dos exponen ordenadamente la
       información recogida en una muestra.

jfgt
Tablas de frecuencia
     Exponen la información recogida en la muestra, de forma que no se pierda nada de
      información (o poca).

                Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad

                Frecuencias relativas (porcentajes): Idem, pero dividido por el total

                Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas
                        Muy útiles para calcular cuantiles (ver más adelante)
                                   ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
                                   ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5%

                             Sexo del encuestado
                                                                                                                        Número de hijos
                                                               Porcentaje
                                                                                                                                              Porcentaje     Porcentaje
                               Frecuencia        Porcentaje      válido
                                                                                                                    Frecuencia   Porcentaje     válido       acumulado
       Válidos     Hombre             636             41,9            41,9
                                                                                           Válidos    0                    419        27,6           27,8           27,8
                   Mujer              881             58,1            58,1
                                                                                                      1                    255        16,8           16,9           44,7
                   Total             1517            100,0           100,0
                                                                                                      2                    375        24,7           24,9           69,5
                                                                                                      3                    215        14,2           14,2           83,8
                                     Nivel de felicidad
                                                                                                      4                    127          8,4            8,4          92,2
                                                               Porcentaje    Porcentaje               5                     54          3,6            3,6          95,8
                                    Frecuencia    Porcentaje     válido      acumulado                6                     24          1,6            1,6          97,3
    Válidos    Muy feliz                   467         30,8           31,1          31,1
                                                                                                      7                     23          1,5            1,5          98,9
               Bastante feliz              872         57,5           58,0          89,0
                                                                                                      Ocho o más            17          1,1            1,1        100,0
               No demasiado feliz          165         10,9           11,0        100,0
                                                                                                      Total               1509        99,5          100,0
               Total                      1504         99,1          100,0
    Perdidos   No contesta
                                                                                           Perdidos   No contesta            8           ,5
                                            13            ,9
    Total                                 1517        100,0                                Total                          1517       100,0
Datos desordenados y ordenados en tablas
                          Género Frec.        Frec. relat.
   Variable: Género
                                              porcentaje
       Modalidades:
                          Hombre 4            4/10=0,4=40%
            H = Hombre
            M = Mujer    Mujer   6           6/10=0,6=60%

                                  10=tamaño
                                  muestral
   Muestra:

        MHHMMHMMMH

       equivale a
        HHHH MMMMMM
Ejemplo
   ¿Cuántos individuos tienen              Número de hijos
    menos de 2 hijos?
      frec. indiv. sin hijos                        Porcent.    Porcent.
       +                                     Frec.   (válido)     acum.
       frec. indiv. con 1 hijo      0          419        27,8       27,8
       = 419 + 255                  1          255        16,9       44,7
       = 674 individuos             2          375        24,9       69,5   ≥50%
                                    3          215        14,2       83,8
   ¿Qué porcentaje de individuos   4          127         8,4       92,2
    tiene 6 hijos o menos?          5           54         3,6       95,8
       97,3%
                                    6           24         1,6       97,3
                                    7           23         1,5       98,9
   ¿Qué cantidad de hijos es tal   Ocho+       17         1,1      100,0
    que al menos el 50% de la
    población tiene una cantidad    Total     1509      100,0
    inferior o igual?
      2 hijos
Gráficos para v. cualitativas
   Diagramas de barras
        Alturas proporcionales a las frecuencias (abs. o
         rel.)
        Se pueden aplicar también a variables discretas

   Diagramas de sectores (tartas, polares)
        No usarlo con variables ordinales.
        El área de cada sector es proporcional a su
         frecuencia (abs. o rel.)

   Pictogramas
        Fáciles de entender.
        El área de cada modalidad debe ser proporcional a
         la frecuencia. ¿De los dos, cuál es incorrecto?.
Gráficos diferenciales para variables numéricas                            419
                                                                     400               375




   Son diferentes en función de que las
                                                                     300

                                                                                 255




                                                          Recuento
                                                                                              215


    variables sean discretas o continuas.                            200



                                                                                                    127


    Valen con frec. absolutas o relativas.                           100

                                                                                                          54
                                                                                                                    24   23
       Diagramas barras para v. discretas
                                                                                                                               17


                                                                            0     1     2      3     4    5         6    7 Ocho o más


            Se deja un hueco entre barras para indicar                                     Número de hijos


             los valores que no son posibles
                                                                     250




       Histogramas para v. continuas
                                                                     200




                                                          Recuento
            El área que hay bajo el histograma entre                150




             dos puntos cualesquiera indica la cantidad              100



             (porcentaje o frecuencia) de individuos en               50


             el intervalo.
                                                                           20                40                60                80

                                                                                            Edad del encuestado
Diagramas integrales
   Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
    a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
    (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
    en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por
    derivación (en un sentido más general del que visteis en bachillerato.)
¿Qué hemos visto?
   Definición de estadística
   Población
   Muestra
   Variables
        Cualitativas
        Numéricas
   Presentación ordenada de datos
        Tablas de frecuencias
             absolutas
             relativas
             acumuladas
        Representaciones gráficas
             Cualitativas
             Numéricas
                   Diferenciales
                   Integrales
Song : big in japan by Alphaville




                Inferencia estadística
     1.- Principales conceptos. Muestreo.
    Distribución muestral de un estadístico.
    Principales distribuciones muestrales.




Maestria en Administración ––
 Maestria en Administración
(2003- 2004 ) )- -UNFV --
 (2003- 2004      UNFV
Principales conceptos en inferencia estadística


           Idea básica: Hacer inferencias sobre la población a
partir de la muestra que hemos extraído de la misma.
     Ello nos lleva a tratar (brevemente) el tema del muestreo.
Pensemos que la muestra habrá de ser representativa de la
población, para que podamos efectuar inferencias que tengan
sentido.
Muestreo
 Definición: Proceso que nos permite la extracción de una
 muestra a partir de una población




Hay dos tipos básicos de muestreo:
1. Muestreo probabilístico. En este tipo de muestreo, la probabilidad de
   aparición en una muestra de cualquier elemento de la población es conocida
   (o calculable). Es el único científicamente válido, y es sobre el que nos
   extenderemos especialmente.
2. Muestreo no probabilístico. Es aquel en el que la selección de los elementos
   de la muestra no se hacen al azar.
Muestreo probabilístico
Este muestreo garantiza que, a la larga, las muestras que se van obteniendo de
la población sean representativas de la misma. Vamos a ver varios tipos de
muestreo probabilístico.

140
                                                              M eta 2002 Normalizada
120
100
 80
 60




                                                                                                         %
 40




                                                                                                     0
                                                                                                     8
                                                 .
 20
                                                p




                                                                                                 <




                                                                                                                            N
                              l




                                              s




                                                                                                                        G
                             o




                                                                                                 3
                                            o
  0
                           tr




                                                                                             T
                                           H




                                                                                                                        T
                                                                                    3
            to




                                                                      A
                          n




                                                                                             P
                                                        A




                                                                                    T
                                          o




                                                                                                                    s
                         o
           r




                                                                  D




                                                                                         D
                                                       IR




                                                                                P




                                                                                                                    a
                                       e
        a




                      C




                                                                  E




                                                                                                                   n
                                      N




                                                                               D
       P




                                                                                         t
                                                                                        r




                                                                                                                  u
                     .
                 to




                                   t




                                                                                     e




                                                                                                              c
                                  r




                                                                                    b




                                                                                                              a
                                  o
                 4




                                                                                    o




                                                                                                             V
                              M




                                                                                c
                                                                                i
                                                                               n
                                                                              u
  Obs 2000                   M eta 2001              M eta 2000
      1. Muestreo aleatorio simple




                                                                          M
      2. Muestreo estratificado
      3. Muestreo por conglomerados
      4. Muestreo por etapas (o polietápico)
      5. Muestreo sistemático (?)
Muestreo probabilístico

1. Muestreo aleatorio simple




Es aquel en el que, a priori, todos los elementos de la muestra tienen la misma
probabilidad de aparición.
Supongamos que tengamos una población de 50.000 individuos, y que
tenemos un listado con sus nombres. Si queremos elegir 100 personas, lo que
necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.
Muestreo probabilístico

2. Muestreo estratificado


        En el muestreo estratificado, los investigadores han de dividir a
los sujetos en diferentes subpoblaciones (o estratos), en función de
cierta característica relevante, y después lo que hacen es un muestro
aleatorio simple de cada estrato.
Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno),
y cada individuo del estrato habrá de tener la misma probabilidad de ser
escogido como parte de la muestra.
Ejemplo: Supongamos que, en Cajamarca, 70% de los niños de primaria
van a escuela pública y el 30% a concertada. Si queremos 1,000 niños, lo
que haremos es dividir los alumnos en 2 estratos (pública y concertada) y
se eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 de
la concertada.
Muestreo probabilístico

3. Muestreo por conglomerados


En el muestreo por conglomerados, en lugar de considerar cada
elemento de la población, lo que consideramos son
“conglomerados de elementos”. El proceso es elegir
aleatoriamente uno o varios conglomerados y la muestra estará
formada por TODOS los elementos de los conglomerados.


Ejemplos:
-En las encuestas durante las elecciones, los conglomerados
pueden ser las mesas electorales, y lo que se hace es escoger
algunas mesas al azar (y de ahí se toman todos los votos de las
mesas seleccionadas).
-En otros ejemplos, los conglomerados pueden ser los bloques
de viviendas, los municipios, etc.
Muestreo probabilístico

4. Muestreo por etapas


            En este caso se combina el muestreo aleatorio
simple con el muestreo por conglomerados:
Primero se realiza un muestreo por conglomerados (v.g., si los
conglomerados son colegios en Lince, se seleccionan aleatoriamente
varios de ellos).


Segundo, no se eligen todos los alumnos (como ocurriría en un muestro
por conglomerados), sino que se elige una muestra aleatoria. (Dicha
muestra puede ser obtenida por muestreo aleatorio simple o puede ser
estratificado.)
Es decir, hemos tenido 2 etapas de muestreo. Y claro está, es posible
tener más de 2 etapas...
Muestreo probabilístico

5. Muestreo aleatorio sistemático


Supongamos que tengamos una lista de N elementos (e.g.,
  estudiantes de secundaria) y queramos una muestra de
  tamaño “n”. En este caso, lo que se hace es ordenarlos
  (v.g., en función de los apellidos) y después se elige
  aleatoriamente un elemento entre los N/n=k primeros, y
  luego se elige de manera sistemática el que esté k lugares
  después del primer elemento, y así sucesivamente.
Ejemplo: Tenemos 10000 estudiantes (en una lista) y
  queremos obtener una muestra de 100 estudiantes.
  Primero elegimos al azar un estudiante entre los
  10000/100=100 primeros (supongamos que salga el 26), el
  segundo elemento será el estudiante 100+26 (126), el
  siguiente será el 226, luego el 326, etc.
Muestreo no probabilístico



1. Muestreo sin norma (o de conveniencia)
       Se elige a una muestra por ser conveniente, fácil,
económica. Pero no se hace en base a un criterio de
aleatoridad.
    Ejemplo: las encuestas en los periódicos electrónicos;
el muestreo habitual en los trabajos en psicología.


2. Muestreo intencional
En este caso, si bien el muestreo no es probabilístico, los
investigadores procuran que se garantice la
representatividad de la muestra
Distribución muestral de un estadístico




              Supongamos que tenemos una variable aleatoria, cuya


                      distribución es f ( x)
         Supongamos, por simplicidad, que obtenemos una
    muestra aleatoria simple con tamaño n = X1, X2, ... Xn
Entonces, un estadístico es cualquier función h definida sobre X1,
X2, ... Xn y que no incluye parámetro desconocido alguno:

Y=h(X1, X2, ... Xn)
La distribución de dicho estadístico Y la vamos a denominar g(y)
Distribución muestral de un estadístico
Observad:


             f(x) es la distribución de la v.a. bajo estudio
       g(y) es la distribución del estadístico que tenemos
Es vital conocer la distribución muestral del estadístico
de interés para poder efectuar inferencias sobre el
parámetro correspondiente.


Esto es, para efectuar inferencias sobre la media
poblacional µ, necesitamos conocer la distribución
muestral de X
Distribución muestral de la media


            Veremos primero el caso de que la distribución
            subyacente sea normal, con media µ y varianza                             σ   2



            La media de la distribución muestral de medias es µ
            La varianza de la distribución muestral de medias esσ                             2
                                                                                                  /n


  La forma de la distribución muestral de la media es normal.




Nota: La desviación típica de la distribución muestral suele ser denominada: error típico
 Nota: La desviación típica de la distribución muestral suele ser denominada: error típico
de tal estadístico (v.g., “error típico de la media”, etc.)
 de tal estadístico (v.g., “error típico de la media”, etc.)
Distribución muestral de la media. Ejemplo 1


400    La línea (en este y sucesivos ejemplos) es una curva normal


                                                                                         Distribución poblacional
                                                                                         subyacente (dist. Normal):
300
                                                                                         Media=100
                                                                                         (Varianza=225)
200
                                                                                         Desv.Típica=15

                                                                                          Distribución muestral de la
                                                                                          Distribución muestral de la
100                                                                                       media:
                                                                                          media:
                                                                     Desv. típ. = 4.75    Tamaño muestral=10
                                                                                           Tamaño muestral=10
                                                                     Media = 99.9
 0                                                                   N = 3600.00          Media=100
                                                                                           Media=100
                                                                                          (Varianza=225/10=22.5)
      82
      84
      86
      88
      90
      92
      94
      96
      98
      10
      10 .0
      10 .0
      10 .0
      10 .0
      11 .0
      11 .0
      11 .0
      11 .0




                                                                                           (Varianza=225/10=22.5)
        .0




        .0




        8




        6.
        .0


        .0
        .0
        .0


        .0
        .0
        .0
        0
        2
        4
        6


        0
        2
        4

          0




      N10
                     En este y sucesivos gráficos: Número de réplicas                     Desv.típica= 22.5 = 4.74
                                                                                           Desv.típica=
Distribución muestral de la media. Ejemplo 2

500




400
                                               Distribución poblacional
                                               subyacente (dist. Normal):
300
                                               Media=100
                                               Desv.Típica=15
200

                                                Distribución muestral de la
                                                Distribución muestral de la
100                                             media:
                                                media:
                           Desv. típ. = 3.36
                           Media = 100.0        Tamaño muestral=20
                                                 Tamaño muestral=20
 0                         N = 3600.00
                                                Media=100
                                                 Media=100
      88

      90

      92

      94

      96

      98

      10

      10

      10

      10

      10

      11

      11

      11




                                                (Varianza=225/20=11.3)
        .0



        0.



        4.




        2.

        4.
        .0

        .0

        .0

        .0



        .0



        2.



        6.

        8.

        0.




                                                 (Varianza=225/20=11.3)
          0
          0

          0



          0

          0

          0

          0

          0




      N20                                       Desv.típica=3.35
                                                 Desv.típica=3.35
Distribución muestral de la media. Ejemplo 3

700


600

                                                                                                    Distribución poblacional
500
                                                                                                    subyacente (dist. Normal):
400                                                                                                 Media=100

300
                                                                                                    Desv.Típica=15

200                                                                                                  Distribución muestral de la
                                                                                                     Distribución muestral de la
                                                                                                     media:
                                                                                                     media:
100                                                                             Desv. típ. = 2.12
                                                                                Media = 99.95        Tamaño muestral=50
                                                                                                      Tamaño muestral=50
 0                                                                              N = 3600.00
                                                                                                     Media=100
                                                                                                      Media=100
       93


               95


                       97


                               99


                                       10


                                                10


                                                         10


                                                                  10


                                                                           10
         .2




                                 .2


                                         1.


                                                  3.


                                                           5.


                                                                    7.
                 .2


                         .2




                                                                             9.




                                                                                                     (Varianza=225/50=4.5)
           5




                                           25


                                                    25




                                                                      25




                                                                                                      (Varianza=225/50=4.5)
                   5


                           5


                                   5




                                                             25




                                                                               25




      N50                                                                                            Desv.típica=2.12
                                                                                                      Desv.típica=2.12
Distribución muestral de la media


      Veremos ahora el caso de que la distribución subyacente
      sea arbitraria, si bien sabemos que la media es  y la
      varianza sea       σ 2
      La media de la distribución muestral de medias es                         µµ
      La varianza de la distribución muestral de medias es                          σ 2 /n




La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En
 La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En
concreto, la distribución muestral se acercará más yymás a la distribución normal
 concreto, la distribución muestral se acercará más más a la distribución normal
(media µ yyvarianza σ2/n) a medida que se aumente el tamaño de cada muestra.
 (media µ varianza σ2/n) a medida que se aumente el tamaño de cada muestra.
Distribución muestral de la media. Ejemplo 4

 Distribución poblacional
 subyacente (dist. GAMMA):
                 p 100                      La distribución GAMMA tiene 2 parámetros:
 Media=100=        =   = 100
                 λ   1
                        p 100               λ que es un parámetro de escala (1)
 Varianza=100=            =   = 100
                       λ 2 12               p que es un parámetro de forma (100)

          0.045
           0.04
          0.035
           0.03
          0.025
           0.02
          0.015
           0.01
          0.005
              0
                  80       85     90   95     100    105   110   115   120
Distribución muestral de la media. Ejemplo 4



500
                                                                 Distribución poblacional
                                                                 subyacente (dist. GAMMA):
400
                                                                 Media=100
300                                                              Varianza=100


200
                                                                   Distribución muestral de la
                                                                   media:
100
                                             Desv. típ. = 3.12     Tamaño muestral=10
                                             Media = 100.0
 0                                           N = 3600.00           Media=100
      90

             92

                    94

                           96

                                  98

                                         10

                                         10

                                         10

                                         10

                                         10

                                         11




                                                                   (Varianza=100/10=10)
        .0

               .0

                      .0

                             .0

                                    .0

                                           0.

                                           2.

                                           4.

                                           6.

                                           8.

                                           0.
                                             0

                                             0

                                             0

                                             0

                                             0

                                             0




      DISGAMMA                                                     Desv.típica=   10 = 3.16
Distribución muestral de la media. Ejemplo 5

Distribución poblacional (dist.
EXPONENCIAL):                            La distribución EXPONENCIAL tiene 1
Media=0.1=1/λ                            parámetro: λ (en el ejemplo: 10)

Varianza=0.01=1/λ2

             12

             10

              8

              6

              4

              2

              0
                  0     0.1       0.2   0.3      0.4      0.5      0.6




Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2 pulsaciones
de una rata en una caja de Skinner.
Distribución muestral de la media. Ejemplo 5a

 400




 300                                                           Distribución poblacional (dist.
                                                               EXPONENCIAL):
                                                               Media=0.1=1/λ
 200
                                                               Varianza=0.01=1/λ2

 100
                                                                  Distribución muestral de la
                                            Desv. típ. = .03      media:
                                            Media = .100
  0                                         N = 3600.00           Tamaño muestral=10
       .0
       .0
       .0
       .0
       .0
       .0
       .1
       .1
       .1
       .1
       .1
       .1
       .1
       .1
       .2
       .2
       .2
       .2




                                                                  Media=.100
         69




         69


         94
         31
         44
         56


         81
         94
         06
         19
         31
         44
         56


         81


         06
         19
         31
         44




       EXPON10                                                    (Varianza=0.01/10=.001)

Observad que la dist. muestral se aproxima a la normal            Desv.típica=.03
Distribución muestral de la media. Ejemplo 5b
 500




 400



                                                                  Distribución poblacional (dist.
 300
                                                                  EXPONENCIAL):

 200
                                                                  Media=0.1=1/λ
                                                                  Varianza=0.01=1/λ2
 100
                                               Desv. típ. = .02
                                               Media = .099         Distribución muestral de la
   0                                           N = 3600.00          media:
       .0

       .0

       .0

       .0

       .0

       .1

       .1

       .1

       .1

       .1

       .1

       .1

       .1



                                                                    Tamaño muestral=20
         44

         56

         69

         81

         94

         06

         19

         31

         44

         56

         69

         81

         94




       EXPON20                                                      Media=.100

Observad que la distribución muestral se aproxima más a
                                                                    (Varianza=0.01/20=.0005)
la normal (al elevar el tamaño muestral).                           Desv.típica=.022
OTRAS DISTRIBUCIONES MUESTRALES (1)


Distribución muestral de                       X− µ
                                               s/ n
                                               %
        Cuando la distribución de la que obtenemos las medias muestrales es
        gaussiana (“distr.normal”), la expresión anterior se distribuye según la
        distribución t de Student con tn-1 grados de libertad. (Esta distribución es
        básica para efectuar inferencias entre dos medias.)

                                             s12
                                             %           Asumiendo varianzas
Distribución muestral de                           2
                                                   s
                                                   %     poblacionales iguales
                                                   2




 Cuando las distribuciones de la que obtenemos las varianzas muestrales son
 gaussianas, la expresión anterior se distribuye según la distribución F de
 Fisher con n1-1 grados de libertad en el numerador y n2-1 grados de libertad en
 el denominador. (Recordad que la distribución F es básica para la razón de
 varianzas: ANOVA.)
OTRAS DISTRIBUCIONES MUESTRALES (2)


 Distribución muestral de            ns 2 / σ   2




       Cuando las distribución de la que obtenemos la varianza muestral
       es gaussiana, la anterior expresión se distribuye según la
       distribución chi-cuadrado con n-1 grados de libertad.




jfgt
Song . California dreaming by The mamas and the papas.




                    Simulación a
                    eventos discretos
Independencia de las muestras
Los resultados de una corrida de simulación, son muestras de
alguna distribución.

Esos resultados los llamamos "respuestas".
Las respuestas pueden ser: promedios de valores recolectados en
toda o parte de la corrida, o simplemente una única medida (ej.
largo de la cola al final de la corrida).

Las respuestas son muestras de distribuciones, por lo tanto pueden
variar de una corrida a otra o en la misma corrida.

El promedio de la distribución de respuestas la notamos µ y lo
llamamos la media (valor medio) de la distribución.
Independencia de las
muestras
Cuando los resultados son promedios de valores recolectados en
estado estacionario, una sola respuesta “puede” ser usada como
la estimación de la media de la distribución.


En sistemas terminales o no estacionarios siempre deben
realizarse varias corridas, de modo de obtener varias muestras
como respuestas, tanto para calcular la media como para
calcular la varianza,
Dispersión de la muestra
La dispersión de la variable aleatoria respecto de su media, se
mide mediante la desviación estándar σ o la varianza σ2.

Si la varianza es grande quiere decir que no todos los valores
que toma la V.A. están cerca de la media.



Para calcular la varianza de la distribución muestreada es
necesario obtener varias respuestas independientes.
Análisis de resultados
 En general es aconsejable realizar varias corridas
 independientes para tomar varias muestras como respuestas
 tanto para calcular la media como la varianza (y la desviación
 estándar).

 Por lo tanto....
 El análisis estadístico de los experimentos de simulación
 requieren de varias respuestas independientes x1, ...,xn.

 Cada una de estas muestras se obtienen a partir de alguno de los
 siguientes métodos.
Métodos muestreo resultados
(1)
 1.-

 Se realizan n corridas que generan x1, ..., xn.

 Cada corrida con torrentes de números aleatorios
 diferentes e independientes.

 Cada corrida es una replicación.

 Se pueden registrar resultados solamente en
 determinados períodos de interés.
Métodos muestreo resultados
(2)
  2.-

 El método de replicación en sistemas estacionarios.

 Los datos se toman solamente en el período
 estacionario, la muestra o resultado es un promedio
 de los datos obtenidos durante la corrida o
 replicación.
Métodos muestreo resultados
(3)
 3.-

  Método batch means, usado en simulaciones de
  estado estacionario, aquellos que llevan mucho
 tiempo en alcanzar ese estado.

 Se corre el período run-in una sola vez; a partir de allí
 se registran valores de xi en intervalos
  sucesivos de tiempo de igual longitud, 1 ... n.

 Riesgo: correlación entre resultados sucesivos.
Métodos muestreo
resultados (4)
4.-
El método regenerativo se utiliza cuando nos interesan
medidas en períodos o instantes específicos
(particulares) del tiempo.

Por ejemplo nos interesa el largo de la cola cuando se
rompe una máquina (cantidad de máquinas rotas en esa
ocasión).

Entonces consideramos un punto regenerativo (la
ruptura de la máquina), y se registra una muestra
independiente inmediatamente después de cada
ruptura.
Cálculo media y varianza
 Media, Varianza son los parámetros que mas
 interesan calcular.

 Si xi es la i-ésima respuesta de n replicaciones o
 batches entonces podemos estimar la media µ,

           n                  n

          ∑                  ∑ (x        − X)
                                                2
                 xi
                                                        1  n 2 1 n          
                                     i                                        2

     X=   i= 1
                      s2 =   i= 1
                                                    =        ∑ xi −  ∑ xi  
               n                    n− 1              n − 1  i= 1  n  i= 1  
                                                                             
                                                            


 s2 un estimador sin sesgo de la varianza σ2 de las
 respuestas.
Intervalo de confianza
Nos interesa saber con qué grado de seguridad estamos
estimando el valor medio de la distribución.

La estimación es el promedio muestreado de un conjunto de
respuestas, entonces el intervalo de confianza nos brinda una
medida de la confianza que le podemos tener a esa
estimación;
Los límites de un 95% de confianza son los puntos extremos
de un intervalo alrededor de la media de la muestra; significa
que la media de la distribución se muestreará con una
probabilidad de 0.95.
Intervalo de Confianza
La varianza de la media de la muestra de tamaño n es


   σ 2                                           s2        2
       estimada mediante                            = sx
    n                                            n

             n

            ∑ (x        − X)
                               2
                    i
                                       1    n 2 1 n        
                                                             2

     s2 =   i= 1
                                   =        ∑ xi −  ∑ xi  
                   n− 1              n − 1  i= 1  n  i= 1  
                                                            
                                           
Intervalo de Confianza
Los límites del 95% del intervalo de confianza se pueden
calcular de tablas de distribución Student para
muestras pequeñas y de tablas de la distribución
Normal para muestras grandes .

Para la Normal los límites de un intervalo de confianza
de 95% son



               X ± 1.96 s x
Intervalo de Confianza
 P  x − λ α D < m < x + λ α D  = 1 − α = 0.95
                              
           2               2  



 λ α = 1.96       D = sx
   2
Otras técnicas de análisis
La Técnica predictiva se usa en simulaciones no terminales que
no alcanzan estado estacionario.
Se toma una medida de la media xt en un intervalo de tiempo t y
se grafican los valores tomados (xt vs t) para tener una idea de
como varían los valores con el tiempo.
Si queremos una idea mas precisa, se pueden realizar varias y
diferentes corridas y tomar promedios de ellas.
También se puede usar técnicas de regresión múltiple para
ajustar los valores obtenidos a algún tipo de curva, aunque a
veces el patrón de conducta de xt puede ser complejo, lo que
dificulta el análisis de la misma.
Verificación de hipótesis
Esta técnica se usa para determinar cuando las respuestas de simulaciones
comparativas son significantes estadísticamente.
Si x es una respuesta de una v.a de media µx de una corrida e y ( media µy) es
la respuesta de la corrida con valores cambiados de las var. de decisión,
entonces la hipótesis a verificar es µx = µy.

Si realizamos n corridas para un conjunto de valores de las variables de
decisión y repetimos el mismo número de corridas para los valores
cambiados, entonces la media muestreada de la primera experiencia es X y
de la segunda es Y.
 La verificación se basa en la diferencia entre X e Y y cuánto se aleja la
desviación estándar de la media.
El cálculo de la desviación estándar dependerá de cuan independientes son
los valores xi e yi de las corridas realizadas (distribución t o Normal).
Análisis de factores (1)
Esta técnica estadística se utiliza para evaluar o
determinar los efectos que los cambios en las
variables de decisión producen en las salidas o
resultados de la simulación.

Las variables de decisión se llaman factores, por lo
tanto corremos la simulación con distintos valores
asignados a los factores (niveles) para medir cuánto
afecta a los resultados de la simulación, los distintos
factores ya sea individualmente como interactuando
uno con otro.
Análisis de factores (2)
La complejidad del análisis crece
exponencialmente con la cantidad de factores,
ya que si tenemos n factores y nos interesa el
factor i medido en el nivel mi,
tenemos Π mi diferentes posibles formas de
hacerlo.

Esto además se complica mas, si existe mas de
una salida a considerar.
Análisis de factores (2)
Esta técnica es usable para simulaciones con muchos
factores a ser testeados en varios niveles.
Pero es una técnica muy costosa en tiempo y por lo
tanto muchos test estadísticos no pueden ser
terminados.
De todos modos es valiosa para tener una idea o
imágen de los efectos ocasionados por distintos
cambios en los factores de la simulación. (Law y
Kelton 82).
Depende tambien de la cantidad de torrentes
accesibles
Resumen cap. 5


Simulación terminal , estacionaria.

Detección estado estacionario.

Parámetros interesantes
como registrarlos y presentarlos.

Facilidades de PascalSIM.

Técnicas de Análisis de resultados
Modelo de simulación
 Producir un modelo de simulación no es solamente
 escribir código.

 La estructura de la simulación y sus distribuciones
 se derivarán de :

 OBJETIVOS
 HIPOTESIS DE TRABAJO
 RESPUESTAS
 VARIABLES DE DECISION
Modelo de simulación
  El modelo se compone de:

     + Objetivos, hipótesis,
          variables de decisión y
     respuestas,
     + diagramas de actividades
     + especificación
     + pesudocódigo
     + código
Modelo de simulación

 OBJETIVOS

 deben ser claros, subjetivos o muy detallados, pero
    determinarán:

 i) las variables de decisión,
 ii) cuándo es necesaria una salida visual, un
      detallado tratamiento estadístico o ambos y
 iii) qué salidas son importantes.
Modelo de simulación
 HIPOTESIS DE TRABAJO.

 Existen hipótesis implícitas al modelo y otras explícitas.
 Ambas deben ser documentadas.

  Los programas deben ser diseñados de forma de
 permitir cambios en etapas posteriores del proyecto.
 (reducen la complejidad del modelo)
Modelo de simulación

 RESPUESTAS
 tipos de parámetros y medidas de interés,
 así como estadísticas y datos a recolectar para el
 análisis.

 VARIABLES DE DECISION.
 Los objetivos indicarán cuáles serán fijos y cuáles
 cambiables.
Especificación Sala internación
  El sistema es una simplificación del problema real (describirlo).

  La especificación del problema está dada por el detalle de
  los objetivos,
         las hipótesis de trabajo,
         las variables de decisión,
         las respuestas y las duraciones de las distintas
         actividades (tabla 6.1)
         y el diagrama de actividades (fig 2.2).
Especificación Sala internación
   Aclaración de hipótesis:
   a) El arribo de los pacientes se describe mediante Proceso
      Poisson de tasa constante (aproximación burda pero inicial)
   b) El sistema opera continuamente, cuando en realidad
      pacientes agendados para operación no arriban por la
      noche.
   Consideraremos el sistema en estado estacionario, por lo tanto
      investigaremos el efecto de cambiar valores de las variables
      de decisión en parámetros estables. (estudio completo cap
      8).
   Medidas importantes: utilización de camas y tiempos de
      espera.
Programa

Se programa según algún método elegido.

La sala de operaciones es agendada por dos tipos de eventos:
       fin de operación, y tiempo en que está cerrada.

Se define una variable booleana que controla esas condiciones
en la entidad "sala de operaciones" que siempre está en el
calendario
              (ver record en libro pag 107).

Las variables de decisión se declaran como constante globales.
Programa
El unidad de tiempo de la simulación es la hora.

q4 es una cola ficticia, ventaja:
cada actividad está compuesta por el par de
eventos C y B, lo que facilita la modificación
posterior del programa.

Los histogramas se declaran y
nuevos valores son ingresados cada vez que haya
un cambio en algún tipo de evento C o B.
Período Run-in

Simulación del Hospital es de tipo "Estacionaria",
debemos determinar cuando comenzar a tomar
datos para procesar.

Utilizamos el método de promedios acumulados
(tabla 6.2) se agrega código en la fase B del
ejecutivo para producir promedios de las
respuestas cada 49 hs simuladas.
La Fig 6.1 grafica los datos obtenidos.
Período Run-in
Observar que: la cola de solo internados y el tiempo de
espera para operación alcanzan el estado estable
rápidamente ( se admite para operación si no hay
pacientes tipo solo internación).
La estabilidad se alcanza alrededor de las 720 hs.

En un proyecto real, se deben obtener un cierto número
considerable de promedios acumulados de respuestas,
usando diferentes torrentes de números para asegurarse
de que realmente se ha alcanzado el estado estacionario.
Resultados
Se simularon 14 días luego de alcanzada la estabilidad. Se
utilizaron números distintos que los utilizados para determinar el
período run-in.
Observar:
        - La distribución de las filas de "solo internados" y
pacientes a operar, tienen una varianza grande.
        - Las camas han tenido un gran porcentaje de utilización
( 20 en 318 hs de 336 simuladas)
        - 26 pacientes fueron operados y su tiempo de espera fue
muy variado.
        Cada corrida con un conjunto de diferentes torrentes
producen una replicación. Se necesitan varias replicaciones para
obtener datos mas acertados. Los datos ameritan reducción de
varianza.
Taller de reparaciones

Simulación terminal. Alcanza estabilidad
enseguida. Se toman datos durante toda la
simulación.
Se podrían considerar las máquinas como
variables de decisión. La lógica del programa
se presta para adecuarlo a este cambio.
A tener en cuenta: cómo continuar luego de
teminada la jornada de trabajo (estudienlo!).
Taller de reparaciones (2)
Buena práctica: declarar los niveles de recursos
y torrentes de número como constantes globales.
Fácil de alterar durante la experimentación.
Resultados: el número de máquinas rotas varió
entre 0 y 10. La utilización de mecánicos fue
mayor que la de equipos (84.25% vs 68.7%).
Durante un gran período de tiempo los
mecánincos estuvieron todos ocupados.
IMPORTANTE
  4.5
   4
         Maestristas a nivel
  3.5
         nacional en
   3
         administración
  2.5
   2
  1.5
   1
  0.5
   0
        1998           1999       2000

                      Ejecutado
MUESTREO




 POBLACIÓN DE TAMAÑO N

         MUESTRA DE TAMAÑO n
Censo                         Muestreo

  Conocer parámetros              Estimar parámetros
+ Tiempo para realizarlo       - Tiempo para realizarlo
       + Costo                          -Costo
                                 Personal profesional



             Promedio      µ       x
             Proporción    P       p
             Total
                           T      t
MUESTREO


              ALEATORIO IRRESTRICTO (MAI; MSA)

              MUESTREO SISTEMÁTICO

 DISEÑOS DE                    IGUAL
 MUESTREO     ESTRATIFICADO    PROPORCIONAL
ESTADÍSTICO                    NEYMAN
                               ÓPTIMA
              POLIETÁPICO


              POR CONGLOMERADOS
MUESTREO

   ESTUDIO DE       QUE DISEÑO DE MUESTREO SE DEBE UTILIZAR
   MUESTREO
                    CUAL ES EL TAMAÑO ÓPTIMO DE LA MUESTRA



  QUE        CARACTERÍSTICAS DE LA POBLACIÓN
  DISEÑO

                 DISEÑO DE MUESTREO

                 PARÁMETRO A ESTIMAR (PROMEDIO, PROPORCIÓN, TOTAL
TAMAÑO DE
LA MUESTRA      TAMAÑO DE LA POBLACIÓN       N
                GRADO DE VARIABILIDAD        σ
                NIVEL DE PRECISIÓN   σ   2

                NIVEL DE CONFIABILIDAD d     t (TABLAS)
MUESTREO SIMPLE ALEATORIO




        POBLACIÓN DE TAMAÑO N

              MUESTRA DE TAMAÑO n
              EN FORMA ALEATORIA
PARA QUE SE UTILIZA:   PARA ESTIMAR EL VALOR DE
                        PARÁMETROS DE INTERÉS



                        CUANDO LA VARIABILIDAD DE
CUANDO SE UTILIZA:      LOS ELEMENTOS DE LA
                        POBLACIÓN BAJO ESTUDIO,
                        SEA MÍNIMA



SUGERENCIA           CUANDO EL COEFICIENTE DE
PRÁCTICA             VARIACIÓN < 15 %
ETAPAS EN UN ESTUDIO DE MUESTREO:


1. OBJETIVOS DEL ESTUDIO
2. DEFINICIÓN DE LA POBLACIÓN BAJO ESTUDIO
3. ESTABLECIMIENTO DEL MARCO DE MUESTREO
4. DEFINIR PARAMETROS A ESTIMAR
5. MUESTREO PRELIMINAR
6. DEFINIR EL DISEÑO DE MUESTREO
7. DETERMINAR CONFIABILIDAD Y PRECISIÓN
8. DETERMINAR EL TAMAÑO DE LA MUESTRA
9. DEFINIR LAS VARIABLES BAJO ESTUDIO
10.ESTRUCTURACIÓN DEL CUESTIONARIO
11.PRUEBA DEL CUESTIONARIO
12.REALIZACIÓN DEL TRABAJO DE CAMPO
DETERMINACIÓN DEL TAMAÑO ÓPTIMO DE LA MUESTRA

          Ns
n=                 2
           d
     N − 1  + s
                                                                              ENDSA
                                 Indicadores                    1989           1994    1998
          z          Tasa de mortalidad infantil (por
                     1000 nacidos vivos)
                       Tasa global de fecundidad
                                                                      99

                                                                      5.6
                                                                                 75

                                                                                 4.8
                                                                                          67

                                                                                          4.2

          Npq          % de mujeres que usan

n=
                                                                    12.2        17.8     25.3
                       anticonceptivos modernos
               2
           d
                       % de niños menores de 5 años
                                                                    13.3        15.7      7.6
                       con desnutrición moderada

     N − 1  + pq
           z 
                       Cobertura de Parto Institucional             37,6        42.3     59.2


                     Cobertura de IRA
                       Cobertura de EDA
                                                                    28.7
                                                                      24
                                                                                43.4
                                                                                32.4
                                                                                         47.2
                                                                                         36.2
                       PAI
          Ns
n=                 2
                                DPT 3
                                Sarampión
                                                                    28.4
                                                                    57.5
                                                                                42.8
                                                                                55.7
                                                                                         48.6
                                                                                         50.8
           d
     N − 1  + s
                                Polio                               37.8        47.5     39.1
                       Elaboración: Unidad de Reforma de Salud - MSyPS 1998


          z 
                       * Informe Preliminar



           
UNIDAD 5: TEORIA DEL MUESTREO
   EL MUESTREO
Por  ser la técnica del muestreo de aplicación casi general en las
 investigaciones sociales, es evidente la importancia que tiene su estudio y la
 necesidad en que se halla en investigador social de conocer por lo menos sus
 principios y prácticas básicos, aunque se trate de una materia basada en las
 leyes de azar y el cálculo de probabilidades, que pertenece al campo
 matemático de la estadística.
Una muestra es una parte representativa de un conjunto, población o universo,
 cuyas características debe reproducir en pequeño lo más exactamente posible.
De momo más científico, se pueden definir las muestras como una parte de un
 conjunto o población debidamente elegida, que se somete a observación
 científica en representación del conjunto, con el propósito de obtener resultados
 válidos, también para el universo total investigado.
Las muestras tienen un fundamento matemático-estadístico. Este consiste en
 que obtenidos de una muestra, elegida correctamente y en proporción
 adecuada, unos determinados resultados, se puede hacer la inferencia o
 generalización, fundada matemáticamente, de que dichos resultados son
 válidos para el universo del que se ha extraído la muestra, dentro de unos
 límites de error y probabilidad, que se pueden determinar estadísticamente en
 cada caso.
UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO
Las muestras presentan las siguientes ventajas:
1.   Mediante ellas, con una muestra relativamente reducida con relación al
     universo, se pueden encuestar grandes poblaciones y núcleos humanos,
     que de otra manera sería muy difícil o prácticamente imposible investigar.
2.   Las muestras suponen una gran economía en las encuestas y la posibilidad
     de mayor rapidez en su ejecución.
3.   Una muestra puede ofrecer resultados más precisos que una encuesta total,
     aunque esté afectada del error que resulta de limitar el todo a una parte.

La condiciones de las muestras son:
1.   Que comprendan parte del universo y no la totalidad de este.
2.   Que su amplitud sea estadísticamente proporcionada a la magnitud del
     universo. Esta condición e halla en relación con el punto práctico de
     determinación del tamaño de la muestra y sirve para decidir si, según las
     unidades que comprende respecto al universo, una muestra es o no
     admisible.
3.   La ausencia de distorsión en la elección de los elementos de la muestra. Si
     esta elección presenta alguna anomalía, la muestra resultará por este
     mismo viciada.
UNIDAD 5: TEORIA DEL MUESTREO
                                 EL MUESTREO
• La selección de las unidades de observación es un paso primordial en toda
  investigación. De cómo se realice dicha operación dependerá la calidad de los
  resultados de la investigación.
• Una de las primeras decisiones a tomar es la especificación y acotación de la población
  a analizar. Esta depende de cuál sea el problema y los objetivos principales de la
  investigación.
• Universo o Población se refieren al conjunto total de elementos que constituyen un área
  de interés analítico. Comúnmente se entiende como un conjunto de unidades sobre las
  cuales se desea obtener información.
• Las unidades pueden ser personas, familias, viviendas, organizaciones, artículos de
  prensa, etc.
• Lo que constituye la población total está definido por problemáticas de tipo teórico. El
  universo puede ser la población total de la humanidad, la población de un país, de una
  región, etc.
• En la definición y acotación de la población se deben mencionar ls características
  esenciales que la ubiquen en un espacio y tiempo concreto. Ej. En una investigación
  sobre la ocupación del tiempo luego de jubilar, una posible definición del universo de
  estudio sería la siguiente: Población de 65 años y màs que residen en la V región.
UNIDAD 5: TEORIA DEL MUESTREO . EL MUESTREO
Una  vez definida la población, se procede al diseño de la muestra: la selección
 de unas unidades concretas de dicha población.
Aunque el universo sea de pequeña dimensión, por razones de economía (en
 tiempo y dinero), rara vez se observa a cada una de las unidades que lo
 forman. Por el contrario, se decide la extracción de una muestra de entre los
 integrantes del universo.
La representatividad depende del tamaño de la muestra y del procedimiento
 seguido para la selección de las unidades muestrales.
Si a partir de los datos obtenidos en una muestra, quieren inferirse las
 características correspondientes de la población (parámetros poblacionales), es
  necesario diseñar una muestra que constituya una representación a pequeña
 escala de la población a la que pertenece.
Los diseños muestrales probabilísticos se fundamentan en la Estadística
 Inferencial configurada a partir de la Teoría de las Probabilidades.
Cualquier diseño muestral comienza con la búsqueda de documentación que
 ayude a la identificación de la población de estudio.
Con el término marco se hace referencia al “listado que comprende las
 unidades de la población”. Puede ser un Censo general de la población, un
 registro de individuos o cualquier otro procedimiento que lleve a la identificación
 de los miembros de una población.
UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO
Los elementos principales de la muestra son la base y la unidad de la misma.
La base de la muestra es la población de la que se obtiene o saca la muestra.
La importancia de la base de la muestra se deriva de que esa, operativamente, es el
resultado de la elección de unidades dentro de una población o conjunto
previamente determinado de aquellas. Por ello, fundamento básico de la muestra,
es la existencia de un registro de dicho conjunto, en el que aparezcan
individualizadas todas sus unidades y permita realizar la elección mediante un
sorteo riguroso.
Esta concreción individualizada de las unidades del universo es el punto de partida
y el fundamento necesario para realizar con rigor al elección en que consiste la
muestra y por ello se dice que constituye la base de la muestra en sentido estricto.
Esta puede consistir en un Censo, un registro, una lista, un fichero, un catálogo, un
mapa, un plano, etc.
En la base de la muestra deben figurar individualizadas todas las unidades que
forman la población con expresión de su número en el universo, nombre, domicilio
en su caso, etc.
La base de la muestra hace posible la identificación de los elementos que se hayan
seleccionado mediante la muestra y su encuesta posterior.
La base de la muestra no siempre existe. Ej. Público que circula por las calles ni los
asistentes a un espectáculo. Aquí se elige una muestra con un procedimiento
aleatorio imperfecto como encuestar uno de cada cinco que se encuentren en la
UNIDAD 5: TEORIA DEL MUESTREO: REQUISITOS DEL MARCO
        MUESTRAL
El marco muestral debe cumplir los siguientes requisitos para que sea un descriptor
   válido de la población:
1. Debe ser lo más completo posible. La muestra escogida sólo podrá considerarse
   representativa de la población comprendida en el marco de muestreo elegido, es
   decir, a aquellos que han tenido la probabilidad de ser elegidos para participar en la
   muestra. Por esta razón, la comprehensividad se convierte en una exigencia básica
   de todo marco muestral.
2. La comprehensividad del marco muestral conlleva la exigencia de su actualización.
   En la medida que el marco muestral se halle actualizado las posibilidades de
   omisiones se restringen. Por el contrario, aumenta la probabilidad de que éste
   contenga a los miembros reales de la población que representa.
3. Cuando la investigación persigue la generalización de los datos muestrales (a la
   población que conforma el marco muestral) es preciso que cada componente de la
   población esté igualmente representado en el marco de muestreo. Es decir, no
   deben haber duplicidades.
4. El marco muestral no debe incluir unidades que no correspondan a la población que
   se analiza. La inclusión de estas unidades reduce la probabilidad de elección de las
   unidades que sí pertenecen a la población.
5. El marco muestral debe contener información suplementaria que ayude a la
   localización de las unidades seleccionadas: teléfono y dirección.
UNIDAD 5: TEORIA DEL MUESTREO
EJEMPLOS DE MARCOS MUESTRALES
Ejemplo de comprehensividad del marco de muestreo:
La Guía Telefónica es un marco de muestreo habitual en una encuesta
telefónica. Pero tiene restricciones porque limita la población a las personas con
un número de teléfono registrado y excluye a aquellos que no tienen teléfono.
Por otro lado, generalmente el número está registrado a nombre del jefe de
hogar, apareciendo la mayoría hombres.
Si la finalidad de la investigación fuese conocer la opinión de los psicólogos
españoles sobre su actividad profesional, un marco de muestreo idóneo sería el
directorio de psicólogos colegiados. Pero la muestra sólo será representativa de
los psicólogos colegiados y no de la totalidad de los psicólogos españoles.
Tampoco incluye a los psicólogos que se han inscrito recientemente.

Ejemplo de supresión en un marco de muetreo:
Si se hiciera una encuesta a la población mayor de 40 años, habría que
circunscribir la población a esta cuota de edad. Las personas de 40 años y
menos deberían eliminarse del marco muestral. Esto podría hacerse a priori
(antes de proceder a la extracción de la muestra) o a posteriori (una vez que la
muestra ha sido seleccionada). Aquí, de la muestra obtenida, se sustraen
aquellas unidades que no pertenezcan a la población de interés.

                                                                                     93
UNIDAD 5: TEORIA DEL MUESTREO
ELECCION DE LA MUESTRA

    Operativamente la muestra es una selección de unidades dentro de un conjunto,
     que no es otro que la base de la muestra. Esta es, entonces, el resultado de una
     elección y por tanto, su bondad depende de la bondad de la elección.
    La bondad de esta elección depende de dos condiciones fundamentales: una
     estadística y otra teórica.
    De acuerdo con la primera, debe ser válida la generalización de los resultados
     obtenidos en la muestra a la población.
    Según la teórica, la muestra elegida debe ser adecuada para el logro de la
     investigación y la prueba de las hipótesis teóricas que constituyan su razón de
     ser.
    Estadísticamente, el principio básico de elección de la muestra es
     que ésta se haga, siempre que sea posible, de tal modo que cada
     elemento de la población tenga la misma probabilidad de ser
     elegido.
    Esto se cumple si la elección tiene lugar por un procedimiento
     aleatorio riguroso.
    Pero no siempre es posible realizarlo así, de aquí que existen diversos
     procedimientos de elección de la muestra que se pueden clasificar según se
     conozca o no la probabilidad de elección de cada unidad.                     94
UNIDAD 5: TEORIA DEL MUESTREO
        EJERCICIOS MUESTREO
Dadas las investigaciones que se encuentran a continuación, determine
razonablemente si se basan en una muestra del universo correspondiente y si, en
caso afirmativo, la muestra es correcta.

Para  realizar el sociograma de una clase, se pide a todos los alumnos que
expresen en una papeleta los nombres de sus compañeros de clase que les
gustaría tener sentados a su lado y aquellos que no.

Respuesta: No es muestra pues fueron encuestados todos los alumnos de la
clase.

Para  estudiar las prácticas sexuales de los varones en una prisión se entrevistó a
todos los que se presentaron voluntariamente a responder el cuestionario que se
había preparado.

Respuesta: Genéricamente se puede decir que hay una muestra ya que se hizo la
encuesta a sólo una parte del universo. Sin embargo, se trata de una muestra
viciada, basada en un sistema de elección inadecuado, por lo que no se puede
considerar representativa del universo ni sus resultados extensibles a este.
UNIDAD 5: TEORIA DEL MUESTREO
EJERCICIOS MUESTREO

 Un  antropólogo social ha convivido durante dos años con una familia típica de
 una localidad de Chile, se ha ganado su confianza y ha logrado que sus
 miembros le expusieran los aspectos de su vida de interés para su investigación.

 Respuesta: Este estudio, aunque se diga que se basa en una familia típica, no
 se puede considerar como muestra, pues un solo caso no es suficiente.

 Para  estudiar las infracciones de circulación cometidas por no detención ante el
 signo PARE, un equipo permaneció de 8 de la mañana a 8 de la noche ante la
 señal durante tres días de la semana consecutivos.

 Respuesta: El universo son todas las infracciones. Como sólo se investiga una
 parte, se puede hablar de una muestra de todas ellas. Pero esta muestra es
 desviada y no representativa del universo porque sólo proporciona información
 de unas horas determinadas y de sólo tres días de la semana.



                                                    post-grado en administración UNFV
UNIDAD 5: TEORIA DEL MUESTREO
EJERCICIOS MUESTREO

 Para predecir los resultados de elección municipal en una comunidad,
 el encuestador preguntó su candidato preferido a todos los hombres y
 mujeres con derecho a voto.

 Respuesta: No existe muestra pues se consulta a todo el universo y no
 parte de ellos.

 En  otra elección a diputados en que se presentaba un candidato de
 derecha y otro de izquierda, se realizó el sondeo de opinión a una
 muestra elegida al azar con base en la lista telefónica, por medio del
 teléfono. Se obtuvo un resultado favorable al candidato de derecha,
 aunque fue elegido luego el de izquierda.

 Respuesta: En este sondeo, la muestra tampoco es representativa,
 aunque se halla escogido al azar. Presenta la distorsión que supone el
 hecho de que los que poseen teléfono son de un cierto nivel económico.
UNIDAD 5: TEORIA DEL MUESTREO
EJERCICIOS MUESTREO

 Para  estudiar las actitudes políticas de una sociedad cultural que agrupa 5.000
 miembros se ha decidido realizar una encuesta por cuestionario a 500 de ellos
 elegidos arbitrariamente, además de 200 entrevistas a otros tantos socios
 elegidos al azar, si bien en la realidad los entrevistadores se permitieron sustituir
 frecuentemente los socios elegidos por otros.

 Respuesta: Hay en los dos casos, en principio, muestra del universo. Sin
 embargo, la primera es inadmisible por cuanto no reúne la condición de basarse
 la elección en un procedimiento racional, si es posible al azar, y además se
 opone al principio de que dicha elección no debe ser arbitraria, pues hay un gran
 peligro de que prevalezcan criterios subjetivos en ella.

 En el segundo caso, la muestra correcta inicialmente ha resultado viciada en la
 realidad por la sustitución personal y, por tanto, subjetiva que los entrevistadores
 se han permitido.
UNIDAD 5: TEORIA DEL MUESTREO: EJERCICIOS
        MUESTREO
Supuestos los siguientes estudios que se ha pensado realizar por encuesta muestral, se
pide indicar la base y la unidad de la muestra.

Un  estudio sobre las condiciones estructurales y funcionales de las asociaciones voluntarias
privadas de España, con exclusión de las económicas, religiosas, políticas y sindicales.

Respuesta: La base de la muestra es el registro oficial de asociaciones. La unidad es cada
aosciación.

Una investigación sobre la relación entre la estabilidad familiar y la clase social en una ciudad
pequeña.

Respuesta: La Base sería el Censo o padrón de vecinos de la ciudad. La unidad sería la
familia.

Un   estudio sobre las condiciones de vivienda familiares de la zona madrileña de Vallecas.

Respuesta: La base sería el plano de la zona. Las manzanas serían la unidad de la muestra


                         Que tengas un buen día..

Mais conteúdo relacionado

Mais procurados

Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadisticadiazfatima
 
Clase2 estadistica preceptores
Clase2 estadistica preceptoresClase2 estadistica preceptores
Clase2 estadistica preceptoresAlejandra Camors
 
Clase 1. Estadística para ingenieros
Clase 1. Estadística para ingenierosClase 1. Estadística para ingenieros
Clase 1. Estadística para ingenierosJoanny Ibarbia Pardo
 
Informe estadistica
Informe estadisticaInforme estadistica
Informe estadisticanoeliatoro95
 
Presentació taller estadistica 2015 1
Presentació taller estadistica 2015 1Presentació taller estadistica 2015 1
Presentació taller estadistica 2015 1Liliana Lorenzo
 

Mais procurados (9)

Estadística
EstadísticaEstadística
Estadística
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadistica
 
10. muestreo
10.  muestreo10.  muestreo
10. muestreo
 
Clase2 estadistica preceptores
Clase2 estadistica preceptoresClase2 estadistica preceptores
Clase2 estadistica preceptores
 
Muestreo
MuestreoMuestreo
Muestreo
 
Clase 1. Estadística para ingenieros
Clase 1. Estadística para ingenierosClase 1. Estadística para ingenieros
Clase 1. Estadística para ingenieros
 
Clase01 conceptos generales
Clase01   conceptos generalesClase01   conceptos generales
Clase01 conceptos generales
 
Informe estadistica
Informe estadisticaInforme estadistica
Informe estadistica
 
Presentació taller estadistica 2015 1
Presentació taller estadistica 2015 1Presentació taller estadistica 2015 1
Presentació taller estadistica 2015 1
 

Semelhante a Without You Air Supply Song (20)

Introducción Tema 1
Introducción Tema 1Introducción Tema 1
Introducción Tema 1
 
3esoestad uma 01
3esoestad uma 013esoestad uma 01
3esoestad uma 01
 
Esta udd-2012
Esta udd-2012Esta udd-2012
Esta udd-2012
 
1._Metod_Estad.ppt
1._Metod_Estad.ppt1._Metod_Estad.ppt
1._Metod_Estad.ppt
 
Bioestadística1º clase
Bioestadística1º claseBioestadística1º clase
Bioestadística1º clase
 
Introducción a la Estadísitica Descriptiva
Introducción a la Estadísitica DescriptivaIntroducción a la Estadísitica Descriptiva
Introducción a la Estadísitica Descriptiva
 
elefant
elefantelefant
elefant
 
Introducción bioestadística
Introducción bioestadísticaIntroducción bioestadística
Introducción bioestadística
 
diapositivas de estadistica.ppt
diapositivas de estadistica.pptdiapositivas de estadistica.ppt
diapositivas de estadistica.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticosestadistica descriptiva y gráficos estadisticos
estadistica descriptiva y gráficos estadisticos
 
estadistica datos agrupados e introduccion
estadistica datos agrupados e introduccionestadistica datos agrupados e introduccion
estadistica datos agrupados e introduccion
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
estadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzadaestadistica_probabilidad_curso_clase avanzada
estadistica_probabilidad_curso_clase avanzada
 
estad_uma_01.ppt
estad_uma_01.pptestad_uma_01.ppt
estad_uma_01.ppt
 
Estadística con Excel... Sustento Teórico
Estadística con Excel... Sustento TeóricoEstadística con Excel... Sustento Teórico
Estadística con Excel... Sustento Teórico
 
INTRODUCCION A LA ESTADÍSTICA.pdf
INTRODUCCION A LA ESTADÍSTICA.pdfINTRODUCCION A LA ESTADÍSTICA.pdf
INTRODUCCION A LA ESTADÍSTICA.pdf
 

Mais de juanchojuancho

El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdf
El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdfEl-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdf
El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdfjuanchojuancho
 
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...juanchojuancho
 
Como empezar una tesis by supo jose
Como empezar una tesis by supo jose Como empezar una tesis by supo jose
Como empezar una tesis by supo jose juanchojuancho
 
Diccionario de las preposiciones españolas
Diccionario de las preposiciones españolasDiccionario de las preposiciones españolas
Diccionario de las preposiciones españolasjuanchojuancho
 
Apa guia para citar textos 2016
Apa guia para citar textos 2016Apa guia para citar textos 2016
Apa guia para citar textos 2016juanchojuancho
 
Bruce Lee & uyehara, mito _ el método de combate de bruce lee. entrenamien...
 Bruce Lee  & uyehara, mito _  el método de combate de bruce lee. entrenamien... Bruce Lee  & uyehara, mito _  el método de combate de bruce lee. entrenamien...
Bruce Lee & uyehara, mito _ el método de combate de bruce lee. entrenamien...juanchojuancho
 
Diagramas de Venn y existencia
Diagramas de Venn y existenciaDiagramas de Venn y existencia
Diagramas de Venn y existenciajuanchojuancho
 

Mais de juanchojuancho (20)

El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdf
El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdfEl-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdf
El-origen-del-universo-by-Lucy-y-Stephen-Hawking- .pdf
 
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...
Hablar y escribir correctamente barbarismos, impropiedades y dudas en el espa...
 
Como empezar una tesis by supo jose
Como empezar una tesis by supo jose Como empezar una tesis by supo jose
Como empezar una tesis by supo jose
 
Diccionario de las preposiciones españolas
Diccionario de las preposiciones españolasDiccionario de las preposiciones españolas
Diccionario de las preposiciones españolas
 
Apa guia para citar textos 2016
Apa guia para citar textos 2016Apa guia para citar textos 2016
Apa guia para citar textos 2016
 
Trigonometria
TrigonometriaTrigonometria
Trigonometria
 
¿ Lo sabías? LXXV
¿ Lo sabías? LXXV¿ Lo sabías? LXXV
¿ Lo sabías? LXXV
 
¿Lo sabias? LXXIII
¿Lo sabias? LXXIII¿Lo sabias? LXXIII
¿Lo sabias? LXXIII
 
¿Lo sabías? LXXII
¿Lo sabías? LXXII ¿Lo sabías? LXXII
¿Lo sabías? LXXII
 
Bruce Lee & uyehara, mito _ el método de combate de bruce lee. entrenamien...
 Bruce Lee  & uyehara, mito _  el método de combate de bruce lee. entrenamien... Bruce Lee  & uyehara, mito _  el método de combate de bruce lee. entrenamien...
Bruce Lee & uyehara, mito _ el método de combate de bruce lee. entrenamien...
 
¿Lo sabias? LXV
¿Lo sabias? LXV¿Lo sabias? LXV
¿Lo sabias? LXV
 
¿Lo sabias? LXIII
¿Lo sabias? LXIII¿Lo sabias? LXIII
¿Lo sabias? LXIII
 
¿Lo sabias? LXIV
¿Lo sabias?  LXIV¿Lo sabias?  LXIV
¿Lo sabias? LXIV
 
Brasil 2014
Brasil 2014Brasil 2014
Brasil 2014
 
Frases de pobreza
Frases de pobrezaFrases de pobreza
Frases de pobreza
 
Frases de amor
Frases de amor Frases de amor
Frases de amor
 
Tablas estadisticas
Tablas estadisticasTablas estadisticas
Tablas estadisticas
 
¿Lo sabias? LXI
¿Lo sabias? LXI¿Lo sabias? LXI
¿Lo sabias? LXI
 
Diagramas de Venn y existencia
Diagramas de Venn y existenciaDiagramas de Venn y existencia
Diagramas de Venn y existencia
 
¿ Lo sabías? LVIII
¿ Lo sabías? LVIII¿ Lo sabías? LVIII
¿ Lo sabías? LVIII
 

Without You Air Supply Song

  • 1. Song : without you by air supply Estadística Introducción a la estadística Estadistica (2003 – 2004) – UNFV-
  • 2. ¿Para qué sirve la estadística?  La Ciencia se ocupa en general de fenómenos observables  La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes  Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)  La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza  “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las Ciencias de la Vida donde la variablidad no es la excepción sino la regla”
  • 3. Definición La Estadística es la Ciencia de la • Sistematización, recogida, ordenación y a tiv presentación de los datos referentes a un fenómeno rip que presenta variabilidad o incertidumbre para su sc De estudio metódico, con objeto de • ddeducir las leyes que rigen esos fenómenos, ad b ili b a Pro • ia y poder de esa forma hacer previsiones sobre los c en mismos, tomar decisiones u obtener conclusiones. er f In post-grado en administración - 2004 -
  • 4. Pasos en un estudio estadístico  Plantear hipótesis sobre una población  Los fumadores tienen “más bajas” laborales que los no fumadores  ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?  Decidir qué datos recoger (diseño de experimentos)  Qué individuos pertenecerán al estudio (muestras)  Fumadores y no fumadores en edad laboral.  Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?  Qué datos recoger de los mismos (variables)  Número de bajas  Tiempo de duración de cada baja  ¿Sexo? ¿Sector laboral? ¿Otros factores? No tenéis que  Recoger los datos (muestreo) entenderlo (aún)  ¿Estratificado? ¿Sistemáticamente?  Describir (resumir) los datos obtenidos  tiempo medio de baja en fumadores y no (estadísticos)  % de bajas por fumadores y sexo (frecuencias), gráficos,...  Realizar una inferencia sobre la población  Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.  Cuantificar la confianza en la inferencia  Nivel de confianza del 95%  Significación del contraste: p=2%
  • 5. Método científico y estadística Plantear Diseñar hipótesis experimento Obtener Recoger datos conclusiones y analizarlos
  • 6. Población y muestra  Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).  Normalmente es demasiado grande para poder abarcarlo.  Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)  Debería ser “representativo”  Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). maestría en administración - 2004 -
  • 7. Variables  Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables.  En los individuos de la población española, de uno a otro es variable:  El grupo sanguíneo  {A, B, AB, O}  Var. Cualitativa  Su nivel de felicidad “declarado”  {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal  El número de hijos  {0,1,2,3,...}  Var. Numérica discreta  La altura  {1’62 ; 1’74; ...}  Var. Numérica continua jfgt
  • 8. Tipos de variables  Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)  Nominales: Si sus valores no se pueden ordenar  Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)  Ordinales: Si sus valores se pueden ordenar  Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor  Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)  Discretas: Si toma valores enteros  Número de hijos, Número de cigarrillos, Num. de “cumpleaños”  Continuas: Si entre dos valores, son posibles infinitos valores intermedios.  Altura, Presión intraocular, Dosis de medicamento administrado, edad
  • 9. Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador.  Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.  Sexo (Cualit: Códigos arbitrarios)  1 = Hombre  2 = Mujer  Raza (Cualit: Códigos arbitrarios)  1 = Blanca  2 = Negra,...  Felicidad Ordinal: Respetar un orden al codificar.  1 = Muy feliz  2 = Bastante feliz  3 = No demasiado feliz  Se pueden asignar códigos a respuestas especiales como  0 = No sabe  99 = No contesta...  Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
  • 10. Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico.  No todo está permitido con cualquier tipo de variable.
  • 11. Los posibles valores de una variable suelen denominarse modalidades.  Las modalidades pueden agruparse en clases (intervalos)  Edades:  Menos de 20 años, de 20 a 50 años, más de 50 años  Hijos:  Menos de 3 hijos, De 3 a 5, 6 o más hijos  Las modalidades/clases deben forman un sistema exhaustivo y excluyente  Exhaustivo: No podemos olvidar ningún posible valor de la variable  Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?  Bien: ¿Cuál es su grupo sanguíneo?  Excluyente: Nadie puede presentar dos valores simultáneos de la variable  Estudio sobre el ocio  Mal: De los siguientes, qué le gusta: (deporte, cine)  Bien: Le gusta el deporte: (Sí, No)  Bien: Le gusta el cine: (Sí, No)  Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
  • 12. Presentación ordenada de datos 7 6 Género Frec. 5 Hombre 4 4 3 2 Mujer 6 1 0 Hom bre Mujer  Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra. jfgt
  • 13. Tablas de frecuencia  Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).  Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad  Frecuencias relativas (porcentajes): Idem, pero dividido por el total  Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas  Muy útiles para calcular cuantiles (ver más adelante)  ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8  ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5% Sexo del encuestado Número de hijos Porcentaje Porcentaje Porcentaje Frecuencia Porcentaje válido Frecuencia Porcentaje válido acumulado Válidos Hombre 636 41,9 41,9 Válidos 0 419 27,6 27,8 27,8 Mujer 881 58,1 58,1 1 255 16,8 16,9 44,7 Total 1517 100,0 100,0 2 375 24,7 24,9 69,5 3 215 14,2 14,2 83,8 Nivel de felicidad 4 127 8,4 8,4 92,2 Porcentaje Porcentaje 5 54 3,6 3,6 95,8 Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3 Válidos Muy feliz 467 30,8 31,1 31,1 7 23 1,5 1,5 98,9 Bastante feliz 872 57,5 58,0 89,0 Ocho o más 17 1,1 1,1 100,0 No demasiado feliz 165 10,9 11,0 100,0 Total 1509 99,5 100,0 Total 1504 99,1 100,0 Perdidos No contesta Perdidos No contesta 8 ,5 13 ,9 Total 1517 100,0 Total 1517 100,0
  • 14. Datos desordenados y ordenados en tablas Género Frec. Frec. relat.  Variable: Género porcentaje  Modalidades: Hombre 4 4/10=0,4=40%  H = Hombre  M = Mujer Mujer 6 6/10=0,6=60% 10=tamaño muestral  Muestra: MHHMMHMMMH  equivale a HHHH MMMMMM
  • 15. Ejemplo  ¿Cuántos individuos tienen Número de hijos menos de 2 hijos?  frec. indiv. sin hijos Porcent. Porcent. + Frec. (válido) acum. frec. indiv. con 1 hijo 0 419 27,8 27,8 = 419 + 255 1 255 16,9 44,7 = 674 individuos 2 375 24,9 69,5 ≥50% 3 215 14,2 83,8  ¿Qué porcentaje de individuos 4 127 8,4 92,2 tiene 6 hijos o menos? 5 54 3,6 95,8  97,3% 6 24 1,6 97,3 7 23 1,5 98,9  ¿Qué cantidad de hijos es tal Ocho+ 17 1,1 100,0 que al menos el 50% de la población tiene una cantidad Total 1509 100,0 inferior o igual?  2 hijos
  • 16. Gráficos para v. cualitativas  Diagramas de barras  Alturas proporcionales a las frecuencias (abs. o rel.)  Se pueden aplicar también a variables discretas  Diagramas de sectores (tartas, polares)  No usarlo con variables ordinales.  El área de cada sector es proporcional a su frecuencia (abs. o rel.)  Pictogramas  Fáciles de entender.  El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.
  • 17. Gráficos diferenciales para variables numéricas 419 400 375  Son diferentes en función de que las 300 255 Recuento 215 variables sean discretas o continuas. 200 127 Valen con frec. absolutas o relativas. 100 54 24 23  Diagramas barras para v. discretas 17 0 1 2 3 4 5 6 7 Ocho o más  Se deja un hueco entre barras para indicar Número de hijos los valores que no son posibles 250  Histogramas para v. continuas 200 Recuento  El área que hay bajo el histograma entre 150 dos puntos cualesquiera indica la cantidad 100 (porcentaje o frecuencia) de individuos en 50 el intervalo. 20 40 60 80 Edad del encuestado
  • 18. Diagramas integrales  Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación (en un sentido más general del que visteis en bachillerato.)
  • 19. ¿Qué hemos visto?  Definición de estadística  Población  Muestra  Variables  Cualitativas  Numéricas  Presentación ordenada de datos  Tablas de frecuencias  absolutas  relativas  acumuladas  Representaciones gráficas  Cualitativas  Numéricas  Diferenciales  Integrales
  • 20. Song : big in japan by Alphaville Inferencia estadística 1.- Principales conceptos. Muestreo. Distribución muestral de un estadístico. Principales distribuciones muestrales. Maestria en Administración –– Maestria en Administración (2003- 2004 ) )- -UNFV -- (2003- 2004 UNFV
  • 21. Principales conceptos en inferencia estadística Idea básica: Hacer inferencias sobre la población a partir de la muestra que hemos extraído de la misma. Ello nos lleva a tratar (brevemente) el tema del muestreo. Pensemos que la muestra habrá de ser representativa de la población, para que podamos efectuar inferencias que tengan sentido.
  • 22. Muestreo Definición: Proceso que nos permite la extracción de una muestra a partir de una población Hay dos tipos básicos de muestreo: 1. Muestreo probabilístico. En este tipo de muestreo, la probabilidad de aparición en una muestra de cualquier elemento de la población es conocida (o calculable). Es el único científicamente válido, y es sobre el que nos extenderemos especialmente. 2. Muestreo no probabilístico. Es aquel en el que la selección de los elementos de la muestra no se hacen al azar.
  • 23. Muestreo probabilístico Este muestreo garantiza que, a la larga, las muestras que se van obteniendo de la población sean representativas de la misma. Vamos a ver varios tipos de muestreo probabilístico. 140 M eta 2002 Normalizada 120 100 80 60 % 40 0 8 . 20 p < N l s G o 3 o 0 tr T H T 3 to A n P A T o s o r D D IR P a e a C E n N D P t r u . to t e c r b a o 4 o V M c i n u Obs 2000 M eta 2001 M eta 2000 1. Muestreo aleatorio simple M 2. Muestreo estratificado 3. Muestreo por conglomerados 4. Muestreo por etapas (o polietápico) 5. Muestreo sistemático (?)
  • 24. Muestreo probabilístico 1. Muestreo aleatorio simple Es aquel en el que, a priori, todos los elementos de la muestra tienen la misma probabilidad de aparición. Supongamos que tengamos una población de 50.000 individuos, y que tenemos un listado con sus nombres. Si queremos elegir 100 personas, lo que necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.
  • 25. Muestreo probabilístico 2. Muestreo estratificado En el muestreo estratificado, los investigadores han de dividir a los sujetos en diferentes subpoblaciones (o estratos), en función de cierta característica relevante, y después lo que hacen es un muestro aleatorio simple de cada estrato. Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno), y cada individuo del estrato habrá de tener la misma probabilidad de ser escogido como parte de la muestra. Ejemplo: Supongamos que, en Cajamarca, 70% de los niños de primaria van a escuela pública y el 30% a concertada. Si queremos 1,000 niños, lo que haremos es dividir los alumnos en 2 estratos (pública y concertada) y se eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 de la concertada.
  • 26. Muestreo probabilístico 3. Muestreo por conglomerados En el muestreo por conglomerados, en lugar de considerar cada elemento de la población, lo que consideramos son “conglomerados de elementos”. El proceso es elegir aleatoriamente uno o varios conglomerados y la muestra estará formada por TODOS los elementos de los conglomerados. Ejemplos: -En las encuestas durante las elecciones, los conglomerados pueden ser las mesas electorales, y lo que se hace es escoger algunas mesas al azar (y de ahí se toman todos los votos de las mesas seleccionadas). -En otros ejemplos, los conglomerados pueden ser los bloques de viviendas, los municipios, etc.
  • 27. Muestreo probabilístico 4. Muestreo por etapas En este caso se combina el muestreo aleatorio simple con el muestreo por conglomerados: Primero se realiza un muestreo por conglomerados (v.g., si los conglomerados son colegios en Lince, se seleccionan aleatoriamente varios de ellos). Segundo, no se eligen todos los alumnos (como ocurriría en un muestro por conglomerados), sino que se elige una muestra aleatoria. (Dicha muestra puede ser obtenida por muestreo aleatorio simple o puede ser estratificado.) Es decir, hemos tenido 2 etapas de muestreo. Y claro está, es posible tener más de 2 etapas...
  • 28. Muestreo probabilístico 5. Muestreo aleatorio sistemático Supongamos que tengamos una lista de N elementos (e.g., estudiantes de secundaria) y queramos una muestra de tamaño “n”. En este caso, lo que se hace es ordenarlos (v.g., en función de los apellidos) y después se elige aleatoriamente un elemento entre los N/n=k primeros, y luego se elige de manera sistemática el que esté k lugares después del primer elemento, y así sucesivamente. Ejemplo: Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de 100 estudiantes. Primero elegimos al azar un estudiante entre los 10000/100=100 primeros (supongamos que salga el 26), el segundo elemento será el estudiante 100+26 (126), el siguiente será el 226, luego el 326, etc.
  • 29. Muestreo no probabilístico 1. Muestreo sin norma (o de conveniencia) Se elige a una muestra por ser conveniente, fácil, económica. Pero no se hace en base a un criterio de aleatoridad. Ejemplo: las encuestas en los periódicos electrónicos; el muestreo habitual en los trabajos en psicología. 2. Muestreo intencional En este caso, si bien el muestreo no es probabilístico, los investigadores procuran que se garantice la representatividad de la muestra
  • 30. Distribución muestral de un estadístico Supongamos que tenemos una variable aleatoria, cuya distribución es f ( x) Supongamos, por simplicidad, que obtenemos una muestra aleatoria simple con tamaño n = X1, X2, ... Xn Entonces, un estadístico es cualquier función h definida sobre X1, X2, ... Xn y que no incluye parámetro desconocido alguno: Y=h(X1, X2, ... Xn) La distribución de dicho estadístico Y la vamos a denominar g(y)
  • 31. Distribución muestral de un estadístico Observad: f(x) es la distribución de la v.a. bajo estudio g(y) es la distribución del estadístico que tenemos Es vital conocer la distribución muestral del estadístico de interés para poder efectuar inferencias sobre el parámetro correspondiente. Esto es, para efectuar inferencias sobre la media poblacional µ, necesitamos conocer la distribución muestral de X
  • 32. Distribución muestral de la media Veremos primero el caso de que la distribución subyacente sea normal, con media µ y varianza σ 2 La media de la distribución muestral de medias es µ La varianza de la distribución muestral de medias esσ 2 /n La forma de la distribución muestral de la media es normal. Nota: La desviación típica de la distribución muestral suele ser denominada: error típico Nota: La desviación típica de la distribución muestral suele ser denominada: error típico de tal estadístico (v.g., “error típico de la media”, etc.) de tal estadístico (v.g., “error típico de la media”, etc.)
  • 33. Distribución muestral de la media. Ejemplo 1 400 La línea (en este y sucesivos ejemplos) es una curva normal Distribución poblacional subyacente (dist. Normal): 300 Media=100 (Varianza=225) 200 Desv.Típica=15 Distribución muestral de la Distribución muestral de la 100 media: media: Desv. típ. = 4.75 Tamaño muestral=10 Tamaño muestral=10 Media = 99.9 0 N = 3600.00 Media=100 Media=100 (Varianza=225/10=22.5) 82 84 86 88 90 92 94 96 98 10 10 .0 10 .0 10 .0 10 .0 11 .0 11 .0 11 .0 11 .0 (Varianza=225/10=22.5) .0 .0 8 6. .0 .0 .0 .0 .0 .0 .0 0 2 4 6 0 2 4 0 N10 En este y sucesivos gráficos: Número de réplicas Desv.típica= 22.5 = 4.74 Desv.típica=
  • 34. Distribución muestral de la media. Ejemplo 2 500 400 Distribución poblacional subyacente (dist. Normal): 300 Media=100 Desv.Típica=15 200 Distribución muestral de la Distribución muestral de la 100 media: media: Desv. típ. = 3.36 Media = 100.0 Tamaño muestral=20 Tamaño muestral=20 0 N = 3600.00 Media=100 Media=100 88 90 92 94 96 98 10 10 10 10 10 11 11 11 (Varianza=225/20=11.3) .0 0. 4. 2. 4. .0 .0 .0 .0 .0 2. 6. 8. 0. (Varianza=225/20=11.3) 0 0 0 0 0 0 0 0 N20 Desv.típica=3.35 Desv.típica=3.35
  • 35. Distribución muestral de la media. Ejemplo 3 700 600 Distribución poblacional 500 subyacente (dist. Normal): 400 Media=100 300 Desv.Típica=15 200 Distribución muestral de la Distribución muestral de la media: media: 100 Desv. típ. = 2.12 Media = 99.95 Tamaño muestral=50 Tamaño muestral=50 0 N = 3600.00 Media=100 Media=100 93 95 97 99 10 10 10 10 10 .2 .2 1. 3. 5. 7. .2 .2 9. (Varianza=225/50=4.5) 5 25 25 25 (Varianza=225/50=4.5) 5 5 5 25 25 N50 Desv.típica=2.12 Desv.típica=2.12
  • 36. Distribución muestral de la media Veremos ahora el caso de que la distribución subyacente sea arbitraria, si bien sabemos que la media es y la varianza sea σ 2 La media de la distribución muestral de medias es µµ La varianza de la distribución muestral de medias es σ 2 /n La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En concreto, la distribución muestral se acercará más yymás a la distribución normal concreto, la distribución muestral se acercará más más a la distribución normal (media µ yyvarianza σ2/n) a medida que se aumente el tamaño de cada muestra. (media µ varianza σ2/n) a medida que se aumente el tamaño de cada muestra.
  • 37. Distribución muestral de la media. Ejemplo 4 Distribución poblacional subyacente (dist. GAMMA): p 100 La distribución GAMMA tiene 2 parámetros: Media=100= = = 100 λ 1 p 100 λ que es un parámetro de escala (1) Varianza=100= = = 100 λ 2 12 p que es un parámetro de forma (100) 0.045 0.04 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 80 85 90 95 100 105 110 115 120
  • 38. Distribución muestral de la media. Ejemplo 4 500 Distribución poblacional subyacente (dist. GAMMA): 400 Media=100 300 Varianza=100 200 Distribución muestral de la media: 100 Desv. típ. = 3.12 Tamaño muestral=10 Media = 100.0 0 N = 3600.00 Media=100 90 92 94 96 98 10 10 10 10 10 11 (Varianza=100/10=10) .0 .0 .0 .0 .0 0. 2. 4. 6. 8. 0. 0 0 0 0 0 0 DISGAMMA Desv.típica= 10 = 3.16
  • 39. Distribución muestral de la media. Ejemplo 5 Distribución poblacional (dist. EXPONENCIAL): La distribución EXPONENCIAL tiene 1 Media=0.1=1/λ parámetro: λ (en el ejemplo: 10) Varianza=0.01=1/λ2 12 10 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5 0.6 Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2 pulsaciones de una rata en una caja de Skinner.
  • 40. Distribución muestral de la media. Ejemplo 5a 400 300 Distribución poblacional (dist. EXPONENCIAL): Media=0.1=1/λ 200 Varianza=0.01=1/λ2 100 Distribución muestral de la Desv. típ. = .03 media: Media = .100 0 N = 3600.00 Tamaño muestral=10 .0 .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .1 .1 .1 .2 .2 .2 .2 Media=.100 69 69 94 31 44 56 81 94 06 19 31 44 56 81 06 19 31 44 EXPON10 (Varianza=0.01/10=.001) Observad que la dist. muestral se aproxima a la normal Desv.típica=.03
  • 41. Distribución muestral de la media. Ejemplo 5b 500 400 Distribución poblacional (dist. 300 EXPONENCIAL): 200 Media=0.1=1/λ Varianza=0.01=1/λ2 100 Desv. típ. = .02 Media = .099 Distribución muestral de la 0 N = 3600.00 media: .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .1 .1 .1 Tamaño muestral=20 44 56 69 81 94 06 19 31 44 56 69 81 94 EXPON20 Media=.100 Observad que la distribución muestral se aproxima más a (Varianza=0.01/20=.0005) la normal (al elevar el tamaño muestral). Desv.típica=.022
  • 42. OTRAS DISTRIBUCIONES MUESTRALES (1) Distribución muestral de X− µ s/ n % Cuando la distribución de la que obtenemos las medias muestrales es gaussiana (“distr.normal”), la expresión anterior se distribuye según la distribución t de Student con tn-1 grados de libertad. (Esta distribución es básica para efectuar inferencias entre dos medias.) s12 % Asumiendo varianzas Distribución muestral de 2 s % poblacionales iguales 2 Cuando las distribuciones de la que obtenemos las varianzas muestrales son gaussianas, la expresión anterior se distribuye según la distribución F de Fisher con n1-1 grados de libertad en el numerador y n2-1 grados de libertad en el denominador. (Recordad que la distribución F es básica para la razón de varianzas: ANOVA.)
  • 43. OTRAS DISTRIBUCIONES MUESTRALES (2) Distribución muestral de ns 2 / σ 2 Cuando las distribución de la que obtenemos la varianza muestral es gaussiana, la anterior expresión se distribuye según la distribución chi-cuadrado con n-1 grados de libertad. jfgt
  • 44. Song . California dreaming by The mamas and the papas. Simulación a eventos discretos
  • 45. Independencia de las muestras Los resultados de una corrida de simulación, son muestras de alguna distribución. Esos resultados los llamamos "respuestas". Las respuestas pueden ser: promedios de valores recolectados en toda o parte de la corrida, o simplemente una única medida (ej. largo de la cola al final de la corrida). Las respuestas son muestras de distribuciones, por lo tanto pueden variar de una corrida a otra o en la misma corrida. El promedio de la distribución de respuestas la notamos µ y lo llamamos la media (valor medio) de la distribución.
  • 46. Independencia de las muestras Cuando los resultados son promedios de valores recolectados en estado estacionario, una sola respuesta “puede” ser usada como la estimación de la media de la distribución. En sistemas terminales o no estacionarios siempre deben realizarse varias corridas, de modo de obtener varias muestras como respuestas, tanto para calcular la media como para calcular la varianza,
  • 47. Dispersión de la muestra La dispersión de la variable aleatoria respecto de su media, se mide mediante la desviación estándar σ o la varianza σ2. Si la varianza es grande quiere decir que no todos los valores que toma la V.A. están cerca de la media. Para calcular la varianza de la distribución muestreada es necesario obtener varias respuestas independientes.
  • 48. Análisis de resultados En general es aconsejable realizar varias corridas independientes para tomar varias muestras como respuestas tanto para calcular la media como la varianza (y la desviación estándar). Por lo tanto.... El análisis estadístico de los experimentos de simulación requieren de varias respuestas independientes x1, ...,xn. Cada una de estas muestras se obtienen a partir de alguno de los siguientes métodos.
  • 49. Métodos muestreo resultados (1) 1.- Se realizan n corridas que generan x1, ..., xn. Cada corrida con torrentes de números aleatorios diferentes e independientes. Cada corrida es una replicación. Se pueden registrar resultados solamente en determinados períodos de interés.
  • 50. Métodos muestreo resultados (2) 2.- El método de replicación en sistemas estacionarios. Los datos se toman solamente en el período estacionario, la muestra o resultado es un promedio de los datos obtenidos durante la corrida o replicación.
  • 51. Métodos muestreo resultados (3) 3.- Método batch means, usado en simulaciones de estado estacionario, aquellos que llevan mucho tiempo en alcanzar ese estado. Se corre el período run-in una sola vez; a partir de allí se registran valores de xi en intervalos sucesivos de tiempo de igual longitud, 1 ... n. Riesgo: correlación entre resultados sucesivos.
  • 52. Métodos muestreo resultados (4) 4.- El método regenerativo se utiliza cuando nos interesan medidas en períodos o instantes específicos (particulares) del tiempo. Por ejemplo nos interesa el largo de la cola cuando se rompe una máquina (cantidad de máquinas rotas en esa ocasión). Entonces consideramos un punto regenerativo (la ruptura de la máquina), y se registra una muestra independiente inmediatamente después de cada ruptura.
  • 53. Cálculo media y varianza Media, Varianza son los parámetros que mas interesan calcular. Si xi es la i-ésima respuesta de n replicaciones o batches entonces podemos estimar la media µ, n n ∑ ∑ (x − X) 2 xi 1  n 2 1 n   i 2 X= i= 1 s2 = i= 1 =  ∑ xi −  ∑ xi   n n− 1 n − 1  i= 1 n  i= 1       s2 un estimador sin sesgo de la varianza σ2 de las respuestas.
  • 54. Intervalo de confianza Nos interesa saber con qué grado de seguridad estamos estimando el valor medio de la distribución. La estimación es el promedio muestreado de un conjunto de respuestas, entonces el intervalo de confianza nos brinda una medida de la confianza que le podemos tener a esa estimación; Los límites de un 95% de confianza son los puntos extremos de un intervalo alrededor de la media de la muestra; significa que la media de la distribución se muestreará con una probabilidad de 0.95.
  • 55. Intervalo de Confianza La varianza de la media de la muestra de tamaño n es σ 2 s2 2 estimada mediante = sx n n n ∑ (x − X) 2 i 1  n 2 1 n   2 s2 = i= 1 =  ∑ xi −  ∑ xi   n− 1 n − 1  i= 1 n  i= 1      
  • 56. Intervalo de Confianza Los límites del 95% del intervalo de confianza se pueden calcular de tablas de distribución Student para muestras pequeñas y de tablas de la distribución Normal para muestras grandes . Para la Normal los límites de un intervalo de confianza de 95% son X ± 1.96 s x
  • 57. Intervalo de Confianza P  x − λ α D < m < x + λ α D  = 1 − α = 0.95    2 2  λ α = 1.96 D = sx 2
  • 58. Otras técnicas de análisis La Técnica predictiva se usa en simulaciones no terminales que no alcanzan estado estacionario. Se toma una medida de la media xt en un intervalo de tiempo t y se grafican los valores tomados (xt vs t) para tener una idea de como varían los valores con el tiempo. Si queremos una idea mas precisa, se pueden realizar varias y diferentes corridas y tomar promedios de ellas. También se puede usar técnicas de regresión múltiple para ajustar los valores obtenidos a algún tipo de curva, aunque a veces el patrón de conducta de xt puede ser complejo, lo que dificulta el análisis de la misma.
  • 59. Verificación de hipótesis Esta técnica se usa para determinar cuando las respuestas de simulaciones comparativas son significantes estadísticamente. Si x es una respuesta de una v.a de media µx de una corrida e y ( media µy) es la respuesta de la corrida con valores cambiados de las var. de decisión, entonces la hipótesis a verificar es µx = µy. Si realizamos n corridas para un conjunto de valores de las variables de decisión y repetimos el mismo número de corridas para los valores cambiados, entonces la media muestreada de la primera experiencia es X y de la segunda es Y. La verificación se basa en la diferencia entre X e Y y cuánto se aleja la desviación estándar de la media. El cálculo de la desviación estándar dependerá de cuan independientes son los valores xi e yi de las corridas realizadas (distribución t o Normal).
  • 60. Análisis de factores (1) Esta técnica estadística se utiliza para evaluar o determinar los efectos que los cambios en las variables de decisión producen en las salidas o resultados de la simulación. Las variables de decisión se llaman factores, por lo tanto corremos la simulación con distintos valores asignados a los factores (niveles) para medir cuánto afecta a los resultados de la simulación, los distintos factores ya sea individualmente como interactuando uno con otro.
  • 61. Análisis de factores (2) La complejidad del análisis crece exponencialmente con la cantidad de factores, ya que si tenemos n factores y nos interesa el factor i medido en el nivel mi, tenemos Π mi diferentes posibles formas de hacerlo. Esto además se complica mas, si existe mas de una salida a considerar.
  • 62. Análisis de factores (2) Esta técnica es usable para simulaciones con muchos factores a ser testeados en varios niveles. Pero es una técnica muy costosa en tiempo y por lo tanto muchos test estadísticos no pueden ser terminados. De todos modos es valiosa para tener una idea o imágen de los efectos ocasionados por distintos cambios en los factores de la simulación. (Law y Kelton 82). Depende tambien de la cantidad de torrentes accesibles
  • 63. Resumen cap. 5 Simulación terminal , estacionaria. Detección estado estacionario. Parámetros interesantes como registrarlos y presentarlos. Facilidades de PascalSIM. Técnicas de Análisis de resultados
  • 64. Modelo de simulación Producir un modelo de simulación no es solamente escribir código. La estructura de la simulación y sus distribuciones se derivarán de : OBJETIVOS HIPOTESIS DE TRABAJO RESPUESTAS VARIABLES DE DECISION
  • 65. Modelo de simulación El modelo se compone de: + Objetivos, hipótesis, variables de decisión y respuestas, + diagramas de actividades + especificación + pesudocódigo + código
  • 66. Modelo de simulación OBJETIVOS deben ser claros, subjetivos o muy detallados, pero determinarán: i) las variables de decisión, ii) cuándo es necesaria una salida visual, un detallado tratamiento estadístico o ambos y iii) qué salidas son importantes.
  • 67. Modelo de simulación HIPOTESIS DE TRABAJO. Existen hipótesis implícitas al modelo y otras explícitas. Ambas deben ser documentadas. Los programas deben ser diseñados de forma de permitir cambios en etapas posteriores del proyecto. (reducen la complejidad del modelo)
  • 68. Modelo de simulación RESPUESTAS tipos de parámetros y medidas de interés, así como estadísticas y datos a recolectar para el análisis. VARIABLES DE DECISION. Los objetivos indicarán cuáles serán fijos y cuáles cambiables.
  • 69. Especificación Sala internación El sistema es una simplificación del problema real (describirlo). La especificación del problema está dada por el detalle de los objetivos, las hipótesis de trabajo, las variables de decisión, las respuestas y las duraciones de las distintas actividades (tabla 6.1) y el diagrama de actividades (fig 2.2).
  • 70. Especificación Sala internación Aclaración de hipótesis: a) El arribo de los pacientes se describe mediante Proceso Poisson de tasa constante (aproximación burda pero inicial) b) El sistema opera continuamente, cuando en realidad pacientes agendados para operación no arriban por la noche. Consideraremos el sistema en estado estacionario, por lo tanto investigaremos el efecto de cambiar valores de las variables de decisión en parámetros estables. (estudio completo cap 8). Medidas importantes: utilización de camas y tiempos de espera.
  • 71. Programa Se programa según algún método elegido. La sala de operaciones es agendada por dos tipos de eventos: fin de operación, y tiempo en que está cerrada. Se define una variable booleana que controla esas condiciones en la entidad "sala de operaciones" que siempre está en el calendario (ver record en libro pag 107). Las variables de decisión se declaran como constante globales.
  • 72. Programa El unidad de tiempo de la simulación es la hora. q4 es una cola ficticia, ventaja: cada actividad está compuesta por el par de eventos C y B, lo que facilita la modificación posterior del programa. Los histogramas se declaran y nuevos valores son ingresados cada vez que haya un cambio en algún tipo de evento C o B.
  • 73. Período Run-in Simulación del Hospital es de tipo "Estacionaria", debemos determinar cuando comenzar a tomar datos para procesar. Utilizamos el método de promedios acumulados (tabla 6.2) se agrega código en la fase B del ejecutivo para producir promedios de las respuestas cada 49 hs simuladas. La Fig 6.1 grafica los datos obtenidos.
  • 74. Período Run-in Observar que: la cola de solo internados y el tiempo de espera para operación alcanzan el estado estable rápidamente ( se admite para operación si no hay pacientes tipo solo internación). La estabilidad se alcanza alrededor de las 720 hs. En un proyecto real, se deben obtener un cierto número considerable de promedios acumulados de respuestas, usando diferentes torrentes de números para asegurarse de que realmente se ha alcanzado el estado estacionario.
  • 75. Resultados Se simularon 14 días luego de alcanzada la estabilidad. Se utilizaron números distintos que los utilizados para determinar el período run-in. Observar: - La distribución de las filas de "solo internados" y pacientes a operar, tienen una varianza grande. - Las camas han tenido un gran porcentaje de utilización ( 20 en 318 hs de 336 simuladas) - 26 pacientes fueron operados y su tiempo de espera fue muy variado. Cada corrida con un conjunto de diferentes torrentes producen una replicación. Se necesitan varias replicaciones para obtener datos mas acertados. Los datos ameritan reducción de varianza.
  • 76. Taller de reparaciones Simulación terminal. Alcanza estabilidad enseguida. Se toman datos durante toda la simulación. Se podrían considerar las máquinas como variables de decisión. La lógica del programa se presta para adecuarlo a este cambio. A tener en cuenta: cómo continuar luego de teminada la jornada de trabajo (estudienlo!).
  • 77. Taller de reparaciones (2) Buena práctica: declarar los niveles de recursos y torrentes de número como constantes globales. Fácil de alterar durante la experimentación. Resultados: el número de máquinas rotas varió entre 0 y 10. La utilización de mecánicos fue mayor que la de equipos (84.25% vs 68.7%). Durante un gran período de tiempo los mecánincos estuvieron todos ocupados.
  • 78. IMPORTANTE 4.5 4 Maestristas a nivel 3.5 nacional en 3 administración 2.5 2 1.5 1 0.5 0 1998 1999 2000 Ejecutado
  • 79. MUESTREO POBLACIÓN DE TAMAÑO N MUESTRA DE TAMAÑO n
  • 80. Censo Muestreo Conocer parámetros Estimar parámetros + Tiempo para realizarlo - Tiempo para realizarlo + Costo -Costo Personal profesional Promedio µ x Proporción P p Total T t
  • 81. MUESTREO ALEATORIO IRRESTRICTO (MAI; MSA) MUESTREO SISTEMÁTICO DISEÑOS DE IGUAL MUESTREO ESTRATIFICADO PROPORCIONAL ESTADÍSTICO NEYMAN ÓPTIMA POLIETÁPICO POR CONGLOMERADOS
  • 82. MUESTREO ESTUDIO DE QUE DISEÑO DE MUESTREO SE DEBE UTILIZAR MUESTREO CUAL ES EL TAMAÑO ÓPTIMO DE LA MUESTRA QUE CARACTERÍSTICAS DE LA POBLACIÓN DISEÑO DISEÑO DE MUESTREO PARÁMETRO A ESTIMAR (PROMEDIO, PROPORCIÓN, TOTAL TAMAÑO DE LA MUESTRA TAMAÑO DE LA POBLACIÓN N GRADO DE VARIABILIDAD σ NIVEL DE PRECISIÓN σ 2 NIVEL DE CONFIABILIDAD d t (TABLAS)
  • 83. MUESTREO SIMPLE ALEATORIO POBLACIÓN DE TAMAÑO N MUESTRA DE TAMAÑO n EN FORMA ALEATORIA
  • 84. PARA QUE SE UTILIZA: PARA ESTIMAR EL VALOR DE PARÁMETROS DE INTERÉS CUANDO LA VARIABILIDAD DE CUANDO SE UTILIZA: LOS ELEMENTOS DE LA POBLACIÓN BAJO ESTUDIO, SEA MÍNIMA SUGERENCIA CUANDO EL COEFICIENTE DE PRÁCTICA VARIACIÓN < 15 %
  • 85. ETAPAS EN UN ESTUDIO DE MUESTREO: 1. OBJETIVOS DEL ESTUDIO 2. DEFINICIÓN DE LA POBLACIÓN BAJO ESTUDIO 3. ESTABLECIMIENTO DEL MARCO DE MUESTREO 4. DEFINIR PARAMETROS A ESTIMAR 5. MUESTREO PRELIMINAR 6. DEFINIR EL DISEÑO DE MUESTREO 7. DETERMINAR CONFIABILIDAD Y PRECISIÓN 8. DETERMINAR EL TAMAÑO DE LA MUESTRA 9. DEFINIR LAS VARIABLES BAJO ESTUDIO 10.ESTRUCTURACIÓN DEL CUESTIONARIO 11.PRUEBA DEL CUESTIONARIO 12.REALIZACIÓN DEL TRABAJO DE CAMPO
  • 86. DETERMINACIÓN DEL TAMAÑO ÓPTIMO DE LA MUESTRA Ns n= 2  d N − 1  + s ENDSA Indicadores 1989 1994 1998 z  Tasa de mortalidad infantil (por   1000 nacidos vivos) Tasa global de fecundidad 99 5.6 75 4.8 67 4.2 Npq % de mujeres que usan n= 12.2 17.8 25.3 anticonceptivos modernos 2  d % de niños menores de 5 años 13.3 15.7 7.6 con desnutrición moderada N − 1  + pq  z  Cobertura de Parto Institucional 37,6 42.3 59.2   Cobertura de IRA Cobertura de EDA 28.7 24 43.4 32.4 47.2 36.2 PAI Ns n= 2 DPT 3 Sarampión 28.4 57.5 42.8 55.7 48.6 50.8  d N − 1  + s Polio 37.8 47.5 39.1 Elaboración: Unidad de Reforma de Salud - MSyPS 1998 z  * Informe Preliminar  
  • 87. UNIDAD 5: TEORIA DEL MUESTREO EL MUESTREO Por ser la técnica del muestreo de aplicación casi general en las investigaciones sociales, es evidente la importancia que tiene su estudio y la necesidad en que se halla en investigador social de conocer por lo menos sus principios y prácticas básicos, aunque se trate de una materia basada en las leyes de azar y el cálculo de probabilidades, que pertenece al campo matemático de la estadística. Una muestra es una parte representativa de un conjunto, población o universo, cuyas características debe reproducir en pequeño lo más exactamente posible. De momo más científico, se pueden definir las muestras como una parte de un conjunto o población debidamente elegida, que se somete a observación científica en representación del conjunto, con el propósito de obtener resultados válidos, también para el universo total investigado. Las muestras tienen un fundamento matemático-estadístico. Este consiste en que obtenidos de una muestra, elegida correctamente y en proporción adecuada, unos determinados resultados, se puede hacer la inferencia o generalización, fundada matemáticamente, de que dichos resultados son válidos para el universo del que se ha extraído la muestra, dentro de unos límites de error y probabilidad, que se pueden determinar estadísticamente en cada caso.
  • 88. UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO Las muestras presentan las siguientes ventajas: 1. Mediante ellas, con una muestra relativamente reducida con relación al universo, se pueden encuestar grandes poblaciones y núcleos humanos, que de otra manera sería muy difícil o prácticamente imposible investigar. 2. Las muestras suponen una gran economía en las encuestas y la posibilidad de mayor rapidez en su ejecución. 3. Una muestra puede ofrecer resultados más precisos que una encuesta total, aunque esté afectada del error que resulta de limitar el todo a una parte. La condiciones de las muestras son: 1. Que comprendan parte del universo y no la totalidad de este. 2. Que su amplitud sea estadísticamente proporcionada a la magnitud del universo. Esta condición e halla en relación con el punto práctico de determinación del tamaño de la muestra y sirve para decidir si, según las unidades que comprende respecto al universo, una muestra es o no admisible. 3. La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna anomalía, la muestra resultará por este mismo viciada.
  • 89. UNIDAD 5: TEORIA DEL MUESTREO EL MUESTREO • La selección de las unidades de observación es un paso primordial en toda investigación. De cómo se realice dicha operación dependerá la calidad de los resultados de la investigación. • Una de las primeras decisiones a tomar es la especificación y acotación de la población a analizar. Esta depende de cuál sea el problema y los objetivos principales de la investigación. • Universo o Población se refieren al conjunto total de elementos que constituyen un área de interés analítico. Comúnmente se entiende como un conjunto de unidades sobre las cuales se desea obtener información. • Las unidades pueden ser personas, familias, viviendas, organizaciones, artículos de prensa, etc. • Lo que constituye la población total está definido por problemáticas de tipo teórico. El universo puede ser la población total de la humanidad, la población de un país, de una región, etc. • En la definición y acotación de la población se deben mencionar ls características esenciales que la ubiquen en un espacio y tiempo concreto. Ej. En una investigación sobre la ocupación del tiempo luego de jubilar, una posible definición del universo de estudio sería la siguiente: Población de 65 años y màs que residen en la V región.
  • 90. UNIDAD 5: TEORIA DEL MUESTREO . EL MUESTREO Una vez definida la población, se procede al diseño de la muestra: la selección de unas unidades concretas de dicha población. Aunque el universo sea de pequeña dimensión, por razones de economía (en tiempo y dinero), rara vez se observa a cada una de las unidades que lo forman. Por el contrario, se decide la extracción de una muestra de entre los integrantes del universo. La representatividad depende del tamaño de la muestra y del procedimiento seguido para la selección de las unidades muestrales. Si a partir de los datos obtenidos en una muestra, quieren inferirse las características correspondientes de la población (parámetros poblacionales), es necesario diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece. Los diseños muestrales probabilísticos se fundamentan en la Estadística Inferencial configurada a partir de la Teoría de las Probabilidades. Cualquier diseño muestral comienza con la búsqueda de documentación que ayude a la identificación de la población de estudio. Con el término marco se hace referencia al “listado que comprende las unidades de la población”. Puede ser un Censo general de la población, un registro de individuos o cualquier otro procedimiento que lleve a la identificación de los miembros de una población.
  • 91. UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREO Los elementos principales de la muestra son la base y la unidad de la misma. La base de la muestra es la población de la que se obtiene o saca la muestra. La importancia de la base de la muestra se deriva de que esa, operativamente, es el resultado de la elección de unidades dentro de una población o conjunto previamente determinado de aquellas. Por ello, fundamento básico de la muestra, es la existencia de un registro de dicho conjunto, en el que aparezcan individualizadas todas sus unidades y permita realizar la elección mediante un sorteo riguroso. Esta concreción individualizada de las unidades del universo es el punto de partida y el fundamento necesario para realizar con rigor al elección en que consiste la muestra y por ello se dice que constituye la base de la muestra en sentido estricto. Esta puede consistir en un Censo, un registro, una lista, un fichero, un catálogo, un mapa, un plano, etc. En la base de la muestra deben figurar individualizadas todas las unidades que forman la población con expresión de su número en el universo, nombre, domicilio en su caso, etc. La base de la muestra hace posible la identificación de los elementos que se hayan seleccionado mediante la muestra y su encuesta posterior. La base de la muestra no siempre existe. Ej. Público que circula por las calles ni los asistentes a un espectáculo. Aquí se elige una muestra con un procedimiento aleatorio imperfecto como encuestar uno de cada cinco que se encuentren en la
  • 92. UNIDAD 5: TEORIA DEL MUESTREO: REQUISITOS DEL MARCO MUESTRAL El marco muestral debe cumplir los siguientes requisitos para que sea un descriptor válido de la población: 1. Debe ser lo más completo posible. La muestra escogida sólo podrá considerarse representativa de la población comprendida en el marco de muestreo elegido, es decir, a aquellos que han tenido la probabilidad de ser elegidos para participar en la muestra. Por esta razón, la comprehensividad se convierte en una exigencia básica de todo marco muestral. 2. La comprehensividad del marco muestral conlleva la exigencia de su actualización. En la medida que el marco muestral se halle actualizado las posibilidades de omisiones se restringen. Por el contrario, aumenta la probabilidad de que éste contenga a los miembros reales de la población que representa. 3. Cuando la investigación persigue la generalización de los datos muestrales (a la población que conforma el marco muestral) es preciso que cada componente de la población esté igualmente representado en el marco de muestreo. Es decir, no deben haber duplicidades. 4. El marco muestral no debe incluir unidades que no correspondan a la población que se analiza. La inclusión de estas unidades reduce la probabilidad de elección de las unidades que sí pertenecen a la población. 5. El marco muestral debe contener información suplementaria que ayude a la localización de las unidades seleccionadas: teléfono y dirección.
  • 93. UNIDAD 5: TEORIA DEL MUESTREO EJEMPLOS DE MARCOS MUESTRALES Ejemplo de comprehensividad del marco de muestreo: La Guía Telefónica es un marco de muestreo habitual en una encuesta telefónica. Pero tiene restricciones porque limita la población a las personas con un número de teléfono registrado y excluye a aquellos que no tienen teléfono. Por otro lado, generalmente el número está registrado a nombre del jefe de hogar, apareciendo la mayoría hombres. Si la finalidad de la investigación fuese conocer la opinión de los psicólogos españoles sobre su actividad profesional, un marco de muestreo idóneo sería el directorio de psicólogos colegiados. Pero la muestra sólo será representativa de los psicólogos colegiados y no de la totalidad de los psicólogos españoles. Tampoco incluye a los psicólogos que se han inscrito recientemente. Ejemplo de supresión en un marco de muetreo: Si se hiciera una encuesta a la población mayor de 40 años, habría que circunscribir la población a esta cuota de edad. Las personas de 40 años y menos deberían eliminarse del marco muestral. Esto podría hacerse a priori (antes de proceder a la extracción de la muestra) o a posteriori (una vez que la muestra ha sido seleccionada). Aquí, de la muestra obtenida, se sustraen aquellas unidades que no pertenezcan a la población de interés. 93
  • 94. UNIDAD 5: TEORIA DEL MUESTREO ELECCION DE LA MUESTRA  Operativamente la muestra es una selección de unidades dentro de un conjunto, que no es otro que la base de la muestra. Esta es, entonces, el resultado de una elección y por tanto, su bondad depende de la bondad de la elección.  La bondad de esta elección depende de dos condiciones fundamentales: una estadística y otra teórica.  De acuerdo con la primera, debe ser válida la generalización de los resultados obtenidos en la muestra a la población.  Según la teórica, la muestra elegida debe ser adecuada para el logro de la investigación y la prueba de las hipótesis teóricas que constituyan su razón de ser.  Estadísticamente, el principio básico de elección de la muestra es que ésta se haga, siempre que sea posible, de tal modo que cada elemento de la población tenga la misma probabilidad de ser elegido.  Esto se cumple si la elección tiene lugar por un procedimiento aleatorio riguroso.  Pero no siempre es posible realizarlo así, de aquí que existen diversos procedimientos de elección de la muestra que se pueden clasificar según se conozca o no la probabilidad de elección de cada unidad. 94
  • 95. UNIDAD 5: TEORIA DEL MUESTREO EJERCICIOS MUESTREO Dadas las investigaciones que se encuentran a continuación, determine razonablemente si se basan en una muestra del universo correspondiente y si, en caso afirmativo, la muestra es correcta. Para realizar el sociograma de una clase, se pide a todos los alumnos que expresen en una papeleta los nombres de sus compañeros de clase que les gustaría tener sentados a su lado y aquellos que no. Respuesta: No es muestra pues fueron encuestados todos los alumnos de la clase. Para estudiar las prácticas sexuales de los varones en una prisión se entrevistó a todos los que se presentaron voluntariamente a responder el cuestionario que se había preparado. Respuesta: Genéricamente se puede decir que hay una muestra ya que se hizo la encuesta a sólo una parte del universo. Sin embargo, se trata de una muestra viciada, basada en un sistema de elección inadecuado, por lo que no se puede considerar representativa del universo ni sus resultados extensibles a este.
  • 96. UNIDAD 5: TEORIA DEL MUESTREO EJERCICIOS MUESTREO Un antropólogo social ha convivido durante dos años con una familia típica de una localidad de Chile, se ha ganado su confianza y ha logrado que sus miembros le expusieran los aspectos de su vida de interés para su investigación. Respuesta: Este estudio, aunque se diga que se basa en una familia típica, no se puede considerar como muestra, pues un solo caso no es suficiente. Para estudiar las infracciones de circulación cometidas por no detención ante el signo PARE, un equipo permaneció de 8 de la mañana a 8 de la noche ante la señal durante tres días de la semana consecutivos. Respuesta: El universo son todas las infracciones. Como sólo se investiga una parte, se puede hablar de una muestra de todas ellas. Pero esta muestra es desviada y no representativa del universo porque sólo proporciona información de unas horas determinadas y de sólo tres días de la semana. post-grado en administración UNFV
  • 97. UNIDAD 5: TEORIA DEL MUESTREO EJERCICIOS MUESTREO Para predecir los resultados de elección municipal en una comunidad, el encuestador preguntó su candidato preferido a todos los hombres y mujeres con derecho a voto. Respuesta: No existe muestra pues se consulta a todo el universo y no parte de ellos. En otra elección a diputados en que se presentaba un candidato de derecha y otro de izquierda, se realizó el sondeo de opinión a una muestra elegida al azar con base en la lista telefónica, por medio del teléfono. Se obtuvo un resultado favorable al candidato de derecha, aunque fue elegido luego el de izquierda. Respuesta: En este sondeo, la muestra tampoco es representativa, aunque se halla escogido al azar. Presenta la distorsión que supone el hecho de que los que poseen teléfono son de un cierto nivel económico.
  • 98. UNIDAD 5: TEORIA DEL MUESTREO EJERCICIOS MUESTREO Para estudiar las actitudes políticas de una sociedad cultural que agrupa 5.000 miembros se ha decidido realizar una encuesta por cuestionario a 500 de ellos elegidos arbitrariamente, además de 200 entrevistas a otros tantos socios elegidos al azar, si bien en la realidad los entrevistadores se permitieron sustituir frecuentemente los socios elegidos por otros. Respuesta: Hay en los dos casos, en principio, muestra del universo. Sin embargo, la primera es inadmisible por cuanto no reúne la condición de basarse la elección en un procedimiento racional, si es posible al azar, y además se opone al principio de que dicha elección no debe ser arbitraria, pues hay un gran peligro de que prevalezcan criterios subjetivos en ella. En el segundo caso, la muestra correcta inicialmente ha resultado viciada en la realidad por la sustitución personal y, por tanto, subjetiva que los entrevistadores se han permitido.
  • 99. UNIDAD 5: TEORIA DEL MUESTREO: EJERCICIOS MUESTREO Supuestos los siguientes estudios que se ha pensado realizar por encuesta muestral, se pide indicar la base y la unidad de la muestra. Un estudio sobre las condiciones estructurales y funcionales de las asociaciones voluntarias privadas de España, con exclusión de las económicas, religiosas, políticas y sindicales. Respuesta: La base de la muestra es el registro oficial de asociaciones. La unidad es cada aosciación. Una investigación sobre la relación entre la estabilidad familiar y la clase social en una ciudad pequeña. Respuesta: La Base sería el Censo o padrón de vecinos de la ciudad. La unidad sería la familia. Un estudio sobre las condiciones de vivienda familiares de la zona madrileña de Vallecas. Respuesta: La base sería el plano de la zona. Las manzanas serían la unidad de la muestra Que tengas un buen día..