SlideShare uma empresa Scribd logo
1 de 29
DATOS ESTADÍSTICOS EN LA
INVESTIGACIÓN CIENTÍFICA
Estadística Descriptiva
Jefferson V.
Tema 2: Estadísticos 2
UNACH
Parámetros y estadísticos
 Parámetro: Es una cantidad numérica calculada sobre una
población
 La altura media de los individuos de un país
 La idea es resumir toda la información que hay en la población en
unos pocos números (parámetros).
 Estadístico: Ídem (cambiar población por muestra)
 La altura media de los que estamos en este aula.
 Somos una muestra (¿representativa?) de la población.
 Si un estadístico se usa para aproximar un parámetro también se le
suele llamar estimador.
Normalmente nos interesa conocer un parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población, calculamos un estimador
sobre una muestra y “confiamos” en que sean próximos. Más adelante
veremos como elegir muestras para que el error sea “confiablemente”
pequeño.
Tema 2: Estadísticos 3
UNACH
Tema 2: Estadísticos 4
UNACH
Un brevísimo resumen sobre estadísticos
Posición
 Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralización
 Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersión
 Indican la mayor o menor concentración de los datos
con respecto a las medidas de centralización.
Desviación típica, coeficiente de variación, rango, varianza
Forma
 Asimetría
 Apuntamiento o curtosis
Tema 2: Estadísticos 5
UNACH
Estadísticos de posición
 Se define el cuantil de orden  como un valor de la variable por debajo
del cual se encuentra una frecuencia acumulada 



 Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Tema 2: Estadísticos 6
UNACH
Estadísticos de posición
 Percentil de orden k = cuantil de orden k/100
 La mediana es el percentil 50
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
 Cuartiles: Dividen a la muestra en 4 grupos con
frecuencias similares.
 Primer cuartil = Percentil 25 = Cuantil 0,25
 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
 Tercer cuartil = Percentil 75 = cuantil 0,75
Tema 2: Estadísticos 7
UNACH
Ejemplos
frecuencia
0
5
10
15
20
25
El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué
peso se considera “demasiado bajo”?
 Percentil 5 o cuantil 0,05
Percentil 5 del peso
1 2 3 4 5
Peso al nacer (Kg) de 100 niños
Ejemplos
Tema 2: Estadísticos 8
UNACH
frecuencia
0
5
10
15
20
25
30
¿Qué peso es superado sólo por el 25% de los individuos?
 Percentil 75 o tercer cuartil
Percentil 75 del peso
50 55 60 65 70 75 80 85
Peso (Kg) de 100 deportistas
Ejemplos
Tema 2: Estadísticos 9
UNACH
frecuencia
0
5
10
15
20

El colesterol se distribuye simétricamente en la población. Supongamos
que se consideran patológicos los valores extremos. El 90% de los
individuos son normales ¿Entre qué valores se encuentran los individuos
normales?
Percentiles 5 y 95
180 200 220 240 260
Colesterol en 100 personas
Ejemplos
Tema 2: Estadísticos 10
UNACH
frecuencia
0
5
10
15
20

¿Entre qué valores se encuentran la mitad de los individuos “más
normales” de una población?
 Entre el cuartil 1º y 3º
Percentiles 25 y 75
150 160 170 180 190
Altura (cm) en 100 varones
Tema 2: Estadísticos 11
UNACH
densidad
densidad
0.00
0.01
0.02
0.03
0.04
0.00
0.02
0.04
0.06
0.08
Diagramas de Tukey
Diagrama de cajas de Tukey: Resumen en 5 nú
 Resumen con 5 números:
 Mínimo, cuartiles y máximo.
 Suelen dar una buena idea
de la distribución.
 La zona central, ‘caja’,
contiene al 50% central de
las observaciones.
 Su tamaño se llama ‘rango
intercuartílico’ (R.I.)
 Es costumbre que ‘los
bigotes’, no lleguen hasta los
extremos, sino hasta las
observaciones que se
separan de la caja en no
más de 1,5 R.I.
 Más allá de esa distancia se
consideran anómalas, y así
se marcan.
Mín. P25 P50 P75 Máx.
40 45 50 55 60 65
Velocidad (Km/h) de 200 vehículos en ciudad
Diagrama de cajas de Tukey: Resumen en 5 nú
Mín. P25 P50 P75 Má
80 90 100 110 120 130 140
Velocidad (Km/h) de 200 vehículos en autovía
Tema 2: Estadísticos 12
UNACH
22,2
90,7
11
16
20 11,00
90 16,00
N Válidos
Perdidos
Media
Mediana
Moda
Percentiles 10
1508
0
12,90
12,00
12
9,00
25
30
40
50
60
70
75
80
12,00
12,00
12,00
12,00
13,00
14,00
15,00
16,00
Ejemplo
Número de años de escolarización
Estadísticos
Número de años de escolarización
Frecuencia Porcentaje
Porcentaje
acumulado
3
4
5
6
7
8
9
10
12
13
14
15
17
18
19
20
Total
5
5
6
12
25
68
56
73
85
461
130
175
73
194
43
45
22
30
1508
,3
,3
,4
,8
1,7
4,5
3,7
4,8
5,6
30,6
8,6
11,6
4,8
12,9
2,9
3,0
1,5
2,0
100,0
,3
,7
1,1
1,9
3,5
8,0
11,7
16,6
≥20%?
52,8
61,4
73,0
77,9
≥ 90%?
93,6
96,6
98,0
100,0
Tema 2: Estadísticos 13
UNACH
Estadísticos de centralización
Añaden unos cuantos casos particulares a las medidas de posición. En este caso
son medidas que buscan posiciones (valores) con respecto a los cuales los
datos muestran tendencia a agruparse.
 Media (‘mean’) Es la media aritmética (promedio) de los valores de una
variable. Suma de los valores dividido por el tamaño muestral.

Media de 2,2,3,7 es (2+2+3+7)/4=3,5

Conveniente cuando los datos se concentran simétricamente con respecto
a ese valor. Muy sensible a valores extremos.

Centro de gravedad de los datos
 Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos
con el mismo número de individuos (percentil 50). Si el número de datos es
par, se elige la media de los dos datos centrales.
 Mediana de 1,2,4,5,6,6,8 es 5
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
 Es conveniente cuando los datos son asimétricos. No es sensible a valores
extremos.
Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
 Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un
máximo.
Tema 2: Estadísticos 14
UNACH
Altura mediana
Tema 2: Estadísticos 15
UNACH
Algunas fórmulas
Variable fr. fr. ac.
L0 – L1 x1 n1 N1
L1 – L2 x2 n2 N2
...
Lk-1 – Lk xk nk Nk
n
∑
 Datos sin agrupar: x1, x2, ..., xn
 Media x



 Datos organizados en tabla
 si está en intervalos usar como xi las marcas de
clase. Si no ignorar la columna de intervalos.
 Media
 Cuantil de orden α
 i es el menor intervalo que tiene
frecuencia acumulada superior a α ·n
 α=0,5 es mediana
x i i
n
x 
∑i
xini
n
C 

Li−1 
⋅n − Ni−1
ni
(Li
− Li−1)
Tema 2: Estadísticos 16
UNACH
Ejemplo con variable en intervalos
Peso M.
Clase
frec Fr.
acum.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
En el histograma se identifica “unidad de área” con
“individuo”.
Para calcular la media es necesario elegir un punto
representante del intervalo: La marca de clase.
La media se desplaza hacia los valores extremos.
No coincide con la mediana. Es un punto donde el
histograma “estaría en equilibrio” si tuviese masa.
Tema 2: Estadísticos 17
UNACH
0,5 58

0,75 5
60 – 70
70 - 80
Peso M. Clase Fr. Fr. ac.
40 – 50 45 5 5
50 – 60 55 10 15
65 21 36
75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
Ejemplo (continuación)
x 
∑i
xi ni

n
45⋅5 55⋅10 115⋅3
58
 69,3
Mediana C0,5  Li−1 
⋅ − Ni−1
ni
(Li
−Li−1)
 60


58
0,5⋅58−15
21
(70− 60)

 66,6
P75  C0,75  Li−1
⋅ 8−

ni
Ni−1
(Li
− Li−1)  70 
43,5−36
(80 − 70)
11
 76,8
 Moda = marca de clase de (60,70] = 65
Cada libro ofrece una fórmula diferente para la moda (difícil estar al día.)
Tema 2: Estadísticos 18
UNACH
Variabilidad o dispersión
Los estudiantes de Bioestadística reciben diferentes calificaciones en la
asignatura (variabilidad). ¿A qué puede deberse?
 Diferencias individuales en el conocimiento de la materia.
¿Podría haber otras razones (fuentes de variabilidad)?
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
 Dormir poco el día del examen, el croissant estaba envenenado...
Diferencias individuales en la habilidad para hacer un examen.
 El examen no es una medida perfecta del conocimiento.
Variabilidad por error de medida.
 En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige
la mala
Variabilidad por azar, aleatoriedad.
Tema 2: Estadísticos 19
UNACH
0.00
0.01
0.02
0.03
0.04
0.05
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos, independientemente
de su causa.
Amplitud o Rango (‘range’):
Diferencia entre observaciónes extremas.
 2,1,4,3,8,4. El rango es 8-1=7
 Es muy sensible a los valores extremos.
Rango intercuartílico (‘interquartile range’):
 Es la distancia entre primer y tercer cuartil.
Rango intercuartílico = P75 - P25
Mín. P25 P50 P75 Má
25% 25% 25% 25%
Rango intercuartílico
Rango
150 160 170 180 190
 Parecida al rango, pero eliminando las observaciones más extremas
inferiores y superiores.
 No es tan sensible a valores extremos.
Tema 2: Estadísticos 20
UNACH
1
n
 Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de
las observaciones con respecto a la media.
S2
 ∑(xi
i
−x)2
 Es sensible a valores extremos (alejados de la media).
 Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un
principiante.
 La expresión es fea, pero de gran belleza ‘natural’ (físicamente). Contiene la
información geométrica relevante en muchas situaciones donde la energía interna de
un sistema depende de la posición de sus partículas.
 Energía de rotación (vía el coeficiente de inercia): patinadores con brazos extendidos
(dispersos) o recogidos (poco dispersos)
 Energía elástica: Muelles ‘estirados’ con respecto a su posición de equilibrio (dispersos) frente
a muelles en posición cercana a su posición de equilibrio (poco dispersos)
Tema 2: Estadísticos 21
UNACH
0
0
90
0
1.
300
1.
700
2.
100
2.
500
2.
90
2
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza
S  S

Tiene las misma dimensionalidad
(unidades) que la variable. Versión
50
‘estética’ de la varianza.
40

Cierta distribución que veremos más
adelante (normal o gaussiana) 30
quedará completamente determinada
por la media y la desviación típica. 20
 A una distancia de una desv. típica de la
media hay más de la ‘más de la mitad’.
 A una distancia de dos desv. típica de la
media las tendremos casi todas.
10
Desv. típ.= 568,43
Media = 2023
0 N= 407,00
Pesorecién nacidos enpartosgemelares
Tema 2: Estadísticos 22
UNACH
0.00
0.01
0.02
0.03
0.04
0.05
0.00
0.01
0.02
0.03
0.04
0.05
Dispersión en distribuciones ‘normales’
xs
68.5 %
x 2s
95 %
150 160 170 180 190 150 160 170 180 190
 Centrado en la media y a una desv. típica de distancia hay
aproximadamente el 68% de las observaciones.
 A dos desviaciones típicas tenemos el 95% (aprox.)
Tema 2: Estadísticos 23
UNACH
0.0
0.1
0.2
0.3
0.4
0.0
0.1
0.2
0.3
0.0
0.1
0.2
0.3
0.0
0.1
0.2
0.3
Datos ‘casi normales’. Eje ‘x’ medido en desviaciones típicas…
 ¿Encuentras relación entre rango intercuartílico y desviación típica?
 ¿Y entre los ‘bigotes’ y dos desviaciones típicas? ¿Podrías
caracterizar las observaciones anómalas?
x  s
66 %
x 2s
95 %
x s
71 %
x  2s
94 %
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
x  s
68 %
x 2s
94 %
x s
70 %
x  2s
94 %
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
Tema 2: Estadísticos 24
UNACH

Coeficiente de variación
Es la razón entre la desviación típica y la media.
 Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
 También se la denomina variabilidad relativa.
CV 
S
x
 Es frecuente mostrarla en porcentajes
 Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)
 Es una cantidad adimensional. Interesante para comparar la variabilidad de
diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más
dispersión en peso que en altura.
 No debe usarse cuando la variable presenta valores negativos o donde el valor 0
sea una cantidad fijada arbitrariamente
 Por ejemplo 0ºC ≠ 0ºF
 Los ingenieros electrónicos hablan de la razón ‘señal/ruido’ (su inverso).
Tema 2: Estadísticos 25
UNACH
Asimetría o Sesgo
 Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su mitad
derecha.
 En las distribuciones simétricas
media y mediana coinciden. Si sólo
hay una moda también coincide
 La asimetría es positiva o negativa
en función de a qué lado se
encuentra la cola de la distribución.
 La media tiende a desplazarse
hacia las valores extremos (colas).
 Las discrepancias entre las
medidas de centralización son
indicación de asimetría.
0.00
0.05
0.10
0.15
0.20
0.0
0.1
0.2
0.3
0.4
0.5
0.00
0.05
0.10
0.15
0.20
Estadísticos para detectar asimetría
Hay diferentes estadísticos que sirven para detectar asimetría.
 Basado en diferencia entre estadísticos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la media.
 Los calculados con ordenador. Es pesado de hacer a mano.
En función del signo del estadístico diremos que la asimetría es
positiva o negativa.
 Distribución simétrica  asimetría nula.
x  s
78 %
x  s
66 %
x  s
78 %
8 10 12 14 16 18 20
UNACH x
-2 -1 0 1 2 3
x
0 2 4 6 8 10 12 14
Tema 2:x
Estadísticos 26
Tema 2: Estadísticos 27
UNACH
0.0
0.5
1.0
1.5
2.0
0.0
0.1
0.2
0.3
0.0
0.2
0.4
0.6
0.8
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribución con respecto a la distribución normal o gaussiana. Es
adimensional.
Platicúrtica (aplanada): curtosis < 0
Mesocúrtica (como la normal): curtosis = 0
Leptocúrtica (apuntada): curtosis > 0
En el curso serán de especial
interés las mesocúrticas y
simétricas (parecidas a la normal).
Aplanada Apuntada como la normal Apuntada
x s
57 %
x s
68 %
x s
82 %
0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2
Tema 2: Estadísticos 28
UNACH
Ejercicio: descriptiva con SPSS
Estadístico Error típ.
Media 1,90 ,045
Intervalo de
confianza para la
media al 95%
Límite
inferior
1,81
Límite
superior 1,99
Media recortada al 5%
1,75
Mediana 2,00
Varianza 3,114
Desv. típ. 1,765
Mínimo 0
Máximo 8
Rango 8
Amplitud intercuartil
3,00
Asimetría 1,034 ,063
Curtosis 1,060 ,126
Porcent
aje
Descriptivos para Número de hijos
25%
20%
15%
10%
5%
28%
n=419
17%
n=255
25%
n=375
14%
n=215
8%
n=127
4%
n=54 2%
n=24
2%
n=23
1%
n=17
0 1 2 3 4 5 6 7 Ocho o más
Número de hijos
 Está sombreado lo que sabemos interpretar hasta ahora.
Verifica que comprendes todo. ¿Qué unidades tiene cada
estadístico? ¿Variabilidad relativa?
 Calcula los estadísticos que puedas basándote sólo en el
gráfico de barras.
Tema 2: Estadísticos 29
UNACH
¿Qué hemos visto?
Parámetros
Estadísticos y estimadores
Clasificación
 Posición (cuantiles, percentiles,...)
 Diagramas de cajas
 Medidas de centralización: Media, mediana y moda
 Diferenciar sus propiedades.
 Medidas de dispersión
 con unidades: rango, rango intercuartílico, varianza, desv.
típica
 sin unidades: coeficiente de variación
¿Qué usamos para comparar dispersión de dos poblaciones?
 Asimetría
 positiva
 negativa
¿Podemos observar asimetría sin mirar la gráfica?
¿Cómo me gustan los datos?
 Medidas de apuntamiento (curtosis)
 ¿Cómo me gustan los datos?

Mais conteúdo relacionado

Semelhante a estadistica_Descriptiva.doc

Comunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdfComunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdfIdamithLeon1
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfCarlos Franco
 
Media Mediana y Moda.pdf
Media Mediana y Moda.pdfMedia Mediana y Moda.pdf
Media Mediana y Moda.pdfCarlos Franco
 
Medidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachMedidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachNoe Galea
 
3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersioninsucoppt
 
Clase 03 estadistica y probabilidad minas 2020
Clase 03 estadistica y probabilidad minas 2020Clase 03 estadistica y probabilidad minas 2020
Clase 03 estadistica y probabilidad minas 2020DANNYADHEMIRRAMOSAVI
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia centralUniv Peruana Los Andes
 
Clase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no centralClase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no centralLUZ ELENA GARCIA
 
Psico j 5ta medidas posición relativa
Psico j  5ta medidas posición relativaPsico j  5ta medidas posición relativa
Psico j 5ta medidas posición relativaUniv Peruana Los Andes
 
Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Gabriela Silva
 
tema medidad de posicion cuartiles, deciles, persentiles
tema medidad de posicion cuartiles, deciles, persentilestema medidad de posicion cuartiles, deciles, persentiles
tema medidad de posicion cuartiles, deciles, persentilesguadalupeerazo
 
DIAP-UNE.ppt
DIAP-UNE.pptDIAP-UNE.ppt
DIAP-UNE.pptcochachi
 

Semelhante a estadistica_Descriptiva.doc (20)

Comunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdfComunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdf
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
 
Media Mediana y Moda.pdf
Media Mediana y Moda.pdfMedia Mediana y Moda.pdf
Media Mediana y Moda.pdf
 
Medidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobachMedidas de tendencia central y dispersion cobach
Medidas de tendencia central y dispersion cobach
 
Mediana 100715195108-phpapp01
Mediana 100715195108-phpapp01Mediana 100715195108-phpapp01
Mediana 100715195108-phpapp01
 
3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion
 
Clase 03 estadistica y probabilidad minas 2020
Clase 03 estadistica y probabilidad minas 2020Clase 03 estadistica y probabilidad minas 2020
Clase 03 estadistica y probabilidad minas 2020
 
Psico 6ta medidas posición relativa
Psico 6ta  medidas posición relativaPsico 6ta  medidas posición relativa
Psico 6ta medidas posición relativa
 
3ra psicologia medidas de tendencia central
3ra psicologia  medidas de tendencia central3ra psicologia  medidas de tendencia central
3ra psicologia medidas de tendencia central
 
Clase 3- Ingeniería y Arquitectura 2024.pptx
Clase 3- Ingeniería y Arquitectura 2024.pptxClase 3- Ingeniería y Arquitectura 2024.pptx
Clase 3- Ingeniería y Arquitectura 2024.pptx
 
Clase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no centralClase 4 medidas de tendencia no central
Clase 4 medidas de tendencia no central
 
Psico j 5ta medidas posición relativa
Psico j  5ta medidas posición relativaPsico j  5ta medidas posición relativa
Psico j 5ta medidas posición relativa
 
20101 d403020321203010401114460
20101 d40302032120301040111446020101 d403020321203010401114460
20101 d403020321203010401114460
 
Biometria clase 1_2a
Biometria clase 1_2aBiometria clase 1_2a
Biometria clase 1_2a
 
Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)Estadística I ( medidas de tendencia)
Estadística I ( medidas de tendencia)
 
Estadistica
EstadisticaEstadistica
Estadistica
 
tema medidad de posicion cuartiles, deciles, persentiles
tema medidad de posicion cuartiles, deciles, persentilestema medidad de posicion cuartiles, deciles, persentiles
tema medidad de posicion cuartiles, deciles, persentiles
 
DIAP-UNE.ppt
DIAP-UNE.pptDIAP-UNE.ppt
DIAP-UNE.ppt
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 

Mais de Jefferson Villalba

Estadística_Investigación_1.doc
Estadística_Investigación_1.docEstadística_Investigación_1.doc
Estadística_Investigación_1.docJefferson Villalba
 
Datos estadísticos en la investigacón científica.
Datos estadísticos  en la investigacón científica.Datos estadísticos  en la investigacón científica.
Datos estadísticos en la investigacón científica.Jefferson Villalba
 
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...Jefferson Villalba
 
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docx
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docxInclusive lesson plan: Autism Spectrum and Asperger Syndrome.docx
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docxJefferson Villalba
 
Students with dissabilities principles.pptx
Students with dissabilities principles.pptxStudents with dissabilities principles.pptx
Students with dissabilities principles.pptxJefferson Villalba
 
Technologies_Formative Assessment.pptx
Technologies_Formative Assessment.pptxTechnologies_Formative Assessment.pptx
Technologies_Formative Assessment.pptxJefferson Villalba
 
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdf
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdfTECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdf
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdfJefferson Villalba
 

Mais de Jefferson Villalba (13)

Estadística_Investigación_1.doc
Estadística_Investigación_1.docEstadística_Investigación_1.doc
Estadística_Investigación_1.doc
 
Datos estadísticos en la investigacón científica.
Datos estadísticos  en la investigacón científica.Datos estadísticos  en la investigacón científica.
Datos estadísticos en la investigacón científica.
 
Chi-cuadrado.docx
Chi-cuadrado.docxChi-cuadrado.docx
Chi-cuadrado.docx
 
Analisis de varianza.doc
Analisis de varianza.docAnalisis de varianza.doc
Analisis de varianza.doc
 
Flipped Classroom.pptx
Flipped Classroom.pptxFlipped Classroom.pptx
Flipped Classroom.pptx
 
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...
ENSEÑANZA DEL SIGLO XXI ENFOCADA AL APRENDIZAJE DEL INGLES COMO LENGUA EXTRAN...
 
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docx
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docxInclusive lesson plan: Autism Spectrum and Asperger Syndrome.docx
Inclusive lesson plan: Autism Spectrum and Asperger Syndrome.docx
 
INCLUSIVE EDUCATION.doc
INCLUSIVE EDUCATION.docINCLUSIVE EDUCATION.doc
INCLUSIVE EDUCATION.doc
 
Students with dissabilities principles.pptx
Students with dissabilities principles.pptxStudents with dissabilities principles.pptx
Students with dissabilities principles.pptx
 
Case study 2. Nicola.pptx
Case study 2. Nicola.pptxCase study 2. Nicola.pptx
Case study 2. Nicola.pptx
 
Technologies_Formative Assessment.pptx
Technologies_Formative Assessment.pptxTechnologies_Formative Assessment.pptx
Technologies_Formative Assessment.pptx
 
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdf
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdfTECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdf
TECHNOLOGY FOR THE CLASSROOM, DEVICES, MOBILE LEARNING, LEARNING PLATFORMS.pdf
 
Sistema Operativo
Sistema OperativoSistema Operativo
Sistema Operativo
 

Último

BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOluismii249
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalJonathanCovena1
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxBeatrizQuijano2
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfUPTAIDELTACHIRA
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptAlberto Rubio
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxroberthirigoinvasque
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...jlorentemartos
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesMarisolMartinez707897
 

Último (20)

BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 

estadistica_Descriptiva.doc

  • 1. DATOS ESTADÍSTICOS EN LA INVESTIGACIÓN CIENTÍFICA Estadística Descriptiva Jefferson V.
  • 2. Tema 2: Estadísticos 2 UNACH Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población  La altura media de los individuos de un país  La idea es resumir toda la información que hay en la población en unos pocos números (parámetros).  Estadístico: Ídem (cambiar población por muestra)  La altura media de los que estamos en este aula.  Somos una muestra (¿representativa?) de la población.  Si un estadístico se usa para aproximar un parámetro también se le suele llamar estimador. Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea “confiablemente” pequeño.
  • 4. Tema 2: Estadísticos 4 UNACH Un brevísimo resumen sobre estadísticos Posición  Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuantiles, percentiles, cuartiles, deciles,... Centralización  Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda Dispersión  Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Desviación típica, coeficiente de variación, rango, varianza Forma  Asimetría  Apuntamiento o curtosis
  • 5. Tema 2: Estadísticos 5 UNACH Estadísticos de posición  Se define el cuantil de orden  como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada      Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
  • 6. Tema 2: Estadísticos 6 UNACH Estadísticos de posición  Percentil de orden k = cuantil de orden k/100  La mediana es el percentil 50  El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%  Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.  Primer cuartil = Percentil 25 = Cuantil 0,25  Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana  Tercer cuartil = Percentil 75 = cuantil 0,75
  • 7. Tema 2: Estadísticos 7 UNACH Ejemplos frecuencia 0 5 10 15 20 25 El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se considera “demasiado bajo”?  Percentil 5 o cuantil 0,05 Percentil 5 del peso 1 2 3 4 5 Peso al nacer (Kg) de 100 niños
  • 8. Ejemplos Tema 2: Estadísticos 8 UNACH frecuencia 0 5 10 15 20 25 30 ¿Qué peso es superado sólo por el 25% de los individuos?  Percentil 75 o tercer cuartil Percentil 75 del peso 50 55 60 65 70 75 80 85 Peso (Kg) de 100 deportistas
  • 9. Ejemplos Tema 2: Estadísticos 9 UNACH frecuencia 0 5 10 15 20  El colesterol se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales ¿Entre qué valores se encuentran los individuos normales? Percentiles 5 y 95 180 200 220 240 260 Colesterol en 100 personas
  • 10. Ejemplos Tema 2: Estadísticos 10 UNACH frecuencia 0 5 10 15 20  ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de una población?  Entre el cuartil 1º y 3º Percentiles 25 y 75 150 160 170 180 190 Altura (cm) en 100 varones
  • 11. Tema 2: Estadísticos 11 UNACH densidad densidad 0.00 0.01 0.02 0.03 0.04 0.00 0.02 0.04 0.06 0.08 Diagramas de Tukey Diagrama de cajas de Tukey: Resumen en 5 nú  Resumen con 5 números:  Mínimo, cuartiles y máximo.  Suelen dar una buena idea de la distribución.  La zona central, ‘caja’, contiene al 50% central de las observaciones.  Su tamaño se llama ‘rango intercuartílico’ (R.I.)  Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I.  Más allá de esa distancia se consideran anómalas, y así se marcan. Mín. P25 P50 P75 Máx. 40 45 50 55 60 65 Velocidad (Km/h) de 200 vehículos en ciudad Diagrama de cajas de Tukey: Resumen en 5 nú Mín. P25 P50 P75 Má 80 90 100 110 120 130 140 Velocidad (Km/h) de 200 vehículos en autovía
  • 12. Tema 2: Estadísticos 12 UNACH 22,2 90,7 11 16 20 11,00 90 16,00 N Válidos Perdidos Media Mediana Moda Percentiles 10 1508 0 12,90 12,00 12 9,00 25 30 40 50 60 70 75 80 12,00 12,00 12,00 12,00 13,00 14,00 15,00 16,00 Ejemplo Número de años de escolarización Estadísticos Número de años de escolarización Frecuencia Porcentaje Porcentaje acumulado 3 4 5 6 7 8 9 10 12 13 14 15 17 18 19 20 Total 5 5 6 12 25 68 56 73 85 461 130 175 73 194 43 45 22 30 1508 ,3 ,3 ,4 ,8 1,7 4,5 3,7 4,8 5,6 30,6 8,6 11,6 4,8 12,9 2,9 3,0 1,5 2,0 100,0 ,3 ,7 1,1 1,9 3,5 8,0 11,7 16,6 ≥20%? 52,8 61,4 73,0 77,9 ≥ 90%? 93,6 96,6 98,0 100,0
  • 13. Tema 2: Estadísticos 13 UNACH Estadísticos de centralización Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.  Media (‘mean’) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.  Media de 2,2,3,7 es (2+2+3+7)/4=3,5  Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.  Centro de gravedad de los datos  Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.  Mediana de 1,2,4,5,6,6,8 es 5  Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5  Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!  Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.
  • 14. Tema 2: Estadísticos 14 UNACH Altura mediana
  • 15. Tema 2: Estadísticos 15 UNACH Algunas fórmulas Variable fr. fr. ac. L0 – L1 x1 n1 N1 L1 – L2 x2 n2 N2 ... Lk-1 – Lk xk nk Nk n ∑  Datos sin agrupar: x1, x2, ..., xn  Media x     Datos organizados en tabla  si está en intervalos usar como xi las marcas de clase. Si no ignorar la columna de intervalos.  Media  Cuantil de orden α  i es el menor intervalo que tiene frecuencia acumulada superior a α ·n  α=0,5 es mediana x i i n x  ∑i xini n C   Li−1  ⋅n − Ni−1 ni (Li − Li−1)
  • 16. Tema 2: Estadísticos 16 UNACH Ejemplo con variable en intervalos Peso M. Clase frec Fr. acum. 40 – 50 45 5 5 50 – 60 55 10 15 60 – 70 65 21 36 70 - 80 75 11 47 80 - 90 85 5 52 90 - 100 95 3 55 100 – 130 115 3 58 En el histograma se identifica “unidad de área” con “individuo”. Para calcular la media es necesario elegir un punto representante del intervalo: La marca de clase. La media se desplaza hacia los valores extremos. No coincide con la mediana. Es un punto donde el histograma “estaría en equilibrio” si tuviese masa.
  • 17. Tema 2: Estadísticos 17 UNACH 0,5 58  0,75 5 60 – 70 70 - 80 Peso M. Clase Fr. Fr. ac. 40 – 50 45 5 5 50 – 60 55 10 15 65 21 36 75 11 47 80 - 90 85 5 52 90 - 100 95 3 55 100 – 130 115 3 58 Ejemplo (continuación) x  ∑i xi ni  n 45⋅5 55⋅10 115⋅3 58  69,3 Mediana C0,5  Li−1  ⋅ − Ni−1 ni (Li −Li−1)  60   58 0,5⋅58−15 21 (70− 60)   66,6 P75  C0,75  Li−1 ⋅ 8−  ni Ni−1 (Li − Li−1)  70  43,5−36 (80 − 70) 11  76,8  Moda = marca de clase de (60,70] = 65 Cada libro ofrece una fórmula diferente para la moda (difícil estar al día.)
  • 18. Tema 2: Estadísticos 18 UNACH Variabilidad o dispersión Los estudiantes de Bioestadística reciben diferentes calificaciones en la asignatura (variabilidad). ¿A qué puede deberse?  Diferencias individuales en el conocimiento de la materia. ¿Podría haber otras razones (fuentes de variabilidad)? Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.  Dormir poco el día del examen, el croissant estaba envenenado... Diferencias individuales en la habilidad para hacer un examen.  El examen no es una medida perfecta del conocimiento. Variabilidad por error de medida.  En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala Variabilidad por azar, aleatoriedad.
  • 19. Tema 2: Estadísticos 19 UNACH 0.00 0.01 0.02 0.03 0.04 0.05 Medidas de dispersión Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa. Amplitud o Rango (‘range’): Diferencia entre observaciónes extremas.  2,1,4,3,8,4. El rango es 8-1=7  Es muy sensible a los valores extremos. Rango intercuartílico (‘interquartile range’):  Es la distancia entre primer y tercer cuartil. Rango intercuartílico = P75 - P25 Mín. P25 P50 P75 Má 25% 25% 25% 25% Rango intercuartílico Rango 150 160 170 180 190  Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.  No es tan sensible a valores extremos.
  • 20. Tema 2: Estadísticos 20 UNACH 1 n  Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media. S2  ∑(xi i −x)2  Es sensible a valores extremos (alejados de la media).  Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un principiante.  La expresión es fea, pero de gran belleza ‘natural’ (físicamente). Contiene la información geométrica relevante en muchas situaciones donde la energía interna de un sistema depende de la posición de sus partículas.  Energía de rotación (vía el coeficiente de inercia): patinadores con brazos extendidos (dispersos) o recogidos (poco dispersos)  Energía elástica: Muelles ‘estirados’ con respecto a su posición de equilibrio (dispersos) frente a muelles en posición cercana a su posición de equilibrio (poco dispersos)
  • 21. Tema 2: Estadísticos 21 UNACH 0 0 90 0 1. 300 1. 700 2. 100 2. 500 2. 90 2 Desviación típica (‘standard deviation’) Es la raíz cuadrada de la varianza S  S  Tiene las misma dimensionalidad (unidades) que la variable. Versión 50 ‘estética’ de la varianza. 40  Cierta distribución que veremos más adelante (normal o gaussiana) 30 quedará completamente determinada por la media y la desviación típica. 20  A una distancia de una desv. típica de la media hay más de la ‘más de la mitad’.  A una distancia de dos desv. típica de la media las tendremos casi todas. 10 Desv. típ.= 568,43 Media = 2023 0 N= 407,00 Pesorecién nacidos enpartosgemelares
  • 22. Tema 2: Estadísticos 22 UNACH 0.00 0.01 0.02 0.03 0.04 0.05 0.00 0.01 0.02 0.03 0.04 0.05 Dispersión en distribuciones ‘normales’ xs 68.5 % x 2s 95 % 150 160 170 180 190 150 160 170 180 190  Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.  A dos desviaciones típicas tenemos el 95% (aprox.)
  • 23. Tema 2: Estadísticos 23 UNACH 0.0 0.1 0.2 0.3 0.4 0.0 0.1 0.2 0.3 0.0 0.1 0.2 0.3 0.0 0.1 0.2 0.3 Datos ‘casi normales’. Eje ‘x’ medido en desviaciones típicas…  ¿Encuentras relación entre rango intercuartílico y desviación típica?  ¿Y entre los ‘bigotes’ y dos desviaciones típicas? ¿Podrías caracterizar las observaciones anómalas? x  s 66 % x 2s 95 % x s 71 % x  2s 94 % -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 x  s 68 % x 2s 94 % x s 70 % x  2s 94 % -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
  • 24. Tema 2: Estadísticos 24 UNACH  Coeficiente de variación Es la razón entre la desviación típica y la media.  Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”  También se la denomina variabilidad relativa. CV  S x  Es frecuente mostrarla en porcentajes  Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)  Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.  Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura.  No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente  Por ejemplo 0ºC ≠ 0ºF  Los ingenieros electrónicos hablan de la razón ‘señal/ruido’ (su inverso).
  • 25. Tema 2: Estadísticos 25 UNACH Asimetría o Sesgo  Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.  En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide  La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.  La media tiende a desplazarse hacia las valores extremos (colas).  Las discrepancias entre las medidas de centralización son indicación de asimetría.
  • 26. 0.00 0.05 0.10 0.15 0.20 0.0 0.1 0.2 0.3 0.4 0.5 0.00 0.05 0.10 0.15 0.20 Estadísticos para detectar asimetría Hay diferentes estadísticos que sirven para detectar asimetría.  Basado en diferencia entre estadísticos de tendencia central.  Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.  Basados en desviaciones con signo al cubo con respecto a la media.  Los calculados con ordenador. Es pesado de hacer a mano. En función del signo del estadístico diremos que la asimetría es positiva o negativa.  Distribución simétrica  asimetría nula. x  s 78 % x  s 66 % x  s 78 % 8 10 12 14 16 18 20 UNACH x -2 -1 0 1 2 3 x 0 2 4 6 8 10 12 14 Tema 2:x Estadísticos 26
  • 27. Tema 2: Estadísticos 27 UNACH 0.0 0.5 1.0 1.5 2.0 0.0 0.1 0.2 0.3 0.0 0.2 0.4 0.6 0.8 Apuntamiento o curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional. Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Leptocúrtica (apuntada): curtosis > 0 En el curso serán de especial interés las mesocúrticas y simétricas (parecidas a la normal). Aplanada Apuntada como la normal Apuntada x s 57 % x s 68 % x s 82 % 0.0 0.2 0.4 0.6 0.8 1.0 -3 -2 -1 0 1 2 3 -2 -1 0 1 2
  • 28. Tema 2: Estadísticos 28 UNACH Ejercicio: descriptiva con SPSS Estadístico Error típ. Media 1,90 ,045 Intervalo de confianza para la media al 95% Límite inferior 1,81 Límite superior 1,99 Media recortada al 5% 1,75 Mediana 2,00 Varianza 3,114 Desv. típ. 1,765 Mínimo 0 Máximo 8 Rango 8 Amplitud intercuartil 3,00 Asimetría 1,034 ,063 Curtosis 1,060 ,126 Porcent aje Descriptivos para Número de hijos 25% 20% 15% 10% 5% 28% n=419 17% n=255 25% n=375 14% n=215 8% n=127 4% n=54 2% n=24 2% n=23 1% n=17 0 1 2 3 4 5 6 7 Ocho o más Número de hijos  Está sombreado lo que sabemos interpretar hasta ahora. Verifica que comprendes todo. ¿Qué unidades tiene cada estadístico? ¿Variabilidad relativa?  Calcula los estadísticos que puedas basándote sólo en el gráfico de barras.
  • 29. Tema 2: Estadísticos 29 UNACH ¿Qué hemos visto? Parámetros Estadísticos y estimadores Clasificación  Posición (cuantiles, percentiles,...)  Diagramas de cajas  Medidas de centralización: Media, mediana y moda  Diferenciar sus propiedades.  Medidas de dispersión  con unidades: rango, rango intercuartílico, varianza, desv. típica  sin unidades: coeficiente de variación ¿Qué usamos para comparar dispersión de dos poblaciones?  Asimetría  positiva  negativa ¿Podemos observar asimetría sin mirar la gráfica? ¿Cómo me gustan los datos?  Medidas de apuntamiento (curtosis)  ¿Cómo me gustan los datos?