1. MEDIDAS DE TENDENCIA CENTRALMedidas de localizaciónMedia Aritmética Se obtiene sumando todos los valores de una población o muestra y dividiéndolo entre el número de valores sumados. ∑xi ∑xi µ= x = n N Los valores extremos influyen sobre la media, y en algunos casos puede distorsionarla tanto que llega a ser indeseable como medida de tendencia central.
2. ( W . X ) Σ x = Σ W x ( 20 . 85 ) + (30 . 90) + (50 . 75) 81.5 = = 20 + 30 + 50 Media ponderada Media que se obtiene asignando distintos pesos a los valores, Necesitamos una media de tres calificaciones de una prueba, 85, 90, 75, donde la primera prueba tiene el 20%, la segunda el 30% y la tercera 50% Triola 2004:66
3. Medidas de localizaciónLa Moda La moda de un conjunto de valores es aquel que ocurre con mayor frecuencia Si todos los valores son diferentes, no hay moda. Un conjunto de valores puede tener mas de una moda Ejemplo: ¿Cual es la moda en los siguientes datos? 12 14 09 04 12 33 23 17 33 31 12 24 09 18 16 09 25 07 15
4. Medidas de localizaciónLa Mediana La mediana de un conjunto finito de valores es aquel valor que divide al conjunto de números ordenados en dos partes iguales. Ninguna observación extrema en un conjunto de datos afecta a la mediana, en consecuencia, siempre que una observación extrema esté presente, es adecuado usar la mediana en lugar de la media para describir un conjunto de datos. n + 1 (Par) 50% Me 50% = 2 n = número de datos
5. Tendencia central(Resumen) Son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse. Media:Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral. Media de 2, 2, 3, 7 es (2+2+3+7)/4 = 3,5 Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos. Mediana: Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos. Si el número de datos es par, se elige la media de los dos datos centrales. Mediana de 1, 2 ,4 ,5, 6 ,6, 8 = 5 Mediana de 1, 2, 4, 5, 6, 6, 8, 9 = (5+6)/2 = 5,5 Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Mediana de 1, 2 , 4, 5, 6, 6, 800= 5 La media 1, 2, 4, 5,6, 6, 800 = 117,7
6. x Medidas de Dispersión La dispersión de un conjunto de observaciones se refiere a la variabilidad que presentan estas. Una medida de dispersión conlleva información respecto a la cantidad total de variabilidad presente en el conjunto de datos Tres distribuciones normales con diferentes dispersiones de los datos
7. MEDIDAS DE DISPERSIÓN Rango Diferencia entre el valor mayor y el valor menor de un conjunto de datos obtenidos en una medición. Rango = X más grande – X más pequeño El rango mide la dispersión total en un conjunto de datos. Aunque es una medida sencilla de la variación total de los datos, su debilidad característica consiste en que no toma en cuenta como se distribuyen los datos entre los valores mas grande y más pequeños. No esnecesariamente una medida de típica de dispersión porque la presencia de un valor extremo puede cambiar radicalmente su valor
8. Medidas de dispersión Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa. Amplitud o Rango:Diferencia entre observaciónes extremas. 2,1,4,3,8,4. El rango es 8-1=7 Es muy sensible a los valores extremos. Rango intercuartílico: Es la distancia entre primer y tercer cuartil. Rango intercuartílico = Q3 – Q1 Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores. No es tan sensible a valores extremos.
9.
10.
11.
12.
13. Indica como se agrupa o distribuye un conjunto de datos alrededor de la media.
14.
15.
16. Si el peso tiene CV = 30% y la altura tiene CV = 10%, los individuos presentan más dispersión en peso que en altura.
17. X - X Z = S MEDIDAS DE DISPERSIÓNLocalización Relativa Puntuaciones Z Valor Z: Medida que indica la dirección y el grado en que un valor se aleja de la media, en una escala de unidades de desviaciones estándar del número de desviaciones estándar que un valor se aleja de la media X = Puntuación o el valor a transformar X = Media de la distribución S = Desviación estándar de la distribución Z = Puntuación transformada en unidades de desviaciones estándar
18. 50 - 60 = - 1.00 X = 50 X = 60 S = 10 Z = 10 Ejemplo: Supongamos que en una distribución de frecuencias (Conjunto de datos) )obtuvimos una media de 60 y una desviación estándar de 10, deseamos comparar una puntuación de 50 con el resto de la distribución, entonces: El valor de “50” se encuentra localizado a una desviación estándar por debajo de la media de la distribución. (el valor de 30 está a tres desviaciones por debajo de la media. Las puntuaciones Z,permiten estandarizar valores para comparar puntuaciones de dos distribuciones diferentes. (la forma de medición es la misma, aunque se trata de distribuciones distintas). Sampieri 2006:436
19. 135 - 140 = - 0,51 Z = 130 - 122,5 9,8 = 0,75 Z = 10 Ejemplo: Queremos comparar los resultados obtenidos en una preprueba con los obtenidos en una posprueba. Se trata de un estímulo que incrementa la productividad. Un sujeto obtuvo en la preprueba una productividad de 130; la media del grupo fue de 122,5 y la desviación estándar de 10. En la postprueba obtuvo 135, la media fue de 140 y la desviación estándar de 9,8. ¿Mejoró la productividad del trabajador? Sin transformar las dos calificaciones a puntuaciones Z, no es posible asegurarlo, porque los valores no pertenecen a la misma distribución. Preprueba. Postprueba. En términos absolutos, 135 es una mejor puntuación que 130, pero no en términos relativos (en relación con sus respectivas distribuciones) Sampieri 2006:436
25. El coeficiente de sesgo no debe sobrepasar el valor de ± 2 (para considerarse una distribución Normal) Curtosis > 0 Curtosis = 0 Curtosis < 0
27. 1.-Es simétrica respecto a su media. En la imagen anterior, la curva hacia cualquiera de los lados de es una imagen de espejo de la del otro lado µ Características de la distribución normal 2.-La media, la mediana y la moda son iguales 3.- El área total bajo la curva sobre el eje de las X es una unidad de área. Esta característica se deduce del hecho de que la distribución normal es una distribución de probabilidad. 4.- Si se levantaran perpendiculares a una distancia de una desviación estándar desde la media hacia ambos lados, el área delimitada por esas perpendiculares, el eje de las X y la curva será del 68 % del área total, aproximadamente. A dos desviaciones estándar, estará incluido aproximadamente el 95 % del área, y a tres desviaciones estándar, aproximadamente 99,7 del área total estará englobada.
30. MEDIDAS DE POSICIÓNNO CENTRALES INFORMAN ACERCA DE LA POSICIÓN QUE OCUPA UN DATO DENTRO DE UNA SERIE ORDENADAEN FORMA CRECIENTE. CUARTILES Dividen el conjunto de datos ordenados en cuatro partes iguales. Los cuartiles son: Q1 ; Q2 ; Q3 . Se necesitan solamente tres cuartiles para dividir los datos en cuatro partes. El cuartil Q2 = Mediana DECILES Dividen el conjunto de datos ordenados en diez partes iguales. Nueve deciles dividen las observaciones en diez partes iguales. Se denotan: D1 D2 D3……………… D9 ; D5 = Mediana PERCENTILES Dividen el conjunto de datos ordenados en 100 partes iguales. El percentil 90 es un valor tal que el 90% de todos los valores son menores y el 10 son mayores que él. Se denotan: P1 , P2 P3 , P4 ……………. P99 ; P50 = Mediana; P25 Se corresponde con el primer cuartil ; P75 Se corresponde con tercer cuartil
34. EJERCICIO Abra el archivo que se encuentra en el CD “Ejercicios datos SPSS Abra el archivo “Regresión Multiple_1 Identifique los nombres de cada variable Analizar – estadísticos descriptivos – descriptivos pasar “medición del estrés” (pasos siguientes: próxima diapositiva) Analizar – estadísticos descriptivos – frecuencias pasar “medición del estrés” (pasos siguientes: próxima diapositiva) 6. Interprete los resultados