TAMBIÉN ESTOY EN: Youtube: https://bit.ly/2TCUoiR y Facebook: https://bit.ly/2QYxWPf
Como "Bioestadística con JL Soto"
Estudios univariados y bivariados
Dermis, Hipodermis y receptores sensoriales de la piel-Histología.pptx
Estadística descriptiva por Bioq. José Luis Soto Velásquez (2)
1. Estadística
Descriptiva
Organiza, presenta y describe un
conjunto de datos con el propósito de
facilitar su uso generalmente con el
apoyo de tablas, medidas numéricas o
gráficas.
Unidad N° 2
Dr. José Luis Soto Velásquez
investigacionjls@gmail.com Agosto del 2018
4. RESUMIR
Univariable o
Unidimensional
(1 variable)
CUANTITATIVA CUALITATIVA
Tipo VARIABLES CATEGÓRICAS
Naturaleza CUALITATIVAS
Escala (0) NOMINAL (1) ORDINAL
Ningún atributo Un atributo
Características Posee categorías a las que se asigna
un nombre sin que exista ningún
orden implícito entre ellas.
Posee las categorías ordenadas,
pero no permite cuantificar la
distancia entre una categoría y
otra.
Atributos de la
escala
Orden Distancia Origen Orden Distancia Origen
Clasificación de
Escala
Nominal Ordinal
Nombre
Domicilios
Estado Civil
Nacionalidad
Sexo
Función
Lugar de Nacimiento
Marca de un microscopio
Servicio de un hospital
*Grado de Escolaridad:
1ro, 2do, 3ro, 4to, etc.
*Grado de anemia:
+Leve;++moderado;+++severo
Agudo , crónico
*Lugar que ocupa en la familia
1ro, 2do, 3ro, 4to, etc.
*Clase social:
Indigente, Pobre, media, alta
Ejemplo Género Estado civil Instrucción Intensidad
Valor Final Masculino
Femenino
Soltero
Casado
Conviviente
Primaria
Secundaria
Superior
Leve
Moderado
Grave
Observaciones
(NOMINAL)
Dicotómicas o binarias : Tienen solamente dos categorías
Ejemplo de ordinal Dicotómica:
- Nuevo – Continuador
- Vivo – Fallecido
- Sano – Enfermo
Politómicas: Tienen más de dos categorías (Color de ojos, grupo
sanguíneo, profesión, etc.)
5. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1
VARIABLE
2
VARIABLE
P
VARIABLE
Datos
CUANTITATIVOS
• Estadígrafos: Promedios, Media,
Mediana, Moda, Desviación Estándar,
Varianza, Coeficiente de Variación,
Error Estándar
• Cuartiles, Deciles, Percentiles
• Coeficientes de asimetría y Curtosis
de Fisher
• Gráficas: Histogramas, Box Plot
(Diagramas de Cajas).
• Diagrama de Dispersión
• Coeficiente de correlación de
Pearson
• Regresión lineal y no lineal
• Coeficiente de determinación
• Varianza residuales
• Análisis de los
componentes principales
• Análisis Factorial de
Correspondencia
• Correlación canónica
Datos CUALITATIVOS • Distribución de frecuencia: Tablas de
frecuencia, Tablas de contingencias.
• Gráficos de barra, diagrama de
sectores.
• Distribución de frecuencia
bidimensional
• Coeficiente de correlación
Spearman
• Coeficiente de contingencia
• Análisis Factorial de
Correspondencia
• Modelo log-lineal
Datos MIXTOS NO CORRESPONDE • Box Plot
• Diagrama de error
• Coeficiente biserial de punto
• Regresión múltiple
• Regresión Logística
6. Estadística Descriptiva univariante:
Variables Categóricas o Cualitativas
La estadística descriptiva resume un conjunto de datos
proporcionando información mediante tablas, parámetros y/o
gráficos. En cualquier análisis estadístico, la estadística
descriptiva es la primera parte y más importante, pues permite
conocer el comportamiento de las variables, consideradas
una a una, o la posible relación existente entre ellas.
7. Frecuencias absolutas. Se definen las frecuencias absolutas
(fa) de una variable cualitativa como el número de ocasiones
en las que se ha dado cada una de las categorías de la
variable que queramos resumir.
Frecuencias relativas. Por otro lado las frecuencias relativas (fr)
se definen como la proporción de veces que se ha dado
cada uno de las categorías de la variable. Por tanto las
frecuencias absolutas y relativas de una variable cumplen la
siguiente relación:
serimentaleunidadesdeNúmero
fa
fr
exp
Estadística Descriptiva univariante:
Variables Categóricas o Cualitativas
14. Variables nominal dicotómica: CASO ÚNICO: Sexo
Tabla n° 1.- Distribución según sexo (Población, lugar y tiempo)
Sexo Frecuencia (n) Porcentaje (%)
Masculino 11 55
Femenino 9 45
Total 20 100
Fuente.- Elaboración propia, 2018.
a. Tablas de Frecuencias Absolutas y Relativas
Nivel de investigación DESCRIPTIVO
16. Variables nominal Politómica: CERRADAS: Lugar de almuerzo
Tabla n° 2.- Distribución según el lugar de almuerzo (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
a. Tablas de Frecuencias Absolutas y Relativas
Análisis de Datos Aplicado a la Investigación Científica
2. Usted almuerza con mayor frecuencia en: (Variable nominal politómica-Cerradas)
(X) Casa
( ) Mercado
( ) Pensión
( ) En el trabajo
Lugar de almuerzo Frecuencia (n) Porcentajes (%)
Casa 169 77,5
Mercado 14 6,4
Pensión 22 10,1
En el trabajo 13 6,0
Total 218 100,0
20. Variables nominal Politómica: ABIERTAS: Ciudad
Tabla n° 4.- Distribución según la ciudad de residencia (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
a. Tablas de Frecuencias Absolutas y Relativas
¿Cuál es su ciudad de Origen?
……Santa Cruz de la Sierra..…….
Ciudad Frecuencia (n) Porcentajes (%)
Santa Cruz de la Sierra 133 61,0
Montero 28 12,8
Trinidad 11 5,0
Camiri 9 4,1
Otros 37 17,1
Total 218 100,0
26. Variables ordinal: CASO UNICO: Frecuencia de consumo de alimentos
Tabla n° 7.- Distribución de la frecuencia de consumo de alimentos (Población, lugar y
tiempo)
Fuente.- Elaboración propia, 2018.
a. Tablas de Frecuencias Absolutas y Relativas
Alimento
(1) (2) (3) (4) (5)
Punteo
Menos de 1
vez al mes
2 a 3 veces
al mes
1 a 2 veces
por semana
3 a 4 veces
por semana
5 o más
veces por
semana
Hamburguesa X
Pollo frito X
Choripán /panchito/
salchipapa
X
Embutidos (jamón, mortadela,
chorizo)
X
Pizza X
27. Tablas
según los niveles de investigación
05
04
03
02
01
05 Aplicativo
Tratamiento
04 Predictivo
Pronóstico
03 Explicativo
Causalidad
01 Descriptivo
Univariado
02 Relacional
Bivariado
28. Tablas del Nivel de investigación RELACIONAL
Tablas del
Nivel Relacional
Tablas Cruzadas
Tablas de Cruces de Variables
Tablas Tetracóricas
Tablas de contingencia
Masculino
Porcentaje
(%)
Femenino
Porcentaje
(%)
Desnutrición 2 1% 14 6% 16 7%
Normal (Eutrófico) 62 28% 64 29% 126 57%
Sobrepeso 53 24% 12 5% 65 29%
Obesidad 8 4% 4 2% 12 5%
Obesidad mórbida 2 1% 2 1% 4 2%
Total 127 57% 96 43% 223 100%
Porcentaje
(%)
Estado Nutricional
Sexo
Total
Tabla N° 2.- Distribución del Estado Nutricional según Sexo
Bivariado
Tablas de doble entrada
29. Tablas 2x2 del Nivel de investigación RELACIONAL
a.- Tablas de contingencia (Objetivo es COMPARAR)
Cáncer de Pulmón
Si No Total
Hábito de Fumar N % N % N %
Si 14 63,6 9 32,1 23 46,0
No 8 36,4 19 67,9 27 54,0
Total 22 100,0 28 100,0 50 100,0
Cáncer de Pulmón
Si No Total
Hábito de Fumar N % N % N %
Si 14 60,9 9 39,1 23 100,0
No 8 29,6 19 70,4 27 100,0
Total 22 44,0 28 56,0 50 100,0
Consumo de alcohol
Si No Total
Hábito de fumar N % N % N %
Si 14 28,0 9 18,0 23 46,0
No 8 16,0 19 38,0 27 54,0
Total 22 44,0 28 56,0 50 100,0
a.- Tablas de contingencia (Objetivo es ASOCIAR)
30. Tablas 2x2 del Nivel de investigación RELACIONAL
N % N % N %
Si 9 50 41 35 50 37
No 9 50 75 65 84 63
Total 18 100 116 100 134 100
Si No
Totales
Obesidad
Diabetes
Tabla N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo)
(Objetivo estadístico COMPARAR)
Fuente.- Elaboración propia, 2018.
En la tabla N° 1, se presenta que el 50% de la población diabética presenta obesidad, mientras que el 35% de los
diabéticos no presenta obesidad.
Gráfica N° 1.- Distribución de la diabetes según la obesidad de (Población, Lugar y Tiempo)
50
35
50
65
SI NO
DI ABETES
PORCENTAJES(%)
Obesidad Si Obesidad No
31. Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo)
(Objetivo estadístico COMPARAR)
Fuente.- Elaboración propia, 2018.
En la tabla N° 2, se presenta que el 18% de la población obesa presenta diabetes, mientras que el 82% de los
obesos no presenta diabetes.
Gráfica N° 2.- Distribución de Obesidad según la diabetes de (Población, Lugar y Tiempo)
N % N % N %
Si 9 18 41 82 50 100
No 9 11 75 89 84 100
Total 18 13 116 87 134 100
Obesidad
Diabetes
Totales
Si No
18
11
82
89
SI NO
OBESIDAD
PORCENTAJES(%)
Diabetes Si Diabetes No
32. Tablas 2x2 del Nivel de investigación RELACIONAL
Tabla N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo)
(Objetivo estadístico ASOCIAR)
Fuente.- Elaboración propia, 2018.
En la tabla N° 3, se presenta que el 13% de la población presenta diabetes, de los cuales el 7% de los diabéticos son
obesos, mientras que la otra proporción de diabéticos (7%) no presenta obesidad.
Gráfica N° 3.- Distribución de la diabetes asociado a la Obesidad (Población, Lugar y Tiempo)
7
31
7
56
SI NO
DI ABETES
PORCENTAJES(%)
Obesidad Si Obesidad No
N % N % N %
Si 9 7 41 31 50 37
No 9 7 75 56 84 63
Total 18 13 116 87 134 100
Obesidad
Diabetes
Totales
Si No
33. Tablas 2x3 del Nivel de investigación RELACIONAL
Área académica
CS Salud CS Sociales Ingenierías Total
Estrés laboral N % N % N % N %
Si 18 90 8 53 8 53 18 90
No 2 10 7 46 7 47 2 10
Total 20 100 15 100 15 100 20 100
a.- Tablas de contingencia (Objetivo es COMPARAR)
34. Tablas
según los niveles de investigación
05
04
03
02
01
05 Aplicativo
Tratamiento
04 Predictivo
Pronóstico
03 Explicativo
Causalidad
01 Descriptivo
Univariado
02 Relacional
Bivariado
35. Tablas del Nivel de investigación EXPLICATIVO
a.- Tablas de contingencia (Efecto de 4 tratamientos para
retardar el peso en gramos de papayas de exportación)
Tratamientos Días después de la aplicación del tratamiento
3 6 9 12 15
1 250 242 225 215 205
2 252 225 205 190 183
3 251 235 217 203 195
4 250 242 238 230 225
(5) Testigo 255 210 200 185 164
36. Tablas del Nivel de investigación EXPLICATIVO
a.- Tablas de contingencia: Elevación de la Frecuencia Cardiaca “EFC” por el uso de
Broncodilatadores en las ciudades de Bolivia según las edades.
Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina Salbutamol Fenoterol Terbutalina
De 10 a 25 25 17 13 12 19 26 23 29 17
De 25 a 40 16 11 15 15 21 18 26 22 16
De 40 a 55 14 11 9 19 17 22 15 18 13
Total 55 39 37 46 57 66 64 69 46
Edades
Ciudades de Bolivia
Santa Cruz de la Sierra (416 msnm) Cochabamba (2558 msnm) La Paz (3625 msnm)
37. Diagrama de sectores. Se utiliza para visualizar de forma
sencilla las frecuencias relativas de las variables. En los gráficos
de sectores se divide una figura, habitualmente de forma
circular, de forma que el área correspondiente a cada posible
respuesta de la variable será proporcional a la frecuencia
relativa de la variable.
Estadística Descriptiva univariante:
Representación gráfica
Variables CUALITATIVAS
38. Gráfico de barras. Se representa una barra vertical (u
horizontal si se desea) para cada una de las categorías de la
variable de altura proporcional a su frecuencia, bien absoluta
o relativa.
Estadística Descriptiva univariante:
Representación gráfica
Variables CUALITATIVAS
39.
40. Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS
HTA Frecuencia (n)
Porcentaje
(%)
Si 110 55
No 90 45
Total 200 100
Tabla N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
Con HTA
55%
Sin HTA
45%
Grafico N° 1.- Distribución de la prevalencia de Hipertensión arterial sistólica (Población, lugar y tiempo)
Según la tabla n° 1, la prevalencia de Hipertensión arterial fue del 55%, lo cual significa que aproximadamente 5
de cada 10 personas presentan la presión arterial sistólica elevada.
41. Tabla de Frecuencia y Gráfico de Barras Variables CATEGÓRICAS
Tabla N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)
Fuente.- Elaboración propia, 2018.
Grafico N° 2.- Distribución del Estado Nutricional (Población, lugar y tiempo)
Estado
Nutricional
Frecuencia
(n)
Porcentaje
(%)
Desnutrición 16 7
Normal (Eutrófico) 126 57
Sobrepeso 65 29
Obesidad 12 5
Obesidad mórbida 4 2
Total 223 100
7%
57%
29%
5%
2%
0%
10%
20%
30%
40%
50%
60%
Desnutrición Normal
(Eutrófico)
Sobrepeso Obesidad Obesidad
mórbida
Porcentaje(%)
Estado Nutricional
Según la tabla n° 2, se pudo evidenciar que el 29% de la población de estudio presenta Sobrepeso, mientras que el
7% tiene Obesidad y desnutrición.
45. RESUMIR
Univariable o
Unidimensional
(1 variable)
CUANTITATIVA CUALITATIVA
Tipo VARIABLES NUMÉRICAS
Naturaleza CUANTITATIVAS
Escala (2) INTERVALO (3) RAZÓN
Dos atributos Tres atributos
Características Tiene intervalos iguales y
medibles. No tiene un origen
real, por lo que puede asumir
valores negativos.
Tiene intervalos constantes entre
valores; además de un origen real. El
cero significa la ausencia del
individuo.
Atributos de la
escala
Orden Distancia Origen Orden Distancia Origen
Clasificación de
Escala
Intervalo Continuas Discretas
Edades:
1 a 5 años
6 a 10 años
Ingreso:
< 1000
1000 a 2000
2000 a 3000
> 3000
Temperatura
Peso Kg
Talla cm
% Grasa corp.
Hb (g/dl)
Glucosa
(mg/dl)
Calorías
pH
N° hijos
N° partos
N° Leucocitos
N° huesos
N° dientes
N° Familias
Ejemplo Temperatura Hora del día Peso Hijos
Valor Final -10 °C
0°C
20°C
00 Horas
10 Horas
20 Horas
00,00 Kg
10,24 kg
10,00 Kg
Uno
Dos
Tres
Observaciones
(RAZÓN)
Continuas: Provienen de medir y los valores poseen decimales
Se pueden representar con números enteros o fraccionados
Entre dos valores siempre existe un valor intermedio.
Discretas: Provienen de contar y los valores no tienen decimales
Solamente pueden ser representados con números enteros
46. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1
VARIABLE
2
VARIABLE
P
VARIABLE
Datos
CUANTITATIVOS
• Estadígrafos: Promedios, Media,
Mediana, Moda, Desviación
Estándar, Varianza, Coeficiente de
Variación, Error Estándar
• Cuartiles, Deciles, Percentiles
• Coeficientes de asimetría y
Curtosis de Fisher
• Gráficas: Histogramas, Box Plot.
• Diagrama de Dispersión
• Coeficiente de correlación
de Pearson
• Regresión lineal y no lineal
• Coeficiente de
determinación
• Varianza residuales
• Análisis de los
componentes principales
• Análisis Factorial de
Correspondencia
• Correlación canónica
Datos
CUALITATIVOS
• Distribución de frecuencia: Tablas
de frecuencia, Tablas de
contingencias.
• Diagrama de sectores, gráficos de
barra,
• Moda
• Distribución de frecuencia
bidimensional
• Coeficiente de correlación
Spearman
• Coeficiente de contingencia
• Análisis Factorial de
Correspondencia
• Modelo log-lineal
Datos MIXTOS NO CORRESPONDE • Box Plot
• Diagrama de error
• Coeficiente biserial de
punto
• Regresión múltiple
• Regresión Logística
47. Tabla de agrupación de intervalos (variables Numérica-DISCRETA)
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Variable Indicador Valor Final Escala
Grupo Etáreo
Número de años biológicos
cumplidos a la fecha de la
entrevista
Menor de 2 años
De 2 a 5 años
De 15 a 47 años Embarazadas
Ordinal
48. Tabla de agrupación de intervalos (variables Numérica-DISCRETA)
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Grupo etáreo
(Años)
Frecuencia
(n)
Porcentaje
(%)
Menor de 2 349 39
De 2 a 5 487 54
15 a 47 Embarazadas 61 7
Total 897 100
49. Tabla de agrupación de intervalos (variables cuantitativa-CONTINUA)
Variable Indicador Valor Final Escala
Estado nutricional
Índice de Masa Corporal
Desnutrido
Normal (Eutrófico)
Sobrepeso
Obesidad
Obesidad Mórbida
Ordinal
2
)(
)(
mTalla
KgPeso
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
50. Tabla de agrupación de intervalos (variables numérica-CONTINUA)
Estadística Descriptiva univariante:
Variables NUMÉRICAS de INTERVALOS
Estado
Nutricional
Frecuencia
(n)
Porcentaje
(%)
Desnutrido 4 4
Eutrófico (Normal) 19 19
Sobrepeso 67 67
Obesidad 9 9
Obesidad mórbida 1 1
Total 100 100
51. 7. DEFINICIÓN DEL MÉTODO ESTADÍSTICO
• Análisis de la ESTADÍSTICA DESCRIPTIVA de los datos
1
VARIABLE
2
VARIABLE
P
VARIABLE
Datos
CUANTITATIVOS
• Estadígrafos: Promedios, Media,
Mediana, Moda, Desviación
Estándar, Varianza, Coeficiente de
Variación, Error Estándar
• Cuartiles, Deciles, Percentiles
• Coeficientes de asimetría y
Curtosis de Fisher
• Gráficas: Histogramas, Box Plot.
• Diagrama de Dispersión
• Coeficiente de correlación
de Pearson
• Regresión lineal y no lineal
• Coeficiente de
determinación
• Varianza residuales
• Análisis de los
componentes principales
• Análisis Factorial de
Correspondencia
• Correlación canónica
Datos
CUALITATIVOS
• Distribución de frecuencia: Tablas
de frecuencia, Tablas de
contingencias.
• Diagrama de sectores, gráficos de
barra,
• Moda
• Distribución de frecuencia
bidimensional
• Coeficiente de correlación
Spearman
• Coeficiente de contingencia
• Análisis Factorial de
Correspondencia
• Modelo log-lineal
Datos MIXTOS NO CORRESPONDE • Box Plot
• Diagrama de error
• Coeficiente biserial de
punto
• Regresión múltiple
• Regresión Logística
54. Son indicadores estadísticos que muestran hacia que
valor se agrupan los datos y nos ayudan a saber
sobre que datos se agrupa toda la distribución.
Media
Mediana
Moda
Valor que representa a la población ó a un grupo de datos.
Es un dato que divide a la población en 2 grupos iguales.
Es el dato que más se repite.
MEDIDAS DE TENDENCIA CENTRAL
55. Media Valor que representa a la población ó a un grupo de datos.
MEDIDAS DE TENDENCIA CENTRAL
n
x
x
n
i
i
1
Media Aritmética o Promedio
x
1x
2x
nx
Datos Cuantitativos
Ventajas :
• Fácil de calcular e interpretar.
• En su cálculo intervienen todos los datos disponibles.
• Su valor es único para una serie de datos.
• Es el punto de equilibrio de la información.
Desventajas :
• No es representativa con pocos datos
• Se ve afectada por el grado de dispersión
• Es poco útil con datos muy heterogéneos
• No todos los valores contribuyen de igual forma ,los mayores tienen más peso
56. MEDIDAS DE TENDENCIA CENTRAL
Mediana Es un dato que divide a la población en 2 grupos iguales.
Mediana
)(EM kx
2
M
)1()(
E
kk xx
Datos Cuantitativos ordenados de menor a mayor
Si n es par
Si n es impar
centrodeldato)( kx
Ventajas :
• Valor único que no se ve afectado por los extremos por ser equidistante de ellos.
• Se localiza a la mitad de los datos , dejando el 50 % por arriba y el 50 % por debajo de
su valor.
• Es menos sensible a las variaciones de los datos.
• No se ve afectada por la dispersión de los datos.
Desventajas :
• No se emplea para hacer cálculos
• Utiliza muy poca información de los datos
• Cuanto más grande es la serie de datos , más complicado se vuelve su determinación.
57. Moda Es el dato que más se repite.
MEDIDAS DE TENDENCIA CENTRAL
• La moda de un conjunto de observaciones es el valor que más
se repite, aquel cuya frecuencia absoluta es máxima.
• Puede ser única, que haya más de una, o que no exista.
• Cuando hay más de una , la distribución de los datos se
denomina acorde : bimodal , trimodal, polimodal, etc.
58. Aplicativo
Predictivo
Explicativo
Relacional
Descriptivo
Tabla N° 1.- Medidas de tendencia central (Edad) (Población, lugar y tiempo)
Univariado
Estadístico Años
Media = 43,420
Mediana = 43
Moda = 42
Fuente.- Elaboración propia, 2018.
Tablas de Medidas de tendencia Central Variables Numéricas
60. Son datos estadísticos que sirven para medir la
intensidad de alejamiento entre datos.
Desviación
estándar
Amplitud de
rango
Coeficiente de
variación
Varianza
MEDIDAS DE DISPERSIÓN
Error estándar
de la media
61. Amplitud de
rango
MEDIDAS DE DISPERSIÓN
Indica el ancho, recorrido o amplitud de valores . Se define como
la diferencia entre la observación más grande y la más pequeña :
minmax vvr
Ventajas :
• Fácil de determinar e interpretar.
• Nos indica los límites de nuestra información.
• Nos permite visualizar la amplitud de dispersión de los valores de forma
sencilla.
Desventajas :
• Ignora toda la información de la muestra
• No mide el grado de dispersión , solo su ancho
• No nos da una idea detallada de la información de las observaciones.
62. MEDIDAS DE DISPERSIÓN
Es una medida significativa de la dispersión de las observaciones
alrededor de la media. Se define como el promedio de las
desviaciones respecto a su media , elevadas al cuadrado :
Ventajas :
• Fácil de calcular mediante su fórmula.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.
Desventajas :
• Es impráctica por ser un término cuadrático de poco sentido en la realidad.
• Es un número muy grande de referencia matemática , pero sin valor concreto
y de difícil manejo comparativo.
Varianza
1
)(
1
2
2
n
xx
s
n
i
i
63. MEDIDAS DE DISPERSIÓN
Se define como la raíz cuadrada del promedio las desviaciones
respecto a su media , elevadas al cuadrado , es decir la raíz
cuadrada de la varianza :
Ventajas :
• Fácil de calcular mediante su fórmula y particularmente en hojas de cálculo
como Excel que lo hacen de forma automática.
• Indica el grado y forma de dispersión de los datos con respecto a la media.
• Depende de todas las mediciones.
• Muy práctica por usar los mismos valores de las unidades que se analizan.
• Un valor grande indica que los datos se alejan mucho de la media y un valor
pequeño indica que se acercan a la media.
Desventajas :
• Si hacemos el cálculo manual , es complicado.
Desviación
estándar
1
)(
1
2
n
xx
n
i
i
64. Coeficiente de
variación
MEDIDAS DE DISPERSIÓN
Indica el porcentaje de variación que existe con respecto al
Valor promedio de la distribución:
Ventajas :
• Sirve para comparar la variabilidad en un conjunto de datos con la de otro.
• Permite la comparación de la variabilidad de variables medidas en escalas o
unidades distintas.
• Emplea toda la información disponible para su cálculo.
• Fácil de calcular
Desventajas :
• No es una medida de dispersión con respecto al centro de la distribución de
los datos.
• Arrastra las limitaciones que tiene la media como medida de tendencia
central.
100*
x
s
cv
65. MEDIDAS DE DISPERSIÓN
O Error típicos, mide el grado de dispersión de las medias de
todas las posibles muestras que pudieran extraerse de la
población. Mide el grado de dispersión de las medias muéstrales
respecto a la media poblacional (desconocida) :
Error estándar
de la media
n
s
EE
DISTRIBUCIÓN DE
LAS MEDIAS
MUESTRALES
Sigma σ: desviación
estándar de los individuos
de la población general
66. Fuente.- Elaboración propia, 2018.
Tabla N° 1.- Medidas de dispersión (Hemoglobina en g/dl) (Población, lugar y tiempo)
Estadístico g/dl
Rango = 13,7
Desviación Estándar = 1,478
La varianza = 2,186
Coef. de Variación (%) = 13,05
Error estándar = 0,0494
Tablas de Medidas de Dispersión Variables Numéricas
67. Grafico N° 1.- Histograma
Un histograma es una representación gráfica de una variable en forma de barras agrupados mediante intervalos. Los datos
provienen de una variables cuantitativas continuas. Sirve para tener una idea de la distribución de los datos o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos sea alto.
Graficas de Estadística descriptiva CUANTITATIVA Variables Numéricas
68. Grafico N° 1.- Histograma (Hemoglobina en g/dl) (Población, lugar y tiempo)
Grafico de Medidas de Dispersión Variables Numéricas
69. Fuente.- Elaboración propia, 2018.
Tabla N° 1.- Medidas de dispersión (Peso en embarazadas) (Población, lugar y tiempo)
Estadístico Kilogramos
Rango = 37
Desviación Estándar = 6,985
La varianza = 48,799
Coef. de Variación (%) = 11,80
Error estándar = 0,9596
Tablas de Medidas de Dispersión Variables Numéricas
70. Grafico de Medidas de Dispersión Variables Numéricas
Gráfico N° 1.- Histograma (Peso en embarazadas) (Población, lugar y tiempo)
72. Ejercicio: Se dispone del peso (en gramos) de dos grupos de niños, de 8 niños por grupo
de un mes de edad. Los datos se muestran a continuación:
Grupo A: 4123 4336 4160 4165 4422 3853 3281 3990
Grupo B: 4096 4166 3596 4127 4017 3769 4240 4194
Variables CUANTITATIVAS
1. Indica de qué tipo de variable se trata.
2. Calcular los siguientes estadísticos del Grupo A y B:
Media
Mediana
Moda
Rango
Varianza
Desviación típica
Coeficiente de variación
Error Estándar
73. Ejercicio: En un Centro de Salud se realiza seguimiento de la Hipertensión Arterial de algunos pacientes. Se dispone
de 3 Grupos, cada uno con 10 mediciones de la tensión arterial sistólica (TAS) realizadas en el día de hoy, las cuales
se muestran a continuación:
Grupo A: 173,03 165,54 141,59 158,66 158,81 156,49 150,29 154,53 162,50 158,49
Grupo B: 151,11 166,13 147,47 152,83 166,99 135,62 138,77 168,11 162,04 176,77
Grupo C: 159,97 152,99 161,92 167,70 143,35 154,06 160,82 180,08 172,93 158,72
Variables CUANTITATIVAS
1. Indica de qué tipo de variable se trata.
2. Calcular los siguientes estadísticos para cada uno de los grupos:
Media
Mediana
Moda
Rango
Varianza
Desviación típica
Coeficiente de variación
Error Estándar
76. Grafica de Levey-Jennings para
Control de Calidad
230
235
240
245
250
255
260
265
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Colesterolmg/dl
Control de Colesterol mg/dl
Datos
Media
1DS
2DS
3DS
1DS (-)
2DS (-)
3DS (-)
77. Grafica de Levey-Jennings para
Control de Calidad
230
235
240
245
250
255
260
265
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Colesterolmg/dl Control de Colesterol mg/dl
Datos Colesterol
mg/dl
Media
1DS
2DS
3DS
1DS (-)
2DS (-)
3DS (-)
78. 01
02
03
Tendencia Central
Media, Mediana, Moda
Dispersión
Rango, Desviación Estándar, Varianza,
Coeficiente de Variación, Error Estándar
Posición
Cuartiles, Deciles, Percentiles
MEDIDAS
UNIVARIANTES
Variables NUMÉRICAS - CONTINUAS
79. Sirven para dividir un conjunto de datos en grupos
con la misma cantidad de unidades de estudio.
Las medidas de posición más usadas son:
Cuartiles
Deciles
Percentiles
Son medidas
de posición
más usadas.
MEDIDAS DE POSICIÓN/ORDEN/LOCALIZACIÓN
80. MEDIDAS DE POSICIÓN
Percentiles: Son 99 valores que dividen en cien partes
iguales el conjunto de datos ordenados.
Cuartiles: Son tres valores que dividen al conjunto de
datos ordenados en cuatro partes iguales, son un
caso particular de percentiles.
Deciles: Son nueve valores que dividen al conjunto de
datos ordenados en diez partes iguales, son también
un caso particular de los percentiles.
25% 25% 25% 25%
Q1 Q2 Q3
81. MEDIDAS DE POSICIÓN
Si los datos utilizados siguen una distribución
normal los percentiles y la Desviaciones
Estándar (DE) son comparables.
Las medidas en el percentil 3 corresponde a -
2DE y las del percentil a 97 +2DE
P3 P50 P97
-2DE Media +2DE
82. MEDIDAS DE POSICIÓN
Grafico N° 1.- Diagrama de Caja y Bigotes
Es un gráfico que está basado en cuartiles y mediante el cual se visualiza la distribución de
un conjunto de datos. Está compuesto por un rectángulo (la caja) y dos brazos (los
bigotes); suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
83. MEDIDAS DE POSICIÓN
Tabla N° 1.- Medidas de posición: (Talla) (Población, lugar y tiempo)
Percentiles: Cuartiles: Deciles:
p5= 1,57 D3= 1,64
p25= 1,63 Q1= 1,63 D4= 1,65
p50= 1,67 Q2= 1,67 D5= 1,67
p75= 1,71 Q3= 1,71 D6= 1,69
p95= 1,79 D7= 1,71
Fuente.- Elaboración propia, 2018.
84. MEDIDAS DE POSICIÓN
Grafico N° 1.- Diagrama de Caja: (Talla) (Población, lugar y tiempo)
Máximo 1,83
P75 = Q3 = 75 1,71
Mediana P50 = Q2 = 50 1,67
P25 = Q1 = 25 1,63
Mínimo 1,51
89. Coeficiente de
asimetría
Curtosis
Evalúa la distribución de la frecuencia en
sentido horizontal.
Evalúa la distribución de la frecuencia en
sentido Vertical.
MEDIDAS DE FORMA
90. MEDIDAS DE FORMA
Asimetría: El Coeficiente de Asimetría de
Pearson.
Apuntamiento o Curtosis: Se mide con el
coeficiente de curtosis.
91. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
Dos variables Numéricas o Cuantitativas
Las dos variables cuantitativas se lleva a cabo a
partir de la obtención del coeficiente de covarianza
y del coeficiente de correlación de Pearson y
gráficos de nubes de puntos.
Una V. Categórica y otra V. Numérica (MIXTAS)
La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.
01
02
03
Estadística Descriptiva Bivariante
92. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
N % N % N %
Si 9 50 41 35 50 37
No 9 50 75 65 84 63
Total 18 100 116 100 134 100
Si No
Totales
Obesidad
Diabetes
1.- Tabla de contingencia con Porcentajes por columnas (Objetivo estadístico comparar)
93. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
50
35
50
65
SI NO
DIABETES
PORCENTAJES(%)
Obesidad Si Obesidad No
94. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
N % N % N %
Si 9 18 41 82 50 100
No 9 11 75 89 84 100
Total 18 13 116 87 134 100
Obesidad
Diabetes
Totales
Si No
2.- Tabla de contingencia con Porcentajes por Filas (Objetivo estadístico comparar)
95. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
18
11
82
89
SI NO
OBESIDAD
PORCENTAJES(%)
Diabetes Si Diabetes No
96. N % N % N %
Si 9 7 41 31 50 37
No 9 7 75 56 84 63
Total 18 13 116 87 134 100
Obesidad
Diabetes
Totales
Si No
Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
3.- Tabla de contingencia con Porcentajes Total (Objetivo estadístico asociar)
97. Dos variables Categóricas o Cualitativas
Se describe la relación entre dos variables
categóricas a partir de la construcción de una tabla
de contingencia y gráficos de sectores o de barras.
01
Estadística Descriptiva Bivariante
7
31
7
56
SI NO
DIABETES
PORCENTAJES(%)
Obesidad Si Obesidad No
98. Dos variables Numéricas o Cuantitativas
Las dos variables cuantitativas se lleva a cabo a
partir de la obtención del coeficiente de covarianza
y del coeficiente de correlación de Pearson y
gráficos de nubes de puntos.
02
Estadística Descriptiva Bivariante
Un párrafo de nuestra introducción
99. Una V. Categórica y otra V. Numérica (MIXTAS)
La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.
03
Estadística Descriptiva Bivariante
Tabla 1.- Medidas de Tendencia Central y de Dispersión (Peso en Kg) en pacientes Con
y Sin HTA
Estadísticos Con HTA Sin HTA
Media = 67,49 64,90
Mediana = 66,55 64,50
Moda = 55,00 72,00
Rango = 55,30 58,40
Desv. Estandar = 12,58 13,13
Varianza = 158,23 172,32
Coef. Variación = 18,64 20,23
Error Estándar = 1,39 1,82
Peso en Kilogramos
100. Una V. Categórica y otra V. Numérica (MIXTAS)
La descripción se reduce a la variable cuantitativa,
tal y como se ha descrito en la sección de análisis
univariante, para cada una de las categorías de la
variable cualitativa.
03
Estadística Descriptiva Bivariante
Grafica 1.- Diagrama de Cajas y bigotes de (Peso en Kg) en pacientes Con y Sin HTA
101. Outliers
COMO DETECTAR EN EL SPSS:
OUTLIERS o
VALORES ATÍPICOS
Es una observación que es numéricamente distante del
resto de los datos, pueden ser indicativos de datos que
pertenecen a una población diferente del resto de las
muestras establecidas.
102. ¿Qué es un Outlier o Valores atípicos?
Puntuación en una variable continua que es diferente a
las demás.
Puntuación
extrema
103. ¿Porqué identificar un Outlier o Valores atípicos?
¿Estará relacionado el consumo de helado con el consumo de cerveza?
104. ¿Porqué identificar un Outlier o Valores atípicos?
Rpta.- Existe correlación entre el consumo de helado y el consumo de cerveza.
108. ¿Cómo detectamos un Outliers?
A través de las “Puntuaciones típicas” (Z):
Miden la DISTANCIA de cada puntuación con respecto a
la media de la variable en desviaciones típicas o
estándar.
Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
109. ¿Cómo detectamos un Outliers en SPSS?
Analizar/Estadísticos descriptivos/Descriptivos
110. ¿Cómo detectamos un Outliers en SPSS?
Z
Muestras Pequeñas (<80) 2,5
Muestras Grandes (>80) 3
112. ¿Qué hacemos con los Outlier o Valores atípicos?
1. Identificarlos
2. Razones -> Error de codificación?
3. Resultados de los análisis estadísticos CON y SIN outliers