Sesión de aprendizaje Planifica Textos argumentativo.docx
procesar informacion de ventas de gasolina durante un mesTrabajo gasolinera.
1. UNIVERSIDAD TÉCNICA DE MACHALA
FACULTAD DE CIENCIAS EMPRESARIALES
ESCUELA DE CONTABILIDAD Y AUDITORIA
PROYECTO FINAL
CALCULOS ESTADISTICOS
INTEGRANTES:
AUS PEREIRA DIANA MICHELLE
AZANZA AGUILAR CORAIMA NICOLE
JARAMILLO MOLINA CRISTHY MABEL
TORO PROAÑO DANIELA DEL ROSARIO
ASIGNATURA:
ESTADISTICA
PROFESORA:
ING. RAFAEL SALCEDO
CURSO:
PRIMERO “B”
MACHALA EL ORO ECUADOR
2012
2. Estadística
¿Qué es Estadística?
La Estadística es una ciencia formal que
estudia la recolección, análisis e
interpretación de datos de una muestra
representativa, ya sea para ayudar en la
toma de decisiones o para explicar
condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia
en forma aleatoria o condicional. Sin embargo, la estadística es más
que eso, es decir, es el vehículo que permite llevar a cabo el proceso
relacionado con la investigación científica.
Distribución normal
Es transversal a una amplia variedad de disciplinas, desde la física
hasta las ciencias sociales, desde las ciencias de la salud hasta el
control de calidad. Se usa para la toma de decisiones en áreas de
negocios o instituciones gubernamentales.
La estadística se divide en dos grandes áreas:
La estadística descriptiva, se dedica a la descripción, visualización y
resumen de datos originados a partir de los fenómenos de estudio.
Los datos pueden ser resumidos numérica o gráficamente. Ejemplos
básicos de parámetros estadísticos son: la media y la desviación
estándar. Algunos ejemplos gráficos son: histograma, pirámide
poblacional, gráfico circular, entre otros.
La estadística inferencial, se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión
3. teniendo en cuenta la aleatoriedad de las observaciones. Se usa
para modelar patrones en los datos y extraer inferencias acerca de
la población bajo estudio. Estas inferencias pueden tomar la forma
de respuestas a preguntas si/no (prueba de hipótesis), estimaciones
de unas características numéricas (estimación), pronósticos de
futuras observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión).
Otras técnicas de modelamiento incluyen anova, series de tiempo y
minería de datos.
GRAFICOS ESTADISTICOS
IMPORTANCIA, UTILIDAD Y CARACTERÍSTICAS DESEABLES
DE LOS GRÁFICOS
Importancia:
Permite a las personas no especializadas, interpretar mejor
determinada información, haciéndola más entendible e interesante.
Aun cuando presentan una cantidad limitada de datos y
cifras aproximadas, permite reforzar los argumentos o
conclusiones que una investigación presente. Proporciona una idea
generalizada de los resultados.
Utilidad general de un gráfico:
El gráfico hace más atractiva la información; presentando en forma
generalizada los números y proporciones que se obtienen como
resultado de un estudio. El uso del gráfico varía según la cantidad
de datos que muestre. A menor cantidad de datos, mayor será la
utilidad del gráfico empleado, mejora la presentación de un grupo
en un informe.
Características generales deseables en un gráfico:
4. La proporción debe ser adecuada: no debe ser ni muy ancho, ni muy
alto. Para un gráfico de diez centímetros de ancho, la altura
aproximada debe ser de cinco centímetros.
Debe ser diseñado para una reproducción fácil y económica; estar
centrado en la página o en el espacio que ocupe, para llamar la
atención del observador.
Debe explicarse a sí mismo, por lo que necesita la tabla de datos, el
título, la escala, la leyenda y los símbolos, el gráfico debe ser
conciso en la información que proporciona.
Debe incluir pocas series de datos, para hacerlo fácil de
interpretar, es decir debe ser simple.
Debe ser cómodo de leer, es decir poder leerse sin necesidad de
mover o girar la hoja, y adecuado al tipo de información que
presenta, debe tener comunicabilidad, en otras palabras, ser
sencillo de utilizar e identificar.
Debe usar un vocabulario común a todas las personas y evitar las
palabras inusuales o demasiado especializadas.
Los colores son vivos, y deben tomar en cuenta las personas
daltónicas.
Las tramas, sombras y tonos no deben ser muy elaborados
El tipo de letra usada es clara, precisa y modesta.
Los textos son cortos; están escritos tanto en mayúscula como en
minúscula
5. Características específicas deseables según el tipo de gráfico:
Gráfico de Barras:
Es el más simple y utilizado, ya que las comparaciones se basan en el
tamaño de las barras
Se ordenan de mayor a menor para facilitar su lectura
El espacio entre las barras le da mayor claridad.
Gráfico Circular y de Barra de 100%:
Presentan proporciones en porcentajes
Permiten presentar la importancia relativa de un dato.
El gráfico circular no posee ejes
6. Gráficos Lineales Aritméticos y Logarítmicos:
se usan especialmente para presentar series de tiempo y
crecimiento
siempre tienen dos escalas, una horizontal y otra vertical, que al
formar parejas representan puntos específicos de un gráfico.
Permiten presentar mayor cantidad de datos dentro del mismo
gráfico
Pictogramas:
es un gráfico construido con figuras o dibujos
no usa escalas.
todos los dibujos son iguales y se presentan horizontalmente
todos los dibujos tiene el mismo tamaño para expresar mejor su
valor numérico
las magnitudes se representan con la cantidad de dibujos
empleados.
7. cada símbolo representa un valor específico
Mapas Estadísticos:
muestran la información sobre un mapa.
muestran datos de áreas geográficas en un país.
Al igual que el anterior las magnitudes se representan en la
cantidad de marcas usadas.
Variable estadística
Una variable es una característica que al ser medida en diferentes
individuos es susceptible de adoptar diferentes valores.
Existen diferentes tipos de variables:
Según la medición:
Variables cualitativas: Son las variables que expresan distintas
cualidades, características o modalidad. Cada modalidad que se
presenta se denomina atributo o categoría y la medición consiste en
una clasificación de dichos atributos. Las variables cualitativas
pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos
distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La
variable puede tomar distintos valores ordenados siguiendo una
escala establecida, aunque no es necesario que el intervalo entre
mediciones sea uniforme, por ejemplo: leve, moderado, grave.
Variable cualitativa nominal: En esta variable los valores no pueden
ser sometidos a un criterio de orden como por ejemplo los colores.
8. Variables cuantitativas: Son las variables que se expresan
mediante cantidades numéricas. Las variables cuantitativas además
pueden ser:
Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre
los distintos valores específicos que la variable pueda asumir.
Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor
dentro de un intervalo especificado de valores. Por ejemplo la masa
(2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el
salario. Solamente se está limitado por la precisión del aparato
medidor, en teoría permiten que siempre exista un valor entre dos
variables.
Según la influencia:
Según la influencia que asignemos a unas variables sobre otras,
podrán ser:
Variables independientes: Son las que el investigador escoge para
establecer agrupaciones en el estudio, clasificando intrínsecamente
a los casos del mismo. Un tipo especial son las variables de control,
que modifican al resto de las variables independientes y que de no
tenerse en cuenta adecuadamente pueden alterar los resultados
por medio de un sesgo.
Es aquella característica o propiedad que se supone ser la causa del
fenómeno estudiado. En investigación experimental se llama así a la
variable que el investigador manipula.
9. Variables dependientes: Son las variables de respuesta que se
observan en el estudio y que podrían estar influenciadas por los
valores de las variables independientes.
Hayman (1974: 69) la define como propiedad o característica que
se trata de cambiar mediante la manipulación de la variable
independiente.
La variable dependiente es el factor que es observado y medido
para determinar el efecto de la variable independiente.
Otras
Variables intervinientes: Son aquellas características o
propiedades que, de una manera u otra, afectan el resultado que se
espera y están vinculadas con las variables independientes y
dependientes.
Variables moderadoras: Según Tuckman: representan un tipo
especial de variable independiente, que es secundaria, y se
selecciona con la finalidad de determinar si afecta la relación entre
la variable independiente primaria y las variables dependientes. Son
las variables que expresan distintas cualidades, características o
modalidad. Cada modalidad que se presenta se denomina atributo o
categoría y la medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser dicotómicas cuando
sólo pueden tomar dos valores posibles como sí y no, hombre y
mujer o son politómicas cuando pueden adquirir tres o más valores.
Distribución de frecuencias
En estadística, se le llama distribución de frecuencias a la
agrupación de datos en categorías mutuamente excluyentes que
10. indican el número de observaciones en cada categoría.1
Esto
proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas
de modo que se pueda ver el número existente en cada clase. Estas
agrupaciones de datos suelen estar agrupadas en forma de tablas.
Características
Una distribución de frecuencias es un formato tabular en la que se
organizan los datos en clases, es decir, en grupos de valores que
describen una característica de los [datos] y muestra el número de
observaciones del conjunto de datos que caen en cada una de las
clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato
numérico. En principio, en la tabla de frecuencias se detalla cada
uno de los valores diferentes en el conjunto de datos junto con el
número de veces que aparece, es decir, su Frecuencia. Se puede
complementar la frecuencia absoluta con la denominada frecuencia
relativa, que indica la frecuencia en porcentaje sobre el total de
datos. En variables cuantitativas se distinguen por otra parte la
frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representarse gráficamente en un
histograma (Diagrama De Barras). Normalmente en el eje vertical
se coloca las frecuencias y en el horizontal los intervalos de
valores.
La distribución de frecuencias o tabla de frecuencias es una
ordenación en forma de tabla de los datos estadísticos, asignando a
cada dato su frecuencia correspondiente.
11. Tipos de frecuencias
Frecuencia absoluta: La frecuencia absoluta es el número de veces
que aparece un determinado valor en un estudio estadístico. Se
representa por ni. La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por N. Para indicar
resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria.
Frecuencia relativa: La frecuencia relativa es el cociente entre la
frecuencia absoluta de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento y se representa por
fi. La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada: La frecuencia acumulada es la suma de las
frecuencias absolutas de todos los valores inferiores o iguales al
valor considerado. Se representa por Fa.
Frecuencia relativa acumulada: La frecuencia relativa acumulada
es el cociente entre la frecuencia acumulada de un determinado
valor y el número total de datos. Se puede expresar en tantos por
ciento. Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las
siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30,
30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de
menor a mayor, en la segunda hacemos el recuento y en la tercera
anotamos la frecuencia absoluta.
12. Este tipo de tablas de frecuencias se utiliza con variables
discretas.
Distribución de frecuencias agrupadas: La distribución de
frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es
continua. Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente. Límites de la clase. Cada clase está
delimitada por el límite inferior de la clase y el límite superior de la
clase.
La amplitud de la clase es la diferencia entre el límite superior e
inferior de la clase. La marca de clase es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el
cálculo de algunos parámetros.
El diagrama de tallos y hojas
Dado un conjunto de datos formado por observaciones, las cuales
pueden ser representadas mediante y donde cada
tiene por lo menos dos dígitos. Una forma rápida de
obtener una representación visual del conjunto de datos es
construir un diagrama de tallos y hojas. Este diagrama es usado
cuando hay un número no muy pequeño de datos. Los siguientes son
los pasos para construir un diagrama de tallos y hojas:
Seleccionar uno o más dígitos iniciales para los valores de tallo. El
dígito(s) final(es) se convierte (n) en hojas. Para facilitar la
determinación de la forma de la distribución de los datos se
necesitan al menos 5 tallos.
Hacer una lista de valores de tallo en una columna vertical.
Registrar las hojas por cada observación junto al valor
correspondiente del tallo.
13. Indicar las unidades para tallos y hojas en algún lugar del diagrama.
Muchos de los procedimientos estadísticos que se desarrollarán en
las siguientes unidades suponen que la variable aleatoria estudiada
tiene al menos una distribución aproximadamente normal, para la
cual el diagrama de tallos y hojas tiene forma de campana.
Los diagramas de tallos y hojas nos dan una idea de la localización
de los datos y de la forma de la distribución. Esta técnica funciona
bien para los conjuntos de datos que no tienen una dispersión muy
grande.
Ejemplo:
La siguiente tabla representa el porcentaje de algodón en un
material utilizado para la fabricación de camisas para caballeros.
Tabla 1. Datos del porcentaje de algodón
33.1 35.3 34.2 33.6 33.6 33.1 37.6 33.6
34.5 34.7 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.0 34.7 34.1 34.6 35.9 34.6 34.7
36.3 35.4 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.2 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.8 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.1 34.9 36.4 34.1 33.5 34.5 32.7
32.6 33.6 33.8 34.2 34.6 34.7 35.8 37.8
El diagrama de tallos y hojas para los anteriores datos aparece a
continuación.
Stem-and-leaf of PORCENTAJE DE ALGODON N = 64 Leaf Unit =
0.10 (el número 1 después del punto significa que se usa una sola
cifra decimal).
Tallo Hojas
14. 6 32 156789
18 33 114566666688
(21) 34 011122355666667777779
25 35 00111234456789
11 36 234888
5 37 13689
Algunas veces, la utilización del primero o de los dos primeros
dígitos de los datos puntuales como tallos no proporcionan
suficientes tallos como para permitirnos detectar la forma de su
distribución. Una manera de solucionar esto es utilizar tallos
dobles. Es decir, utilizar cada tallos dos veces: una vez para trazar
las hojas inferiores 0, 1, 2, 3, 4, y a continuación nuevamente para
trazar las hojas superiores 5, 6, 7, 8, 9. El siguiente gráfico ilustra
lo anterior
Histograma
En estadística, un histograma es una representación gráfica de una
variable en forma de barras, donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados. En el eje
vertical se representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las marcas de
15. clase, es decir, la mitad del intervalo en el que están agrupados los
datos.
Se utilizan para variables continuas o para variables discretas, con
un gran número de datos, y que se han agrupado en clases.
Se utiliza cuando se estudia una variable continua, como franjas de
edades o altura de la muestra, y, por comodidad, sus valores se
agrupan en clases, es decir, valores continuos. En los casos en los
que los datos son cualitativos (no-numéricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y
económicas que en ciencias naturales y exactas. Y permite la
comparación de los resultados de un proceso.
Tipos de histograma
Diagramas de barras simples
Representa la frecuencia simple (absoluta o
relativa) mediante la altura de la barra la cual
es proporcional a la frecuencia simple de la
categoría que representa.
Diagramas de barras compuesta
Se usa para representar la
información de una tabla de doble
entrada o sea a partir de dos
variables, las cuales se
representan así; la altura de la
barra representa la frecuencia
16. simple de las modalidades o categorías de la variable y esta
altura es proporcional a la frecuencia simple de cada
modalidad.
Diagramas de barras
agrupadas
Se usa para representar la
información de una tabla de
doble entrada o sea a partir
de dos variables, el cual es
representado mediante un
conjunto de barras como se
clasifican respecto a las diferentes modalidades.
Polígono de frecuencias
Es un gráfico de líneas que de las
frecuencias absolutas de los
valores de una distribución en el
cual la altura del punto asociado a
un valor de las variables es
proporcional a la frecuencia de
dicho valor.
Ojiva porcentual
Es un gráfico acumulativo, el cual
es muy útil cuando se quiere
representar el rango porcentual
de cada valor en una distribución
de frecuencias.
17. En los gráficos las barras se encuentran juntas y en la tabla los
números poseen en el primer miembro un corchete y en el segundo
un paréntesis, por ejemplo: [10-20)
Construcción de un histograma:
Paso 1: Determinar el rango de los datos. Rango es igual al dato
mayor menos el dato menor.
Paso 2: Obtener los números de clases, existen varios criterios
para determinar el número de clases (o barras) -por ejemplo la
regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos
autores recomiendan de cinco a quince clases, dependiendo de cómo
estén los datos y cuántos sean. Un criterio usado frecuentemente
es que el número de clases debe ser aproximadamente a la raíz
cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30
(número de artículos) es mayor que cinco, por lo que se seleccionan
seis clases.
Paso 3: Establecer la longitud de clase: es igual al rango dividido
por el número de clases.
Paso 4: Construir los intervalos de clases: Los intervalos resultan
de dividir el rango de los datos en relación al resultado del PASO 2
en intervalos iguales.
Paso 5: Graficar el histograma: En caso de que las clases sean
todas de la misma amplitud, se hace un gráfico de barras, las bases
de las barras son los intervalos de clases y altura son la frecuencia
de las clases. Si se unen los puntos medios de la base superior de
los rectángulos se obtiene el polígono de frecuencias.
El histograma de una imagen representa la frecuencia relativa de
los niveles de gris de la imagen. Las técnicas de modificación del
histograma de una imagen son útiles para aumentar el contraste de
imágenes con histogramas muy concentrados.
Sea u una imagen de tamaño NxN, la función de distribución del
histograma es:
18. Ejemplos de otros tipos de representaciones gráficas: Hay
histogramas donde se agrupan los datos en clases, y se cuenta
cuántas observaciones (frecuencia absoluta) hay en cada una de
ellas. En algunas variables (variables cualitativas) las clases están
definidas de modo natural, p.e sexo con dos clases: mujer, varón o
grupo sanguíneo con cuatro: A, B, AB, O. En las variables
cuantitativas, las clases hay que definirlas explícitamente
(intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje
horizontal) y las frecuencias, absolutas o relativas, en el de
ordenadas (eje vertical).
A veces es más útil representar las frecuencias acumuladas.
O representar simultáneamente los histogramas de una variable en
dos situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la
misma variable en dos situaciones distintas.
En las variables cuantitativas o en las cualitativas ordinales se
pueden representar polígonos de frecuencia en lugar de
histogramas, cuando se representa la frecuencia acumulativa, se
denomina
ojiva.
19. MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia es
conveniente resumir la información con un solo número. Este número
que, para tal fin, suele situarse hacia el centro de la distribución de
datos se denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición
de estos parámetros dentro de la distribución, independientemente
de que ésta esté más o menos centrada, se habla de estas medidas
como medidas de posición. En este caso se incluyen también
los cuantiles entre estas medidas. Se debe tener en cuenta que
existen variables cualitativas y variables cuantitativas, por lo que
las medidas de posición o medidas de tendencia se usan de
acuerdo al tipo de variable que se está observando, en este caso se
observan variables cuantitativas.
MEDIA ARITMETICA
La media aritmética es el valor obtenido por la suma de todos sus
valores dividida entre el número de sumandos
Propiedades:
La media aritmética es una medida de tendencia central.
Todas las observaciones están incluidas en el calculo
La media aritmética es afectada por medios extremos.
Cada conjunto de datos con variable observada de intervalo o razón
tienen una única media.
La suma de las desviaciones de cada observación respecto de ella es
cero.
20. MEDIA ARITMETICA PARA
DATOS NO AGRUPADOS
𝑥̅ =
Σx
𝑛
MEDIA ARITMETICA PARA
DATOS AGRUPADOS
𝑥̅ =
Σfx
𝑛
MEDIA POBLACIONAL
𝓊 =
Σx
𝑁
MEDIA PONDERADA
𝑋𝑤 =
(Σwx)
Σ𝑛
MEDIA GEOMETRICA
La media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los
números, es recomendada para datos de progresión geométrica,
para promediar razones, interés compuesto y números índices.
Propiedades:
El logaritmo de la media geométrica es igual a la media
aritmética de los logaritmos de los valores de la variable.
La media geométrica de un conjunto de números positivos es
siempre menor o igual que la media aritmética.
21. MEDIA GEOMETRICA PARA DATOS NO AGRUPADOS
𝑀𝐺 = √ 𝑥1. 𝑥2 . 𝑥3 … 𝑥 𝑛
𝑛
AUMENTO PORCENTUAL PROMEDIO DE UN PERIODO
DETERMINADO
𝑴𝑮 = √
𝒗𝒂𝒍𝒐𝒓 𝒂𝒍 𝒇𝒊𝒏𝒂𝒍 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐
𝒗𝒂𝒍𝒐𝒓 𝒂𝒍 𝒊𝒏𝒊𝒄𝒊𝒐 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐
𝒏
− 𝟏
MEDIANA
La mediana, representa el valor de la variable de posición central en
un conjunto de datos ordenados. De acuerdo con esta definición el
conjunto de datos menores o iguales que la mediana representarán
el 50% de los datos, y los que sean mayores que la mediana
representarán el otro 50% del total de datos de la muestra. La
mediana coincide con el percentil 50, con el segundo cuartil y con el
quinto decil. Su cálculo no se ve afectado por valores extremos.
MEDIANA PARA DATOS AGRUPADOS
𝑴𝒆 = 𝑳 +
𝒏
𝟐
− 𝑭𝑨
𝒇
. 𝒊
L: límite inferior de la clase donde está ubicada la mediana
n: número de términos
FA: frecuencia absoluta acumulada del intervalo anterior a la clase
de donde está la mediana.
f: frecuencia absoluta del intervalo donde se ubica la mediana
i: amplitud del intervalo
22. MODA
La moda es el valor con una mayor frecuencia en una distribución de
datos.
Hablaremos de una distribución bimodal de los datos adquiridos en
una columna cuando encontremos dos modas, es decir, dos datos que
tengan la misma frecuencia absoluta máxima. Una distribución
trimodal de los datos es en la que encontramos tres modas. Si todas
las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando
tratamos con datos agrupados antes de definir la moda, se ha de
definir el intervalo modal.
MEDIDAS DE DISPERSION
VARIANZAS
La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media de una distribución
estadística.
Propiedades de la varianza:
La varianza será siempre un valor positivo o cero, en el
caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se
les suma un número la varianza no varía.
Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por
el cuadrado de dicho número.
23. Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular
la varianza total.
AMPLITUD DE LA VARIANZA PARA DATOS AGRUPADOS
𝑨𝒗 = 𝑉𝑀 − 𝑉𝑚
AMPLITUD DE LA VARIANZA PARA DATOS AGRUPADOS
𝑨𝒗 = 𝐿𝑠 − 𝐿𝑖
DESVIACION MEDIA
La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
𝐷𝑚 =
Σ|x − x̅|
n
VARIANZA POBLACIONAL
𝝈 𝟐
=
𝛴( 𝑥 − 𝑢)2
𝑁
VARIANZA MUESTRAL
𝑺 𝟐
=
Σ( 𝑥 − 𝑥̅)2
𝑛 − 1
24. DESVIACION ESTANDAR
La desviación estándar o desviación típica (denotada con el símbolo
σ o s, dependiendo de la procedencia del conjunto de datos) es
una medida de centralización o dispersión para variables de razón
(ratio o cociente) y de intervalo, de gran utilidad en la estadística
descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este
valor, la desviación típica es una medida (cuadrática) que informa de
la media de distancias que tienen los datos respecto de su media
aritmética, expresada en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con
conocer las medidas de tendencia central, sino que necesitamos
conocer también la desviación que presentan los datos en su
distribución respecto de la media aritmética de dicha distribución,
con objeto de tener una visión de los mismos más acorde con la
realidad al momento de describirlos e interpretarlos para la toma
de decisiones.
DESVIACION ESTANDAR POBLACIONAL
𝝈 = √
Σ(x− u)2
𝑵
DESVIACION ESTANDAR MUESTRAL
𝑺 = √Σ𝑓𝑥2 −
(Σ𝑓𝑥)2
𝑛
𝑛 − 1
27. Se ha observado durante 31 días los datos de la cantidad de galones
vendidos en la Gasolinera “____”de El Guabo. Obteniendo los
siguientes datos.
0 1417 111 1690 1287 911
1008 1165 1421 995 1806 1514
1138 1192 1008 1751 1205 1348
1299 1148 1052 1396 1512 1606
1253 913 1176 1110 1302 1358
1235
a) Elabore un cuadro de frecuencias donde exista la Frecuencia
Absoluta y Relativa en forma decimaly porcentual.
DATOS f F f% F% fr Fr Xm
0 362 1 1 3.22 3.22 0.03 0.03 181
362 724 0 1 0 3.22 0 0.03 543
724 1086 6 7 19.35 22.57 0.2 0.23 905
1086 1448 19 26 61.3 83.87 0.61 0.84 1267
1448 1810 5 31 16.13 100 0.16 1 1629
b) ¿Cuál es el mayor número de ventas diarias?
El mayor número de ventas diarias es de: 1806
2k #Datos.
2k 31
25 32
K = 5
i = H-L/k
i = 1806-0/5
i = 361.2
i = 362
30. d) Halle la media, la mediana y la moda de los datos de la gasolinera.
U 38333
U = = = 1236.548
N 31
0 911 913 995 1008 1008
1058 1110 1117 1138 1148 1165
1176 1192 1205 1253 1287
1299 1302 1348 1358 1396 1417
1421 1512 1514 1606 1690 1751
1806
Mediana= 1235
Moda= 1008
31. n
e) Hallar la Media Geométricade las frecuencias de las ventas de la
Gasolinera.
MG= X1.X2.X3…Xn
MG=3.22*0*19.35*61.3*16.13
MG=0 = 0
f%
3.22%
0%
19.35%
61.3%
16.13%
32. DATOS AGRUPADOS.
GALONES f F Xm fXm
0 362 1 1 181 181
362 724 0 1 543 0
724 1086 6 7 905 5430
1086 1448 19 26 1267 24073
1448 1810 5 31 1629 8145
37829
f) Hallar la Media Aritmética.
fx 37829
x = = = 1220.290
N 31
g) Halle la Mediana.
N/2 - FA
Me= L+ . i
f
15.5-7
Me=1086+ . 362
19
33. Me=1247.94
h) Calcule la Moda.
Moda= 1267
i) Una muestra de la venta de los galones de gasolina vendidas
en 31 días, se organizó una distribuciónde frecuencias para
su estudio.
Calcule la Amplitud de la Varianza.
Evalué la Desviación EstándarMuestral.
Determine la Varianza de la Muestra.
DATOS f Xm fXm X2
Fx2
0 362 1 181 181 32761 32761
362 724 0 543 0 294849 0
724 1086 6 905 5430 819025 4914150
1086 1448 19 1267 24073 1605289 30500491
1448 1810 5 1629 8145 26539641 13268205
31 37829 5405565 48715607
AV= Ls-Li
AV= 1810-0
AV=1810.