PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
1. PARCIAL 1
>1<
Que es estadística?
Rama de las matematicas que se dedica a la organización, recolección y análisis de los datos para representarlos
gráficamente y poder tomar una decisión.
* estadística descriptiva(graficar): conjunto de métodos para organizar, resumir y presentar datos.
la aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores.
*estadística inferencial(tomar decisiones): interpretación de resultados obtenidos y a partir de ellos predecir o deducir.
en la siguiente prueba de aptitudes probablemente los trabajadores reciben calificaciones más bajas que las de las
trabajadoras.
Es importante porque. . .
porque los negocios, las economías mundiales, los descubrimientos científicos y los avances médicos se basan, en
esencia, en la estadística.
La disciplina de la estadística proporciona el marco de los balances y cuentas de pérdidas y ganancias para el
conocimiento empresarial y científico.
La estadística es una disciplina contable que, en lugar de limitarse a rendir cuentas sobre el dinero, informa de la
credibilidad científica.
Se trata del arte de ponderar y sopesar las evidencias observacionales.
Campos de aplicación de la estadística:’
- ciencias sociales: demografía (censo)
- econometría: modelos matemáticos (mercadotecnia)
- ciencias medicas: índices de mortalidad y natalidad
- ciencias naturales: especies en peligro de extinción
- ingeniería: control de manufactura
- genética: factores hereditarios
POBLACION:
es el conjunto de todos los posibles elementos que intervienen en un experimento o en un estudio.
-PARAMETRO: características medibles de una población.
- FINITA: cantidad limitada de elementos.
- INFINITA: observaciones donde no existe limite (estrellas)
MUESTRA:
Un conjunto de medidas u observaciones tomadas a partir de una población dada, es un SUBCONJUNTO de la
población.
-ESTADISTICO: característica medible de una muestra
-VARIABLE: cada uno de los caracteres de la muestra o población.
>2< >3<
a) Como describir la población? Viendo de que se esta hablando en general, sin importar las variables que lo
diferencian (100 PERSONAS; enfermas, saludables)
b) Como identificar la muestra? Identificando la variable que hace que la población cambie en algún sentido al que
va dirigido el estudio de dicha población (100 PERSONAS; Se analizan 10 que pueden estar: enfermas, saludables)
c) como describir variable? Viendo las partes que influyen en la muestra de esa población.
- VARIABLE CUALITATIVA: Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser ordinales y nominales.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no,
hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
- Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida,
aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave
- Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por
ejemplo los colores o el lugar de residencia.
-VARIABLE CUANTITATIVA: Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser:
Variable discreta: ( tiempo para resolver un examen.)Es la variable que presenta separaciones o interrupciones en la
escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: (altura del mercurio en un barómetro) Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo el peso (2.3 kg, 2.4 kg, 2.5 kg...) o la altura (1.64 m, 1.65 m, 1.66 m...),
que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre
dos cualesquiera
Como….
2. d) Identificar estadístico:
A las características medibles de una muestra se les denomina estadístico.
Dar su valor:
45 72 67 91 14 15 a) Población
52 21 74 18 42 22 b)Tamaño de población
86 71 24 82 12 60 c) Muestra
34 21 72 92 74 21 d) Tamaño de muestra
54 26 74 22 65 51 e) Parámetro
e) identificar parámetro:
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:
De centralización.
De posición
De dispersión.
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Media aritmética:
La media es el valor promedio de la distribución.
Mediana:
La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es
decir divide la serie de datos en dos partes iguales.
Moda:
La moda es el valor que más se repite en una distribución.
Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
La medidas de posición son:
Cuartiles:
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles:
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles:
Los percentiles dividen la serie de datos en cien partes iguales.
Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido:
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media:
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a
la media.
Varianza:
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.
3. Desviación típica:
La desviación típica es la raíz cuadrada de la varianza.
Dar su valor:
si estas observando un grupo de personas, digamos 50 personas, debes caracterizar tu grupo
como? haciendo observaciones de cada elemento
para esto, hay parametros numericos y parametros binarios
quieres saber que promedio de estatura tiene tu grupo
debes medir a las 50 personas, y obtener por tanto 50 observaciones (parametro numerico, estatura, cm o m)
con esos datos puedes calcular los parametros de tendencia central: el promedio (media), la mediana y la moda
lo mismo puedes hacer para otras caracteristicas: peso, edad, etc
quieres saber que caracteristica predomina mas en tu grupo, color de pelo, color de ojos, color de piel, complexion, es
decir, que vas a evaluar a cada elemento y obtendras una observacion de cada parametro, y por tanto tendras 50
observaciones de cada parametro cuando tienes la informacion, debes asignarle un valor a cada condicion: ojos cafes
(1), ojos azules (2), ojos verdesd (3) para el parametro color de ojos, pelo negro (1), pelo rubio (2), pelo rojizo (3), pelo
castaño (4) para el parametro color de pelo, y asi para cada caracteristica al transformar tus valores cualitativos (color)
a cuantitativos (1,2,3,...n) puedes ver que valor predomina y puedes ahora si caracterizar a tu grupo
>4<
MARGEN DE ERROR: Sacar el mayor y el menor y el margende error será lo que esta entre ellos a la misma
distancia (mayor:80; menor:70, diferencia:10; 10/2=5; +5 & -5 ).
g) TABLA DE DISTRIBUCION DE FRECUENCIAS:
La distribución o tabla de frecuencias es una tabla de los datos estadísticos con sus correspondientes frecuencias.
Frecuencia absoluta: el número de veces que aparece un valor, se representa con fi donde el subíndice representa
cada uno de los valores.
La suma de las frecuencias absolutas es igual al número total de datos, representado por N.
f1+f2+f3+…+fn=N
equivalente a
∑i=1nfi=N
Frecuencia relativa: el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de
datos, se representa por ni.
ni=fiN
La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se factoriza N.
Frecuencia acumulada: la suma de frecuencias absolutas de todos los valores iguales o inferiores al valor considerado,
se representa por Fi.
Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el número total de datos, se
representa por Ni.
(nótese que cuando se trata de acumuladas las letras que las representan están en mayúscula)
Ejemplo
15 alumnos contestan a la pregunta de cuantos hermanos tienen. Las respuestas son
1,1,2,0,3,2,1,4,2,3,1,0,0,1,2
A continuación construimos una tabla de frecuencias:
Hermanos Frecuencia absoluta fi Frecuencia relativa ni Frecuencia acumulada Fi Frecuencia relativa acumulada Ni
0 3 315 3 315
1 5 515 3+5=8 315+515=815
2 4 415 3+5+4=12 1215
3 2 215 3+5+4+2=14 1415
4 1 115 3+5+4+2+1=15 1515
∑ 15 1
Nótese que la diferencia entre la frecuencia acumulada y la relativa es solamente que en el caso de la relativa debemos
dividir por el número total de observaciones, lo que nos puede ayudar a ahorrar cálculos.
4. DATOS NO AGRUPADOS:
RANGO: acomodar de menor a mayor. (dato mayor – dato menor)
14 – 7= 7
MEDIA MUESTRAL: sumatoria de todos los datos dividido entre el numero total de datos.
7+7+7+8+9+9+9+10+10+11+11+11+11+12+12+14 158
_________________________________________ = _______________ = 9.875 == 9.87
16 16
MEDIANA: es el valor que se encuentra en la mitad de la lista de valores, cuando estos son ordenados de
acuerdo a su magnitud.
* Total de datos: 7
* Como es IMPAR, sumarle 1: 17 + 1 = 18
* Dividirlo entre 2 : 18 / 2 = 9
* BUSCAR EL DATO QUE ESTE EN ESA POSICION
5. MODA: el dato que más se repite.
VARIANZA: sumatoria de dispersiones cuadráticas con respecto a la media, entre el numero total - 1
DESVIACION ESTANDAR: raíz cuadrada de la varianza
√3.93 = 1.98242276 == 1.99 == 2
DATOS AGRUPADOS:
Li: donde empieza el intervalo
Ls:donde termina el intervalo
X: marca de clase (numero que se encuentra entre Li y Ls); FORMULA: Li + Ls/ 2
Xf: marca de clase por la frecuencia (X * f)
Lri: limite real inferior (limite inferior – 0.5)
Lrs: limite real superior(limite superior + 0.5)
LIMITES REALES: Son limites reales porque donde acaba una comienza la otra.
Lri de la clase CON MAYOR FRECUENCIA
D1: diferencia de la frecuencia maxima menos la que esta antes
D2: diferencia de la frecuencia maxima menos la que esta después
C: tamaño del intervalo
x
Sumatoria de todos
los valores de xf
ente “n”
--------------------------
4930 / 100 = 49.3
PARA LA MEDIA
(7 - 9.87)²+(7- 9.87)²+(7- 9.87)²+(8- 9.87)²+(9- 9.87)²+(9- 9.87)²+(9- 9.87)²+(10- 9.87)²+(10- 9.87)²+(11- 9.87)²+(11- 9.87)²+(11- 9.87)²+(11- 9.87)²+(12- 9.87)²+(12- 9.87)²+(14- 9.87)²
________________________________________________________________________________________________________________________________________________
16-1
(-2.87)²+(-2.87)²+(-2.87)²+(-1.87)²+(-.87)²+(-.87)²+(-.87)²+(.13)²+(.13)²+(1.13)²+(1.13)²+(1.13)²+(1.13)²+(2.13)²+(2.13)²+(4.13)² 58.9597
____________________________________________________________________________________________________ = ______________ = 3.930646667 == 3.93
15 15
Con las frecuencias buscar el que tiene mayor frecuencia.
6. Lri : 39.5 d1 + d2= 30
D1 : 35 – 10 = 25 d1 / d1+d2= 25/30= 0.833333 == 0.833
D2: 35 – 30 = 05 0.833 * c = 8.33
C: 10 MODA= 8.33 + Lri = 8.33 + 39.5 = 47.83
http://www.youtube.com/watch?v=bbkgCvGZicw
ANCHO DE CLASE: (C)
MARCA DE CLASE: (x)
FRECUENCIAS: (f)
h) COMO HACER. . . .
GRAFICA DE BARRAS: GRAFICA DE SECTORES: GRAFICA DE OJIVA:
RANGO (rango-recorrido):
R= Lm – Lo
Lm: límite superior del último intervalo.
Lo: límite o extremo inferior del primer intervalo.
N / 2 = 100/2 = 50 (la mediana esta en el dato #50)
F = frecuencia acumulada (se van sumando hasta llegar a 50)
Sabemos que ahí esta la mediana
7. VARIANZA:
K) COMO DETERMINAR:
Q1: n / 4
n=60
60/4 = 15
Q2:2n / 4
N=60
2*(60)/4= 120/4 = 30
++
Q3: 3n/4
N=60
3*60/4= 180/4= 45
>2<
PERMUTACIONES Y COMBINACIONES
“PERMUTACIONES”
MEDIA MUESTRAL:
29610
DESVIACION ESTANDAR:
Importan la posición de los elementos en el grupo:
4P2
Tengo {4}
Los quiero en {2} posiciones