Este documento contiene información sobre un alumno llamado Cesar Jesús Estrada Escobedo que cursa la materia de Estadística en el 2do Cuatrimestre de la Sección A con el maestro Gerardo Edgar Mata Ortiz. Luego presenta conceptos sobre las distribuciones de Bernoulli, Binomial, Poisson y Gamma. Finalmente incluye ejercicios de aplicación sobre estas distribuciones.
1. Alumno: Cesar Jesús Estrada Escobedo
2DO Cuatrimestre Sección “A”
Maestro: Gerardo Edgar Mata Ortiz
Materia: Estadística
Fecha: 18/03/12
2. Distribución de Bernoulli
En teoría de probabilidad y estadística, la distribución de Bernoulli (o distribución
dicotómica), nombrada así por el matemático y científico suizo Jakob Bernoulli, es
una distribución de probabilidad discreta, que toma valor 1 para la probabilidad de
éxito ( ) y valor 0 para la probabilidad de fracaso ( ).
Si es una variable aleatoria que mide "número de éxitos", y se realiza un único
experimento con dos posibles resultados (éxito o fracaso), se dice que la variable
aleatoria se distribuye como una Bernoulli de parámetro .
La fórmula será:
Su función de probabilidad viene definida por:
Un experimento al cual se aplica la distribución de Bernoulli se conoce
como Ensayo de Bernoulli o simplemente ensayo, y la serie de esos experimentos
como ensayos repetidos.
Esperanza matemática:
Varianza:
Función generatriz de momentos:
Función característica:
Moda:
0 si q > p (hay más fracasos que éxitos)
1 si q < p (hay más éxitos que fracasos)
0 y 1 si q = p (los dos valores, pues hay igual número de fracasos que de éxitos)
3. 1.- Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal y
cuyos conductores no tenían cinturón de
seguridad, que 300 individuos quedaron con secuelas.
Describa el experimento usando conceptos de v.a.
Solución.
La noción frecuentista de problema nos permite aproximar la probabilidad de
tener secuelas mediante 300/2000=0,15=15%
X=“tener secuelas tras accidente sin cinturón” es variable de Bernoulli
X=1 tiene probabilidad p ≈ 0,15
X=0 tiene probabilidad q ≈ 0,85
2.- Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal y
cuyos conductores sí tenían cinturón de seguridad, que 10 individuos quedaron
con secuelas.
Describa el experimento usando conceptos de v.a.
Solución.
La noción frecuentista de problema nos permite aproximar la probabilidad de
quedar con secuelas por 10/2000=0,005=0,5%
X=“tener secuelas tras accidente usando cinturón” es variable de Bernoulli
X=1 tiene probabilidad p ≈ 0,005
X=0 tiene probabilidad q ≈ 0,995
3.- Un agente de seguros vende pólizas a 5 individuos, todos de la misma edad.
De acuerdo con las tablas actuariales, la probabilidad de que un individuo con esa
edad viva 30 años más es de 3/5. Determinar la probabilidad de que dentro de
30 años vivan: 1. Los cinco individuos. 2. Al menos tres. 3. Sólo dos. 4. Al menos
uno.
Estamos frente a una variable Bernoulli ya que dentro de 30 años se pueden
presentar dos situaciones que la persona este viva (p = 3/5) o que haya muerto (q
= 2/5). Al considerar los 5 individuos, estamos frente a una varia aleatoria X
binomial con n = 5, p = 0, 6 X ~ B (5, 0,6).
4. 4.- Consideremos el conjunto de experimentos de Bernoulli en el que se
seleccionan tres artículos al azar de un proceso de ensamblaje, se inspeccionan y
se clasifican como defectuosos o no defectuosos. Un artículo defectuoso se
designa como éxito. El número de éxitos es una v.a. X que toma valores integrales
de 0 a 3.
Como los artículos se seleccionan de forma independiente de un proceso que
supondremos produce 25% de artículos defectuosos,
P(NDN)=P(N)P(D)P(N)=(3/4)(1/4)(3/4)=9/64.
5.- La v.a. que define el experimento lanzamiento de una moneda sigue una
distribución de Bernoulli de parámetro p. Donde p es la probabilidad del suceso de
interés, cara o cruz.
PROPIEDADES
5. Distribución Binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta
que mide el número de éxitos en una secuencia de n ensayos
de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del
éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son
posibles dos resultados. A uno de estos se denomina éxito y tiene una
probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En
la distribución binomial el anterior experimento se repite nveces, de forma
independiente, y se trata de calcular la probabilidad de un determinado número de
éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de
Bernoulli.
Para representar que una variable aleatoria X sigue una distribución binomial de
parámetros n y p, se escribe:
La distribución binomial es la base del test binomial de significación estadística.
Existen muchas situaciones en las que se presenta una experiencia binomial.
Cada uno de los experimentos es independiente de los restantes (la probabilidad
del resultado de un experimento no depende del resultado del resto). El resultado
de cada experimento ha de admitir sólo dos categorías (a las que se denomina
éxito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes
en todos los experimentos (se denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el número de éxitos que se han producido
en los n experimentos.
Cuando se dan estas circunstancias, se dice que la variable X sigue una
distribución de probabilidad binomial, y se denota B(n,p).
Su función de probabilidad es
donde
siendo las combinaciones de en ( elementos tomados
de en ).
6. 1.- Un agente de seguros vende pólizas a 5 individuos, todos de la misma edad. De acuerdo
con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años
más es de 3/5. Determinar la probabilidad de que dentro de 30 años vivan:
1. Los cinco individuos.
2. Al menos tres.
3. Sólo dos.
4. Al menos uno.
Estamos frente a una variable Bernoulli ya que dentro de 30 años se pueden presentar dos
situaciones que la persona este viva (p = 3/5) o que haya muerto (q = 2/5). Al considerar
los 5 individuos, estamos frente a una varia aleatoria X binomial con n = 5, p = 0, 6 X ~
B(5, 0,6).
2.-Suponiendo que la probabilidad de tener un hijo varón es 0,51. Hallar la probabilidad de
que una familia con seis hijos tenga:
1. Por lo menos un niño.
2. Por lo menos una niña.
7. 3.- La probabilidad de que un paciente se recupere de una cierta enfermedad es 0.4.
Si 15 personas contraen la enfermedad ¿cual es la probabilidad de que
a) al menos 10 sobrevivan ? Sea X el n´umero de supervivientes.
4.- Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?
El número de aciertos k es 6. Esto es x=6
El número de experimentos n son 10
La probabilidad de éxito p, es decir, que salga "cara" al lanzar la moneda es 50% ó 0.50
La fórmula quedaría:
P (k = 6) = 0.205
Es decir, que la probabilidad de obtener 6 caras al lanzar 10 veces una moneda es de 20.5%
5.- En una fábrica de cámaras el 5% sale con defectos. Determine la probabilidad de que en
una muestra de 12 se encuentren 2 cámaras defectuosas.
Solución :
Se trata de una distribución binomial de parámetros B(12, 0.05). Debemos calcular la
probabilidad de que x sea igual a k que en este caso es 2. Esto es P (k=2).
Busque en la parte izquierda de la tabla n=12, luego en la parte superiror p=0.05 . La
probabilidad estará en x=2
El resultado es 0.0988
.
Distribución de Poisson
En teoría de probabilidad y estadística, la distribución de Poisson es una
distribución de probabilidad discreta que expresa, a partir de una frecuencia de
ocurrencia media, la probabilidad que ocurra un determinado número de eventos
durante cierto periodo de tiempo.
Fue descubierta por Siméon-Denis Poisson, que la dio a conocer en 1838 en su
trabajo Recherches sur la probabilité des jugements en matières criminelles et
matière civile (Investigación sobre la probabilidad de los juicios en materias
criminales y civiles).
La función de masa de la distribución de Poisson es
8. Donde:
k es el número de ocurrencias del evento o fenómeno (la función nos da la
probabilidad de que el evento suceda precisamente k veces).
λ es un parámetro positivo que representa el número de veces que se espera que
ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado
tiene lugar en promedio 4 veces por minuto y estamos interesados en la
probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos,
usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
e es la base de los logaritmos naturales (e = 2,71828 ...)
Tanto el valor esperado como la varianza de una variable aleatoria con distribución
de Poisson son iguales a λ. Los momentos de orden superior son polinomios de
Touchard en λ cuyos coeficientes tienen una interpretación combinatoria. De
hecho, cuando el valor esperado de la distribución de Poisson es 1, entonces
según la fórmula de Dobinski, el n-ésimo momento iguala al número
de particiones de tamaño.
La moda de una variable aleatoria de distribución de Poisson con un λ no entero
es igual a , el mayor de los enteros menores que λ (los símbolos representan
la función). Cuando λ es un entero positivo, las modas son λ y λ − 1.
La función generadora de momentos de la distribución de Poisson con valor
esperado λ es
1.- El número de accidente por semana en una fábrica sigue una distribución
Poisson de
Parámetro l = 2. Calcular:
1. La probabilidad de que en una semana haya algún accidente.
2. La probabilidad de que haya 4 accidentes en dos semanas.
3. La probabilidad de que haya 2 accidentes en una semana y otros dos en la
semana
Siguiente.
4. Si sabemos que ha habido un accidente hallar la probabilidad de que en esa
semana
No haya más de tres accidentes.
9. 2.-La proporción de alumnos de un distrito universitario con calificación de
sobresaliente es
de 0,005%. Determinar la probabilidad de que entre 5000 alumnos seleccionados
al azar
haya dos con calificación media sobresaliente.
3.-En promedio, cada una de las 18 gallinas de un gallinero pone un huevo al día.
Si se recogen los huevos cada hora ¿Cuál es el número medio de huevos que se
recogen en cada visita? ¿Con qué probabilidad encontraremos x huevos para 0,1,
2, 3x =? ¿y la probabilidad de que4x = ?
Distribución de Poisson para un valor medio de µ = 0.75
10. 4.-Durante un experimento de laboratorio el número promedio de partículas
radioactivas que pasan a través de un contador de un milisegundo es cuatro.
¿Cuál es la probabilidad de que seis partículas entren al contador en un
milisegundo dado?
Solución:
5.- El número promedio de camiones tanque que llega cada día a cierta ciudad
portuaria es 10. Las instalaciones en el puerto pueden manejar a lo más 15
camiones tanque por día. ¿Cuál es la probabilidad de que en un día dado los
camiones se tengan que regresar?. Solución:
Sea X el número de camiones tanque que llegan
Al usar la distribución de Poisson desde x=0 a x=15 y encontrando el
complementario tenemos el resultado:
p=0.95 representa la probabilidad de recibir de 0 a 15 camiones, es decir, no
rebasa la capacidad de las instalaciones. El complementario p’=0.05 es la
probabilidad de rebasar la capacidad, es decir, de devolver camiones.
DISTRIBUCIÓN GAMMA
1.-En un estudio de la guardia urbana de Barcelona se toma una distribución
gamma para modelizar el número de víctimas en accidentes de tráfico. Como es
más habitual la proporción de 1 ocupante por vehículo siniestrado, y es más rara
la probabilidad de 4 ó 5 ocupantes por vehículo siniestrado, se crea una
distribución gamma para modelizar el número de víctimas por accidente de tráfico.
El 38% de la distribución lo acumula la proporción 1 accidentado por accidente, el
36% 2:1, 16% la 3:1, 6% el 4:1 y finalmente un 3% para 5:1. La media del modelo
es 1,5 víctimas por accidente, pero no indican el valor de los parámetros α y β
tomados en cuenta.
2.-También en el ámbito de la siniestralidad viaria, en un estudio de la ciudad de
Medellín, Colombia, se usa la distribución Gamma para obtener la distribución de
probabilidad de la variable aleatoria “edad de fallecimiento en accidentes de
tráfico”. En este caso explican que se asignaron los parámetros α y “a ojo”. El
mejor resultado es el que parece minimizar los errores cuadráticos medios
después de varias asignaciones. Finalmente obtienen α=2,94 y =13,94.
11. 3.- A una centralita de teléfonos llegan 12 llamadas por minuto, siguiendo una
distribución de Poisson. ¿Cuál es la probabilidad de que en menos de 1 minuto
lleguen 8 llamadas?
Existe un 91,05% de probabilidades de recibir 8 llamadas en un plazo de tiempo
de menos de 1 minuto.
4.- Si un componente eléctrico falla una vez cada 5 horas, ¿cuál es el tiempo
medio que transcurre hasta que fallan dos componentes? ¿Cuál es la probabilidad
de que transcurran 12 horas antes de que fallen los dos componentes?
12. En un 30,84% de las situaciones pasarán 12 horas hasta que fallen dos
componentes.
5.- En una ciudad se observa que el consumo diario de energía (en millones de
kilowatt-hora) es una variable aleatoria que sigue una distribución gamma con
parámetros α= 3 y =2. Si la planta de energía que suministra a la ciudad tiene una
capacidad diaria de generar un máximo de 12, ¿cuál es la probabilidad de que
haya un día donde no se pueda satisfacer la demanda?
13. Distribución normal
En estadística y probabilidad se llama distribución normal, distribución de
Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece aproximada en
fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica
respecto de un determinado parámetro. Esta curva se conoce como campana de
Gauss y e es el gráfico de de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos
fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenómenos son desconocidos, por la
enorme cantidad de variables incontrolables que en ellos intervienen, el uso del
modelo normal puede justificarse asumiendo que cada observación se obtiene
como la suma de unas pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un
fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño
experimental, de ahí que al uso de la estadística en psicología y sociología sea
conocido como método correlacional.
Función de densidad
Se dice que una variable aleatoria continua X sigue una distribución normal de
parámetros μy σ y se denota X~N (μ, σ) si su función de densidad está dada por:
donde μ (mu) es la media y σ (sigma) es la desviación estándar (σ2 es
la varianza).5
Se llama distribución normal "estándar" a aquélla en la que sus parámetros toman
los valores μ = 0 y σ = 1. En este caso la función de densidad tiene la siguiente
expresión:
14. Su gráfica se muestra a la derecha y con frecuencia se usan ...tablas para el
cálculo de los valores de su distribución.
Es una distribución adecuada para modelizar el comportamiento de variables
aleatorias continuas con asimetría positiva. Es decir, variables que presentan una
mayor densidad de sucesos a la izquierda de la media que a la derecha. En su
expresión se encuentran dos parámetros, siempre positivos, (α) y (β) de los que
depende su forma y alcance por la derecha, y también la función Gamma Γ(α),
responsable de la convergencia de la distribución.
Los parámetros de la distribución
El primer parámetro (α) sitúa la máxima intensidad de probabilidad y por este
motivo en algunas fuentes se denomina “la forma” de la distribución: cuando se
toman valores próximos a cero aparece entonces un dibujo muy similar al de la
distribución exponencial. Cuando se toman valores más grandes de (α) el centro
de la distribución se desplaza a la derecha y va apareciendo la forma de una
campana de Gauss con asimetría positiva. Es el segundo parámetro (β) el que
determina la forma o alcance de esta asimetría positiva desplazando la densidad
de probabilidad en la cola de la derecha. Para valores elevados de (β) la
distribución acumula más densidad de probabilidad en el extremo derecho de la
cola, alargando mucho su dibujo y dispersando la probabilidad a lo largo del plano.
Al dispersar la probabilidad la altura máxima de densidad de probabilidad se va
reduciendo; de aquí que se le denomine “escala”. Valores más pequeños de (β)
conducen a una figura más simétrica y concentrada, con un pico de densidad de
probabilidad más elevado.
Una forma de interpretar (β) es “tiempo promedio entre ocurrencia de un suceso”.
Relacionándose con el parámetro de la Poisson como β=1/λ. Alternativamente λ
será el ratio de ocurrencia: λ=1/β.
La expresión también será necesaria más adelante para poder llevar a cabo el
desarrollo matemático.
Supongamos que se sabe que el peso de los sujetos de una determinada
población sigue una distribución aproximadamente normal, con una media de 80
Kg y una desviación estándar de 10 Kg. ¿Podremos saber cuál es la probabilidad
de que una persona, elegida al azar, tenga un peso superior a 100 Kg?
15. Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente
de esa población tenga un peso mayor de 100 Kg , es de 1–0.9772=0.0228, es
decir, aproximadamente de un 2.3%.
2.- cuál es la probabilidad que una variable normal estandarizada se encuentre en
los rangos:
1. P(-1≤X≤1) = normcdf(1)-normcdf(-1)= 0.6827
2. P(0≤ X ≤1.72) = normcdf(1.72)-normcdf(0)= 0.4573
3. P(4.5≤X) = 1
3.-Suponga que la altura de las mujeres mexicanas está normalmente distribuida,
con promedio μ = 160cm y desviación estándar σ = 7.5cm. Encuentre el
porcentaje de mexicanas que están:
a) Entre 153 y 168 centímetros
b) Aproximadamente 170 centímetros
Suponga que la altura de las mujeres mexicanas está normalmente distribuida,
con promedio μ = 160cm y desviación estándar σ = 7.5cm.
entonces z1 = (153-160)/7.5=-0.93 y z2 = (168-160)/7.5=1.07
De aquí que:
P(153≤X≤168) = normcdf(-0.93)-normcdf(1.07)= 0.6815
Asuma que las alturas son redondeadas al centímetro más cercano,
entonces z1 = (169.5-160)/7.5=1.27 y z2 = (170.5-160)/7.5=1.4
De aquí que:
P(169.5≤X≤170.5) = normcdf(1.4)-normcdf(1.27)= 0.0213
4.- Se lanzan 100 volados con una moneda correcta.
Encuentre la probabilidad que ocurran exactamente 60 águilas.
¿Cuál es la predicción de la aproximación normal?
Se lanzan 100 volados con una moneda correcta.
Encuentre la probabilidad que ocurran exactamente 60 águilas.
Note que: μ = np = 100(0.5) =50, σ2 = npq = 100(0.5)(0.5) = 25, por
lo que σ = 5. Se usa entonces la distribución normal para
aproximar la probabilidad binomial como sigue:
b(100, 60, 0.5) ≈ N(59.5 ≤ X ≤ 60.5). Tras transformar, a = 59.5,
b = 60.5 en unidades estándar se obtiene:
z1 = (59.5-50)/5=1.9 y z2 = (60.5-50)/5=2.1. De aquí que:
16. P(59.5≤X≤60.5) = normcdf(2.1)-normcdf(1.9)= 0.0109
5.- Suponga que el 4% de la población de la tercera edad tiene Alzheimer.
Suponga que se toma una muestra aleatoria de 3500 ancianos. Encuentre la
probabilidad que al menos 150 de ellos tengan la enfermedad.
Suponga que el 4% de la población de la tercera edad tiene Alzheimer. Suponga
que se toma una muestra aleatoria de 3500 ancianos. Encuentre la probabilidad
que al menos 150 de ellos tengan la enfermedad.
μ = np = 3500(0.04) =140, σ2 = npq = 3500(0.04)(0.96) = 134.4, por
lo que σ = 11.6. Se usa entonces la distribución normal para
aproximar la probabilidad binomial como sigue:
b(k ≤ 150) ≈ N(X ≤ 149.5). Tras transformar, a = 149.5, en unidades estándar se
obtiene: z1 = (149.5-140)/5= 0.82 De aquí que:
P(X≤149.5) = normcdf(0.82) = 0.7939
Distribución T de student
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es
pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación
de las diferencias entre dos medias muéstrales y para la construcción del intervalo
de confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir
de los datos de una muestra.
La distribución t de Student es la distribución de probabilidad del cociente
Donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución ji-cuadrado con grados de libertad
Z y V son independientes
17. Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la
distribución t de Student no central con parámetro de no-centralidad .
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas
normalmente, con media μ y varianza σ2. Sea
la media muestral. Entonces
sigue una distribución normal de media 0 y varianza 1.
Sin embargo, dado que la desviación estándar no siempre es conocida de
antemano, Gosset estudió un cociente relacionado,
Donde:
Se tienen los siguientes datos experimentales correspondientes a 17 individuos de
los que se ha recogido el valor que presentan en dos variables, una de ellas
cuantitativa con distribución normal considerada como variable respuesta (Rta), y
la otra variable dicotómica considerada como variable explicativa (Exp). Los datos
se presentan de forma que en las filas hay varios individuos para facilitar la
lectura:
18. Calcular un intervalo de confianza al 90% para la diferencia de medias asumiendo
igualdad de varianzas y no asumiendo la igualdad de éstas y realizar el siguiente
contraste:
H0: m1 - m2 = 0
H1: m1 - m2 ¹ 0
mediante la prueba t-Student para dos medias en los dos supuestos de igualdad y
no igualdad de varianzas.