4. 1. Introdución á Inferencia Estatística A Inferencia Estatística é a rama da Estatística mediante a cal se trata de obter conclusións dunha poboación en estudo, apoiándose no Cálculo de Probabilidades, a partir da información que proporciona unha mostra representativa da mesma. Tamén se denomina Estatística Indutiva ou Inferencia Indutiva.
5. 1. Introdución á Inferencia Estatística Estatística Descritiva Probabilidade Século XIX Galton, Pearson, Fisher Inferencia
6. 1. Introdución á Inferencia Estatística A unión entre o Cálculo de Probabilidades e a Estatística xorde polos problemas teóricos e metodolóxicos que suscita o contraste empírico da teoría de Darwin .
7. 1. Introdución á Inferencia Estatística F. Galton , primo de Darwin propugna un novo enfoque estatístico na súa obra “Natural Inheritance” para o estudo dos problemas da evolución que é aceptado con entusiasmo por W Weldon , quen busca colaboración no matemático K.Pearson para a resolución de novos problemas.
8. 1. Introdución á Inferencia Estatística O laboratorio de K. Pearson convértese a principios do século XX no centro de investigación de análise empírica de datos. Entre outros acode W.S. Gasset, que propón a nova distribución t (coñecida como t de Student). Pearson, Galton e Weldon fundan a revista Biométrica , que aínda hoxe é unha das publicacións máis prestixiosas de estatística
9. 1. Introdución á Inferencia Estatística Os fundamentos da Estatística actual débense a R.A. Fisher (1890-1962) quen escribe no seu libro “ Statistical Methods for Research Workers” os principios da Inferencia Estatística. En 1930 aparece a teoría xeral sobre o contraste de hipóteses elaborada por J. Neyman (1894-1981) e E.S. Pearson.
10. 1. Introdución á Inferencia Estatística A partir de 1950 comeza unha nova etapa no desenvolvemento da Estatística co uso das computadoras e a posibilidade de tratar grandes cantidades de datos
11. 1. Introdución á Inferencia Estatística Diferenzas entre a Inferencia e a Probabilidade Aínda que a Inferencia Estatística se apoia no Cálculo de Probabilidades, os fins de ámbalas dúas disciplinas son ben distintos. Vexamos uns exemplos:
12. 1. Introdución á Inferencia Estatística Experimento Tirar unha moeda Teoría de Probabilidade Supón que a moeda non está trucada e deduce que a probabilidade de obter cara ou cruz é 1/2 Inferencia Analizamos se a moeda está trucada comprobando se o modelo experimental obtido tirando a moeda un certo número de veces concorda co modelo probabilístico
13. 1. Introdución á Inferencia Estatística Probabilidade: Sabendo o contido da caixa, intentar saber o que teño na man (probabilidade de ter unha certa cor)
14. 1. Introdución á Inferencia Estatística Inferencia: Sabendo o contido da man, tratar de saber o que hai na caixa (proporcións de globos de cada cor)
15. 1. Introdución á Inferencia Estatística Podemos concluír que: A Inferencia Estatística é unha ciencia indutiva , é dicir, xeneraliza unhas propiedades observadas nun conxunto de datos a outro conxunto maior. O proceso indutivo é un proceso “arriscado", xa que toda inferencia indutiva exacta é imposible. Trátase de conseguir técnicas que midan o grao de incerteza producida. Tal medida faise mediante o Cálculo de Probabilidades.
16. 1. Introdución á Inferencia Estatística EXEMPLO: Supoñamos que temos nun almacén 10 millóns de sementes; sabemos que producen flores brancas ou vermellas. O que desexamos saber é cantos destes 10 millóns producirán flores brancas
17. 1. Introdución á Inferencia Estatística O único xeito de dar unha resposta correcta a esa pregunta é sementar todas as sementes e observar cantas saen brancas.
18. 1. Introdución á Inferencia Estatística A forma normal de proceder é seleccionar unhas poucas sementes, as plantamos e observamos o número das que producen flores brancas e, baseándonos nestes datos, facemos unha predición.
19.
20. 1. Introdución á Inferencia Estatística A Inferencia Paramétrica supón que a distribución de probabilidade da poboación obxecto de estudo é coñecida, agás os valores que toman certos parámetros. Neste contexto, o obxectivo é estimar , dar intervalos de confianza ou contrastar hipóteses sobre ditos parámetros.
21. 1. Introdución á Inferencia Estatística Exemplo No caso das sementes, podemos supoñer que unha determinada característica (a cor da flor) dunha poboación (10 millóns de sementes) segue unha distribución de probabilidade cun parámetro descoñecido (binomial con parámetro descoñecido p: probabilidade de que a flor sexa branca) e tomamos unha mostra. Calculamos o valor de dita característica neste subconxunto de elementos poboacionais para facer inferencias sobre p.
22. 1. Introdución á Inferencia Estatística Poboación 10 millóns de sementes Característica Cor da flor Distribución de probabilidades Binomial con parámetro p descoñecido (probabilidade de que a flor sexa branca) Mostra Valor da característica nesta mostra e inferimos p
23. 1. Introdución á Inferencia Estatística A Inferencia non Paramétrica trata problemas semellantes cando se ten unha distribución poboacional totalmente descoñecida, sobre a cal só se realizan suposicións moi xerais (é simétrica, continua, etc.)
25. 2. Poboación e Mostra Poboación : Colectivo: Universo: conxunto de elementos obxecto do estudo. Exemplos: Pacientes que chegan a urxencias dun hospital nun determinado ano, pezas producidas por unha máquina durante un certo período de tempo…
26.
27. 2. Poboación e Mostra Nota A poboación definirase sen ambigüidade, de forma que sempre se poida clasificar un elemento como pertencente ou non a ela. Se podemos analizar toda a poboación teremos un censo, e poderanse sacar conclusións mediante técnicas descritivas dos datos.
28. 2. Poboación e Mostra Individuo: Unidade Estatística: cada un dos elementos da poboación.
34. 2. Poboación e Mostra Mostraxe: Proceso de tomar mostras dunha poboación. Tamaño mostral: Número de elementos da mostra
35.
36. 2. Poboación e Mostra Exemplo Supoñamos que no campus universitario da Coruña proponse a eliminación da circulación de vehículos nalgunhas zonas. Quérese incluír un estudo sobre a opinión das persoas vinculadas á universidade.
37. 2. Poboación e Mostra ¿Canta xente está a favor de prohibir a entrada de coches no campus?
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65. 3. Mostraxe probabilística. Tipos de mostraxe Exemplo Queremos obter unha mostra aleatoria simple, de tamaño 10, dos días do ano (nun ano non bisesto). Numeramos os días do ano correlativamente, comezando polo 1 de xaneiro (número 1) e terminando polo 31 de decembro (número 365).
67. 3. Mostraxe probabilística. Tipos de mostraxe 369 =) NON. 024 =) SI. Escollemos o 24 de xaneiro 927 =) NON. 171 =) SI. Escollemos o 20 de xuño. 772 =) NON. 065 =) SI. Escollemos o 6 de marzo. 097 =) SI. Escollemos o 7 de abril. 549 =) NON. 233=) SI. Escollemos o 22 de agosto. 057 =) SI. Escollemos o 26 de febreiro. 334 =) SI. Escollemos o 30 de novembro.
68.
69.
70.
71.
72. 3. Mostraxe probabilística. Tipos de mostraxe Exemplo Consideramos a poboación: “Recadación dun cine para cada día do ano 2004 (N = 366)”. Decidimos tomar unha mostra de 52 días, entón k=366/52=7, polo tanto os 52 días da mostra corresponderán sempre ao mesmo día da semana.
73. 3. Mostraxe probabilística. Tipos de mostraxe Así se o valor elixido ao azar entre 1 e 7 é l = 6, a mostra consistirá en todas as recadacións dos sábados do ano 2004. Isto, obviamente producirá un nesgo considerable nas estimacións que se obteñan desta mostra.
78. 3. Mostraxe probabilística. Tipos de mostraxe Exemplo : para saber o número de persoas que traballan no subsector pesqueiro en Galicia, no IGE realízase unha mostraxe aleatoria estratificada.
79.
80.
81. 3. Mostraxe probabilística. Tipos de mostraxe Exemplo : unha enquisa nos fogares galegos. A enquisa divide a Galicia en seccións censais (conglomerados), aleatoriamente obtén mostras de seccións censais e estuda cada un dos fogares nas seccións censais pertencentes á mostra
82.
83. 3. Mostraxe probabilística. Tipos de mostraxe Exemplo: Supoñamos que se quere analizar a vixencia dos equipos informáticos nun conxunto de empresas dun certo ramo.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96. 4. Teorema central do límite El teorema central del límite, uno de los fundamentales en estadística, estudia el comportamiento de la suma de variables aleatorias, cuando crece el número de sumandos, asegurando su convergencia hacia una distribución normal en condiciones muy generales. Este teorema, del cual existen diferentes versiones que se han ido desarrollando a lo largo de la historia, tiene una gran aplicación en inferencia estadística, pues muchos parámetros de diferentes distribuciones de probabilidad, como la media, pueden expresarse en función de una suma de variables. Permite también aproximar muchas distribuciones de uso frecuente: binomial, Poisson, chi cuadrado, t-student, gamma, etc., cuando sus parámetros crecen y el cálculo se hace difícil (Devore 2001: 232). Por otro lado, la suma de variables aleatorias aparece en forma natural en muchas aplicaciones de la ingeniería: determinación de masa forestal, carga soportada por una estructura, tiempo de espera de servicios, etc. Todo ello explica por qué muchos métodos estadísticos requieren la condición de normalidad para su correcta aplicación y, en consecuencia, este teorema es un componente importante de la formación estadística de los ingenieros, ya que, por otro lado, su enseñanza plantea interrogantes importantes al profesor. El teorema se apoya y relaciona entre sí con otros conceptos y procedimientos básicos en estadística, como los de variable aleatoria y sus transformaciones, distribución muestral, convergencia, tipificación, cálculo de probabilidades, etc., algunos de los cuales podrían plantear problemas de aprendizaje. Fanse 64 observacións aleatorias de temperatura. Cal é a probabilidade de que a temperatura media observada exceda en máis de 1,5 graos á μ ?
97.
98. 4. Teorema central do límite O obxectivo do noso estudo é poder estender á poboación o que obteñamos dunha mostra .
99. 5. Distribución da media mostral Distribución da media mostral
100.
101.
102.
103.
104.
105.
106. 6. Distribución da media mostral dunha poboación normal b) Estas medias distribúense arredor da media da poboación, cunha desviación típica (chamada desviación típica da media , ) igual á da poboación dividida pola raíz de n, é dicir, a desviación da media mostral é: c) A distribución das medias mostrais é unha distribución de tipo "normal" sempre que a poboación de procedencia o sexa, ou incluso se non o é, sempre que o tamaño das mostras sexa N = 30 ou maior.
107.
108.
109. 6. Distribución da media mostral dunha poboación normal Nesta páxina podes atopar unha aplicación interactiva que o ilustra http://ntic.educacion.es/w3/eos/MaterialesEducativos/mem2001/estadistica/index2.htm
110.
111.
112. 6. Distribución da media mostral dunha poboación normal O peso medio das bagaxes de dito grupo estará na distribución mostral de medias A probabilidade de que o peso medio para estes pasaxeiros sexa superior a 26 kg sería:
113. 6. Distribución da media mostral dunha poboación normal Se o avión non debe cargar máis de 1300 kg nas súas bodegas, a media do conxunto dos 50 pasaxeiros non debe superar os Polo tanto nun 11,9% dos casos os avións desta compañía superan a marxe de seguridade.
115. 7. Distribución da proporción A distribución binomial B(n,p), permítenos coñecer como se distribúe o número de éxitos correspondente a un experimento realizado n veces, e no que a probabilidade de éxito en cada experimento é p . Dita distribución ten media e desviación típica:
116. 7. Distribución da proporción Supoñamos que X é a variable que mide o número de éxitos. Os posibles valores de X son: 0,1,2,...,n. Se definimos unha nova variable , esta tomaría os valores correspondentes á s proporcións (en tanto por un) de éxito .
117. 7. Distribución da proporción Se por exemplo n=200, como teríase: X=0 , (0 éxitos ) equivale a Y=0 ( é dicir, un 0% de éxitos) X=1 , (1 éxito ) equivale a Y=0,005 ( 0,5% de éxitos) X=2 , Y=0,01 ( é dicir, 2 éxitos equivalen a un 1% de éxitos) .... X=n , Y=1 ( n éxitos = 100% de éxitos)
118. 7. Distribución da proporción Dividindo por n, obteremos a media e a desviación típica da variable Y que representa a proporción de éxitos :
119. 7. Distribución da proporción Se np>5, nq>5, utilizando a aproximación normal á binomial, poderemos afirmar que as proporcións de éxito, para un experimento binomial de n probas con probabilidade de éxito p en cada proba, distribúense segundo:
120. 7. Distribución da proporción Polo tanto, se nunha poboación, unha determinada característica de tipo binomial (a poboación divídese entre os que a teñen e os que non), preséntase nunha proporción p, ao tomar mostras de tamaño n, as proporcións p' obtidas, distribuiranse segundo (a partir deste momento suporemos sempre que np>5,nq>5). Esta distribución denomínase distribución da proporción mostral
121.
122.
123. 7. Distribución da proporción En consecuencia, a probabilidade de valores como o rexistrado resulta ser: e podemos asegurar "estatisticamente" que a máquina está estragada.