Os quartis são os valores da variável que dividem a
   distribuição de frequências em quatro partes iguais.
   ...
   Os d...
Quartis


         Conforme se viu anteriormente, a mediana é o
valor que divide a distribuição em duas partes iguais.
   ...
Exemplo 11:          Tamanho dos N.º de pares
                       sapatos    vendidos          cum ni          fi (%)  ...
Diagrama de Extremos e Quartis
         Utiliza-se para representar a mediana, a dispersão
inter-quartil, as observações m...
Exercícios:

1. As classificações obtidas pelo Vítor no teste de Matemática foram:
                   55%     65%       55...
Medidas de Dispersão
         As medidas de localização não caracterizam a dispersão ou
a variabilidade dos dados. É então...
Amplitude total

   Num conjunto de dados chama-se amplitude total ou apenas
amplitude à diferença entre o maior e o menor...
Exemplos:

1. As notas do João nas disciplinas de português, Filosofia,
Matemática e Inglês foram: 10    16     18    8
O ...
Amplitude interquartis é a diferença entre o 3º e o 1º quartis e
representa-se por:
                          AQx = Q3 – Q...
Propriedades:




  www.joaoleal.net   Professor: João José Leal   66
Variância

 A medida de dispersão mais utilizada é o desvio- padrão. No entanto,
para obter o desvio- padrão temos de dete...
Exemplo:
Exemplo:


   Observe o conjunto de dados correspondentes às classificações
obtidas no 9º ano, em cinco testes, p...
José:                                                                                   Maria:
                           ...
Ou, relativamente às notas da Maria nós tínhamos:


      xi           fi    xi  x                 xi  x 
            ...
Desvio-padrão: O desvio-padrão, que se representa por                               , é igual
à raiz quadrada positiva da...
Exemplo:
Exemplo:


         Considerando as notas do José e da Maria, o desvio-padrão
seria, respectivamente:

          ...
Propriedades do desvio-padrão
                desvio-


•O desvio-padrão é sempre não negativo.


•Quanto maior for o desv...
Distribuições bidimensionais

         No estudo da estatística, até agora desenvolvido,
estudámos variáveis estatísticas ...
Assim,


Definição de distribuição unidimensional: É aquela em que a
observação é apenas feita atendendo a uma variável.

...
Definição de distribuição bidimensional: Quando a população é
estudada relativamente a duas variáveis.




Nota: Quando se...
Exemplos deste tipo de situações:


Averiguar se há uma relação entre:


   1) o peso e a altura dos alunos de uma determi...
Relação funcional: É quando existe uma relação exacta entre duas
variáveis, isto é, é possível determinar com precisão a r...
Relação estatística: É quando a relação é menos precisa, mais
vaga, e sujeita a mais variações.




 Exemplo:

 As idades ...
Assim, perante dois fenómenos quaisquer, pode-se afirmar

que ou estão ligados através de uma relação funcional ou de uma
...
Diagrama de dispersão

          Definição: Chama-se diagrama de dispersão a uma nuvem
de pontos obtidos após a representa...
Correlação linear ou Coeficiente de correlação


         Quando se observa um diagrama de dispersão, intuitivamente
é-se ...
Observem-se alguns tipos de correlação:




  www.joaoleal.net           Professor: João José Leal   83
A intensidade da relação existente entre as
variáveis x e y pode ser quantificada. Para quantificar
essa        relação   ...
O coeficiente de correlação é um número do intervalo [-1, 1] e
é representado por r ou rxy e definido por:
               ...
Conhecido o valor de r avalia-se a intensidade da correlação
de acordo com a seguinte escala.




   www.joaoleal.net     ...
Ou graficamente,




 www.joaoleal.net   Professor: João José Leal   87
www.joaoleal.net   Professor: João José Leal   88
Recta de regressão.

        Considerem-se os seguintes diagramas de dispersão:


                           Figura     1:...
Figura 2: Verifica-se que os pontos se situam em
                   torno de uma recta imaginária que passa através da
   ...
Figura 3: A linha que se ajusta à nuvem é uma
                   parábola.




www.joaoleal.net      Professor: João José ...
Figura 4: As variáveis não estão relacionadas. A
                   dispersão dos pontos é muito irregular.




www.joaole...
Notas:
 1. A recta de regressão pode ser definida por uma equação ( yaxb ).


 2. Vantagem do conhecimento da recta de r...
3. A recta de regressão contém o ponto ( x , y ) , sendo   x e y as
   médias das variáveis x e y, respectivamente. Este c...
Medidas de assimetria
Assimetria
        O método mais simples de reconhecer a assimetria de uma
distribuição consiste na ...
Exercícios:

1. A temperatura média anual e a latitude das capitais dos países da
   EU aproximadamente a seguinte:
      ...
1.1 Calcule a média das variáveis temperatura e latitude.


    1.2 Desenhe o diagrama de dispersão e a recta de regressão...
Próximos SlideShares
Carregando em…5
×

Estatística Descritiva - parte 2 (ISMT)

4.670 visualizações

Publicada em

Estatística Descritiva - parte 2 (ISMT)

Publicada em: Educação
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
4.670
No SlideShare
0
A partir de incorporações
0
Número de incorporações
51
Ações
Compartilhamentos
0
Downloads
158
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Estatística Descritiva - parte 2 (ISMT)

  1. 1. Os quartis são os valores da variável que dividem a distribuição de frequências em quatro partes iguais. ... Os decis em dez. ... Os percentis em cem. ... 0 0,25 0,5 0,75 1,00 cum fi Q1 Q2 Q3 Xi www.joaoleal.net Professor: João José Leal 57
  2. 2. Quartis Conforme se viu anteriormente, a mediana é o valor que divide a distribuição em duas partes iguais. Os quartis são os valores que dividem a distribuição em quatro partes iguais. www.joaoleal.net Professor: João José Leal 58
  3. 3. Exemplo 11: Tamanho dos N.º de pares sapatos vendidos cum ni fi (%) cum fi (%) Xi ni 35 30 30 0,65 0,65 35,5 40 70 0,87 1,52 36 50 120 1,08 2,60 36,5 150 270 3,25 5,86 37 300 570 6,51 12,37 Q1 37,5 600 1170 13,02 25,38 38 950 2120 20,61 46,00 Q2 38,5 820 2940 17,79 63,79 Q3 39 750 3690 16,27 80,06 39,5 440 4130 9,55 89,61 40 250 4380 5,42 95,03 40,5 150 4530 3,25 98,29 41 40 4570 0,87 99,15 41,5 39 4609 0,85 100,00 4.609 100,00 www.joaoleal.net Professor: João José Leal 59
  4. 4. Diagrama de Extremos e Quartis Utiliza-se para representar a mediana, a dispersão inter-quartil, as observações máximas e mínimas e os outliers. www.joaoleal.net Professor: João José Leal 60
  5. 5. Exercícios: 1. As classificações obtidas pelo Vítor no teste de Matemática foram: 55% 65% 55% 70% 72% 1.1 Qual foi a classificação média? 1.2 Qual é a moda? 1.3 Qual é a mediana? 1.4 O Vítor fez um 6º teste e obteve a classificação de 80%. a) Qual é a média dos seis testes? b) Qual é a classificação mediana dos seis testes? www.joaoleal.net Professor: João José Leal 61
  6. 6. Medidas de Dispersão As medidas de localização não caracterizam a dispersão ou a variabilidade dos dados. É então necessário considerar medidas de estatísticas que descrevam tal dispersão, pois ela desempenha um papel importante na explicação de um fenómeno ou acontecimento. A amplitude, a variância e o desvio padrão são normalmente conhecidos como medidas de dispersão. www.joaoleal.net Professor: João José Leal 62
  7. 7. Amplitude total Num conjunto de dados chama-se amplitude total ou apenas amplitude à diferença entre o maior e o menor valor da variável. Se os dados estão agrupados em classes, a amplitude é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. www.joaoleal.net Professor: João José Leal 63
  8. 8. Exemplos: 1. As notas do João nas disciplinas de português, Filosofia, Matemática e Inglês foram: 10 16 18 8 O maior destes valores é 18 e o menor é 8. Deste modo, a amplitude do conjunto de dados é: A = 18 - 8 = 10 2. Considerando o exemplo do levantamento da área total das divisões de cada uma das casas de uma aldeia e os resultados forma os seguintes: Classes fi [50, 100[ 25 [100, 150[ 55 A  300  50  250 [150, 200[ 92 [200, 250[ 71 [250, 300[ 57 Total 300 www.joaoleal.net Professor: João José Leal 64
  9. 9. Amplitude interquartis é a diferença entre o 3º e o 1º quartis e representa-se por: AQx = Q3 – Q1 Esta medida é mais útil do que a amplitude, pois dá-nos informação sobre a amplitude do intervalo em que se encontram 50 % das observações centrais www.joaoleal.net Professor: João José Leal 65
  10. 10. Propriedades: www.joaoleal.net Professor: João José Leal 66
  11. 11. Variância A medida de dispersão mais utilizada é o desvio- padrão. No entanto, para obter o desvio- padrão temos de determinar primeiro a variância. Variância: Sendo x1, x2, ..., xn os n valores de um variável quantitativa e x a média, chama-se variância, e representa-se por 2 n ao valor dado pela fórmula:   xi  x  2 Para dados não classificados: 2  i 1 n n  fi  xi  x  2 Para dados classificados: 2  i 1 n www.joaoleal.net Professor: João José Leal 67
  12. 12. Exemplo: Exemplo: Observe o conjunto de dados correspondentes às classificações obtidas no 9º ano, em cinco testes, por dois irmãos: o José e a Maria. Vamos calcular, para cada um dos conjuntos de dados, a variância. Começa-se por calcular a média: www.joaoleal.net Professor: João José Leal 68
  13. 13. José: Maria: 2333 4 1 2  3  4  5 x 3 x 3 5 5  23  33  33  33  43 2 2 2 2 2 13  2 3  33  4 3  53 2 2 2 2 2  2   2   5 5  1 02 02 02 12 2  2  1  0 1  2 2 2 2 2 2  0,4  2 5 5 www.joaoleal.net Professor: João José Leal 69
  14. 14. Ou, relativamente às notas da Maria nós tínhamos: xi fi xi  x  xi  x  2 f i  xi  x  2 2 1 2-3 = -1  1  1 2 1 1  1 3 3 3-3 = 0 02  0 3 0  0 4 1 4-3 = 1 12  1 1 1  1  f x  x 2 2 Total 5 i i Assim, 2    0, 4 2 5 www.joaoleal.net Professor: João José Leal 70
  15. 15. Desvio-padrão: O desvio-padrão, que se representa por  , é igual à raiz quadrada positiva da variância, ou seja: • Para dados não classificados: n   xi  x  2  i 1 n • Para dados classificados: n  f i  xi  x  2  i 1 n www.joaoleal.net Professor: João José Leal 71
  16. 16. Exemplo: Exemplo: Considerando as notas do José e da Maria, o desvio-padrão seria, respectivamente:   2  1, 4 1c.d  e   0, 4  0,6 1c.d  www.joaoleal.net Professor: João José Leal 72
  17. 17. Propriedades do desvio-padrão desvio- •O desvio-padrão é sempre não negativo. •Quanto maior for o desvio-padrão maior será a dispersão dos dados em relação à média. •Se o desvio-padrão é igual a zero é porque não existe variabilidade, isto é, os dados são todos iguais. www.joaoleal.net Professor: João José Leal 73
  18. 18. Distribuições bidimensionais No estudo da estatística, até agora desenvolvido, estudámos variáveis estatísticas isoladamente, isto é, a cada observação correspondia um registo e depois eram trabalhados esses registos. A variável estatística era unidimensional. www.joaoleal.net Professor: João José Leal 74
  19. 19. Assim, Definição de distribuição unidimensional: É aquela em que a observação é apenas feita atendendo a uma variável. Porém, o que se pretende estudar da população não é só essa variável, mas sim averiguar se há alguma relação entre duas ou mais características da população. www.joaoleal.net Professor: João José Leal 75
  20. 20. Definição de distribuição bidimensional: Quando a população é estudada relativamente a duas variáveis. Nota: Quando se pretende estudar duas características ao mesmo tempo, a cada observação correspondem dois valores. Assim, os valores aparecem como pares ordenados (x, y). www.joaoleal.net Professor: João José Leal 76
  21. 21. Exemplos deste tipo de situações: Averiguar se há uma relação entre: 1) o peso e a altura dos alunos de uma determinada turma; 2) as alturas dos progenitores e dos seus filhos adultos. www.joaoleal.net Professor: João José Leal 77
  22. 22. Relação funcional: É quando existe uma relação exacta entre duas variáveis, isto é, é possível determinar com precisão a relação existente entre duas variáveis. Exemplo: A área de um quadrado e o comprimento do seu lado. Estas duas variáveis estão relacionadas, a relação que as liga é bem definida, invariável e pode ser traduzida pela expressão matemática: A=l2, representando A a área e l o lado. Podemos, assim dizer que esta relação permite determinar, com a precisão desejada, a área de um quadrado a partir do comprimento do seu lado ou vice-versa. www.joaoleal.net Professor: João José Leal 78
  23. 23. Relação estatística: É quando a relação é menos precisa, mais vaga, e sujeita a mais variações. Exemplo: As idades dos cônjuges na data do casamento. A idade do marido, não pode ser determinada com exactidão a partir da idade da mulher. Pois, o que se pode dizer é que em média quanto mais velho é o marido mais velha será também a mulher. No entanto, em alguns casos, o marido pode ser mais novo ou ter a mesma idade da mulher. www.joaoleal.net Professor: João José Leal 79
  24. 24. Assim, perante dois fenómenos quaisquer, pode-se afirmar que ou estão ligados através de uma relação funcional ou de uma relação estatística, ou não estão ligados através de qualquer relação. No caso da ausência de qualquer relação entre dois fenómenos, estes dizem-se independentes. www.joaoleal.net Professor: João José Leal 80
  25. 25. Diagrama de dispersão Definição: Chama-se diagrama de dispersão a uma nuvem de pontos obtidos após a representação num sistema de eixos dos pontos correspondentes aos pares ordenados (x, y) [as duas variáveis]. y x www.joaoleal.net Professor: João José Leal 81
  26. 26. Correlação linear ou Coeficiente de correlação Quando se observa um diagrama de dispersão, intuitivamente é-se levado a afirmar que existe ou não existe a possibilidade de qualquer relação entre as variáveis. Se os pontos se concentrarem à volta de uma linha recta é porque existe uma relação entre as variáveis (correlação linear). Definição de correlação: A correlação é a teoria que estuda a intensidade da relação ou a dependência entre as duas variáveis de uma distribuição bidimensional. www.joaoleal.net Professor: João José Leal 82
  27. 27. Observem-se alguns tipos de correlação: www.joaoleal.net Professor: João José Leal 83
  28. 28. A intensidade da relação existente entre as variáveis x e y pode ser quantificada. Para quantificar essa relação Pearson propôs o coeficiente de correlação linear de Pearson. www.joaoleal.net Professor: João José Leal 84
  29. 29. O coeficiente de correlação é um número do intervalo [-1, 1] e é representado por r ou rxy e definido por: n   x  x  y  y  i i r i 1 n n  x  x   y  y  2 2 i i i 1 i 1 sendo xi valores das observações de uma das variáveis, yi os valores das observações correspondentes da outra variável, x éa média das observações de xi e y é a média das observações de yi. www.joaoleal.net Professor: João José Leal 85
  30. 30. Conhecido o valor de r avalia-se a intensidade da correlação de acordo com a seguinte escala. www.joaoleal.net Professor: João José Leal 86
  31. 31. Ou graficamente, www.joaoleal.net Professor: João José Leal 87
  32. 32. www.joaoleal.net Professor: João José Leal 88
  33. 33. Recta de regressão. Considerem-se os seguintes diagramas de dispersão: Figura 1: Todos os pontos do diagrama de dispersão estão sobre uma recta, o que significa que existe um ajustamento perfeito entre os pontos da recta. Esta situação representa graficamente uma relação funcional. www.joaoleal.net Professor: João José Leal 89
  34. 34. Figura 2: Verifica-se que os pontos se situam em torno de uma recta imaginária que passa através da nuvem de pontos. www.joaoleal.net Professor: João José Leal 90
  35. 35. Figura 3: A linha que se ajusta à nuvem é uma parábola. www.joaoleal.net Professor: João José Leal 91
  36. 36. Figura 4: As variáveis não estão relacionadas. A dispersão dos pontos é muito irregular. www.joaoleal.net Professor: João José Leal 92
  37. 37. Notas: 1. A recta de regressão pode ser definida por uma equação ( yaxb ). 2. Vantagem do conhecimento da recta de regressão: Permite determinar uma estimativa do valor de uma das variáveis conhecido o valor da outra variável. www.joaoleal.net Professor: João José Leal 93
  38. 38. 3. A recta de regressão contém o ponto ( x , y ) , sendo x e y as médias das variáveis x e y, respectivamente. Este conhecimento permite construir a recta com um menor erro. www.joaoleal.net Professor: João José Leal 94
  39. 39. Medidas de assimetria Assimetria O método mais simples de reconhecer a assimetria de uma distribuição consiste na observação das posições relativas da média, mediana e moda e na comparação dos seus valores. x = Me = Mo Mo < Me < x x < Me < Mo simetria assimetria positiva assimetria negativa x – Mo = 0 x – Mo > 0 x – Mo < 0 www.joaoleal.net Professor: João José Leal 95
  40. 40. Exercícios: 1. A temperatura média anual e a latitude das capitais dos países da EU aproximadamente a seguinte: Capitais Temperatura Latitude (º) (ºC) Lisboa 19 39 Madrid 19 40 Paris 15 49 Londres 14 53 Amesterdão 13 54 Bruxelas 14 52 Luxemburgo 14 50 Bona 13 52 Roma 22 42 Atenas 24 37 Dublin 13 53 Copenhaga 11 54 www.joaoleal.net Professor: João José Leal 96
  41. 41. 1.1 Calcule a média das variáveis temperatura e latitude. 1.2 Desenhe o diagrama de dispersão e a recta de regressão passando no ponto x , y  Capitais Temperatura Latitude (ºC) (º) Lisboa 19 39 Madrid 19 40 Paris 15 49 Londres 14 53 Amesterdão 13 54 Bruxelas 14 52 Luxemburgo 14 50 Bona 13 52 Roma 22 42 Atenas 24 37 Dublin 13 53 Copenhaga 11 54 www.joaoleal.net Professor: João José Leal 97

×