FACULDADE TEOLOGIA E CIENTÍFICA DO
MARANHÃO-FATECMA
Estatística na educação
Prof.: Magno Fernando
População e Amostra
População e Amostra Estatística
População de uma Variável
É o universo de todas as ocorrências possíveis de um
fenômeno aleatório. A população é o conjunto total de dados
de uma realidade.
Amostra
É um subconjunto da população. Representa uma parte dos
dados da população.
Levantamento de dados
São as observações de uma amostra da população. Como é
impossível levantar todos os dados de uma população,
coletamos parte desta informação: amostra.
Objetivo da Estatística
Levantar dados amostrais para concluir (inferir ou generalizar)
sobre as características da realidade mais ampla: população.
Indução Estatística
Processo pelo qual assumimos que os dados da amostra são
iguais ao de toda população. Essa generalização é feita através
do cálculo das probabilidades.
População e Amostra Estatística
Amostra
População e Amostra Estatística
Amostragem
Amostragem
Amostragem
Seleção da Amostra
As amostras devem se escolhidas de modo a permitir calcular a
probabilidade de ocorrência de um evento.
Amostra Representativa
É aquela que tem as mesmas características da população de onde foi
retirada
Amostra Probabilística
É aquela cujo processo de amostragem permite atribuir a cada elemento
da amostra uma probabilidade semelhante à da população.
Amostragem Aleatória
É aquela em que cada um dos elementos da população tem a mesma
chance de ser selecionado no levantamento dos dados.
Amostragem
Tipos de Amostragem probabilística:
Amostragem casual simples com reposição
Os elementos da população entram mais de uma vez na amostra.
Amostragem casual simples sem reposição
Os elementos da população só podem entrar uma vez na amostra
Amostragem sistemática:
Seleção da amostra com base num critério: Um em cada dez.
Amostragem por conglomerados:
A amostra é selecionada por sorteio da área a ser pesquisada
Amostra estratificada ou em estágios múltiplos:
A amostra é dividida em grupos e selecionada por etapas dentro de
cada grupo: cidade/bairro/quadra
Experimentação
Experimento e Variável
• Experimento – É a observação sistemática de um
fenômeno (evento aleatório) qualquer da população.
• Variável – É o valor que o fenômeno assume, em
um experimento qualquer.
• Domínio da Variável – São todos os valores
possíveis que um fenômeno pode assumir em um
experimento.
• Variável Qualitativa (Atributo)
– a qualidade assumida pelo evento (fenômeno).
• Ex: O que Você acha das viagem de Carutapera a
Belém. bom, ruim, regular
Experimento e Variável
•Variável Quantitativa
– a medida da variação de um evento
(fenômeno)
•Ex: Qual é a idade média dos alunos da FATECMA
23, 24, 25, 40, 48
Experimento e Variável
• Variável Contínua – aquela que pode assumir qualquer
valor numa escala de valores (teoricamente infinitos
valores): Altura da pessoas.
• Variável Discreta – aquela cujos valores possíveis são
números inteiros (contagem): No. de alunos numa sala.
Variáveis contínuas e discretas
ESTATÍSTICA DESCRITIVA
Tabela de distribuição de frequência
• É a tabela utilizada na apresentação dos
dados de um determinado estudo
estatístico
• Variável estatística (xi)
• Frequência absoluta ( fi)
• Frequência relativa (fr%)
• Frequência acumulada (fac)
• Frequência relativa acumulada ( fac%)
Distribuição de Frequência
• Frequência de uma variável – é a quantidade de vezes
que a variável ocorre (evento). Em outras palavras, é a
frequência em que a variável assume um certo valor.
• Frequência de variáveis contínuas: É obtida
dividindo o conjunto de valores em intervalos de classe e
indicando a frequência dos valores observados para cada
intervalo.
• Intervalo de Classe – É o intervalo entre o valor máximo e
mínimo de uma variável. A cada intervalo de classe estão
associados os limites de classe (valores extremos) e o ponto
médio.
Frequência de uma Variável
Pesquisa realizada com os 200 alunos de uma universidade buscava
identificar as preferências por esportes. Foram fornecidas as seguintes de
opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe
os resultados:
Distribuição de Frequência
• Amplitude Total de uma série – É a extensão de variação
total da variável: A diferença entre valor maior da última classe e o
menor valor da primeira classe.
• Amplitude de Classe – É a diferença entre o valor máximo e
mínimo da variável dentro da classe.
• Ponto Médio de Intervalo de Classe = valor médio
limite inferior + limite superior
2
Distribuição de Frequência
Intervalos de Classe
6
15
25
16
7
0
5
10
15
20
25
30
1
A B C D E D
2626
Intervalo Limites Variáveis Freqüência
A
Inferior 10
6
Superior 20
B
Inferior 30
15
Superior 40
C
Inferior 50
25
Superior 60
D
Inferior 70
26
Superior 80
E
Inferior 90
16
Superior 100
D
Inferior 200
7
Superior 500
Variável Frequência
10 2
20 4
30 7
40 8
50 9
60 16
70 16
80 10
90 9
100 7
200 4
500 3
Variável: Quantidade de $ no bolso
Distribuição de Frequência
• Frequência Absoluta – Valor total das observações
• Frequência Relativa – Valor porcentual das observações
• Frequência Acumulada – Somatória das frequências de todos intervalos
Modalidade
Esportiva
Frequencia
Relativa
Frequência
Absoluta
Frequência
Acumulada
Frequência
Acumulada
Futebol 35% 70 70 35%
Vôlei 25% 50 120 60%
Basquete 20% 40 160 80%
Natação 10% 20 180 90%
Tênis 8% 15 195 98%
Ciclismo 2% 5 200 100%
100% 200 200 100%
Histograma
• Histograma: Gráfico das distribuições das frequências de
uma variável.
• Gráfico de Barras (Histograma) – Gráfico de
retângulos, diagrama de colunas; gráfico de áreas.
• Histograma – As frequências dos fenômenos são
proporcionais à superfície de cada retângulo que as
representam. Para intervalos de mesma amplitude as
frequências serão proporcionais às alturas
Processo de Elaboração do Histograma
• Organizar os dados em ordem crescente;
• Determinar a amplitude total;
• Dividir a amplitude total em um nº adequado de intervalos
de preferência com a mesma amplitude;
• O número mínimo de intervalos é 5, número máximo 20;
• Quando possível os pontos médios dos intervalos devem
coincidir com os valores realmente observados
Distribuição de Frequência
Histograma
• Distribuições Simétricas e Assimétricas - Os
histogramas podem apresentar distribuição simétricas ou
assimétricas. Indicadas nos slides a seguir,
• Polígono de Frequências – Unindo-se os valores
médios dos intervalos de classe, o histograma se
transforma num polígono de frequências. Pode-se então
comparar este polígono com uma curva teórica (Normal).
Distribuição de Frequência
Histograma
Variaveis Frequência
1 4
2 6
3 16
4 8
5 7
6 2
GRÁFICO DE FREQUÊNCIAS: Histograma
0
2
4
6
8
10
12
14
16
18
1 2 3 4 5 6
Categorias
Frequências
40-45 10
45-50 15
50-55 18
55-60 22
60-65 35
65-70 42
70-75 32
75-80 18
89-85 10
85-90 6
Total 208
Pesos
(x1)
Nº alunos
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
10
15
18
22
35
42
32
18
10
6
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
simétrico
40-45 35
45-50 42
50-55 32
55-60 24
60-65 20
65-70 17
70-75 15
75-80 10
89-85 10
85-90 6
Total 208
Pesos
(x1)
Nº alunos
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à esquerda
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico
40-45 5
45-50 8
50-55 12
55-60 15
60-65 17
65-70 21
70-75 24
75-80 29
89-85 42
85-90 35
Total 173
Pesos
(x1)
Nº alunos
(f1)
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à direita
0
5
10
15
20
25
30
35
40
45
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico
Medidas de Ordenamento ou Posição
Medidas de Tendência Central
• Valores Centrais ou Médias de uma Amostra – Valores
que indicam posição de centralidade, ou o ponto central da
distribuição.
• Média Aritmética Simples – Quociente da soma dos valores
observados, pelo número total de valores.
α = Σ xi i = 1.....n
n
Medida de Tendência Central
Levantamento
do peso
dos alunos
da classe
Observações Evento Observações Frequência
48 1
55 2 48 2
51 3 51 3
58 4 55 5
55 5 58 4
48 6 60 1
51 7
55 8 Média 54,4
58 9
51 10
55 11
58 12
60 13
55 14
58 15
Medidas de Tendência Central
• Média Aritmética Ponderada - Quando há valores que
se repetem mais que outros.
• α = Σ xi . fi
Σ fi
• Ex: α = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4
15
• Utilização: média de cálculo mais fácil. Valor médio
significativo por incluir todos os valores observados. Usada em
estatística para o cálculo do desvio padrão. Em probabilidade
esta média é chamada Esperança Matemática.
Medidas de Tendência Central
• Mediana – Medida de posição central. A mediana é o valor
que ocupa a posição central (meio) da distribuição.
• Série de valores com nº impar de termos
– Mediana = n + 1 /2
– Nº de termos 7
– Md = 7+1 = 8 / 2 = 4 (mediana é o 4º termo)
– Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11
• Série de valores com nº par de termos
– Mediana = n /2 + 1 e
– Mediana = n /2
– Nº de termos 8
– Md = 8/2 = 4 (mediana entre o 4º e 5 º termo)
– Md = 8/2+1 = 5
– Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5
• Utilização: |A mediana é usada quando a distribuição apresenta resultados
extremos muito discrepantes. A mediana não sofre a influência de valores
extremos
Medidas de Tendência Central
• Moda – Valor dominante de uma distribuição. Aquele que
numa série de valores se apresenta com a maior freqüência.
Um conjunto de valores pode apresentar mais de uma moda:
plurimodal.
Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50
Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5 (plurimodal)

Estatística na educação

  • 1.
    FACULDADE TEOLOGIA ECIENTÍFICA DO MARANHÃO-FATECMA Estatística na educação Prof.: Magno Fernando
  • 8.
  • 9.
    População e AmostraEstatística População de uma Variável É o universo de todas as ocorrências possíveis de um fenômeno aleatório. A população é o conjunto total de dados de uma realidade. Amostra É um subconjunto da população. Representa uma parte dos dados da população.
  • 10.
    Levantamento de dados Sãoas observações de uma amostra da população. Como é impossível levantar todos os dados de uma população, coletamos parte desta informação: amostra. Objetivo da Estatística Levantar dados amostrais para concluir (inferir ou generalizar) sobre as características da realidade mais ampla: população. Indução Estatística Processo pelo qual assumimos que os dados da amostra são iguais ao de toda população. Essa generalização é feita através do cálculo das probabilidades. População e Amostra Estatística
  • 12.
  • 13.
  • 16.
  • 18.
  • 19.
    Amostragem Seleção da Amostra Asamostras devem se escolhidas de modo a permitir calcular a probabilidade de ocorrência de um evento. Amostra Representativa É aquela que tem as mesmas características da população de onde foi retirada Amostra Probabilística É aquela cujo processo de amostragem permite atribuir a cada elemento da amostra uma probabilidade semelhante à da população. Amostragem Aleatória É aquela em que cada um dos elementos da população tem a mesma chance de ser selecionado no levantamento dos dados.
  • 20.
    Amostragem Tipos de Amostragemprobabilística: Amostragem casual simples com reposição Os elementos da população entram mais de uma vez na amostra. Amostragem casual simples sem reposição Os elementos da população só podem entrar uma vez na amostra Amostragem sistemática: Seleção da amostra com base num critério: Um em cada dez. Amostragem por conglomerados: A amostra é selecionada por sorteio da área a ser pesquisada Amostra estratificada ou em estágios múltiplos: A amostra é dividida em grupos e selecionada por etapas dentro de cada grupo: cidade/bairro/quadra
  • 21.
  • 22.
    Experimento e Variável •Experimento – É a observação sistemática de um fenômeno (evento aleatório) qualquer da população. • Variável – É o valor que o fenômeno assume, em um experimento qualquer. • Domínio da Variável – São todos os valores possíveis que um fenômeno pode assumir em um experimento.
  • 23.
    • Variável Qualitativa(Atributo) – a qualidade assumida pelo evento (fenômeno). • Ex: O que Você acha das viagem de Carutapera a Belém. bom, ruim, regular Experimento e Variável •Variável Quantitativa – a medida da variação de um evento (fenômeno) •Ex: Qual é a idade média dos alunos da FATECMA 23, 24, 25, 40, 48
  • 24.
    Experimento e Variável •Variável Contínua – aquela que pode assumir qualquer valor numa escala de valores (teoricamente infinitos valores): Altura da pessoas. • Variável Discreta – aquela cujos valores possíveis são números inteiros (contagem): No. de alunos numa sala.
  • 25.
  • 26.
  • 27.
    Tabela de distribuiçãode frequência • É a tabela utilizada na apresentação dos dados de um determinado estudo estatístico • Variável estatística (xi) • Frequência absoluta ( fi) • Frequência relativa (fr%) • Frequência acumulada (fac) • Frequência relativa acumulada ( fac%)
  • 28.
    Distribuição de Frequência •Frequência de uma variável – é a quantidade de vezes que a variável ocorre (evento). Em outras palavras, é a frequência em que a variável assume um certo valor. • Frequência de variáveis contínuas: É obtida dividindo o conjunto de valores em intervalos de classe e indicando a frequência dos valores observados para cada intervalo. • Intervalo de Classe – É o intervalo entre o valor máximo e mínimo de uma variável. A cada intervalo de classe estão associados os limites de classe (valores extremos) e o ponto médio.
  • 29.
    Frequência de umaVariável Pesquisa realizada com os 200 alunos de uma universidade buscava identificar as preferências por esportes. Foram fornecidas as seguintes de opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe os resultados:
  • 30.
    Distribuição de Frequência •Amplitude Total de uma série – É a extensão de variação total da variável: A diferença entre valor maior da última classe e o menor valor da primeira classe. • Amplitude de Classe – É a diferença entre o valor máximo e mínimo da variável dentro da classe. • Ponto Médio de Intervalo de Classe = valor médio limite inferior + limite superior 2
  • 31.
    Distribuição de Frequência Intervalosde Classe 6 15 25 16 7 0 5 10 15 20 25 30 1 A B C D E D 2626 Intervalo Limites Variáveis Freqüência A Inferior 10 6 Superior 20 B Inferior 30 15 Superior 40 C Inferior 50 25 Superior 60 D Inferior 70 26 Superior 80 E Inferior 90 16 Superior 100 D Inferior 200 7 Superior 500 Variável Frequência 10 2 20 4 30 7 40 8 50 9 60 16 70 16 80 10 90 9 100 7 200 4 500 3 Variável: Quantidade de $ no bolso
  • 32.
    Distribuição de Frequência •Frequência Absoluta – Valor total das observações • Frequência Relativa – Valor porcentual das observações • Frequência Acumulada – Somatória das frequências de todos intervalos Modalidade Esportiva Frequencia Relativa Frequência Absoluta Frequência Acumulada Frequência Acumulada Futebol 35% 70 70 35% Vôlei 25% 50 120 60% Basquete 20% 40 160 80% Natação 10% 20 180 90% Tênis 8% 15 195 98% Ciclismo 2% 5 200 100% 100% 200 200 100%
  • 33.
    Histograma • Histograma: Gráficodas distribuições das frequências de uma variável. • Gráfico de Barras (Histograma) – Gráfico de retângulos, diagrama de colunas; gráfico de áreas. • Histograma – As frequências dos fenômenos são proporcionais à superfície de cada retângulo que as representam. Para intervalos de mesma amplitude as frequências serão proporcionais às alturas
  • 34.
    Processo de Elaboraçãodo Histograma • Organizar os dados em ordem crescente; • Determinar a amplitude total; • Dividir a amplitude total em um nº adequado de intervalos de preferência com a mesma amplitude; • O número mínimo de intervalos é 5, número máximo 20; • Quando possível os pontos médios dos intervalos devem coincidir com os valores realmente observados Distribuição de Frequência Histograma
  • 35.
    • Distribuições Simétricase Assimétricas - Os histogramas podem apresentar distribuição simétricas ou assimétricas. Indicadas nos slides a seguir, • Polígono de Frequências – Unindo-se os valores médios dos intervalos de classe, o histograma se transforma num polígono de frequências. Pode-se então comparar este polígono com uma curva teórica (Normal). Distribuição de Frequência Histograma
  • 36.
    Variaveis Frequência 1 4 26 3 16 4 8 5 7 6 2 GRÁFICO DE FREQUÊNCIAS: Histograma 0 2 4 6 8 10 12 14 16 18 1 2 3 4 5 6 Categorias Frequências
  • 37.
    40-45 10 45-50 15 50-5518 55-60 22 60-65 35 65-70 42 70-75 32 75-80 18 89-85 10 85-90 6 Total 208 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA 10 15 18 22 35 42 32 18 10 6 0 5 10 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 simétrico
  • 38.
    40-45 35 45-50 42 50-5532 55-60 24 60-65 20 65-70 17 70-75 15 75-80 10 89-85 10 85-90 6 Total 208 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA Assimétrico à esquerda 0 5 10 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 assimétrico
  • 39.
    40-45 5 45-50 8 50-5512 55-60 15 60-65 17 65-70 21 70-75 24 75-80 29 89-85 42 85-90 35 Total 173 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA Assimétrico à direita 0 5 10 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 assimétrico
  • 40.
  • 41.
    Medidas de TendênciaCentral • Valores Centrais ou Médias de uma Amostra – Valores que indicam posição de centralidade, ou o ponto central da distribuição. • Média Aritmética Simples – Quociente da soma dos valores observados, pelo número total de valores. α = Σ xi i = 1.....n n
  • 42.
    Medida de TendênciaCentral Levantamento do peso dos alunos da classe Observações Evento Observações Frequência 48 1 55 2 48 2 51 3 51 3 58 4 55 5 55 5 58 4 48 6 60 1 51 7 55 8 Média 54,4 58 9 51 10 55 11 58 12 60 13 55 14 58 15
  • 43.
    Medidas de TendênciaCentral • Média Aritmética Ponderada - Quando há valores que se repetem mais que outros. • α = Σ xi . fi Σ fi • Ex: α = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4 15 • Utilização: média de cálculo mais fácil. Valor médio significativo por incluir todos os valores observados. Usada em estatística para o cálculo do desvio padrão. Em probabilidade esta média é chamada Esperança Matemática.
  • 44.
    Medidas de TendênciaCentral • Mediana – Medida de posição central. A mediana é o valor que ocupa a posição central (meio) da distribuição. • Série de valores com nº impar de termos – Mediana = n + 1 /2 – Nº de termos 7 – Md = 7+1 = 8 / 2 = 4 (mediana é o 4º termo) – Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11 • Série de valores com nº par de termos – Mediana = n /2 + 1 e – Mediana = n /2 – Nº de termos 8 – Md = 8/2 = 4 (mediana entre o 4º e 5 º termo) – Md = 8/2+1 = 5 – Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5 • Utilização: |A mediana é usada quando a distribuição apresenta resultados extremos muito discrepantes. A mediana não sofre a influência de valores extremos
  • 45.
    Medidas de TendênciaCentral • Moda – Valor dominante de uma distribuição. Aquele que numa série de valores se apresenta com a maior freqüência. Um conjunto de valores pode apresentar mais de uma moda: plurimodal. Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50 Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5 (plurimodal)