Aula 1: Bioestatística
Caroline Godoy
Turma: Graduação em Educação Física
Objetivo da disciplina
• Coletar e sumarizar os dados experimentais a
  fim de facilitar sua análise e comunicação;

• Calcular e interpretar as principais medidas de
  posição e dispersão;

• Descrever graficamente dados coletados;

• Inferir resultados da análise amostral para o
  universo de interesse.
Ementa
•   Estatística descritiva;
•   Noções de cálculo de probabilidade;
•   Distribuições de probabilidades;
•   Amostragem;
•   Estimação de parâmetros;
•   Teste de hipótese;
•   Testes de associação;
•   Correlação e regressão linear simples.
Critérios de avaliação
• Média de 2 provas (MP);

• Média de 2 trabalhos (MT);

          MF     MP * 0,7 MT * 0,3

                    70%            30%
              P1 40% e P2 30%
• Sub da menor nota ou um trabalho.
Bibliografia
• Estatística Básica – Wilton Bussab (foi professor
  da FGV e USP) e Pedro A. Morettin (Professor
  da USP);
• Curso prático de bioestatística – Bernardo
  Beiguelman (professor da UNICAMP);
• Introdução à bioestatística – Sônia Vieira;
• Estatística – Costa Neto;
• Bioestatística – Berquó.
                         ...
A origem da estatística
• 2000 a.C. – registros fornecimento de dados
  demográficos e econômicos pelos egípcios;

 ▫ Originou-se da palavra Estado

• Século XVII – Desenvolvimento da teoria das
  probabilidades;
O QUE É?

A Bioestatística
• Bioestatística – aplicação da estatística no campo
  biológico e médico;

• Exemplo: avaliar a comparação de pessoas fumantes e
  não fumantes em relação aos batimentos cardíacos;

• O Sistema V.I.S. (Volley-Ball Information
  System), é uma forma estatística, pelo método de coleta
  de dados, com orientação, descrição e análise, com a
  interpretação de dados qualitativos, baseando na
  utilização dos dados para a tomada correta de decisão, e
  é usada para calcular as habilidades individuais no
  decorrer de uma partida de voleibol;
O que é a ciência da estatística?
• É uma ciência que se dedica à coleta, análise e
  interpretação de dados;

• A estatística pode responder questões como:
 ▫ Como pesquisadores testam a eficiência de novas
   drogas?
 ▫ Como será o comportamento de uma determinada
   característica daqui à algum tempo?
Estatística Descritiva




Variáveis
• São características as quais temos interesses:
  peso, altura, nro de batimentos
  cardíacos, velocidade, sexo, ...

 ▫ Qualitativas – ideia de qualidade

 ▫ Quantitativas – ideia de quantidade
Estatística Descritiva




Variáveis Qualitativas
• Variável qualitativa nominal
 ▫ Não existe ordem nos possíveis resultados
    Ex: Sexo (Feminino e Masculino)



• Variável qualitativa ordinal
 ▫ Existe uma ordem nos resultados
    Ex: Classe social (Alta, Média e Baixa)
Estatística Descritiva




Variáveis Quantitativas
• Variável quantitativa discreta
 ▫ Valores finitos, contáveis
    Ex: Número de filhos (0, 1, 2,...)



• Variável quantitativa contínua
 ▫ Valores que resultam de uma medição em um
   intervalo
     Ex: Salário (R$1.200,30, R$900,00,...)
Estatística Descritiva




Exercício: Variáveis
• Grau de instrução - Qualitativa ordinal
• Cor dos olhos       - Qualitativa nominal
• Nro de defeitos em aparelhos de TV
                      - Quantitativa discreta
• Velocidade da corrida de um atleta em Km/h
                     - Quantitativa contínua
• Local de nascimento- Qualitativa nominal
Estatística Descritiva




                                           Parte +

Levantamento de dados                    importante!!!



1. Definição da necessidade (identificação dos
   objetivos e populações);
2. Coleta das informações (Como?)
3. Planejamento e seleção da amostra
4. Processo de coleta de dados (campo)
5. Processamento dos dados
6. Análise dos dados
Estatística Descritiva



Apresentação dos dados
• Gráfica
  ▫ Variáveis Qualitativas:




         Gráfico de                     Gráfico de
          Barras Grau de instrução        Pizza
  ▫ Variáveis Quantitativas




            Gráfico de
             Barras                     Histograma
              Idade                  Nível de Colesterol
Estatística Descritiva




EXEMPLO
Estatística Descritiva



  Apresentação dos dados - EX
     ▫ Variáveis Quantitativas - Histograma:

            INTERESSE: Aspectos socioeconômicos dos empregados da seção
            de orçamentos da companhia MB


                   Classes de      Ponto                     Porcentagem
                                             Frequência
                    Salários       Médio                          %
                  4,00 |- 8,00      6,00          10              27,78
Diferença
                  8,00 |- 12,00     10,00         12              33,33
de mesmo
tamanho           12,00 |- 16,00    14,00         8               22,22
                  16,00 |- 20,00    18,00         5               13,89
                 20,00 |- 24,00    22,00          1               2,78
                      Total          ---          36             100,00


                                                                             * Fazer a mão
Estatística Descritiva



Apresentação dos dados
• Portal Action – Software Livre de conexão R + Excel
Estatística Descritiva



Apresentação dos dados
 ▫ Variáveis Quantitativas - Histograma:
                             Histogram of Dataset
                   10
                   8
       Frequency

                   6
                   4
                   2
                   0




                        5   10            15        20

                                    Dataset
Estatística Descritiva




Apresentação dos dados
• Tabelas: A tabela é um quadro que resume um conjunto
  de observações. Compõe-se de:
  ▫ corpo: linhas e colunas que contém os valores
    das variáveis em estudo.
  ▫ cabeçalho: parte superior que especifica o
    conteúdo das colunas.
  ▫ coluna indicadora: coluna que indica o
    conteúdo das linhas.
  ▫ casa ou célula: espaço destinado a uma só
    informação.
  ▫ título: conjunto de informações sobre a tabela
    (O quê? Quando? Onde?) localizada no topo da
    tabela.
                                                   *Ferrari , 2004
Estatística Descritiva




Apresentação dos dados
• Tabelas




                                *Ferrari , 2004
Estatística Descritiva




Apresentação dos dados
• Normas para células
  ▫ usar um traço horizontal (—) quando o valor é
    nulo quanto à natureza das coisas ou resultado do
    inquérito;
  ▫ três pontos (...) quando não temos dados;
  ▫ um ponto de interrogação (?) quando temos
    dúvida quanto à exatidão do valor;
  ▫ zero (0; 0,0; 0,00) quando o valor é muito
    pequeno para ser expresso pela grandeza
    utilizada.


                                                   *Ferrari , 2004
Estatística Descritiva




Tipos de Frequências
• Distribuição de frequências – número de ocorrências de
  uma determinada realização;

  ▫ Dados absolutos – dados originais;

  ▫ Dados relativos – provem de um quociente;

                        Frequência       Frequência
          Grau de
                         absoluta          relativa
         Instrução
                            ni                %
        Fundamental         650            32,50
           Médio           1.020           51,00
          Superior          330            16,50
            Total          2.000           100,00
Estatística Descritiva




Medidas de Tendência Central

• Uma outra forma de resumir os dados;

• As medidas mais conhecidas na estatística;

• Também chamadas de medidas de posição ou
  localização central;
Estatística Descritiva




Medidas de Tendência Central
                 • Realização mais frequente
      Moda       • Pode ser bimodal ou trimodal,...


                 • Indica a posição central da série
     Mediana       de observações



      Média      • Soma das observações dividido
                   pelo número delas
    aritmética
      Média      • Pesos atribuídos nos valores

    ponderada
Estatística Descritiva




Medidas de Tendência Central
OBSERVAÇÕES:

• Variáveis nominais  MODA

• Variáveis ordinais  MODA ou MEDIANA

• Variáveis quantitativas  MÉDIA ARITMÉTICA
  e MÉDIA PONDERADA
Estatística Descritiva




Medidas de Tendência Central
• Moda - Exemplo: Tabela de Frequências do
  número de filhos dos empregados da companhia
  MB
                     Frequência   Frequência
      Nº de filhos    absoluta      relativa
                         ni            %
           0             4           20
           1             5            25
           2             7            35
           3             3            15
           4             0            0
           5             1            5
         Total          20           100
Estatística Descritiva




Medidas de Tendência Central
• Mediana - Exemplo: Tabela de Frequências do
  número de filhos dos empregados da companhia
  MB
• Ordenando os dados
                               md= 2

  0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5

                         20


• n é par então soma-se os valores centrais e
  divide por 2
Estatística Descritiva




    Medidas de Tendência Central
    • Média - Exemplo: Tabela de Frequências do
      número de filhos dos empregados da companhia
      MB
    0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5
x                                           1,65 2
                       20

                              ou



                4 * 0 5 * 1 7 * 2 3 * 3 1* 5
            x                                1,65 2
                             20
Estatística Descritiva




Medidas de Tendência Central
• Média – Leva em consideração todos os
  elementos da distribuição e por isso fica
  influenciada pelos valores extremos.
                   N                              N
                           xi                          f i xi
                   i 1                           i 1
População
                                  ponderada
                       N                               N
                   n                              n
                           xi                          f i xi
                   i 1                           i 1
Amostra       x                 x ponderada
                       n                               n
                                      *variável, população e amostra
Estatística Descritiva




Medidas de Variabilidade (dispersão)

• A medida central esconde a informação sobre a
  variabilidade do conjunto de observações

• O objetivo é analisar os desvios das observações
  em relação à média dessas observações
Estatística Descritiva




Medidas de Variabilidade (dispersão)
• Desvio:   di     xi         x
                                   n
                                         ( xi   x)                  A soma porém
                                                                    sempre dá zero
• Desvio Médio:     dm             i 1
                                           n
                                                     n
                                                                                Não foi
                                                         | ( xi   x) |         usual para
• Desvio Médio Absoluto: d m                     i 1                           aplicações
                                                             n                  práticas

                        n
                            ( xi       x )2               É n-1 porque é um
                                                         grau de liberdade da
• Variância: S 2    i 1
                                                                amostra
                            n 1                          Se a u.m. é m fica m2
Estatística Descritiva




Medidas de Variabilidade (dispersão)
• Coeficiente de Variação (dispersão relativa):
              S                  S *100
        CV         ou     CV            %
              x                     x
 ▫ Compara o valor da homogeneidade de uma
   distribuição em relação a outra (variabilidade dos
   dados em relação à média)
 ▫ Quanto menor melhor, mais homogêneo
Estatística Descritiva




Medidas de Variabilidade (dispersão)
• Quantis (são melhores para avaliar os dados sem
  considerar valores extremos e dar ideia de
  simetria)
 ▫ A mediana é um tipo de quartil

• Q(0,25): 1º Quartil;
• Q(0,50): Mediana;            Para uma distribuição
                           simétrica ou aprox. simétrica,
• Q(0,75): 3º Quartil.     as diferenças entre mediana e
                             q1 e q3 devem ser menores
                            que a diferença entre q1 e q3
            Pode ser
            alterado
Estatística Descritiva




Medidas de Variabilidade (dispersão)




                     50% das
                   observações




    x(1)      q1       q2        q3      x(n)
Estatística Descritiva




 Medidas de Variabilidade (dispersão)

       3
         dq
       2
              q3



dq   q3 q1    q2=mediana



              q3

       3
         dq
       2

                           *
Estatística Descritiva




Exercícios
• Considerando a série abaixo calcule:

               5 8 4 10 5 9 6 7 3

• Moda?    5


• Mediana? 6

• Média aritmética? 6,33
Estatística Descritiva




Exercícios
• Supondo que as notas dos alunos de Educação
  Física sejam consideradas com pesos:

              P1 = 4 ; P2 = 3 ; P3 = 3

• Se fulano tirou respectivamente: 7 , 6 e 3, então
  a nota final seria dada por:


                        5,5
Estatística Descritiva




Exercícios
• Considerando o conjunto de dados abaixo,
  calcular:

• Variância: 2,2857

• Desvio Padrão:   1,5119


• Média: 7,4286

• Coeficiente de Variação: 20%
Estatística Descritiva




Próxima aula – 05/05/2012
• Noções de Cálculos de Probabilidades

• Variáveis Aleatórias

• Distribuição de probabilidades

Aula 1 - Bioestatística

  • 1.
    Aula 1: Bioestatística CarolineGodoy Turma: Graduação em Educação Física
  • 2.
    Objetivo da disciplina •Coletar e sumarizar os dados experimentais a fim de facilitar sua análise e comunicação; • Calcular e interpretar as principais medidas de posição e dispersão; • Descrever graficamente dados coletados; • Inferir resultados da análise amostral para o universo de interesse.
  • 3.
    Ementa • Estatística descritiva; • Noções de cálculo de probabilidade; • Distribuições de probabilidades; • Amostragem; • Estimação de parâmetros; • Teste de hipótese; • Testes de associação; • Correlação e regressão linear simples.
  • 4.
    Critérios de avaliação •Média de 2 provas (MP); • Média de 2 trabalhos (MT); MF MP * 0,7 MT * 0,3 70% 30% P1 40% e P2 30% • Sub da menor nota ou um trabalho.
  • 5.
    Bibliografia • Estatística Básica– Wilton Bussab (foi professor da FGV e USP) e Pedro A. Morettin (Professor da USP); • Curso prático de bioestatística – Bernardo Beiguelman (professor da UNICAMP); • Introdução à bioestatística – Sônia Vieira; • Estatística – Costa Neto; • Bioestatística – Berquó. ...
  • 6.
    A origem daestatística • 2000 a.C. – registros fornecimento de dados demográficos e econômicos pelos egípcios; ▫ Originou-se da palavra Estado • Século XVII – Desenvolvimento da teoria das probabilidades;
  • 7.
    O QUE É? ABioestatística • Bioestatística – aplicação da estatística no campo biológico e médico; • Exemplo: avaliar a comparação de pessoas fumantes e não fumantes em relação aos batimentos cardíacos; • O Sistema V.I.S. (Volley-Ball Information System), é uma forma estatística, pelo método de coleta de dados, com orientação, descrição e análise, com a interpretação de dados qualitativos, baseando na utilização dos dados para a tomada correta de decisão, e é usada para calcular as habilidades individuais no decorrer de uma partida de voleibol;
  • 9.
    O que éa ciência da estatística? • É uma ciência que se dedica à coleta, análise e interpretação de dados; • A estatística pode responder questões como: ▫ Como pesquisadores testam a eficiência de novas drogas? ▫ Como será o comportamento de uma determinada característica daqui à algum tempo?
  • 10.
    Estatística Descritiva Variáveis • Sãocaracterísticas as quais temos interesses: peso, altura, nro de batimentos cardíacos, velocidade, sexo, ... ▫ Qualitativas – ideia de qualidade ▫ Quantitativas – ideia de quantidade
  • 11.
    Estatística Descritiva Variáveis Qualitativas •Variável qualitativa nominal ▫ Não existe ordem nos possíveis resultados Ex: Sexo (Feminino e Masculino) • Variável qualitativa ordinal ▫ Existe uma ordem nos resultados Ex: Classe social (Alta, Média e Baixa)
  • 12.
    Estatística Descritiva Variáveis Quantitativas •Variável quantitativa discreta ▫ Valores finitos, contáveis Ex: Número de filhos (0, 1, 2,...) • Variável quantitativa contínua ▫ Valores que resultam de uma medição em um intervalo Ex: Salário (R$1.200,30, R$900,00,...)
  • 13.
    Estatística Descritiva Exercício: Variáveis •Grau de instrução - Qualitativa ordinal • Cor dos olhos - Qualitativa nominal • Nro de defeitos em aparelhos de TV - Quantitativa discreta • Velocidade da corrida de um atleta em Km/h - Quantitativa contínua • Local de nascimento- Qualitativa nominal
  • 14.
    Estatística Descritiva Parte + Levantamento de dados importante!!! 1. Definição da necessidade (identificação dos objetivos e populações); 2. Coleta das informações (Como?) 3. Planejamento e seleção da amostra 4. Processo de coleta de dados (campo) 5. Processamento dos dados 6. Análise dos dados
  • 15.
    Estatística Descritiva Apresentação dosdados • Gráfica ▫ Variáveis Qualitativas: Gráfico de Gráfico de Barras Grau de instrução Pizza ▫ Variáveis Quantitativas Gráfico de Barras Histograma Idade Nível de Colesterol
  • 16.
  • 17.
    Estatística Descritiva Apresentação dos dados - EX ▫ Variáveis Quantitativas - Histograma: INTERESSE: Aspectos socioeconômicos dos empregados da seção de orçamentos da companhia MB Classes de Ponto Porcentagem Frequência Salários Médio % 4,00 |- 8,00 6,00 10 27,78 Diferença 8,00 |- 12,00 10,00 12 33,33 de mesmo tamanho 12,00 |- 16,00 14,00 8 22,22 16,00 |- 20,00 18,00 5 13,89 20,00 |- 24,00 22,00 1 2,78 Total --- 36 100,00 * Fazer a mão
  • 18.
    Estatística Descritiva Apresentação dosdados • Portal Action – Software Livre de conexão R + Excel
  • 19.
    Estatística Descritiva Apresentação dosdados ▫ Variáveis Quantitativas - Histograma: Histogram of Dataset 10 8 Frequency 6 4 2 0 5 10 15 20 Dataset
  • 20.
    Estatística Descritiva Apresentação dosdados • Tabelas: A tabela é um quadro que resume um conjunto de observações. Compõe-se de: ▫ corpo: linhas e colunas que contém os valores das variáveis em estudo. ▫ cabeçalho: parte superior que especifica o conteúdo das colunas. ▫ coluna indicadora: coluna que indica o conteúdo das linhas. ▫ casa ou célula: espaço destinado a uma só informação. ▫ título: conjunto de informações sobre a tabela (O quê? Quando? Onde?) localizada no topo da tabela. *Ferrari , 2004
  • 21.
    Estatística Descritiva Apresentação dosdados • Tabelas *Ferrari , 2004
  • 22.
    Estatística Descritiva Apresentação dosdados • Normas para células ▫ usar um traço horizontal (—) quando o valor é nulo quanto à natureza das coisas ou resultado do inquérito; ▫ três pontos (...) quando não temos dados; ▫ um ponto de interrogação (?) quando temos dúvida quanto à exatidão do valor; ▫ zero (0; 0,0; 0,00) quando o valor é muito pequeno para ser expresso pela grandeza utilizada. *Ferrari , 2004
  • 23.
    Estatística Descritiva Tipos deFrequências • Distribuição de frequências – número de ocorrências de uma determinada realização; ▫ Dados absolutos – dados originais; ▫ Dados relativos – provem de um quociente; Frequência Frequência Grau de absoluta relativa Instrução ni % Fundamental 650 32,50 Médio 1.020 51,00 Superior 330 16,50 Total 2.000 100,00
  • 24.
    Estatística Descritiva Medidas deTendência Central • Uma outra forma de resumir os dados; • As medidas mais conhecidas na estatística; • Também chamadas de medidas de posição ou localização central;
  • 25.
    Estatística Descritiva Medidas deTendência Central • Realização mais frequente Moda • Pode ser bimodal ou trimodal,... • Indica a posição central da série Mediana de observações Média • Soma das observações dividido pelo número delas aritmética Média • Pesos atribuídos nos valores ponderada
  • 26.
    Estatística Descritiva Medidas deTendência Central OBSERVAÇÕES: • Variáveis nominais  MODA • Variáveis ordinais  MODA ou MEDIANA • Variáveis quantitativas  MÉDIA ARITMÉTICA e MÉDIA PONDERADA
  • 27.
    Estatística Descritiva Medidas deTendência Central • Moda - Exemplo: Tabela de Frequências do número de filhos dos empregados da companhia MB Frequência Frequência Nº de filhos absoluta relativa ni % 0 4 20 1 5 25 2 7 35 3 3 15 4 0 0 5 1 5 Total 20 100
  • 28.
    Estatística Descritiva Medidas deTendência Central • Mediana - Exemplo: Tabela de Frequências do número de filhos dos empregados da companhia MB • Ordenando os dados md= 2 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 20 • n é par então soma-se os valores centrais e divide por 2
  • 29.
    Estatística Descritiva Medidas de Tendência Central • Média - Exemplo: Tabela de Frequências do número de filhos dos empregados da companhia MB 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 x 1,65 2 20 ou 4 * 0 5 * 1 7 * 2 3 * 3 1* 5 x 1,65 2 20
  • 30.
    Estatística Descritiva Medidas deTendência Central • Média – Leva em consideração todos os elementos da distribuição e por isso fica influenciada pelos valores extremos. N N xi f i xi i 1 i 1 População ponderada N N n n xi f i xi i 1 i 1 Amostra x x ponderada n n *variável, população e amostra
  • 31.
    Estatística Descritiva Medidas deVariabilidade (dispersão) • A medida central esconde a informação sobre a variabilidade do conjunto de observações • O objetivo é analisar os desvios das observações em relação à média dessas observações
  • 32.
    Estatística Descritiva Medidas deVariabilidade (dispersão) • Desvio: di xi x n ( xi x) A soma porém sempre dá zero • Desvio Médio: dm i 1 n n Não foi | ( xi x) | usual para • Desvio Médio Absoluto: d m i 1 aplicações n práticas n ( xi x )2 É n-1 porque é um grau de liberdade da • Variância: S 2 i 1 amostra n 1 Se a u.m. é m fica m2
  • 33.
    Estatística Descritiva Medidas deVariabilidade (dispersão) • Coeficiente de Variação (dispersão relativa): S S *100 CV ou CV % x x ▫ Compara o valor da homogeneidade de uma distribuição em relação a outra (variabilidade dos dados em relação à média) ▫ Quanto menor melhor, mais homogêneo
  • 34.
    Estatística Descritiva Medidas deVariabilidade (dispersão) • Quantis (são melhores para avaliar os dados sem considerar valores extremos e dar ideia de simetria) ▫ A mediana é um tipo de quartil • Q(0,25): 1º Quartil; • Q(0,50): Mediana; Para uma distribuição simétrica ou aprox. simétrica, • Q(0,75): 3º Quartil. as diferenças entre mediana e q1 e q3 devem ser menores que a diferença entre q1 e q3 Pode ser alterado
  • 35.
    Estatística Descritiva Medidas deVariabilidade (dispersão) 50% das observações x(1) q1 q2 q3 x(n)
  • 36.
    Estatística Descritiva Medidasde Variabilidade (dispersão) 3 dq 2 q3 dq q3 q1 q2=mediana q3 3 dq 2 *
  • 37.
    Estatística Descritiva Exercícios • Considerandoa série abaixo calcule: 5 8 4 10 5 9 6 7 3 • Moda? 5 • Mediana? 6 • Média aritmética? 6,33
  • 38.
    Estatística Descritiva Exercícios • Supondoque as notas dos alunos de Educação Física sejam consideradas com pesos: P1 = 4 ; P2 = 3 ; P3 = 3 • Se fulano tirou respectivamente: 7 , 6 e 3, então a nota final seria dada por: 5,5
  • 39.
    Estatística Descritiva Exercícios • Considerandoo conjunto de dados abaixo, calcular: • Variância: 2,2857 • Desvio Padrão: 1,5119 • Média: 7,4286 • Coeficiente de Variação: 20%
  • 40.
    Estatística Descritiva Próxima aula– 05/05/2012 • Noções de Cálculos de Probabilidades • Variáveis Aleatórias • Distribuição de probabilidades