Dados

Ecologia de Populações
Prof. Dr. Harold Gordon Fowler
19-3526-4230
popecologia@hotmail.com

Ecologia de Populações

Análise de Dados

Resumo
 Organizando um estudo ecológico
 Terminologia básica de amostragem
 Análise Estatística de Dados
– Por que usar estatística?
– Descrição de dados
 Medidas de tendência
 Medidas de dispersão
 Distribuição Normal
 Usando Excel
– Produzindo tabelas
– Produzindo gráficos
– Análise de dados
– Testes Estatísticos
 Teste-T
 ANOVA
 Regressão

Organizando um estudo ecológico
 Qual é o propósito da pesquisa?
 Qual é a pergunta principal levantada?
 Quais são suas hipóteses?
 Coleta de dados
 Resumo dos dados em tabelas
 Apresentação gráfica dos dados
 Teste estatístico das hipóteses
 Análise dos resultados estatísticos
 Apresentação de uma conclusão para a
pergunta inicial

Terminologia Básica de
Amostragem
 Elemento
 Variáveis
 Populações
 Amostras
 Parâmetros
 Estatísticas

Elemento
A unidade sobre qual coletamos
informação.

Tipicamente um indivíduo, mas pode
ser outro grupo social, planta, colonia
microbiana, etc.

O que é um variável?
 Variável: qualquer
característica definida que
varia entre entes biológicas
ou físicas.
 Exemplos: altura de plantas.
Peso de aves, cor do olho
humano, número de espécies
de árvores
 Se um indivíduo é selecionado
aleatoriamente de uma
população, pode demonstrar
um peso, altura ou outra
característica própria.
 Se vários indivíduos são
selecionados, suas
características podem ser
muito similares ou muito
diferentes.

População

É o grupo sobre qual queremos
tirar conclusões

O que é uma população?
 População: a coleção
inteira de medidas do
variável de interesse.
 Exemplo: se temos
interesse nas alturas de
árvores de uma espécie em
um parque nacional (Altura
da planta é nosso variável)
então nossa população
consiste de todas as
árvores da espécie no
parque nacional .

Conceito Estatístico de uma população
Contagem, Freqüência
, Número

Característica

Amostra
Um ou mais elementos
(indivíduos) da população

O que é uma amostra?
 Amostra: grupos menores
ou sub-conjuntos da
população que são usados
para estimar a distribuição
de um variável dentro da
população verdadeira
 Exemplo: as alturas de 100
árvores de uma espécie
num parque nacional podem
ser usadas para estimar as
alturas das árvores da
população intera (que pode
ser de milhares de
indivíduos)

Amostra com viés

Means that those selected are not
typical or representative of the
larger population from which they
have been selected

Parâmetro

É uma descrição resumida de um
variável na população

O que é um parâmetro?
 Parâmetro:
qualquer medida
calculada usada
para descrever ou
caracterizar uma
população

 Exemplo: a altura
média de árvores
de uma espécie
num parque
nacional

Propósitos da Replicação

 Controle de erro aleatório ou estocástico
– fatores independentes não testados podem
determinar o resultado do experimento
 Aumenta a precisão do teste
 Aumenta a capacidade geral do teste
– Se examine muitos locais – você pode
generalizar com segurança para outros locais

Algumas Definições
 Replica = Amostra
– Maximize essas no desenho experimental
– Maior número possível, sob as limitações
logísticas
– Se você é profissional, use a analise de poder
 Sub-amostra = Pseudo-replica
– Somente valida se as sub-amostras são
tratadas erradas como replicas verdadeiras
para a analise estatística
– Sub-amostras: úteis para aumentar a precisão
da estimativa dos dados da replica
– Um tipo especial de analise estatística pode
ser usado

Pseudo-replicação Definida

 “Replicação” errada
– Replicando amostras e não tratamentos
– Replicas não são independentes
 Problema é a violação das premissas
chaves da analise estatística:
– Independência das replicas
 Aumento da precisão dos estudos se são
independentes
 Aproxima a “verdade” melhor se
independente

Prevalência da Pseudo-
replicação
 48% de todos os estudos com pseudo-
replicação (Hurlbert 1984)
 71% dos estudos que usaram ANOVA (um
teste estatístico comum) com erros de
desenho (Underwood 1981)
 Mais marcado em estudos com problemas
de logística
– Animais raros
– Limitações de transporte ou financiamento
– Quase todo no Brasil!

Exemplos de Pseudo-replicas
 Muitas amostras de um local único
– Formam na verdade sub-amostras
 Somente uma amostra única para cada
tratamento
– Atualmente são replicas, mas não podemos fazer
estatística com um tamanho amostral de um
 Amostras solitárias de um local só, mas
replicadas no tempo
– Seriam amostras verdadeiras se a pergunta
experimental é dependente do tempo
– Se não, é uma pseudo-replicação

Pseudo-replicação
Tratamento A Tratamento B
 Pergunta – Qual é
o efeito dos
tratamentos A e
B?
 Pseudo-replicação
Local 1 Local 3 = usando estrelas
do mesmo cor como
replicas
 Replicação = inclua
somente uma
estrela de cada cor
Local 2 Local 4

Controle de Pseudo-replicação I
 Conheça sua pergunta
 Pergunta determina se o desenho
incluía a pseudo-replicação
 Nível Taxonômico
 Nível hierárquico ecológico

 Define claramente os variáveis
dependentes e independentes

Controle de Pseudo-replicação II

 O que conceitue uma unidade de dados?
– Ramo de arvore? Individuo? População? ....?
 Identifique qual é a unidade da replicação
– Individuo? População? Comunidade? Local?
– Replique de forma apropriada – locais
freqüentemente formam o nível de replicação
na ecologia
 Randomize seu desenho de amostragem
– Ajuda diminuir erros de amostragem

Na Disciplina

 Usaremos freqüentemente a pseudo-
replicação
– Limitações de tempo (pantanal!)
– Limitações de transporte (ônibus!)
– Limitações de esforço (você!)
 Por isso
– Lidaremos as pseudo-replicas como replicas
verdadeiras
 Mas – fique atente deste fato para após
criar projetos de pesquisa mais robustos
no futuro

O que é uma estatística?
 Estatística: uma
estimativa de qualquer
parâmetro populacional

 Exemplo: a altura média
de uma amostra de 100
árvores de uma espécie
num parque nacional

Por que usar estatísticas?
 Não é sempre possível obter medidas e calcular parâmetros
de variáveis na população de interesse

 A estatística permite estimar esses valores para a população
intera a base de variáveis aleatórios múltiplos do variável de
interesse

 Quanto maior o número de amostras, mais próxima fica a
medida estimada a medida verdadeira da população

 A estatística permite uma comparação eficiente de
populações para determinar as diferencias entre elas

 As estatística permite determinar relações entre os
variáveis

Análise Estatística de Dados
Alturas de uma espécie de
árvore em 2 locais num parque
nacional Local1 Local 2

5 4

7 2

3 8

8 3

6 7

 Medidas da tendência central
 Medidas da dispersão e variabilidade

Medidas da tendência central
 Onde fica o centro da distribuição?
media ( ou μ): media aritmética…… x
x
n
mediano: o valor na media de um conjunto ordenado de dados

modo: a valor que ocorre mais freqüentemente

Exemplo de conjunto de dados : 1, 2, 2, 2, 3, 5,
6, 7, 8, 9, 10
Media = (1 + 2 + 2 + 2+ 3 + 5 + 6 + 7 + 8 + 9 + 10)/11 = 55/11 = 5
Mediano = 1, 2, 2, 2, 3, 5, 6, 7, 8, 9,10 = 5
1, 2, 2, 2, 3, 5, 6, 7, 8, 9,10,11 = (5+6)/2 = 5.5
Modo = 1, 2, 2, 2, 3, 5, 6, 7, 8, 9, 10 = 2

Medidas de dispersão e
variabilidade
 Qual é a dispersão dos dados?
amplitude: valor maior menos valor menor
variância (s 2  
2 ou σ2) ………….…………. ( xi  x ) 2
n 1
desvio padrão (s ou σ)…………………   2

Ampla limitada

Medidas de dispersão e
variabilidade
Conjunto de dados - exemplo : 0, 1, 3, 3, 5, 5,
5, 7, 7, 9, 10 3.5

3

Variância = 9.8

Number of Occurences
2.5

2

Desvio Padrão = 3.29 1.5

Amplitude = 10
1

0.5

0
0 1 3 5 7 9 10
Value

Conjunto de dados - exemplo: 0, 10, 30, 30,
50, 50, 50, 70, 70, 90, 100 3.5

3

Number of Occurences
2.5

Variância = 980 2

Desvio Padrão = 270.13
1.5

1

Amplitude = 100
0.5

0
0 10 30 50 70 90 100
Value

Distribuição Normal dos Dados
 Um conjunto de dados no qual quase todos
os valores ficam próximos a média, e
existem poucas observações nos extremos
da amplitude dos dados
 Existe uma distribuição simétrica ao redor
da média

Proporções de uma Distribuição
Normal
 Uma população normal de 1000 pesos
corporais
 μ = 70kg σ = 10kg
 500 pesos são > 70kg
 500 pesos são < 70 kg
Massas de antas no Pantanal

450
400
350
Número de antas

300
250
200
150
100
50
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140
Massa (kg)

Proporções de uma Distribuição
Normal Massas de antas no Pantanal
500
400

Número de antas
300
200
100
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140

Quantos antas pesam > 80kg
Massa (kg)

 μ = 70kg σ = 10kg X = 80kg
 Usamos uma equação para nos informar quantos desvios
padrões doa meia está o valor de X :
Z=X–μ = Z = 80 – 70 =1
σ 10
 Depois usamos uma tabela para nos informar qual proporção
de uma população normal fica além desse valor de Z
 Essa proporção é igual a probabilidade de escolher
aleatoriamente um valor (X) maior do que 80kg

Tabela
de
valores
de Z

• Encontre o valor de Z na tabela (1.0)
• Encontre o valor de P associado (0.1587)
• O valor de P indica que existe uma probabilidade de 15.87%
((0.1587/1)x100) de que o urso escolhido de uma população de
1000 ursos medidos terá um peso maior do que 80kg

Distribuição de Probabilidade

 Existem várias tabelas de probabilidade
para tipos diferentes de testes
estatísticos.
exemplos. Tabela Z, Tabela t, Tabela de
Χ2
 Cada tabela permite a associação do
“valor crítico” com um valor de “P”
 Esse valor de P é usado para
determinar a significância do resultado
estatístico

Dados

Mais conteúdo relacionado

Mais procurados

Destaque

Semelhante a Dados

Mais de unesp

Último

Dados