SlideShare uma empresa Scribd logo
1 de 105
Baixar para ler offline
1
4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações
4.1 Conceitos básicos de Probabilidades
Um conjunto de dados hidrológicos necessita ser previamente analisado com base
em alguns indicadores estatísticos básicos para que se possa, efetivamente, desenvolver a
teoria das probabilidades às situações práticas desejadas. Primeiramente, este conjunto de
dados hidrológicos é conhecido, no âmbito da hidrologia, como série histórica e consiste,
basicamente, de uma amostra extraída de uma população.
Com base nesta amostra, podemos calcular alguns indicadores e medidas
estatísticas importantes, como média, desvio padrão (variância), assimetria, curtose e
distribuição de freqüência dos dados observados na amostra. Estas medidas caracterizam
apenas a amostra e nada dizem a respeito da população em si. A distribuição de
freqüências demonstra o comportamento da amostra no tocante à sua simetria e é nosso
objetivo, na hidrologia estatística, modelar esta distribuição de freqüência com base num
modelo matemático, constituído de parâmetros, conhecido como Distribuição de
Probabilidades.
Primeiramente, é importante que caracterizemos algumas situações relativas à
amostra, contextualizada em termos da hidrologia. Podemos modelar uma distribuição de
freqüência no contexto de dados discretos, como por exemplo, o lançamento de uma moeda
ou no sorteio de números de alguma forma de loteria. No caso da hidrologia, pode-se,
eventualmente, considerar dias chuvosos como variáveis hidrológicas discretas, mas na
maioria das vezes, a hidrologia considera suas análises dentro do contexto de variáveis
contínuas.
Em se tratando de variáveis discretas, podemos responder à pergunta: qual a
probabilidade de um número qualquer ser sorteado (evento x) dentro de um espaço
amostral finito S qualquer, constituído por N números, sendo este um evento aleatório. A
resposta pode ser escrita da seguinte forma:
( )
N
mx
xP = (1)
Observe que todos os números que constituem o espaço amostral S possuem a
mesma possibilidade de ser sorteados numa situação não viciada.
É importante, no entanto, diferenciarmos probabilidade de freqüência. Esta última
está associada ao número de vezes que um determinado evento ocorreu, enquanto que
probabilidade refere-se às possíveis situações de ocorrência, que no caso da equação 1, é
considerada como de igual de probabilidade. Assim, se um sorteio de cara e coroa é
realizado 10 vezes e “cara” for sorteado 7 vezes, sua freqüência será 0,7. Por lado, como
2
temos apenas duas possibilidades e estas são iguais (numa situação não viciada), o número
de vezes esperado para o sorteio de “cara” é 5 vezes, portanto, a probabilidade seria 0,5.
No entanto, na hidrologia, em grande parte das vezes, nos interessa, em termos
práticos, avaliar qual a possibilidade de um determinado evento ser maior ou igual (ou
menor ou igual) a um dado valor xi e isto remete ao conceito de uma variável contínua, como
por exemplo, vazões de um rio.
Existem diferenças importantes nos modelos probabilísticos para ambas as
situações. No caso de variáveis discretas busca-se estimar qual a P(x) ser igual a um valor;
no caso de variáveis contínuas, qual a P(x > xi) ou P(X<xi). Para variáveis discretas, o
modelo probabilístico pode ser ajustado com apenas um parâmetro, normalmente vinculado
à média, como no caso da Distribuição de Poisson. Em se tratando de variáveis contínuas, o
modelo probabilístico necessita de 2 ou 3 parâmetros para seu ajuste, e estes estão
vinculados às medidas estatísticas de média, variância e assimetria, ou seja, aos momentos
estatísticos de 1ª, 2ª e 3ª ordens.
4.1.1 Probabilidade Condicional
A probabilidade de ocorrência de um determinado evento A pode ser influenciado
pela ocorrência de outro evento B, uma vez que haverá redução do espaço amostral S para
a realização do evento A quando B ocorre. Neste caso, tem-se a seguinte definição:
( ) ( )
( )BP
BAP
B|AP
∩
= (2)
Nesta equação, ( )B|AP significa a probabilidade do evento A, associada (ou
condicionada) ao evento B, ( )BAP ∩ significa a intersecção dos eventos A e B no plano
amostral S e P(B) é a probabilidade de ocorrência do evento B. Graficamente, teríamos:
Deste esquema, depreende-se também que:
S
B
A ( )BAP ∩
3
( ) ( ) ( ) ( )BAPBPAPBAP ∩−+=∪ (3)
Exemplo de Aplicação 4.1
a) Sabendo-se que a probabilidade de ocorrer em janeiro uma precipitação total
superior 200 mm é de 0,098, recalcule esta probabilidade sabendo-se que já
ocorreram 130 mm no respectivo mês e que a probabilidade de se superar este
último valor é de 0,234.
Neste exemplo, o evento A consiste de P(A) = 0,098; o evento B é P(B) = 0,234.
Queremos a probabilidade do evento A mediante a condição de que já houve 130 mm no
mês de janeiro, ou seja, P(A|B):
( ) ( )
( )
( ) ( )
( )
581,0
234,0
098,0
1
BP
APBP
BP
BAP
B|AP =−=
−
=
∩
=
b) Considere 2 eventos probabilísticos, A e B, ambos associados à possibilidade da
vazão mínima de um curso d’água não atender à demanda de um projeto, que é 4
m3
/s. O evento A implica que a probabilidade da vazão do córrego A ser inferior a 2
m3
/s é de 0,0547 e do córrego B é de 0,0891. Qual a probabilidade do projeto não
receber a vazão mínima projetada, sabendo-se que o evento A está condicionado a
B [(P|B) = 0,65]?
P(A) = 0,0547; P(B) = 0,0891. A possibilidade do projeto não ser atendido implica em
( )BAP ∪ (equação 3).
Como P(A|B) é 0,65, da equação 2, tem-se:
( ) ( ) ( ) 0579,00891,065,0BPB|APBAP =×=×=∩
( ) ( ) ( ) ( ) 0859,00579,00891,00547,0BAPBPAPBAP =−+=∩−+=∪
4
4.2 Freqüência de Dados Hidrológicos
Os fenômenos hidrológicos podem ser caracterizados como aleatórios, podendo-se
associar aos mesmos, um caráter probabilístico envolvendo estes fenômenos. Em termos
de seu comportamento há de se ressaltar que, sempre haverá possibilidade de um dado
evento hidrológico ser superior ou inferior a um valor histórico já registrado. Isto é essencial
para o entendimento das variáveis hidrológicas, uma vez que esta é uma das principais
funções da hidrologia, que consiste em observar os eventos e modelar as freqüências de
ocorrência, possibilitando que sejam feitas previsões assumindo determinado risco.
As variáveis hidrológicas, na maioria das vezes, são consideradas contínuas, ou
seja, variáveis que em termos físicos, existem continuamente no tempo. Em termos
estatísticos, são aplicadas distribuições que modelam este caráter, trabalhando com
cálculos de áreas sob a curva de distribuição de probabilidades abaixo ou acima de
determinado valor de interesse prático ou entre valores. Percebe-se que neste caso, não se
pergunta qual a probabilidade de um determinado evento ser IGUAL a um valor específico,
como no sorteio de um número, e sim, deste evento ser maior ou menor que este valor, ou
estar entre 2 valores específicos. Este entendimento também é fundamental para aplicação
das distribuições de probabilidades aos fenômenos hidrológicos.
O primeiro passo para se modelar a freqüência de dados hidrológicos é fazer um
estudo de sua ocorrência, no que se estabelece um percentual com que uma variável
hidrológica pode ser maior que um dado valor. Isto é chamado freqüência de excedência e é
obtida diretamente de uma série histórica de dados. Contudo, pode-se trabalhar com a
freqüência de não excedência, ou seja, aquela em que se estuda o percentual de uma
variável ser menor ou igual a um dado valor. A escolha depende dos objetivos, os quais
serão discutidos na seqüência. Deve-se ressaltar que uma é o complemento da outra, ou
seja:
excnãoexc f1f −−= (4)
Existem algumas definições de freqüência considerando variáveis contínuas,
destacando-se:
5
Tabela 4.1 Equações para estimativa da freqüência observada e suas aplicações.
Fórmula Autor Observações
1N
i
fobs
+
=
Weibull Aplicação ao estudo de probabilidades não
enviesadas (sem tendência) para qualquer modelo de
Distribuição.
12,0N
44,0i
fobs
+
−
=
Gringorten Aplicada para estudos associados às Distribuições
Gumbel e GEV.
25,0N
375,0i
fobs
+
−
=
Blom Aplicada para estudos associados às Distribuições
Normal e Log-normal.
N
50,0i
fobs
−
=
Hazen Aplicada para estudos associados à Distribuição
Gama 3 parâmetros.
20,0N
40,0i
fobs
+
−
=
Cunnane Aplicação ao estudo de probabilidades não
enviesadas (sem tendência) para qualquer modelo de
Distribuição.
O termo i, no numerador, refere-se à posição que o dado ocupa dentro da série
histórica, a qual deve ser ordena em ordem crescente para freqüências de não excedência e
ordem decrescente para freqüência de excedência. Por outro lado, N, no denominador,
refere-se ao tamanho da série histórica. Ressalta-se que nos exemplos de aplicação aqui
desenvolvidos, será considerada apenas a equação proposta por Weibull.
Com base no estudo das freqüências de ocorrência, ajusta-se uma distribuição de
probabilidades e aquela que obtiver o melhor ajuste (menores diferenças entre as
freqüências observadas e estimadas) deve ser a escolhida. Note que o tamanho da série
histórica tem grande importância haja vista que ela representará a possibilidade de
ocorrência, ou seja, quanto maior esta, maior a representatividade do evento, tendo como
referência seu registro histórico. Portanto, o ajuste de uma distribuição de probabilidades
busca sua aplicação para estimar as freqüências de eventos que ainda não foram
registrados e que normalmente são aplicados a projetos hidráulicos.
A freqüência de excedência é bastante usada em hidrologia, especialmente quando
os dados a serem trabalhados constituem séries históricas de precipitação. No entanto, para
estudos de vazões, esta situação é também é importante, sendo que, neste caso, pode-se
gerar um gráfico conhecido como “Curva de Permanência”. Isto significa que pode-se obter
a percentagem de tempo (ou permanência) no qual um determinado evento é superado ou
igualado. Estudos com esta conotação têm várias importâncias práticas, como por exemplo,
na determinação de uma vazão mínima de um curso d’água para abastecimento ou
irrigação, ou ainda, a precipitação mínima num determinado período de um mês visando ao
balanço hídrico e fornecimento da lâmina de irrigação suplementar, ambas as grandezas
6
associadas a uma probabilidade de excedência. A Figura 4.1 ilustra uma curva de
permanência hipotética.
Figura 4.1 Representação gráfica de uma curva de permanência hipotética.
No gráfico acima, para um valor y de vazão, x é a percentagem de tempo com que
esta vazão é igualada ou superada, ou seja, sua permanência. Um valor prático extraído da
curva de permanência é o Q90%, o qual significa a vazão existente no curso d´água em 90%
do tempo, sendo aplicada à gestão dos recursos hídricos. Pela curva, observa-se que se
trata de uma vazão pequena. O risco assumido é de que há possibilidade de 10% da
mesma ser inferior ao valor estimado e neste caso, problemas com o fornecimento de água
ao projeto.
Uma observação adicional pode ser feita. Quanto menor o intervalo de análise dos
dados (dados diários, mensais ou anuais) mais segura será a interpretação da curva de
permanência. Isto quer dizer, por exemplo, que a análise de dados diários de vazão de um
determinado rio fornece um valor menor de vazão, para uma dada permanência, do que
dados mensais ou anuais. Estes últimos geram valores superestimados, sendo mais útil
para a gestão dos recursos hídricos, o estudo com observações diárias.
7
4.3 Conceito de Tempo de Retorno (TR)
O tempo de retorno representa o inverso da freqüência com que um evento pode ser
igualado ou superado, ou seja, reflete a probabilidade com que uma dada variável
hidrológica possa ser igualada ou superada, pelo menos uma vez, num ano qualquer. Ao se
ajustar uma distribuição de probabilidades aos dados de freqüência de uma série histórica,
utiliza-se a probabilidade de excedência para estimar um tempo de retorno, que é obtido em
anos. Por definição, tem-se:
( )xiXF
1
TR
>
= (5)
Ao se assumir uma distribuição de probabilidades com F (X > xi) estimado por P (X >
xi), tem-se:
( )xiXP
1
TR
>
≅ (6)
No entanto, quando o objeto de estudo consiste de uma série histórica de dados
hidrológicos mínimos ou dados que apresentem distribuição normal, o tempo de retorno a
ser estimado também está associado à probabilidade com que o valor mínimo considerado
pode ser inferior ao esperado, ou seja:
( ) ( )xiXP
1
xiXF
1
TR
≤
≅
≤
= (7)
Esta situação é comum quando se trabalha com dados de vazão mínima visando à
gestão dos recursos hídricos e avaliação da disponibilidade de água para irrigação ou
abastecimento. Uma vazão específica corresponde ao valor da Q7,10, que significa um valor
mínimo de vazão em 7 dias consecutivos, com Tempo de Retorno de 10 anos. Isto significa
que há probabilidade de 10% de ocorrer uma vazão mínima com 7 dias consecutivos inferior
ao valor estimado, sendo interpretado como um fator de segurança, porém associado à
garantia de vazão no curso d’água.
Contudo, o cálculo de TR, com base no seu conceito, não é suficiente. Assim, é
possível calcular o “risco hidrológico” propriamente dito, o qual está associado à
probabilidade de um evento ser igualado ou superado, porém, num intervalo de tempo N
menor que TR e cuja definição prática está associada à vida útil da obra. Na realidade, esta
probabilidade pode ser calculada pensando-se na probabilidade de que o evento não ocorra.
A linha de raciocínio é a seguinte: dados que p é a probabilidade de ocorrência de um
evento num ano qualquer; seu complemento é k, ou seja, a probabilidade de não ocorrência.
Assim:
p1k −= (8)
8
Considera-se que a probabilidade do evento não ocorrer em qualquer dos anos, num
intervalo de N anos, é dada por:
N
kK = (9)
Da mesma forma, seu complemento, no sentido agora de ocorrência, será:
K1R −= (10)
Sendo R o risco de ocorrência do evento num período de N anos. Fazendo-se
algumas substituições, chega-se a:
N
k1R −= (11)
N
)p1(1R −−= (12)
N
TR
1
11R −−= (13)
Na realidade, esta seqüência de equações nada mais é do que a aplicação da
Distribuição Binomial, considerando a probabilidade de não ocorrência, ou seja, P(x=0). A
Distribuição Binomial apresenta a seguinte estrutura:
( ) ( ) xNx
p1p
x
N
xXP
−
−⋅⋅== (14)
Assim, para a situação de não ocorrência, ou seja, P (X=0), teremos:
( ) ( ) ( )NN0
p1p1p
0
N
0XP −=−⋅⋅== (15)
Para a situação de ocorrência:
N
)p1(1)xX(P −−== (16)
Sendo P(X=x) o risco hidrológico R definido anteriormente. O desdobramento, em
função de TR, é idêntico ao apresentado anteriormente.
9
4.4 Classificação das Principais Séries Históricas Hidrológicas
Os dados históricos relativos a um evento hidrológico constituem uma série
hidrológica, a qual pode ser classificada em:
a) Série original: constituída por todos os valores registrados. Exemplo: 30 anos de
dados de precipitação mensal. A série será constituída por 30 x 12 valores.
b) Série anual: constituída por valores extremos (máximos ou mínimos) de cada ano. A
partir do exemplo anterior, ter-se-ia uma série com 30 valores. Normalmente, valores
mínimos anuais dizem respeito ao comportamento de vazões em cursos d’água.
Este tipo de estudo visa fornecer informações para projetos de abastecimento de
água e irrigação.
c) Série parcial: constituída pelos “N” maiores ou menores valores ocorridos nos “N”
anos de observação. A partir do exemplo inicial, ter-se-ia uma série constituída por
30 valores, os quais seriam os maiores ou menores da série original, sem haver a
vinculação com o ano de ocorrência. Uma outra alternativa seria constituir a série
com todos os maiores (ou menores) valores da série, referindo-se a uma situação na
qual a série histórica é pequena e há utilização de mais de um valor extremo por
ano.
As séries históricas mais trabalhadas em hidrologia são as seguintes:
a) Precipitação total anual: constituída pela soma das precipitações diárias ocorridas ao
longo de 1 ano, obtendo-se, desta forma, 1 valor para a série. É estruturada,
portanto, com valores totais de cada ano. Neste caso, normalmente objetiva-se ao
estudo comportamental do ciclo hidrológico, sendo importante para estudos
vinculados ao balanço hídrico climatológico bem como balanço hídrico anual em
bacias hidrográficas.
b) Precipitação total mensal, quinzenal e decendial: nestas séries históricas, pode-se
trabalhar considerando um mês específico do ano (de interesse regional, por
exemplo) e estudar os seus totais mensal, da 1a
e 2a
quinzenas e 1o
, 2o
e 3o
decêndios. Este estudo é importante quando se realiza balanço hídrico de culturas
visando ao manejo de irrigação. O produto gerado é conhecido como Precipitação
Provável e trabalha-se com probabilidade de excedência, ou seja, objetiva-se
garantir um valor mínimo com 75, 90 ou 95% de excedência, dependendo da cultura
em questão. Culturas de maior valor econômico trabalha-se com um nível de
10
probabilidade de excedência maior, estimando-se um valor menor de precipitação
provável, devido ao risco de prejuízos mais importantes.
c) Precipitação máxima diária anual: neste caso, toma-se, em determinado ano, a maior
precipitação diária registrada, sendo este valor 1 componente da série histórica. É
feito desta forma para vários anos, constituindo-se a série histórica. Seu estudo é
importante quando se deseja obter valores extremos máximos diários, visando ao
estudo da freqüência de ocorrência de precipitações intensas, inclusive para geração
das equações de chuvas intensas. Quando a disponibilidade de dados históricos é
pequena, pode-se trabalhar com os 2 maiores valores anuais, a fim de melhorar a
representatividade da série.
d) Precipitação máxima anual correspondente a um determinado tempo de duração da
precipitação: aqui, têm-se os mesmos objetivos anteriores, porém trabalhando-se
com pluviogramas, separando-se o valor máximo da precipitação num determinado
ano, para vários tempos de duração. Assim, constitui-se uma série histórica para
cada tempo de duração. Estas séries geram resultados mais precisos para o ajuste
da equação de chuvas intensas, pois trata-se de intensidades reais que ocorreram
num determinado local. Valores totais diários não expressam tal característica.
e) Vazões Máximas Diárias Anuais: são séries históricas aplicadas ao estudo de vazões
de cheia e de projeto em cursos d´água. São séries com característica assintótica,
assim como as de precipitações máximas, ou seja, com acúmulo de dados à
esquerda na distribuição de freqüências, gerando-se um caudal à direita.
f) Vazões Mínimas Diárias Anuais: são séries históricas muito aplicadas à hidrologia,
fundamentais em estudos ligados à disponibilidade de água em cursos d’água para
projetos e gestão de recursos hídricos. De forma semelhante às vazões máximas,
são assintóticas, com acúmulo de dados à direita na distribuição de freqüência,
gerando-se um caudal à esquerda.
g) Vazões médias anuais: são séries históricas aplicadas ao estudo do comportamento
do deflúvio médio anual, obtida pela média aritmética dos dados.
h) Evapotranspiração: séries históricas que permitem estudar o comportamento
evapotranspirativo em bacias hidrográficas. Importante nos estudos ligados ao
11
comportamento climático de regiões, bem como modelagem do balanço hídrico
climatológico.
4.5 Histogramas de Freqüência
Histogramas de freqüência dizem respeito à representação gráfica (normalmente em
barras) da freqüência de ocorrência de uma dada variável, podendo ser simples ou
acumulada (de excedência ou não excedência). A curva de permanência é um tipo de
histograma de excedência, com as classes acumulando-se à esquerda. A seguir será
apresentada a metodologia clássica para o desenvolvimento de histogramas de freqüência.
1o
) Determinação do número de classes (k)
- até 100 dados = nk =
- acima de 100 dados = ( )nlog5k 10⋅=
onde n é o número de observações.
2o
) Amplitude total dos dados (A)
mMA −= , em que M é o valor máximo observado e m, o menor valor.
3o
) Amplitude de classe (Ac)
1k
xA
Ac
−
∆+
= , em que, x∆ é a precisão de leitura (por exemplo: dados com uma casa
decimal, a precisão é de 0,1).
4o
) Limite inferior da 1a
classe
2
Ac
mLI 1classe −=
5o
) Limite superior da 1a
Classe
AcLILS 1classe1classe +=
6o
) As demais classes são computadas somando-se os limites à amplitude, e assim
sucessivamente.
LSclasse1 = LIclasse2
LSclasse2 = LIclasse2 + Ac
LSclasse2 = LIclasse3, e assim por diante.
12
4.6 Medidas estatísticas básicas aplicadas em hidrologia
4.6.1 Média Aritmética
A média aritmétrica de um conjunto de dados é expressa por:
n
x
X
n
1i
i
= =
−
(17)
4.6.2 Moda
É definida como sendo o valor que aparece com mais freqüência num conjunto de
dados. Quando se tem um intervalo de classe, a moda será o ponto médio da classe que
contiver o maior número de ocorrências.
4.6.3 Mediana
Corresponde ao valor que representa exatamente 50% das ocorrências. Para obtê-lo
basta avaliar as freqüências de ocorrência, independentemente de ser de excedência ou
não-excedência. Para obter o valor exato de 50%, pode-se utilizar o procedimento de
interpolação dos dados vizinhos a este valor, quando não for possível obtê-lo diretamente.
4.6.4 Variância da Amostra
1n
xx
s
2
n
1i
i
2
−
−
=
=
−
(18)
4.6.5 Desvio Padrão da Amostra
2
ss = (19)
Ao se avaliar tanto o desvio padrão quanto a variância, observa-se que quanto maior
ambos, maior a variação dos dados em torno da média.
4.6.6 Assimetria
A assimetria é um parâmetro importante na medida em que avalia a forma como os
dados estão distribuídos em relação à média. Para que os dados apresentem distribuição
normal, a assimetria deve ser próxima ou igual a zero. Nesta situação, a média, a moda e a
mediana são iguais. Contudo, quando este valor for distante de zero, apresentará um
padrão de distribuição com a maior quantidade de dados à esquerda (assimetria positiva) ou
à direita (assimetria negativa). Em termos de dados hidrológicos, por apresentarem um
padrão com limitação inferior (normalmente, valor mínimo é zero) e sem limitação superior
13
(os eventos hidrológicos podem ser superados), a assimetria é positiva. A assimetria pode
ser calculada da seguinte forma:
n
xx
A
n
1i
3
i −
=
=
−
(20)
Na prática é mais comum a utilização do coeficiente de assimetria, que representa a
relação entre a assimetria e o desvio padrão ao cubo. Este coeficiente pode ser do tipo
corrigido ou comum. O último pode ser calculado por:
3
s
A
Ca = (21)
O coeficiente corrigido é determinado da seguinte forma:
( ) ( ) 3
n
1i
3
i
s
xx
2n1n
n
Ca
−
⋅
−⋅−
=
=
−
(22)
Além da análise geral dos dados, a média, o desvio padrão e o coeficiente de
assimetria são extremamente importantes, pois constituem-se nos parâmetros que permitem
o ajuste das distribuições de probabilidades.
4.6.7 Curtose
Quantifica o grau de “achatamento” da distribuição de freqüência de uma
determinada amostra. A referência para curtose é a curva normal e pode ser calculada pela
seguinte equação:
3
s
1
n
xx
Cu
4
n
1i
4
i
−⋅
−
=
=
−
(23)
Se Cu for próximo a zero, a distribuição é intermediária, sendo conhecido como
“Mesocúrtica”; se for maior que zero, os dados estão distribuídos de forma “afilada”
(“Leptocúrtica”); se for menor que zero, forma “achatada” (Platicúrtica) (Figura 4.2).
14
Figura 4.2 Comportamento da distribuição normal em função do achatamento dos dados.
4.6.8 Co-variância amostral
Quando se relaciona um conjunto de dados de uma variável com valores de outra
variável que possa explicar o comportamento da primeira, aplica-se a co-variância amostral,
onde quanto maior este valor, maior a relação entre as variáveis, ou seja, mais uma variável
explica a outra. Este coeficiente pode ser calculado pela equação:
−⋅−
=
⋅−⋅⋅= yxyx
n
1
cov i
n
1i
ixy (24)
A co-variância pode ser negativa ou positiva. No primeiro caso, significa que valores
mais baixos de uma variável explicam valores mais altos de outra variável. No segundo, as
variáveis possuem o mesmo comportamento em termos de crescimento. Em ambos os
casos, quanto maior o valor, em módulo, maior a explicação da variável dependente.
4.6.9 Coeficiente de correlação
É um coeficiente que adimensionaliza a co-variância e busca explicar, da mesma
forma anterior, a relação entre duas variáveis. Seu valor varia de –1 a 1 e quanto mais
próximo dos extremos, maior a explicação da variável. É calculada por:
15
( )yx
xy
ss
cov
r
⋅
= (25)
Em que sx e sy são respectivamente, o desvio padrão das variáveis x e y.
4.7 Distribuições Contínuas de Probabilidades em Hidrologia
4.7.1 Equação Geral de Ven Te Chow
Há situações em que se necessita estimar valores de eventos associados a
recorrências muito altas, cujas freqüências não foram ainda obtidas, como é o caso de
estruturas civis, cuja falha coloque em risco vidas humanas. Nestas condições, recomenda-
se o uso de Distribuições Teóricas de Probabilidades, as quais devem ser adequadas para
estimativa das freqüências observadas, sendo que estas são determinadas pelas
características dos dados, especialmente se forem assintóticas.
Ven Te Chow1
afirma que a maioria das funções de probabilidades, aplicáveis à
Hidrologia, visando associar valor (magnitude) da variável à probabilidade de sua
ocorrência, pode ser representada pela seguinte equação:
SKXX TRTR ⋅+=
−
(26)
Em que XTR é o valor da variável hidrológica associada à recorrência TR,
−
X é a
média aritmética da série histórica, S é o desvio padrão da mesma e KTR é o fator associado
à freqüência, sendo função de TR e da distribuição de probabilidades. É também chamado
“variável reduzida”. Basicamente, este modelo geral é aplicado em quase todos os estudos
probabilísticos em hidrologia.
4.7.2 Principais Distribuições de Probabilidades em Hidrologia
As distribuições de probabilidades que serão apresentadas, com as respectivas
aplicações, são as seguintes:
- Distribuição Normal ou de Gauss: adequada para séries originais (Ex.: totais
anuais de precipitação);
- Distribuição de Gumbel para máximos (ou Assintótica de Valores Máximos
Extremos do tipo I): adequada para série de valores extremos máximos (série
de valores máximos diários de precipitação ou vazão);
1
Haan (2002).
16
- Distribuição de Gumbel para mínimos (ou Assintótica de Valores Mínimos
Extremos do Tipo I): adequada para valores mínimos extremos (série de
valores mínimos de vazão);
- Distribuição Log-Normal a 2 e 3 parâmetros: aplicável tanto a valores originais
quanto máximos e estimativa da precipitação provável;
- Distribuição Gama: aplicável para estimativa da precipitação provável e séries
históricas de valores extremos;
- Distribuição Weibull: aplicável a série histórica de vazões mínimas;
- Distribuição de Extremos de Fréchet ou Log-Gumbel: aplicação voltada para
séries históricas de valores extremos máximos, especialmente vazões
máximas;
- Distribuição Generalizada de Valores Extremos (GEV): distribuição que
engloba as distribuições de extremos Tipo I (Gumbel), Tipo II (Fréchet) e Tipo
III (Weibull).
O ajuste de uma distribuição de probabilidades é conduzido com base em 2 ou 3
parâmetros. A estimativa destes parâmetros é feita com base na Inferência Estatística,
sendo o método dos momentos, o qual calcula os parâmetros com base nos momentos
estatísticos de 1a
, 2a
e 3a
ordem, associados, respectivamente, à média, variância e
assimetria, o mais simples. As distribuições Normal e de Gumbel possuem apenas os 2
primeiros parâmetros. A Log-Normal pode estar associada aos 2 primeiros, assim como a
Normal, ou aos 3 parâmetros. No entanto, este método, apesar de mais aplicado, é menos
preciso que outros. Os métodos da Máxima Verossimilhança e Momentos – L são também
aplicados para estimativa dos parâmetros e também serão apresentados e discutidos.
4.7.2.1 Distribuição Normal ou de Gauss
A distribuição de Gauss ou Normal (DN) é uma distribuição de probabilidades para
variável contínua, caracterizada pela média e desvio padrão. Os valores de uma série que
segue a DN se distribuem simetricamente em relação à média. Portanto, apresentam o
coeficiente de assimetria igual a zero. A relação entre os valores e a probabilidade de
ocorrência pode ser visualizada na Figura 4.3, cuja área até determinado ponto (ou valor),
no sentido da esquerda para direita, representa a probabilidade de ocorrer valores menores
ou iguais àquele valor (probabilidade de não excedência).
17
Figura 4.3 Representação da distribuição normal com seus principais parâmetros.
A função densidade de probabilidade (FDP) é dada pela seguinte equação:
( )
( ) 2
e
2
1
xfFDP
x
5,0
σ
µ−
⋅−
⋅
π⋅σ
== (27)
Em que σ é o desvio padrão e µ é a esperança ou média, ambos da população, que serão
substituídas pelo desvio padrão e média amostrais, com o 1o
e 2o
momentos calculados da
seguinte forma:
s
^
=σ e X
^
=µ (28)
A probabilidade propriamente dita é obtida pela integração da função densidade de
probabilidade (FDP), gerando a Função Cumulativa de Probabilidades (FCP). A
probabilidade de não-excedência é obtida pela integração da FDP de ∞− a um
determinado valor X. A probabilidade de excedência é obtida com base na equação 1, já
que a integração da FDP de ∞− a ∞+ é igual a 1. Desta forma, tem-se para a
probabilidade de não-excedência:
18
( ) ( )
( )
dx
2
e
2
1
xxobPrxFFCP
x
5,0x
i
σ
µ−
⋅−
∞−
⋅
π⋅⋅σ
=≤== (29)
Para facilitar a generalização desta relação (valor e probabilidade), propõem-se a
distribuição normal padrão, que utiliza a chamada variável reduzida ou padrão z, que mede
o desvio de uma variável em relação à média, em termos do desvio padrão, ou seja:
s
xx
z
−
=
−
(30)
Observa-se que z faz o papel de KTR conforme equação geral proposta por Ven Te
Chow (equação 26). Verifica-se, portanto, que a variável KTR é equivalente a z, no caso da
DN. A distribuição normal passa a ser DN (0,1) que é a distribuição normal padrão e sua
FCP calculada por:
( ) ( ) ⋅
π⋅
=≤=
∞−
⋅−
z
z5,0
dz
2
e
2
1
zZobPrzF (31)
Em que z é a variável reduzida.
Observa-se que esta integral não apresenta solução analítica. Desta forma, pode-se
utilizar a tabela de distribuição de Gauss ou tabela de z (Tabela 4.2), a qual foi gerada a
partir da solução numérica da equação 31. Esta tabela fornece os valores de probabilidade,
de ∞− até o valor de z que corresponde ao valor da variável hidrológica X, correspondendo
a uma tabela com probabilidades de não excedência. Além desta metodologia, pode-se
trabalhar com uma aproximação razoável, utilizando a equação abaixo:
( ) ( ) ( )3
3
2
21 qaqaqazf1zZobPr ⋅+⋅+⋅⋅−=≤ (32)
Em que:
( )
2
e
2
1
zf z5,0 ⋅−
⋅
π⋅
= (33)
( ) 1
0 za1q −
⋅+= (34)
Os valores para as constantes são:
a0 = 0,33267; a1 = 0,43618; a2 = -0,12017; a3 = 0,9373
Devido à simetria da curva normal, a série pode ser dividida em valores “menores
que” e “maiores que” a média. Deve-se ressaltar que variáveis afastadas da média do
19
mesmo valor (com os mesmos desvios) têm o mesmo tempo de recorrência, independente
de ser menor ou maior que a média. Assim, se 2 valores da variável X (X1 e X2) distam da
média, o mesmo desvio, tem-se o mesmo tempo de retorno para ambas. Numa situação,
busca-se a possibilidade de um valor menor que a média voltar a se repetir e noutra, um
valor maior que a média. Nesta situação, o cálculo de TR é conduzido considerando-se as
seguintes situações:
- Para valores menores que a média, objetiva-se conhecer o valor de não-
excedência;
- Para valores maiores que a média, objetiva a probabilidade de excedência;
Pelas equações abaixo, tem-se, respectivamente, a forma de cálculo de TR para
cada situação:
( )ixxP
1
TR
≤
= ; se o valor da variável for menor que a média;
( )ixxP
1
TR
≥
= ; se o valor da variável for maior que a média;
Exemplo de Aplicação 4.2
Se a precipitação total anual média é de 1000 mm e o desvio padrão, 200 mm, qual o
TR para as precipitações de 1200 mm e 800 mm.
O cálculo de z por meio da equação 30 fornece um valor para a primeira situação,
igual a 1 e para a segunda, –1. Ao se consultar a tabela de z (Tabela 4.2), encontra-se uma
freqüência de não excedência para z = 1, de 0,84134 e para z = -1, 0,15865. Para o primeiro
caso, o cálculo de TR é dado pela segunda equação. Assim, tem-se:
anos3,6
15865,0
1
TR == ; o valor da probabilidade de excedência foi obtido por 1 –
0,84134 = 0,15865.
Para o segundo caso, tem-se:
anos3,6
15865,0
1
TR == ;
O valor da probabilidade de não excedência, neste caso, é obtido considerando-se o
aspecto de simetria dos dados, ou seja, como ( )1zP ≤ é igual a 0,84134, seu complemento
( )[ ]1zP > será 0,15865. Como os valores são simétricos, ( ) ( )1zP1zP ≥=−≤ e portanto,
0,15865.
20
Tabela 4.2 Tabela de z considerando probabilidade de não excedência
( ( ) −⋅
π⋅
=
∞−
z 2
dz
2
z
exp
2
1
zF ).
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 0.5 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.10 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.20 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.30 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.40 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
Exemplo de Aplicação 4.3
Com base na série histórica de alturas pluviométricas anuais de Lavras, MG, no
período de 1914-1943, 1946-1949 e 1951-1991, obter:
a) Distribuição de freqüência (tabela e gráfico), média, mediana, moda, desvio padrão e
coeficiente de assimetria.
21
b) Utilize a distribuição de Gauss para calcular os valores máximos e mínimos esperados
para os tempos de retorno de 10, 50, 100 e 1000 anos.
c) Compare as freqüências observada e teórica, associadas às precipitações de 1068,1
mm e 2042,2 mm.
d) Qual a probabilidade de ocorrer de um ano com precipitação superior a 2000 mm
sabendo-se que já ocorreram 1600 mm?
Tabela 4.3 Alturas pluviométricas anuais para Lavras, MG, e respectiva distribuição de
freqüência.
Ordem P Fnão-exc. Ordem P Fnão-exc. Ordem P Fnão-exc.
1 747,1 0,01316 29 1353,7 0,38158 57 1696,0 0,75
2 832,4 0,02632 30 1354,7 0,39474 58 1673,2 0,76316
3 999,2 0,03947 31 1355,7 0,40789 59 1683,5 0,77632
4 1001,3 0,05263 32 1374,4 0,42105 60 1686,6 0,78947
5 1068,1 0,06579 33 1377,9 0,43421 61 1689,4 0,80263
6 1093,5 0,07895 34 1380,4 0,44737 62 1705,5 0,81579
7 1109,9 0,09211 35 1393,6 0,46053 63 1719,1 0,82895
8 1170,6 0,10526 36 1398,7 0,47368 64 1726,6 0,84211
9 1171,3 0,11842 37 1413,1 0,48684 65 1728,5 0,85526
10 1183,2 0,13158 38 1427,3 0,50 66 1794,0 0,86842
11 1184,9 0,14474 39 1428,1 0,51316 67 1816,6 0,88158
12 1187,7 0,15789 40 1430,0 0,52632 68 1820,3 0,89474
13 1196,6 0,17105 41 1443,4 0,53947 69 1832,7 0,90789
14 1204,7 0,18421 42 1445,8 0,55263 70 1933,2 0,92105
15 1216,1 0,19737 43 1448,8 0,56579 71 1938,0 0,93421
16 1216,2 0,21053 44 1450,3 0,57895 72 1951,8 0,94737
17 1217,8 0,22368 45 1453,4 0,59211 73 2042,2 0,96053
18 1246,0 0,23684 46 1479,5 0,60526 74 2130,7 0,97368
19 1263,5 0,25 47 1496,3 0,61842 75 2485,6 0,98684
20 1266,7 0,26316 48 1555,8 0,63158
21 1268,6 0,27632 49 1567,4 0,64474
22 1282,5 0,28947 50 1584,3 0,65789
23 1288,8 0,30263 51 1585,1 0,67105
24 1301,2 0,31579 52 1589,1 0,68421
25 1313,0 0,32895 53 1590,0 0,69737
26 1319,8 0,34211 54 1634,1 0,71053
27 1326,6 0,35526 55 1634,1 0,72368
28 1352,8 0,36842 56 1665,3 0,73684
22
a) Distribuição de freqüência por classes
- número de classes (k) = 866,875 ≈= classes
- amplitude total (A) = 2485,6 – 747,1 = 1738,5
- amplitude de classe (Ac) = 4,248
18
1,05,1738
=
−
+
- LIclasse 1 = 747,1 – (248,4)/2 = 622,9
- LSclasse 1 = 622,9 + 248,4 = 871,3
Tabela 4.4 Classes e distribuição de freqüência simples e acumulada.
Classes
No
observações
Ponto médio da
classe
F simples
não-excedência
F acumulada
não-excedência
622,9 – 871,3 2 747,1 0,02632 0,02632
871,3 – 1119,7 3 995,5 0,06579 0,09211
1119,7 – 1368,1 24 1243,9 0,31579 0,4079
1368,1- 1616,5 22 1492,3 0,28947 0,69737
1616,5 – 1864,9 16 1740,7 0,21053 0,9079
1864,9 – 2113,3 4 1989,1 0,05263 0,96053
2113,3 – 2361,7 1 2237,5 0,01316 0,97368
2361,7 – 2610,1 1 2485,9 0,01316 0,98685
Moda: ponto da classe com maior número de observações. Portanto, 1243,9 mm.
Mediana: valor que corresponde a exatamente 50% dos dados. Na Tabela 4.1, 1427,3 mm.
Gráfico da distribuição de freqüência simples e acumulada.
23
Ca = 0,72 Observa-se que a assimetria dos dados é pequena, sugerindo-se que é possível
ajustar a distribuição normal aos dados.
b) Aplicação da distribuição normal de probabilidades
=
−
x 1466,0 mm e s = 319,2 mm
Equação geral de Ven Te Chow:
2,319k1466x TRTR ⋅+=
Para TR = 10 anos tem-se, com base na definição deste e na condição de simetria
da curva normal:
P (x > xi) = 0,10; A probabilidade de não excedência é: P(x < xi) = 0,90. Consultando a
tabela de z, tem-se z = 1,28. Para calcular os valores máximos e mínimos procede-se da
seguinte forma:
- Valor máximo
xTR = 1466 + 1,28 * 319,2 = 1874,6 mm
- Valor mínimo
Pela simetria da curva normal, tem-se z = -1,28 e xTR = 1466 – 1,28 * 319,2 = 1057,4 mm.
Os demais tempos de retorno são obtidos a partir do mesmo procedimento.
c) Aplicacão da equação geral de Ven Te Chow
( ) 10628,025,1ZobPr25,1
2,319
14661,1068
s
xx
z =−≤→−=
−
=
−
=
−
( ) 96447,081,1ZobPr81,1
2,319
14662,2042
s
xx
z =≤→=
−
=
−
=
−
d) Evento A: precipitação anual superior a 2000 mm ( )[ ]mm2000XP ≥
Evento B: precipitação anual superior a 1600 mm ( )[ ]mm1600XP ≥
Busca-se estimar o evento A condicionado ao evento B, portanto:
( ) ( )
( )
( ) ( )
( )mm1600XP
mm2000XPmm1600XP
BP
BAP
B|AP
≥
≥−≥
=
∩
=
24
( ) 9525,067,1ZP67,1
2,319
14662000
s
xx
z =≤→=
−
=
−
=
−
( ) 0475,09525,01mm2000XP =−=≥
( )
( ) 3372,06628,011600XP
6628,042,0ZP42,0
2,319
14661600
s
xx
z
=−=≥
=≤→=
−
=
−
=
−
( ) ( )
( )
( ) ( )
( )
859,0
3372,0
0475,03372,0
mm1600XP
mm2000XPmm1600XP
BP
BAP
B|AP =
−
=
≥
≥−≥
=
∩
=
Três observações sobre o exemplo são pertinentes:
a) À medida que TR aumenta, aumenta-se a precipitação máxima e diminui-se a mínima.
Isto ocorre porque quando o TR fica maior, menor será a probabilidade com a qual o
valor será maior (no caso de máximos) ou menor (no caso de mínimos) que um
determinado valor da variável. Isto significa que, como a probabilidade é cada vez menor
para que o evento ocorra, mais no extremo da curva normal o mesmo se encontrará.
P2 é maior que P1, assim como P1`é menor que P2`.: TR2 > TR1.
25
b) Pode-se observar também que, para probabilidades menores que 0,01316 e maiores
que 0,98684 não é possível obter o valor com base na freqüência observada, porque as
freqüências extremas correspondem a estes valores, ou seja, o tamanho da amostra
(série histórica) não foi suficiente para que se pudesse detectar e comparar os
estimados pela distribuição de probabilidades em relação às respectivas freqüências
observadas.
c) Pode-se verificar que os erros na estimativa dos eventos são pequenos, indicando que a
distribuição normal pode representar bem o fenômeno das precipitações totais anuais.
No entanto, deve-se aplicar um teste estatístico de aderência para se concluir de forma
mais efetiva, o qual será tratado em tópico específico deste capítulo.
4.7.2.2 Distribuição de Gumbel para máximos ou assintótica de valores máximos do
tipo I
A Função Densidade de Probabilidade (FDP) de Gumbel é dada por:
( ) ( )−µ−α− µ−α−
⋅α=
x
eFDP
ex
(35)
A integração da FDP fornece a função cumulativa de probabilidades (FCP):
( )
( )µ−α−
=≤ − x
exxP e
i (36)
Esta distribuição apresenta os 2 primeiros parâmetros de uma distribuição de
probabilidades, ou seja, σµ e , que são calculados pelas expressões abaixo, considerando-
se o método dos momentos:
s
2826,1^
=α (37)
s45,0x
^
⋅−=µ
−
(38)
Em que
−
x e s correspondem, respectivamente, à média e o desvio padrão da série
histórica.
26
Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação
abaixo, fruto da manipulação da equação 36 e da consideração de TR como função da
probabilidade de excedência:
µ+
α
−−−
=
TR
1
1LNLN
xTR (39)
4.7.2.3 Distribuição Generalizada de Extremos – GEV
A distribuição GEV (do inglês “Generalized Extreme Value”) foi introduzida por
Jenkinson (1955), incorporando as 3 formas assintóticas: Gumbel (Tipo I), Fréchet (Tipo II) e
Weibull (Tipo III). Sua FDP é dada por:
( )
σ
µ−
⋅ξ+−⋅
σ
µ−
⋅ξ+⋅
σ
==
ξ
−
ξ
ξ+
−
11
x
1exp
x
1
1
xfFDP (40)
Em que ξ, σ e µ são, respectivamente, os parâmetros de forma, escala e posição. Se
ξ for negativo, a GEV representa a forma assintótica de valores mínimos (Tipo III) e existe
apenas para
( )
ξ
σ−µ
<x . Se ξ for positivo, a GEV representa uma distribuição Tipo II
(Fréchet), definida para
( )
ξ
σ−µ
>x . Se ξ = 0 , tem-se a Distribuição Gumbel. Sua FCP é
dada por:
σ
µ−
⋅ξ+−=≥=
ξ
−
1
x
1exp)xiX(PFCP (41)
A Distribuição GEV apresenta 3 momentos estatísticos:
[ ] ( )[ ]11xxE −ξ−Γ⋅
ξ
σ
+µ== (42)
( ) ( ) ( )[ ]ξ−Γ−ξ⋅−Γ⋅
ξ
σ
= 121xVar 2
2
(43)
( ) ( ) ( ) ( ) ( )
( ) ( )[ ]ξ−Γ−ξ⋅−Γ
ξ−Γ⋅−ξ⋅−Γ⋅ξ−Γ⋅+ξ⋅−Γ−
⋅ξ==γ
2
3
2
3
121
12211331
dealsinCA (44)
27
Para estimar os parâmetros da Distribuição GEV deve-se inicialmente calcular o
parâmetro de forma pela equação 44. Para isto, é importante observar qual sinal ξ tem para
a situação em estudo, o que é obtido mediante análise do coeficiente de assimetria
(distorção). Para ξ = 0, γ = 1,1396; valores de γ superiores a este valor, ξ < 0; valores de γ
menores que 1,1396 implica em ξ > 0 até o valor de -1/3.
A estimativa de uma variável hidrológica associada a um tempo de retorno é dada
por, considerando-se freqüência de excedência:
−−−⋅
ξ
σ
+µ=
ξ−
TR
1
1LN1xTR (45)
4.7.2.4 Distribuição de Fréchet ou Log-Gumbel
Também conhecida como Distribuição de Fréchet, consiste da aplicação da
Distribuição Gumbel aos valores logaritmizados da variável hidrológica. Fréchet aplicou-a
para estudar as freqüências de vazões de cheias, sendo muito útil aos estudos que
envolvem variáveis hidrológicas máximas. Sua FDP e FCP são, respectivamente:
( ) λ
−⋅
λ
⋅
λ
θ
==
θ+θ
x
exp
x
xfFDP
1
(46)
( ) λ
−−=≥=
θ
x
exp1xiXPFCP para x > 0; θ, λ > 0 (47)
Sendo F(x) a freqüência de excedência. São 3 momentos estatísticos:
( )
θ
−Γ⋅λ=µ=
1
1xE para θ > 1 (48)
( )
θ
−Γ−
θ
−Γ⋅λ=σ=
1
1
2
1xVar 222
x para θ > 2 (49)
1
1
1
2
1
CV
2
−
θ
−Γ
θ
−Γ
= para θ > 2 (50)
28
A obtenção dos parâmetros desta distribuição começa com a equação 50 a partir do
coeficiente de variação; em seguida, calcula-se o parâmetro λ com a equação 48, partindo-
se da média. A estimativa de um valor x, associado a um TR, é dada por:
θ
−
−
⋅λ=
1
TR
1TR
TR
LNx (51)
4.7.2.5 Distribuição de Gumbel para mínimos ou assintótica de valores mínimos
extremos do tipo I
Esta distribuição de probabilidades consiste de uma versão da Distribuição de
Gumbel, com a diferença de se trabalhar com séries históricas de valores mínimos,
normalmente vazões mínimas. Na estimativa do parâmetro µ, troca-se o sinal. A definição
dos parâmetros da distribuição, pelo método dos momentos, é dada por:
s
2826,1^
=α (52)
s45,0x
^
⋅+=µ
−
(53)
A FDP é definida por:
( ) ( )−µ−⋅α µ−α
⋅α=
x
eFDP
ex
(54)
A FCP é dada pela probabilidade de não excedência:
( )
( )µ−α−
−=≤
xe
i e1xxP (55)
Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação
abaixo, fruto da manipulação da equação 55 e da consideração de TR como função da
probabilidade de não excedência:
µ+
α
−−
=
TR
1
1LNLN
xTR (56)
29
Exemplo de Aplicação 4.4
Dada uma série histórica de 16 anos de precipitação máxima diária anual para a
cidade de Lavras, MG, no período de 1915 a 1930 (Tabela 4.5). Determinar:
a) Distribuição de freqüência simples de não-excedência dos dados;
b) Aplicar as distribuições Gumbel, GEV e Fréchet e determinar a precipitação máxima
diária para TR de 5, 10 e 20 anos;
c) Determinar o TR para as precipitações máximas diárias anuais de 80 e 90 mm;
Tabela 4.5 Precipitações máximas diárias anuais para Lavras, MG no período de 1915 a
1930 e respectivas freqüências observadas de não excedência.
Ordem Precipitação
(mm)
F não exced. Ordem Precipitação
(mm)
F não exced.
1 46,2 0,05882 9 64,2 0,52941
2 50,0 0,11765 10 66,9 0,58824
3 50,4 0,17647 11 78,2 0,64706
4 57,0 0,23529 12 78,6 0,70588
5 58,7 0,29412 13 78,7 0,76471
6 60,2 0,35294 14 80 0,82353
7 61,6 0,41176 15 85,5 0,88240
8 63,4 0,47059 16 88,5 0,94120
30
Observa-se que as distribuições se ajustaram de forma razoável às freqüências
observadas, com destaque para a distribuição GEV para os valores mais baixos da série,
Fréchet para os intermediários e Gumbel para os maiores. Contudo, nenhuma delas se
ajustou bem aos dados próximos ao valor de 80 mm, uma vez que são números muito
próximos e com freqüências distintas, dificultando o ajuste da distribuição.
a) Estimativa dos valores de precipitação associados aos TRs
de 5, 10 e 20 anos
Distribuição Gumbel
Os parâmetros ajustados para esta distribuição foram: α = 0,0968; µ = 60,80. Aplicando-se
estes parâmetros à equação 39 chega-se aos seguintes valores:
TR = 5 anos.: XTR = 76,30 mm
TR = 10 anos.: XTR = 84,05 mm
TR = 20 anos.: XTR = 91,50 mm
Distribuição GEV
Para esta distribuição, os parâmetros estimados foram: ξ = 0,2329; σ = 10,69; µ = 60,8685.
Aplicando-se a equação 45, chega-se aos seguintes valores:
TR = 5 anos . : XTR = 73,56 mm;
TR = 10 anos . : XTR = 77,94 mm;
TR = 20 anos . : XTR = 81,24 mm;
Distribuição Fréchet
Os parâmetros estimados para esta distribuição foram: θ = 7,313; λ = 60,68. Aplicando-se a
equação 51, chega-se aos seguintes valores:
TR = 5 anos.: XTR = 74,5 mm;
TR = 10 anos.: XTR = 82,54 mm;
TR = 20 anos.: XTR = 91,08 mm;
31
b) Estimativa de TR para as precipitações de 80 e 100 mm
Distribuição de Gumbel
Aplicando o inverso do complemento da equação 36, chega-se a:
P = 80 mm.: TR = 7 anos
P= 90 mm.: TR = 17,4 anos
Distribuição GEV
Aplicando-se a inversa da equação 41, chega-se aos seguintes valores:
P = 80 mm.: TR = 10,6 anos
P = 90 mm.: TR = 76 anos
Distribuição Fréchet
Aplicando-se o inverso da equação 47, chega-se aos seguintes valores:
P = 80 mm.: TR = 8,1 anos
P = 90 mm.: TR = 13,4 anos
Observa-se que a Distribuição GEV tende a superestimar o TR, especialmente para
valores mais altos, por se caracterizar, neste caso como uma distribuição Tipo III, a qual
para valores máximos, consiste de uma exponencial apenas, refletindo em valores mais
elevados. A partir de valores em torno de 80 mm (observar gráfico de ajuste), a distribuição
GEV proporciona ajustes mais distantes dos valores de freqüência observados, o que não
ocorre com as outras duas distribuições.
4.7.2.6 Distribuição Log-normal a 2 parâmetros
A função densidade de probabilidades (FDP) desta distribuição a seguinte:
( ) 2
n
n
e
2x
1
FDP
xLn
5,0
n
σ
µ−
⋅−
⋅
π⋅⋅σ⋅
= (57)
Os parâmetros são determinados por:
( )( )
n
xLn
n
1i
n =µ =
(58)
32
=σn desvio padrão dos dados transformados.
Os valores dos parâmetros desta distribuição podem ser estimados com base na
média e desvio padrão dos dados sem transformação logarítmica. As equações são:
+
⋅=µ
−
−
2
2
4
n
sx
x
Ln
2
1
(59)
+
=σ
−
−
2
2
2
n
x
sx
Ln (60)
Esta distribuição se assemelha à Normal, porém, trabalhando-se com o logarítmo
dos dados. A variável reduzida kTR é o próprio valor de z utilizado na Distribuição Normal.
Assim, a equação geral de Ven Te Chow é trabalhada da seguinte forma:
nTRn k
TR ex σ⋅+µ
= (61)
4.7.2.7 Distribuição Log-normal a 3 parâmetros
Neste caso, a FDP é dada em função de 3 parâmetros, tendo-se a seguinte
estrutura:
( )
( )
( ) 2
n
n
e
2x
1
xf:FDP
xLn
5,0
n
σ
µ−β−
⋅−
⋅
π⋅⋅σ⋅β−
= , com x ≥ β . (62)
Para estimar os parâmetros da distribuição log-normal, com base numa série
histórica de dados, as seguintes equações são aplicadas:
y
s
x
η
−=β
−
(63)
( )
31
32
y
1
φ
φ−
=η (64)
( )
2
4
5,02
+γ+γ−
=φ (65)
33
Com base no coeficiente de assimetria - Ca (equação 22) calcula-se γ . Com isto,
estima-se φ (equação 65), yη (equação 64) e com base neste último valor e na média e
desvio padrão dos dados, o parâmetro β , na equação 63. Os parâmetros nn e σµ são
calculados com base nas seguintes equações:
( )1Ln5,0
s
Ln 2
y
y
n +η⋅−
η
=µ (66)
( )1Ln 2
yn +η=σ (67)
Neste caso, a variável xTR é calculada por:
β+= σ⋅+µ nTRkn
TR ex (68)
Exemplo de Aplicação 4.5
Determinar a precipitação provável para 10, 75 e 90% de probabilidade, com base na
série histórica de precipitação associada ao 1o
decêndio (Tabela 4.6) do mês de janeiro, de
1960 a 1981, para a cidade de Lavras, MG. Calcule também, o TR para uma precipitação
decendial de 310 mm nos primeiros 10 dias de janeiro. Aplique as distribuições log-normal
2P, log-normal 3P e GEV.
1o
) Aplicação da Distribuição Log-normal a 2 parâmetros
A precipitação provável sugere um estudo probabilístico de valores mínimos a serem
garantidos, ou seja, visa-se à uma probabilidade de um dado valor x superar um xi. Esta
situação diz respeito, portanto, à probabilidade de excedência.
O cálculo dos parâmetros nn e σµ foi feito com base no cálculo da média dos dados
logaritmizados, obtendo-se para o primeiro 4,358 e para o segundo 0,8985.
- Para 10% de probabilidade, P(x>xi) = 10% .: P(x<xi) = 90%. Da tabela de z, o
valor deste, para 90% de probabilidade, é 1,28. Assim, a precipitação
provável associada a esta probabilidade:
mm7,246eex 8985,028,1358,4nTRkn
TR === ⋅+σ⋅+µ
. Disto conclui-se que, com uma
probabilidade de 10%, a precipitação provável para os primeiros 10 dias de janeiro é
de 246,7 mm.
34
- Para 75% de probabilidade, P(x>xi) = 75%.: P(x<xi) = 0,25%. Da tabela de z,
obtém-se valor aproximadamente igual a –0,67. Da mesma forma anterior, a
precipitação provável será 42,78 mm. Espera-se uma precipitação mínima
para os primeiros 10 dias de janeiro, de 42,78 mm, com 75% de
probabilidade.
- Para 90% de probabilidade, P(x>xi) = 90%.: P(x<xi) = 10%. Da tabela de z,
obtém-se este aproximadamente igual a –1,28. Da mesma forma anterior, a
precipitação provável será 24,7 mm.
Tabela 4.6 Série histórica de precipitação associada ao 1ºdecêndio de janeiro para Lavras,
MG, no período de 1960 a 1981, e respectivas freqüências observadas.
Ordem Precipitação
(mm)
Fexcedência Ordem Precipitação
(mm)
Fexcedência
1 290 0,04545 12 84,8 0,54545
2 253,2 0,09091 13 78,5 0,59091
3 189,9 0,13636 14 69,9 0,63636
4 162,8 0,18182 15 53,5 0,68182
5 144,8 0,22727 16 52,4 0,72727
6 141,2 0,27273 17 42,2 0,77273
7 140,3 0,31818 18 29,2 0,81818
8 135,3 0,36364 19 25,5 0,86364
9 111,7 0,40909 20 17,6 0,90909
10 97,8 0,45455 21 8,4 0,95455
11 95,9 0,50000
Analisando os resultados, observa-se que quanto maior a probabilidade de um
evento exceder um dado valor, menor será o evento, uma vez que a probabilidade do valor
ser superado aumenta. Em contrapartida, quanto menor a probabilidade de excedência,
maior será o valor, haja vista que o risco assumido é maior (a probabilidade do valor ser
superado é maior).
Para determinar o TR para uma precipitação mínima de 340 mm, com base nesta
série histórica, procede-se da seguinte forma:
Determina-se kTR e com este valor, na tabela de z, a probabilidade de não-
excedência. Determina-se então a de excedência, e aplica-se na definição de TR para
variáveis cujos estudos interessam a sua superioridade.
35
64,1k
e340ex
TR
8985,0TRk358,4nTRkn
TR
=
=== ⋅+σ⋅+µ
Na tabela de z, obtém-se uma P(x<xi) = 0,94949 e P(x>xi) = 0,05051. O TR será
então igual a 19,8 anos. A probabilidade do valor de 340 mm ser igualado ou superado, pelo
menos uma vez, em 20 anos, é de 0,05051.
2o
) Aplicando-se o modelo Log-normal a 3 parâmetros
Neste caso, o procedimento consiste no cálculo da média, desvio padrão e
coeficiente de assimetria dos dados. Assim:
−
x = 105,95 mm
s = 75,07 mm
Ca = 0,9845
Aplicando a equação 65, em que Ca = γ , determina-se φ :
( ) ( )
6223,0
2
49845,09845,0
2
4
5,025,02
=
++−
=
+γ+γ−
=φ
Na seqüência, aplicando-se a equação 64, obtém-se:
( ) 3175,0
6223,0
6223,01
1
3
1
3
2
31
32
y =
−
=
φ
φ−
=η
Com a equação 63, determina-se o 3o
parâmetro, que representa a assimetria dos
dados:
47,130
3175,0
07,75
95,105
s
x
y
−=−=
η
−=β
−
Com estas informações, estima-se nn e σµ com nas equações 66 e 67:
( ) ( ) 418,513175,0Ln5,0
3175,0
07,75
Ln1Ln5,0
s
Ln 22
y
y
n =+⋅−=+η⋅−
η
=µ
36
( ) ( ) 3099,013175,0Ln1Ln 22
yn =+=+η=σ
- Para P(x>xi) = 10%, o valor de z, conforme exemplo anterior,,é 1,28. Assim, a
precipitação será:
-
mm71,20447,130eex 3099,028,1418,5nTRkn
TR =−=β+= ⋅+σ⋅+µ
- Para P(x>xi) = 75%, o valor de z é –0,67, e a precipitação mínima será:
xTR = 52,7 mm
- Para P(x>xi) = 90%, o valor de z é de –1,28 e a precipitação será:
xTR = 21,1 mm.
Cálculo de TR para 340 mm com base na distribuição com 3 parâmetros:
kTR = 2,37.: P(x<xi) = 0,9911 e P(x>xi) = 0,0089 e TR = 112,4 anos. Nota-se uma grande
diferença entre os cálculos dos dois modelos para a estimativa deste TR.
3o
Aplicando a Distribuição GEV
O cálculo da assimetria dos dados produziu um valor de 0,9845. Aplicando-se a
equação 44, considerando sinal negativo, chega-se ao valor do parâmetro de forma desta
distribuição, o qual é igual a 0,02742. Na seqüência, aplicando o momento de segunda
ordem, encontra-se o parâmetro de escala igual a 60,587. Com a equação 42 e os demais
parâmetros, é possível estimar o parâmetro de posição µ como sendo igual a 72,58. Desta
forma, com a equação 41, são estimados os valores de precipitação associados aos níveis
de probabilidade de excedência.
Para Prob (x>xi) = 90%: P = 21,5 mm;
Para Prob (x>xi) = 75%: P = 52,7 mm;
Para Prob (x>xi) = 10%: P = 204,8 mm.
Comparando-se as estimativas da precipitação pelas três distribuições ao valor
obtido com base na freqüência observada, é possível desenvolver o seguinte quadro
resumo dos resultados:
37
P(x>xi) LN 2P (mm) LN 3P (mm) GEV (mm)
10 246,7 204,7 204,8
75 42,8 52,7 52,7
90 24,7 21,1 21,5
Obs.: A análise da distribuição de probabilidades que é mais precisa pode ser obtida
mediante testes estatísticos apropriados, os quais permitirão verificar a adequação da
distribuição bem como inferir sobre sua precisão propriamente dito.
4.7.2.8 Distribuição Gama
Consiste de uma distribuição de probabilidades com ampla aplicação à hidrologia,
com destaque para precipitação provável e vazões de maneira geral. Sua Função
Densidade de Probabilidades (FDP), considerando sua versão a 2 parâmetros, é:
( )
( )
β
−
−υ
υ
⋅⋅
υΓ×β
=
x
1
ex
1
xf:FDP (69)
Os parâmetros desta distribuição são β e υ, os quais podem ser obtidos por:
X
s2
=β (70)
( )
2
2
s
X
=υ (71)
A função Gama de um número qualquer pode ser aproximada por2
:
( ) ( ) ( )5.5n5.0n5
1i
i
o e5.5n
in
p
p
n
2
n +−+
=
⋅+⋅
+
+⋅
π
=Γ (72)
Para esta estimativa considerar:
po = 1,000000000190015; p1 = 76,180091729471460; p2 = -86,505320329416770;
p3 = 24,014098240830910; p4 = -1,231739572450155; p5 = 1,208650973866179x10-3
No entanto, com auxílio do software Excel, é possível obter a função gama de um
número qualquer de forma rápida e precisa, utilizando a função “exp(LNGAMA(n))”, sendo n
o número cujo gama deseja-se obter.
2
Trabalho desenvolvido por Press et al. (1992) com erro absoluto menor que 2x10-10
e citado por Ferreira (2005).
38
A Função Cumulativa de Probabilidades (FCP) deve ser obtida, primeiramente, entre
cada um dos valores da variável x de forma ordenada, para posterior somatório. Para isto,
procede-se calculando as integrais para cada intervalo de x de forma numérica:
( ) ( ) ( ) ( )[ ]+
⋅−=⋅
+
+
+
1ix
ix
1ii
i1i
2
xfxf
xxdxxf (73)
Portanto, a FCP é calculada por:
( ) ( )⋅=≤
x
0
dxxfxXP (74)
A FDP para a versão a 3 parâmetros é:
( )
( )
( )
( )
β
µ−−
−υ
υ
⋅µ−⋅
υΓ×β
=
x
1
ex
1
xf:FDP (75)
A estimativa dos parâmetros desta equação, com base no método dos momentos, é:
2
as
4
=υ (76)
2
sas ⋅
=β (77)
as
s2
X
⋅
−=µ (78)
Em que s é o desvio padrão e as é o coeficiente de assimetria. A versão desta
distribuição a 3 parâmetros pode produzir melhores resultados, contudo, os graus de
liberdade do ajuste também podem ficar comprometidos. Alguns estudos desenvolvidos
para precipitação provável têm mostrado desempenho similar destas distribuições, optando-
se, normalmente pela versão a 2 parâmetros.
4.7.2.9 Distribuição Weibull
Esta distribuição apresenta aplicações a séries históricas de valores mínimos, sendo,
normalmente trabalhada para séries de vazões mínimas ou similares. A distribuição de
Weibull é uma derivação da distribuição Assintótica de Valores Extremos. Sua FDP é dada
por:
39
( )
β⋅λ−−β
⋅⋅β⋅λ= x1
exxf:FDP (79)
A Função Cumulativa de Probabilidades (FCP) é dada por:
( )
β⋅λ−
−=≤ x
e1xXP:FCP (80)
Os parâmetros desta distribuição são λ e β, que estão associados à média e
variância, respectivamente, por:
β
+Γ⋅
λ
==µ
β 1
1
1
X
1
^
(81)
β
+Γ−
β
+Γ⋅
λ
==σ
β
22
2
^
2 1
1
2
1
1
s (82)
O valor da variável x associada ao tempo de retorno (TR) pode ser calculado por:
β
λ
−
=
1
-
TR
1
1Ln
x (83)
Exemplo de Aplicação 4.6
Com base nas distribuições de probabilidade Weibull, Gumbel e GEV determinar a
vazão mínima de sete dias consecutivos para os TRs de 10, 20 e 50 anos, com base numa
série histórica de vazão mínima com 7 dias consecutivos, de 68 anos para o Rio Grande, sul
de Minas Gerais (Tabela 4.7). Calcule também, o TR para uma vazão mínima esperada de 6
m3
s-1
por ambas as distribuições.
40
Tabela 4.7 Série histórica de vazões mínimas com 7 dias consecutivos do Rio Grande com
seção de controle em Madre de Deus e respectivas freqüências observadas.
Ordem Vazão Fnão-excedência Ordem Vazão Fnão-excedência
1 8,97 0.01449 35 19.49 0.50725
2 10,41 0.02899 36 19.53 0.52174
3 11,32 0.04348 37 19.67 0.53623
4 11,50 0.05797 38 19.87 0.55072
5 13,10 0.07246 39 19.89 0.56522
6 13,15 0.08696 40 19.98 0.57971
7 13,57 0.10145 41 20.11 0.59420
8 14,46 0.11594 42 20.21 0.60870
9 14,95 0.13043 43 20.39 0.62319
10 14,95 0.14493 44 20.83 0.63768
11 15,66 0.15942 45 21.08 0.65217
12 16,04 0.17391 46 21.61 0.66667
13 16,06 0.18841 47 22.11 0.68116
14 16,18 0.20290 48 22.16 0.69565
15 16,20 0.21739 49 22.40 0.71014
16 16,32 0.23188 50 22.41 0.72464
17 16,39 0.24638 51 22.72 0.73913
18 17,00 0.26087 52 22.84 0.75362
19 17,02 0.27536 53 23.19 0.76812
20 17,04 0.28986 54 23.79 0.78261
21 17,04 0.30435 55 24.76 0.79710
22 17,48 0.31884 56 24.78 0.81159
23 17,57 0.33333 57 25.16 0.82609
24 17,66 0.34783 58 25.24 0.84058
25 17,72 0.36232 59 25.41 0.85507
26 17,88 0.37681 60 25.72 0.86957
27 18,09 0.39130 61 26.60 0.88406
28 18,77 0.40580 62 26.62 0.89855
29 18,79 0.42029 63 26.96 0.91304
30 18,79 0.43478 64 27.90 0.92754
31 18,80 0.44928 65 29.24 0.94203
32 19,04 0.46377 66 30.30 0.95652
33 19,41 0.47826 67 32.50 0.97101
34 19,48 0.49275 68 38.25 0.98551
1o
) Aplicação da distribuição de Weibull
Trabalhando com os dados da Tabela 4.7, calcula-se a média e desvio padrão dos
dados da mesma. Assim, tem-se:
−
x = 20,01 m3
s-1
s = 5,276 m3
s-1
Manipulando as equações 81 e 82, pode-se chegar à seguinte equação:
41
β
+Γ−
β
+Γ⋅
β
+Γ
µ
=σ
2
2
2 1
1
2
1
1
1
(84)
Com isto, é possível estimar o parâmetro β e a partir daí, com a média dos dados, o
parâmetro λ na equação 81. Respectivamente, tem-se:
β = 4,283378; λ = 1,78219 x 10-6
Aplicando-se a equação 83, para todos os TRs
, tem-se:
TR = 10 anos: Q = 13 m3
/s;
TR = 20 anos: Q = 10,99 m3
/s;
TR = 50 anos: Q = 8,84 m3
/s;
Com base na equação abaixo, calcula-se TR para Q = 6 m3
s-1
, ou seja:
β⋅λ−
−
=
x
e1
1
TR (85)
TR = 261 anos
2o
) Aplicação da distribuição Gumbel (série de mínimos)
Cálculo dos parâmetros da distribuição:
38,22276,545,001,20s45,0X
2431,0
s
2826,1
^
^
=⋅+=⋅+=µ
==α
Para TR = 10 anos
12,1338,22
2431,0
10
1
1LNLN
TR
1
1LNLN
xTR =+
−−
=µ+
α
−−
= m3
/s
Valendo-se do mesmo procedimento, tem-se para os demais tempos de retorno:
TR = 20 anos: Q = 10,16 m3
s-1
TR = 50 anos: Q = 6,33 m3
s-1
42
Determinação de TR:
( ) ( )( )( )µ−⋅α−−
=
≤
=
xexpexp1
1
xiXP
1
TR
( )( )( )
12,54
38,2262431,0expexp1
1
TR =
−⋅−−
= anos
3o
Aplicando-se a Distribuição GEV
O coeficiente de assimetria da série histórica é igual a 0,7195, gerando os seguintes
parâmetros da GEV: σ = 0,5332; α= 5,7207; β = 18,8035. Com estes valores e aplicando a
equação correspondente, tem-se:
Para TR = 10 anos: Q = 12,79 m3
/s;
Para TR = 20 anos: Q = 10,27 m3
/s;
Para TR = 50 anos: Q = 7,33 m3
/s.
O cálculo de TR para uma vazão mínima de 7 dias consecutivos igual a 6 m3
/s,
produziu um valor de 78,5 anos.
Observações
A comparação das distribuições mostra que para valores mais altos de vazão, a
estimativa da freqüência tende a ser próxima, especialmente Weibull e GEV. Para valores
menores, observa-se discrepância nas estimativas, com a GEV mais próxima da
Distribuição Gumbel.
4.8 Estimação dos parâmetros das distribuições de probabilidades com base na
Máxima Verossimilhança
4.8.1 Definições
O Método da Máxima Verossimilhança consiste de uma metodologia desenvolvida
por Fisher em 1922, no qual se busca a maximização da probabilidade (plausibilidade) de
um parâmetro representar uma população, maximizando a densidade conjunta dos
elementos amostrais. A função de verossimilhança é matematicamente definida pelo
produtório das densidades de cada valor amostral, sendo este dado por x1, x2, x3, etc, ou
seja:
( ) ( ) ( ) ( ) ( )∏=⋅⋅=
=
n
1i
xifxnf...3xf2xf1xfL (86)
43
Assim, a máxima verossimilhança consiste em encontrar o ponto de máximo da
função acima, derivando-a em relação a cada um dos seus parâmetros, e igualando-se a
zero. Supondo uma distribuição de probabilidades com 1 parâmetro, como, por exemplo,
Poisson, tem-se:
( ) x
!x
e
xP λ⋅=
λ−
(87)
Em que λ é o parâmetro e x uma variável aleatória discreta. Uma pergunta pode ser
feita: “Qual o melhor parâmetro λ que maximizará a probabilidade de x ser igual a 10?”
Assim, a idéia geral dos estimadores de Máxima Verossimilhança é a seguinte:
Pelo esquema acima, percebe-se que existem vários valores do parâmetro que
podem ser utilizados para calcular a probabilidade de x ser igual a 10. Matematicamente, o
que maximizará esta probabilidade é o valor de λ que satisfará a equação abaixo:
0
d
dP
=
λ
(88)
Para distribuições contínuas com mais de um parâmetro, tem-se uma superfície e
duas outras equações, constituindo um sistema para obtenção dos parâmetros
correspondentes ao ponto de máximo. Para facilitar a solução matemática do ponto de
44
máximo, é necessário linearizar a equação 86, obtendo-se a função logaritmo de
verossimilhança (log (L)):
( ) ( ) ( ) ( ) ( ) ( )=++++=
=
n
1i
xiflogxiflog...3xflog2xflog1xflogLlog (89)
Considerando uma distribuição contínua com parâmetros θ1 e θ2, tem-se:
( )
( ) =
θ∂
∂
=
θ∂
∂
0
2
Llog
0
1
Llog
Sistema de Equações para obtenção dos parâmetros θ1 e θ2.
A seguir serão apresentadas as soluções do sistema acima para as distribuições de
probabilidades apresentadas anteriormente.
4.8.2 Distribuição Normal
A Distribuição Normal é caracterizada pela seguinte expressão:
( ) ( )
σ⋅
µ−
−⋅
σ⋅π
=σµ 2
2
2
2
2
x
exp
2
1
,;xf:.FDP (90)
Aplicando-se o conceito definido pela equação 89, tem-se:
( ) ( )
( )
( )µ−
σ
−
σ⋅π
=∏
σ⋅
µ−
−⋅
σ⋅π
=∏=
===
n
1i
2
2
2
n
2
n
1i
2
2
2
n
1i
xi
2
1
exp
2
1
2
x
exp
2
1
xifL (91)
Linearizando a equação 91, tem-se:
( ) ( ) ( ) ( )µ−
σ
−σ−π−=
=
n
1i
2
2
2
xi
2
1
ln
2
n
2ln
2
n
Lln (92)
Finalmente, derivando-se a equação acima em relação a µ e σ2
, igualando-se a zero,
tem-se:
45
( )
( )µ−⋅
σ
+
σ⋅
−=
σ∂
∂
=
n
1i
2
2222
xi
2
1
2
nLln
(93)
( )µ−⋅
σ
=
µ∂
∂
=
n
1i
2
xi
1Lln
(94)
Assim, igualando as equações acima a zero, é possível resolver em função dos
parâmetros µ e σ2
, obtendo-se sua estimativa por Máxima Verossimilhança:
x
n
xi
n
1i
−
=
==µ (95)
( ) 22
S
n
1n
⋅
−
=σ (96)
Observa-se que estas equações são utilizadas na maioria das vezes em que a
Distribuição Normal é aplicada.
4.8.3 Distribuição Gumbel para máximos
A FDP da distribuição Gumbel é dada por:
( )
( ) ( )µ−⋅α−−µ−⋅α−
⋅α=µα
xex
e,;xf (97)
Sua função logaritmo de verossimilhança é:
( )
( ) ( )
⋅α=
=
µ−α−−µ−⋅α−n
1i
xiexi
elnLln (98)
( ) ( ) ( )+µ−⋅α−+α⋅=
=
µ−⋅α−
=
n
1i
xi
n
1i
exiln
n
1
Lln (99)
Derivando-se em relação a α e µ, igualando-se a zero, tem-se:
( )
( )
=
=
⋅α−
⋅α−⋅
−=
α n
1i
i
n
1i
ii
xexp
xexpx
X
1
(100)
46
( )
( )
n
xexp
exp
n
1i
i
=
⋅α−
=µ⋅α− (101)
A solução deste sistema de equações é desenvolvida solucionando-se a equação
100 para α e substituindo-se este valor na equação 101, encontrando-se µ.
Exemplo de Aplicação 4.7
Compare o comportamento das freqüências estimadas pela distribuição Gumbel,
com parâmetros obtidos pelos Métodos dos Momentos e da Máxima Verossimilhança. A
série histórica de chuvas máximas diárias anuais apresentada na Tabela 4.8 é do município
de Barbacena, MG.
A distribuição Gumbel ajustada com base no método dos momentos propiciou a
estimativa dos parâmetros α e µ, respectivamente iguais a 0,064829 e 68,57729. Pelo
método da máxima verossimilhança obteve-se, respectivamente, 0,0557329 e 67,74231. Os
gráficos da Figura 4.4, na seqüência, representam os ajustes das freqüências teóricas às
observadas.
Figura 4.4 Ajustes da distribuição Gumbel, por Máxima Verossimilhança (MV) e Método dos
Momentos (MM), para série histórica de precipitação máxima diária anual para a cidade de
Barbacena, MG.
47
Tabela 4.8 Série histórica de precipitação máxima diária para o município de Barbacena,
MG.
Ordem hdia Ordem hdia Ordem hdia
1 43.20 25 73.20 49 97.20
2 43.80 26 74.00 50 97.60
3 47.60 27 74.20 51 100.00
4 47.60 28 75.40 52 100
5 49.00 29 77.00 53 100.20
6 49.40 30 78.20 54 101.00
7 49.80 31 79.00 55 105.50
8 50.00 32 81.00 56 111.50
9 50.20 33 82.00 57 116.40
10 53.20 34 82.60 58 121.00
11 57.00 35 83.00
12 58.00 36 86.40
13 58.40 37 88.20
14 60 38 88.20
15 63.20 39 89.00
16 65.00 40 90.00
17 65.00 41 90.40
18 65.60 42 92.60
19 66.00 43 93.00
20 66.00 44 93.20
21 68.00 45 95.00
22 70.00 46 95.00
23 72.60 47 96.20
24 72.60 48 96.60
É possível observar um melhor ajuste da distribuição Gumbel ajustada com base em
parâmetros estimados pela Máxima Verossimilhança, avaliando maior proximidade entre as
freqüências estimadas pela distribuição e as freqüências observadas. Isto também pode ser
comprovado pelo teste Qui-quadrado, onde obteve-se um valor de 7,3 para a distribuição
ajustada por máxima verossimilhança e 13,9 para a distribuição ajustada pelo método dos
momentos, enquanto o Qui-quadrado tabelado é de 14,1. Avalia-se que por este último
método, a distribuição quase não foi adequada e a grande diferença entre os valores de Qui-
quadrado reflete a precisão do ajuste3
. Detalhes da aplicação do teste de Qui-quadrado
serão apresentados em tópico específico sobre Testes de Aderência.
3
Conforme Walpole & Mayers (1978).
48
4.8.4 Distribuição Gama
A distribuição Gama possui a seguinte formulação, na forma incompleta, para sua
FDP:
( )
( )
β
−
−υ
υ
⋅⋅
υΓ⋅β
=υβ
x
1
ex
1
,;xf (102)
Sua função log-verossimilhança é dada por:
( ) ( ) ( )[ ] ( ) ( )
β
−⋅−υ+υΓ⋅−β⋅υ⋅−=υβ =
=
n
1i
n
1i
xi
xilnln1lnnlnn,Lln (103)
As derivadas parciais de ln (L) em relação a α e β igualadas a zero produz:
( ) ( )=υψ−υ
GX
X
lnln (104)
Em que ψ(υ) corresponde à função digama de υ e GX é a média geométrica dos
dados. A função digama pode ser aproximada por uma série de potência da seguinte forma:
( ) ( ) ...
240
1
252
1
120
1
12
1
2
1
ln 8642
υ⋅
+
υ⋅
−
υ⋅
+
υ⋅
−
υ⋅
−υ≅υψ (105)
A solução da equação 105 permite estimar o valor de υ e assim, calcula-se β da
seguinte forma:
υ
=β
X
(106)
4.8.5 Log-normal 3 parâmetros
A FDP da distribuição log-normal 3 parâmetros é dada por:
( )
( )
( )( )µ−−⋅
σ⋅
−
⋅
π⋅σ⋅−
=µσ
2axlog
22
1
e
2ax
1
,,a;xf (107)
49
Para a estimativa dos parâmetros pela Máxima Verossimilhança, adota-se o seguinte
procedimento:
Faz-se x*
= x – a e os parâmetros µ e σ são obtidos por:
( )
n
xlog
n
1i
*
i
=µ =
(108)
( )
n
xlog
n
1i
2*
i µ−
=σ =
(109)
Assim, o parâmetro a é testado, avaliando-se a função log-verossimilhança, até que
haja maximização desta função. A função de log-verossimilhança é dada por:
( ) ( ) ( ) ( ) ( )µ−⋅
σ⋅
−−
π⋅
−σ⋅−=σµ
==
n
1i
2*
i2
n
1i
*
i xlog
2
1
xlog
2
2logn
logna,,;xLln (110)
Exemplo de Aplicação 4.8
Compare os ajustes das freqüências teóricas às observadas para vazões mínimas
anuais do Rio Aiuruoca, região Alto Rio Grande, MG, produzidos pelas distribuições Gama
Incompleta e Log-normal 3 parâmetros, ajustadas por máxima verossimilhança à série
histórica apresentada na Tabela 4.9.
50
Tabela 4.9 Série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem Vazão Ordem Vazão
1 4,71 15 7,48
2 5,34 16 7,53
3 5,72 17 7,57
4 6,00 18 7,62
5 6,18 19 7,70
6 6,43 20 7,92
7 6,45 21 8,01
8 6,72 22 8,09
9 6,81 23 8,22
10 6,87 24 8,77
11 6,95 25 8,94
12 7,05 26 9,75
13 7,13 27 10,25
14 7,40 28 10,69
29 17,50
É possível observar um ligeiro melhor ajuste da distribuição log-normal 3 parâmetros,
o que pode ser constatado também pelos valores de Qui-quadrado calculados para ambos,
onde para a distribuição log-normal 3 parâmetros este valor foi de 0,233 enquanto para
distribuição Gama de 0,297.
Figura 4.5 Ajustes das distribuições Gama e log-normal 3 parâmetros, ajustadas pela
Máxima Verossimilhança, para série histórica de vazões mínimas diárias anuais do Rio
Aiuruoca, Alto Rio Grande, MG.
51
Exemplo de Aplicação 4.9
Comparar o ajuste das distribuições Gama, Log-normal 3 parâmetros e Gumbel,
ajustadas por máxima verossimilhança, às freqüências observadas da série de vazões
máximas diárias anuais do Rio Aiuruoca, apresentadas na Tabela 4.10.
Com base nos gráficos da Figura 4.6, verifica-se que a distribuição Gumbel
apresentou um melhor ajustamento das freqüências teóricas às observadas, seguida da
distribuição log-normal 3 parâmetros. Isto pode ser comprovado pelos valores de Qui-
quadrado das distribuições, sendo igual a 3,423 para distribuição Gumbel; 4,048 para log-
normal 3 parâmetros e 4,315 para a distribuição Gama.
Tabela 4.10 Série histórica de vazões máximas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem Vazão Ordem Vazão
1 53,8 15 95,5
2 54,3 16 98,4
3 57,8 17 105
4 66,3 18 106
5 74,9 19 120
6 75,2 20 120
7 77,3 21 136
8 77,8 22 147
9 79,4 23 155
10 85,7 24 159
11 86,8 25 162
12 88,4 26 163
13 89,2 27 174
14 93,8 28 179
29 179
52
Figura 4.6. Distribuições Gumbel, log-normal 3 parâmetros e Gama, ajustadas por Máxima
Verossimilhança, para série histórica de vazões máximas diárias anuais do Rio Aiuruoca,
Alto Rio Grande, MG.
4.8.6 Weibull
A distribuição de Weibull possui sua FDP caracterizada por:
( )
β⋅λ−
−β
⋅β⋅⋅λ=βα
x
1
ex,;xf (111)
Em que: 0x ≥ ;λ, β > 0
Aplicando-se os conceitos de máxima verossimilhança, chega-se ao seguinte
sistema de equações:
=λ
=
βn
1i
ix
n
(112)
( )( ) ( )−⋅⋅λ
=β
= =
βn
1i
n
1i
ii xlnxilnx
n
(113)
53
Utilizando-se o método de Newton-Raphson, obtém-se simultaneamente, β e λ.
4.8.7 GEV
A distribuição GEV possui sua FDP dada por:
( )
σ
µ−
⋅ξ+−⋅
σ
µ−
⋅ξ+⋅
σ
=
ξ
−
ξ
ξ+
−
11
x
1exp
x
1
1
xf (114)
Aplicando-se os conceitos de verossimilhança, chega-se à seguinte equação:
( ) ( )
σ
µ−
⋅ξ+−
σ
µ−
⋅ξ+⋅
σ
==ξσµ ∏∏
=
ξ
−
=
ξ
ξ+
−
=
n
1i
1
i
n
1i
1
i
n
n
1i
i
x
1exp
x
1
1
xf,,L (115)
O logaritmo da função de verossimilhança produz:
( ) ( )
σ
µ−
⋅ξ+−
σ
µ−
⋅ξ+⋅
ξ
ξ+
−σ−=µσξ
=
ξ
−
n
1i
1
ii x
1
x
1ln
1
ln,,;xl (116)
Derivando-se a equação 115 em relação aos respectivos parâmetros e fazendo-se
uma série de manipulações, chega-se ao seguinte sistema de equações:
( ) ( )
( ) ( ) ( )
=
ξ
−
=
ξ
−
=
ξ
−
=
⋅σ
µ−
−
⋅σ⋅ξ
µ−
−⋅
ξ
⋅−
=
−ξ+⋅µ−
⋅
σ
+
σ
−
=
σ
−ξ+
⋅
σ
n
1i i
i
i
i
i2
1
i
n
1i i
1
ii
2
n
1i
1
i
0
y
x
y
x
yln
1
y1
0
y
y1x
1n
0
y11
(117)
Neste caso, tem-se que:
54
σ
µ−
⋅ξ+= i
i
x
1y (118)
Para solução do sistema de equações, sugere-se iniciá-lo com base nos parâmetros
µ, σ e ξ oriundos do método dos momentos (equações 42, 43 e 44).
Exemplo de Aplicação 4.10
Ajustar a distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, na Região Alto Rio Grande (Tabela 4.7).
Os parâmetros ajustados foram: λ = 5,6482 x 10-6
; β = 3,908993 e a aderência das
freqüências observadas às teóricas representada na Figura 4.7.
Figura 4.7 Ajuste da Distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, seção de Madre de Deus, MG.
Exemplo de Aplicação 4.11
Ajustar a distribuição GEV ajustada por Máxima Verossimilhança e Método dos
Momentos para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6.
55
Parâmetro MV MM
σ 54,08 60,59
µ 70,74 72,58
ξ 0,088 0,0274
Gráfico dos ajustes
A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em
relação às observadas foi de 9,70% para o método dos momentos e de 9,49% para o
método da Máxima Verossimilhança, com o erro máximo de 52% para MM e de 44% para
MV. Segundo alguns autores, o desempenho da MV será superior quanto maior a série
histórica, que no caso deste exemplo, apesar de apenas 21 dados da série histórica, esta
metodologia mostrou-se ligeiramente superior.
4.9 Estimação de parâmetros das Distribuições de Probabilidades com base nos
Momentos – L
O método dos momentos – L consiste de uma abordagem estatística que permite
estimar os parâmetros de uma distribuição de probabilidades com base em mais momentos
estatísticos de ordem superior a 3, podendo permitir, em casos de pequenas amostras,
ajustar, com maior precisão, uma distribuição de probabilidades do que o Método da
Máxima Verossimilhança.
56
Hosking (1990) menciona que os valores numéricos de momentos amostrais, em
especial de pequenas amostras, podem ser muito diferentes daqueles que de fato
caracterizam uma determinada população, constituindo-se em erros de elevada magnitude
na estimativa da freqüência.
Desta forma, foram introduzidos os conceitos de momentos ponderados por
probabilidades (MPP), apresentando a seguinte expressão para estimativa dos momentos
amostrais:
i
N
1i
^
s x
s
1N
s
iN
N
1
⋅
−
−
⋅=α
=
(119)
Em que N é o tamanho da amostra, s é um número inteiro que varia de 0 a 3 e xi a
variável hidrológica em questão. Os termos entre parênteses são obtidos pela análise
combinatória, ou seja:
( )
( ) !s!siN
!iN
s
iN
⋅−−
−
=
−
(120)
Os momentos que podem ser estimados pela equação 119 podem ser linearizados
de acordo com Hosking (1990), uma vez que, nesta forma, os momentos são de difícil
aplicação para modelagem (caracterização da forma e escala) de uma distribuição de
probabilidades. Assim, os momentos podem então ser estimados pelas equações, sendo
conhecidos como Momentos - L:
32104
2103
102
01
203012
66
2
α⋅−α⋅+α⋅−α=λ
α⋅+α⋅−α=λ
α⋅−α=λ
α=λ
(121)
O momento – L λ1 é equivalente à média. O coeficiente de variação, o qual está
associado ao parâmetro de escala, é dado por:
1
2
λ
λ
=τ (122)
Os coeficientes de assimetria e curtose são obtidos respectivamente, por:
57
2
3
3
λ
λ
=τ (123)
2
4
4
λ
λ
=τ (124)
4.9.1 Aplicação às Distribuições de Probabilidades apresentadas
a) Distribuição Normal
01
^
α=λ=µ (125)
( )102
^
2 α⋅−α⋅π=λ⋅π=σ (126)
b) Distribuição Gumbel para Máximos
( )
2
^ 2ln
λ
=α (127)
^1
^ 5772,0
α
−λ=µ (128)
c) Distribuição Gumbel para Mínimos
( )
2
^ 2ln
λ
=α
^1
^ 5772,0
α
+λ=µ (129)
d) Distribuição Gama
( )
( )1
5,0
1
2
+υΓ⋅π
+υΓ
=
λ
λ
(130)
υ
λ
=β 1
(131)
58
e) GEV
( ) ( )2
^
C9554,2C859,71 ⋅+⋅⋅−=ξ (132)
( )
( )3ln
2ln
3
2
C
3
−
τ+
= (133)
( )
( )ξ−
ξ−
−
−⋅
+−=τ
21
312
33 (134)
( ) ( )ξ−
−⋅ξ+Γ
ξ⋅λ
=σ
211
2
^
(135)
( )[ ]ξ+Γ−⋅
ξ
α
−λ=µ 111
^
(136)
f) Log-normal
2
z
2
^
N ⋅=σ (137)
Sendo z a variável Normal padrão correspondente à probabilidade
+τ
2
1
.
( ) ( )
2
ln
2
N
1N
^ σ
−λ=µ (138)
Exemplo de Aplicação 4.12
Compare o ajuste da distribuição GEV obtido pela Máxima Verossimilhança (MV),
Método dos Momentos (MM) e Método dos Momentos – L (MML) para a série histórica de
precipitação decendial do mês de janeiro da Tabela 4.6. Os ajuste por MV e MM foram
apresentados no Exemplo de Aplicação 4.11.
Parâmetro MV MM MML
σ 54,08 60,59 60,93
µ 70,74 72,58 70,77
ξ 0,088 0,0274 0,00000104
59
Gráfico dos ajustes
A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em
relação às observadas foi de 9,70% para o método dos momentos, de 9,49% para o método
da Máxima Verossimilhança e 8,54% para o método dos momentos-L, com o erro máximo
de 52% para MM, de 44% para MV e 46,3% para MML. O desempenho de MML
normalmente é superior, especialmente para séries históricas menores, conforme
comentado anteriormente.
Exemplo de Aplicação 4.13
Com base na série histórica do Exemplo de Aplicação 4.4 (série da Tabela 4.5), a
qual diz respeito à precipitação máxima diária anual, ajuste a Distribuição de Gumbel pelo
método dos Momentos-L (ML), comparando o ajuste ao obtido pelo Método dos Momentos
(MM) e calcule a precipitação máxima diária anual para os TRs
de 5, 10, 50 e 100 anos.
Os respectivos ajustes produziram os seguintes parâmetros, calculando-se os erros
médios absolutos entre as freqüências observadas e estimadas em cada um dos métodos.
60
Parâmetros MM ML
0,09683 0,08930
60,7957 60,2926
Erro (%) 16,81 13,64
Graficamente:
TR MM ML
5 76,29 77,09
10 84,04 85,49
50 101,09 104,00
100 108,30 111,81
Com base nos dados de erro absoluto acima, há indicativo de que o Método dos
Momentos-L gerou maior precisão do que o Método dos Momentos. No entanto, é
importante que esta análise possa ser conduzida com base em algum teste estatístico,
permitindo uma conclusão mais apropriada.
61
Exemplo de Aplicação 4.14
Ajuste as distribuições Gama 2P e GEV pelo método dos Momentos-L, comparando
os ajustes, à mesma série histórica do Exemplo 4.13 (Série da Tabela 4.5).
Os ajustes produziram um erro médio absoluto de estimativa das freqüências
observadas de 9,94% para a Distribuição Gama e de 13,81% para a Distribuição GEV. O
erro máximo observado na primeira situação foi de 24,1% e para a segunda, de 37,6%,
apontando para um melhor desempenho da distribuição Gama quando este método de
ajuste é aplicado. Graficamente, é possível perceber o melhor ajustamento das freqüências
estimadas às observadas pela Distribuição Gama.
Exemplo de Aplicação 4.15
Com base na série histórica de vazões mínimas consecutivas de 7 dias, do Rio
Grande (Tabela 4.7), ajuste as distribuições GEV e log-normal 2P pelo método dos
Momentos-L e calcule o valor correspondente ao TR de 10 anos por ambos os modelos.
Os parâmetros ajustados para a distribuição GEV foram:
= 6,91x10-5
; = 4,191; = 17,588
Os parâmetros ajustados da distribuição log-normal 2P foram:
N = 0,2588; N = 2,963
62
Para um TR de 10 anos, correspondendo a valores mínimos, portanto, probabilidade
de não excedência, estima-se uma Q7,10 para o Rio Grande na seção de controle de Madre
de Deus, um valor de 14,1 m3
/s com aplicação da GEV e de 13,9 m3
/s aplicando-se a
distribuição log-normal 2P. O desempenho das distribuições é semelhante.
Graficamente, tem-se:
4.10 Adequação Estatística de uma Distribuição de Probabilidades
Para a aplicação de uma distribuição de probabilidades é indispensável analisar se a
mesma representa adequadamente bem a relação funcional entre os valores do evento e as
respectivas freqüências de ocorrência dos mesmos. Para isto, há necessidade de se
comprovar previamente se a distribuição é adequada para a série histórica a ser trabalhada.
A comprovação é feita com base em testes estatísticos não paramétricos, os quais, na
seqüência, serão apresentados de forma detalhada aqueles mais usuais em hidrologia,
sendo que também são conhecidos como Testes de Aderência Estatística.
4.10.1 Teste de Kolmogorov-Smirnov
Neste teste, promove-se o cálculo da diferença entre as freqüências observadas
(amostrais) e as freqüências esperadas com base na distribuição de probabilidades,
comparando-se a maior diferença obtida a um valor que correspondente à estatística do
teste (Tabela 4.11). Esta estatística é obtida em função do tamanho da amostra (n) e nível
63
de significância ( )α a ser adotado (5% na maioria das vezes). A hipótese de nulidade a ser
testada é a Hipótese Ho de que a freqüência observada poderá ser estimada pela
distribuição de pobabilidades, ou seja, como o valor tabelado é estatisticamente nulo, pode-
se concluir que valores menores ou iguais a este serão também estatisticamente nulos.
Desta forma, tem-se:
( )α
∆≤∆ n,tabelaáximocalculadom
FF (139)
Nesta situação, a distribuição de probabilidades será adequada, pois
[ ] máximocalculadoF∆ será nulo estatisticamente e, portanto, a freqüência observada não difere
da esperada. Observa-se que apenas a máxima diferença entre as freqüências é
considerada neste teste. Desta forma, o Teste de Kolmogorov-Smirnov é inteiramente
qualitativo, significando que o mesmo permite apenas a conclusão de que a distribuição de
probabilidades é adequada ou não, não havendo embasamento suficiente para se concluir a
respeito da precisão e comparação entre distribuições distintas. Se na equação 139 ocorrer
o contrário, a distribuição não será adequada, devendo-se buscar o ajuste de outra.
64
Tabela 4.11 Valores críticos do teste de Kolmogorov-Smirnov (Adaptado de Haan, 2002).
Nível de SignificânciaTamanho da
Amostra (N) 0,20 0,15 0,10 0,05 0,01
1 0,900 0,925 0,950 0,975 0,995
2 0,684 0,726 0,776 0,842 0,929
3 0,565 0,597 0,642 0,708 0,829
4 0,494 0,525 0,564 0,624 0,734
5 0,446 0,474 0,510 0,563 0,669
6 0,410 0,436 0,470 0,521 0,618
7 0,381 0,405 0,438 0,486 0,577
8 0,358 0,381 0,411 0,457 0,543
9 0,339 0,360 0,388 0,432 0,514
10 0,322 0,342 0,368 0,409 0,486
15 0,268 0,283 0,304 0,338 0,404
20 0,231 0,246 0,264 0,294 0,352
25 0,210 0,220 0,240 0,264 0,320
30 0,190 0,200 0,220 0,242 0,290
40 - - - 0,210 0,250
50 - - - 0,190 0,230
60 - - - 0,170 0,210
70 - - - 0,160 0,190
80 - - - 0,150 0,180
90 - - - 0,140 -
100 - - - 0,140 -
4.10.2 Teste de Qui-quadrado
Este teste é mais rigoroso que o anterior por agrupar os dados da série histórica em
classes de freqüência e acumular os erros entre as freqüências observada e teórica, com
participação de todas as classes e não apenas a máxima diferença. A soma destes erros
(obtida pela soma dos erros de todas as classes) gera o valor de λ2
calculado. A estatística do
teste é obtida por meio da tabela de λ2
(Tabela 4.12), adotando-se o valor tabelado com
base em graus de liberdade da distribuição e nível de significância. Para que a distribuição
de probabilidades tenha aderência aos dados, o valor de λ2
calculado deve ser menor que o de
tabela. Assim, tem-se:
65
( )−
=χ
=
n
1i teoricoi
2
teoricoiobsi
calculado
2
f
ff
(140)
Em que n é o número de classes, fobsi e fteóricoi são, respectivamente, as freqüências
observada e teórica na classe i. As classes com menos de 3 valores devem ser agrupadas
com as classes vizinhas, seguindo os critérios de aplicação do teste. Os Graus de Liberdade
a serem adotados neste teste podem ser obtidos considerando-se uma situação
intermediária entre o número de classes menos 1 e o número de classes menos número de
parâmetros da distribuição menos 1. Por exemplo: para 6 classes, os graus de liberdade
devem estar, para uma Distribuição Normal (2 parâmetros) entre 5 e 3, adotando-se 4.
Ressalta-se que para um pequeno número de classes o teste perde precisão. Para maiores
detalhes para aplicação deste teste, consultar Ferreira (2005) e Haan (2002). Um detalhe
adicional é de que a equação 140 representa uma forma de cálculo do quadrado médio do
erro e todas as freqüências participam do mesmo. Desta forma, Walpole & Myers (1978)
consideram o teste de λ2
um cálculo de precisão do ajuste da distribuição de probabilidades.
131
Tabela 4.12 Quantis superiores da distribuição Qui-quadrado associados aos graus de liberdade (v) e diferentes níveis de significância
(adaptado de Ferreira 2005).
Nível de SignificânciaGraus de
Liberdade (v) 0,995 0,975 0,950 0,900 0,750 0,500 0,100 0,050 0,010 0,005
1 0,000039 0,000982 0,003932 0,015791 0,101532 0,455 2,706 3,841 6,635 7,879
2 0,010025 0,050636 0,102587 0,210721 0,575364 1,386 4,605 5,991 9,210 10,597
3 0,071721 0,215793 0,351843 0,584369 1,213 2,366 6,251 7,815 11,345 12,838
4 0,206989 0,484418 0,710723 1,064 1,923 3,357 7,779 9,488 13,277 14,860
5 0,411742 0,831212 1,145 1,610 2,675 4,351 9,236 11,070 15,086 16,750
6 0,675727 1,237 1,635 2,204 3,455 5,348 10,645 12,592 16,812 18,548
7 0,989256 1,690 2,167 2,833 4,255 6,346 12,017 14,067 18,475 20,278
8 1,344 2,180 2,733 3,490 5,071 7,344 13,362 15,507 20,090 21,955
9 1,735 2,700 3,325 4,168 5,899 8,343 14,684 16,919 21,666 23,589
10 2,156 3,247 3,940 4,865 6,737 9,342 15,987 18,307 23,209 25,188
15 4,601 6,262 7,261 8,547 11,037 14,339 22,307 24,996 30,578 32,801
20 7,434 9,591 10,851 12,443 15,452 19,337 28,412 31,410 37,566 39,997
25 10,520 13,120 14,611 16,473 19,939 24,337 34,382 37,652 44,314 46,928
30 13,787 16,791 18,493 20,599 24,478 29,336 40,256 43,773 50,892 53,672
40 20,707 24,433 26,509 29,051 33,660 39,335 51,805 55,758 63,691 66,766
50 27,991 32,357 34,764 37,689 42,942 49,335 63,167 67,505 76,154 79,490
60 35,534 40,482 43,188 46,459 52,294 59,335 74,397 79,082 88,379 91,952
120 83,852 91,573 95,705 100,624 109,220 119,334 140,233 146,567 158,950 163,648
240 187,324 198,984 205,135 212,386 224,882 239,334 268,471 277,138 293,888 300,182
480 403,949 421,189 430,198 440,745 458,754 479,334 520,11 532,075 555,006 563,561
∞ 850,891 876,028 889,081 904,291 930,093 959,333 1016,566 1033,193 1064,867 1076,621
132
4.10.3 Teste de Filliben
Este teste foi introduzido por Filliben em 1975 para testar (verificar) a hipótese
H0 de normalidade, tendo sido adaptada para outras distribuições. Isto significa que o
teste verificará se uma determinada amostra y1, y2, y3, ..., yN, extraída de uma
população Y com distribuição de probabilidade F(y) também poderá ser representada
pela mesma distribuição.
Para isto, o teste de aderência estimará um coeficiente de correlação (r) entre
as observações yi e os quantis teóricos wi. Os valores de wi são obtidos pela inversa
da FCP, ou seja:
( )qi1Fwi 1
y −= −
(141)
Sendo Fy
-1
a função inversa da distribuição F(y). Isto significa obter o valor da
variável hidrológica associada à freqüência observada q. Para a distribuição Normal, o
software Excel possui uma função conhecida como INV.NORM. Para as demais,
procede-se aplicando a estrutura da própria distribuição. A freqüência observada qi é
obtida pela seguinte equação:
a21N
ai
qi
⋅−+
−
= (142)
Sendo i a posição ocupada pelo valor na série amostrada, de preferência em
ordem crescente, N é o tamanho da amostra e a é um parâmetro a ser adotado de
acordo com a distribuição. Para a distribuição Normal e log-normal, a = 0,375; para
Weibull, a = 0; Gumbel, a = 0,44; GEV e outras, a = 0,40.
O coeficiente de correlação entre wi e yi é dado por:
( ) ( )
( ) ( )−⋅−
−⋅−
=
==
=
N
1i
2
i
N
1i
2
i
N
1i
ii
calc
wwyy
wwyy
r (143)
Este valor deverá ser comparado a um valor crítico de r, considerando a
distribuição em questão. Se rcalc > rcr´tic, a amostra poderá ser representada pela
respectiva distribuição. Os valores de rcritic estão apresentados nas Tabelas 4.13, 4.14
e 4.15, respectivamente para as Distribuições Normal (log-normal), Gumbel (Weibull) e
GEV (adaptadas de Stedinger et al., 1993 por Naghettini & Pinto, 2007).
133
Tabela 4.13 Valores de rcritic para as Distribuições Normal e Log-Normal.
Significância (α)Tamanho da
Amostra (N) 0,10 0,05 0,01
10 0,9347 0,9180 0,8804
15 0,9506 0,9383 0,9110
20 0,9600 0,9503 0,9290
30 0,9707 0,9639 0,9490
40 0,9767 0,9715 0,9597
50 0,9807 0,9764 0,9664
60 0,9835 0,9799 0,9710
75 0,9865 0,9835 0,9757
100 0,9893 0,9870 0,9812
Tabela 4.14 Valores de rcritic para as Distribuições Gumbel para máximos e Weibull.
Significância (α)Tamanho da
Amostra (N) 0,10 0,05 0,01
10 0,9260 0,9084 0,8630
20 0,9517 0,9390 0,9060
30 0,9622 0,9526 0,9191
40 0,9689 0,9594 0,9286
50 0,9729 0,9646 0,9389
60 0,9760 0,9685 0,9467
70 0,9787 0,9720 0,9506
80 0,9804 0,9747 0,9525
100 0,9831 0,9779 0,9596
134
Tabela 4.15 Valores de rcritic para a Distribuição GEV.
Valores do Parâmetro σ
Significância
(α)
N σ = -0,30 σ = -0,20 σ = -0,10 σ = 0 σ = 0,10 σ = 0,20
5 0,777 0,791 0,805 0,817 0,823 0,825
10 0,836 0,845 0,856 0,866 0,876 0,882
0,01 20 0,839 0,855 0,878 0,903 0,923 0,932
30 0,834 0,858 0,890 0,920 0,942 0,953
50 0,825 0,859 0,902 0,939 0,961 0,970
100 0,815 0,866 0,920 0,959 0,978 0,985
5 0,853 0,863 0,869 0,874 0,877 0,880
10 0,881 0,890 0,900 0,909 0,916 0,920
0,05 20 0,898 0,912 0,926 0,938 0,948 0,953
30 0,903 0,920 0,937 0,952 0,961 0,967
50 0,908 0,929 0,950 0,965 0,974 0,979
100 0,914 0,940 0,963 0,978 0,985 0,989
5 0,888 0,892 0,896 0,899 0,901 0,903
10 0,904 0,912 0,920 0,927 0,932 0,936
0,10 20 0,920 0,932 0,943 0,952 0,958 0,962
30 0,928 0,941 0,953 0,962 0,969 0,973
50 0,935 0,950 0,963 0,973 0,979 0,982
100 0,944 0,961 0,974 0,983 0,988 0,991
4.10.4 Teste de Anderson-Darling
Este teste tem grande aplicabilidade em situações nas quais os dados
apresentam assimetria nas suas distribuições de freqüência, ou seja, séries históricas
caracterizadas por valores extremos, tanto no contexto de mínimos quanto de
máximos. Os demais testes analisam e comparam as freqüências observadas às
teóricas e normalmente verificam distorção significativa apenas em freqüências
intermediárias e não analisam de forma mais específica, os dados extremos (caudais).
Assim, distribuições do tipo Gumbel, log-normal, Weibull, GEV e log-Gumbel, dentre
outras, devem ser testadas por este teste sempre que possível.
Além desta aplicação, segundo Sharda et al. (2008) e D’Agostino & Stephens
(1986), este teste pode ser aplicado para analisar a “bondade do ajuste”, ou seja, a
precisão do mesmo quando se deseja comparar duas ou mais distribuições. A
estatística deste teste é a seguinte:
( ) ( ) ( )( )[ ]
=
−+−⋅⋅−−=
N
1i
ii
2
P1lnPln1i2
N
1
NAD (144)
135
Em que N é o tamanho da amostra, i é a posição de cada um dos dados na
série histórica posicionada em ordem crescente e Pi é o corresponde à probabilidade
calculada pela respectiva distribuição. O valor de AD2
deve ser comparado a um valor
crítico p, considerando um nível de significância α. Se AD2
> p (α), rejeita-se a
hipótese Ho de que a distribuição se ajusta de forma adequada aos dados de
freqüência. Na Tabela 4.16 estão apresentados os valores da estatística p (α) do teste
para as distribuições log-normal (normal), Weibull ou Gumbel, de acordo com
D’Agostino & Stephens (1986) e Naghettini & Pinto (2007).
Tabela 4.16 Valores críticos de p (α) para as distribuições log-normal (ou normal) e
Weibull e Gumbel.
Dsitribuição αααα p (αααα) Correção de A2
0,10 0,631
0,05 0,752
0,025 0,873
Normal ou log-normal
0,01 1,035
++ 2
N
25,2
N
75,0
1
0,10 0,637
0,05 0,757
0,025 0,877
Weibull ou Gumbel para
máximos
0,01 1,038
+
N
2,0
1
Adaptado de D”Agostino & Stephens (1986) e Naghettini & Pinto (2007).
Exemplo de Aplicação 4.16
Verificar pelos testes de adequação de Kolmogorov-Smirnov, Qui-quadrado,
Filliben e Anderson-Darling a aplicação da Distribuição Normal à série histórica de
precipitação total anual do Exemplo de Aplicação 4.3.
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica
Hidrologiaestatistica

Mais conteúdo relacionado

Mais procurados

Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...Danilo Max
 
Slide projeto de pesquisa
Slide projeto de pesquisaSlide projeto de pesquisa
Slide projeto de pesquisarivanialeao
 
Exercicios resolvidos de_hidraulica
Exercicios resolvidos de_hidraulicaExercicios resolvidos de_hidraulica
Exercicios resolvidos de_hidraulicaSérgio Lessa
 
Exemplo De Um Bom Resumo
Exemplo De Um Bom ResumoExemplo De Um Bom Resumo
Exemplo De Um Bom ResumoProfmaria
 
Introducao hidrologia
Introducao hidrologiaIntroducao hidrologia
Introducao hidrologiaCleide Soares
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatísticaNíkolas Paes
 
Hidrologia escoamento superficial
Hidrologia   escoamento superficialHidrologia   escoamento superficial
Hidrologia escoamento superficialmarciotecsoma
 
Hidráulica de Canais
Hidráulica de CanaisHidráulica de Canais
Hidráulica de CanaisDanilo Max
 
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins Rodrigues
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins RodriguesRelatorio de estágio final.de estagio Supervisionado Kamilla Martins Rodrigues
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins RodriguesKamilla Rodrigues
 
Exercicios resolvidos -_hidraulica_basic
Exercicios resolvidos -_hidraulica_basicExercicios resolvidos -_hidraulica_basic
Exercicios resolvidos -_hidraulica_basicGerson Justino
 
3 lista-exercicio manometria
3 lista-exercicio manometria3 lista-exercicio manometria
3 lista-exercicio manometriaMarinaldo Junior
 

Mais procurados (20)

Modelo de artigo cientifico
Modelo de artigo cientificoModelo de artigo cientifico
Modelo de artigo cientifico
 
Escalas (1)
Escalas (1)Escalas (1)
Escalas (1)
 
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 12: Regularização ...
 
Slide projeto de pesquisa
Slide projeto de pesquisaSlide projeto de pesquisa
Slide projeto de pesquisa
 
Exercicios resolvidos de_hidraulica
Exercicios resolvidos de_hidraulicaExercicios resolvidos de_hidraulica
Exercicios resolvidos de_hidraulica
 
Exemplo De Um Bom Resumo
Exemplo De Um Bom ResumoExemplo De Um Bom Resumo
Exemplo De Um Bom Resumo
 
Definição..
Definição..Definição..
Definição..
 
Introducao hidrologia
Introducao hidrologiaIntroducao hidrologia
Introducao hidrologia
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatística
 
Hidrologia escoamento superficial
Hidrologia   escoamento superficialHidrologia   escoamento superficial
Hidrologia escoamento superficial
 
Hidráulica de Canais
Hidráulica de CanaisHidráulica de Canais
Hidráulica de Canais
 
Hidrologia Geral
Hidrologia GeralHidrologia Geral
Hidrologia Geral
 
Estudo de Caso
Estudo de CasoEstudo de Caso
Estudo de Caso
 
Relatório de física 3 lei de ohm
Relatório de física 3  lei de ohmRelatório de física 3  lei de ohm
Relatório de física 3 lei de ohm
 
5127 apostila-de-estatistica
5127 apostila-de-estatistica5127 apostila-de-estatistica
5127 apostila-de-estatistica
 
Hidrologia Aula 1
Hidrologia Aula 1Hidrologia Aula 1
Hidrologia Aula 1
 
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins Rodrigues
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins RodriguesRelatorio de estágio final.de estagio Supervisionado Kamilla Martins Rodrigues
Relatorio de estágio final.de estagio Supervisionado Kamilla Martins Rodrigues
 
Exercicios resolvidos -_hidraulica_basic
Exercicios resolvidos -_hidraulica_basicExercicios resolvidos -_hidraulica_basic
Exercicios resolvidos -_hidraulica_basic
 
Fichamento de Texto
Fichamento de TextoFichamento de Texto
Fichamento de Texto
 
3 lista-exercicio manometria
3 lista-exercicio manometria3 lista-exercicio manometria
3 lista-exercicio manometria
 

Semelhante a Hidrologiaestatistica

Semelhante a Hidrologiaestatistica (20)

Precipitação
PrecipitaçãoPrecipitação
Precipitação
 
Aula 4 previs
Aula 4 previsAula 4 previs
Aula 4 previs
 
Capítulo4 [Read-Only].pdf
Capítulo4 [Read-Only].pdfCapítulo4 [Read-Only].pdf
Capítulo4 [Read-Only].pdf
 
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 9: Previsão de Enc...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 9: Previsão de Enc...Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 9: Previsão de Enc...
Apostila de Hidrologia (Profa. Ticiana Studart) - Capítulo 9: Previsão de Enc...
 
Processos estocaticos 20150
Processos estocaticos 20150Processos estocaticos 20150
Processos estocaticos 20150
 
cap2-eventos.pdf
cap2-eventos.pdfcap2-eventos.pdf
cap2-eventos.pdf
 
37
3737
37
 
Probabilidade
ProbabilidadeProbabilidade
Probabilidade
 
Ipaee capitulo3 1
Ipaee capitulo3 1Ipaee capitulo3 1
Ipaee capitulo3 1
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatística
 
Hidrologia+estatística
Hidrologia+estatísticaHidrologia+estatística
Hidrologia+estatística
 
Introdução à Regressão Linear
Introdução à Regressão LinearIntrodução à Regressão Linear
Introdução à Regressão Linear
 
Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4 Estatistica cap 1 2 3 e 4
Estatistica cap 1 2 3 e 4
 
Testes de dispersão
Testes de dispersãoTestes de dispersão
Testes de dispersão
 
Modulo 1
Modulo 1Modulo 1
Modulo 1
 
Resumo -estimacao
Resumo  -estimacaoResumo  -estimacao
Resumo -estimacao
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
 
3 probabilidade
3   probabilidade3   probabilidade
3 probabilidade
 

Último

Lista de presença treinamento de EPI NR-06
Lista de presença treinamento de EPI NR-06Lista de presença treinamento de EPI NR-06
Lista de presença treinamento de EPI NR-06AndressaTenreiro
 
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxTRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxFlvioDadinhoNNhamizi
 
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptxVagner Soares da Costa
 
apresentação de Bancos de Capacitores aula
apresentação de Bancos de Capacitores aulaapresentação de Bancos de Capacitores aula
apresentação de Bancos de Capacitores aulaWilliamCruz402522
 
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptxVagner Soares da Costa
 
Apresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMApresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMdiminutcasamentos
 
NR10 - Treinamento LOTO - 2023.pp tx
NR10 - Treinamento LOTO - 2023.pp     txNR10 - Treinamento LOTO - 2023.pp     tx
NR10 - Treinamento LOTO - 2023.pp txrafaelacushman21
 

Último (7)

Lista de presença treinamento de EPI NR-06
Lista de presença treinamento de EPI NR-06Lista de presença treinamento de EPI NR-06
Lista de presença treinamento de EPI NR-06
 
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxTRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
 
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
 
apresentação de Bancos de Capacitores aula
apresentação de Bancos de Capacitores aulaapresentação de Bancos de Capacitores aula
apresentação de Bancos de Capacitores aula
 
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
 
Apresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMApresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPM
 
NR10 - Treinamento LOTO - 2023.pp tx
NR10 - Treinamento LOTO - 2023.pp     txNR10 - Treinamento LOTO - 2023.pp     tx
NR10 - Treinamento LOTO - 2023.pp tx
 

Hidrologiaestatistica

  • 1. 1 4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações 4.1 Conceitos básicos de Probabilidades Um conjunto de dados hidrológicos necessita ser previamente analisado com base em alguns indicadores estatísticos básicos para que se possa, efetivamente, desenvolver a teoria das probabilidades às situações práticas desejadas. Primeiramente, este conjunto de dados hidrológicos é conhecido, no âmbito da hidrologia, como série histórica e consiste, basicamente, de uma amostra extraída de uma população. Com base nesta amostra, podemos calcular alguns indicadores e medidas estatísticas importantes, como média, desvio padrão (variância), assimetria, curtose e distribuição de freqüência dos dados observados na amostra. Estas medidas caracterizam apenas a amostra e nada dizem a respeito da população em si. A distribuição de freqüências demonstra o comportamento da amostra no tocante à sua simetria e é nosso objetivo, na hidrologia estatística, modelar esta distribuição de freqüência com base num modelo matemático, constituído de parâmetros, conhecido como Distribuição de Probabilidades. Primeiramente, é importante que caracterizemos algumas situações relativas à amostra, contextualizada em termos da hidrologia. Podemos modelar uma distribuição de freqüência no contexto de dados discretos, como por exemplo, o lançamento de uma moeda ou no sorteio de números de alguma forma de loteria. No caso da hidrologia, pode-se, eventualmente, considerar dias chuvosos como variáveis hidrológicas discretas, mas na maioria das vezes, a hidrologia considera suas análises dentro do contexto de variáveis contínuas. Em se tratando de variáveis discretas, podemos responder à pergunta: qual a probabilidade de um número qualquer ser sorteado (evento x) dentro de um espaço amostral finito S qualquer, constituído por N números, sendo este um evento aleatório. A resposta pode ser escrita da seguinte forma: ( ) N mx xP = (1) Observe que todos os números que constituem o espaço amostral S possuem a mesma possibilidade de ser sorteados numa situação não viciada. É importante, no entanto, diferenciarmos probabilidade de freqüência. Esta última está associada ao número de vezes que um determinado evento ocorreu, enquanto que probabilidade refere-se às possíveis situações de ocorrência, que no caso da equação 1, é considerada como de igual de probabilidade. Assim, se um sorteio de cara e coroa é realizado 10 vezes e “cara” for sorteado 7 vezes, sua freqüência será 0,7. Por lado, como
  • 2. 2 temos apenas duas possibilidades e estas são iguais (numa situação não viciada), o número de vezes esperado para o sorteio de “cara” é 5 vezes, portanto, a probabilidade seria 0,5. No entanto, na hidrologia, em grande parte das vezes, nos interessa, em termos práticos, avaliar qual a possibilidade de um determinado evento ser maior ou igual (ou menor ou igual) a um dado valor xi e isto remete ao conceito de uma variável contínua, como por exemplo, vazões de um rio. Existem diferenças importantes nos modelos probabilísticos para ambas as situações. No caso de variáveis discretas busca-se estimar qual a P(x) ser igual a um valor; no caso de variáveis contínuas, qual a P(x > xi) ou P(X<xi). Para variáveis discretas, o modelo probabilístico pode ser ajustado com apenas um parâmetro, normalmente vinculado à média, como no caso da Distribuição de Poisson. Em se tratando de variáveis contínuas, o modelo probabilístico necessita de 2 ou 3 parâmetros para seu ajuste, e estes estão vinculados às medidas estatísticas de média, variância e assimetria, ou seja, aos momentos estatísticos de 1ª, 2ª e 3ª ordens. 4.1.1 Probabilidade Condicional A probabilidade de ocorrência de um determinado evento A pode ser influenciado pela ocorrência de outro evento B, uma vez que haverá redução do espaço amostral S para a realização do evento A quando B ocorre. Neste caso, tem-se a seguinte definição: ( ) ( ) ( )BP BAP B|AP ∩ = (2) Nesta equação, ( )B|AP significa a probabilidade do evento A, associada (ou condicionada) ao evento B, ( )BAP ∩ significa a intersecção dos eventos A e B no plano amostral S e P(B) é a probabilidade de ocorrência do evento B. Graficamente, teríamos: Deste esquema, depreende-se também que: S B A ( )BAP ∩
  • 3. 3 ( ) ( ) ( ) ( )BAPBPAPBAP ∩−+=∪ (3) Exemplo de Aplicação 4.1 a) Sabendo-se que a probabilidade de ocorrer em janeiro uma precipitação total superior 200 mm é de 0,098, recalcule esta probabilidade sabendo-se que já ocorreram 130 mm no respectivo mês e que a probabilidade de se superar este último valor é de 0,234. Neste exemplo, o evento A consiste de P(A) = 0,098; o evento B é P(B) = 0,234. Queremos a probabilidade do evento A mediante a condição de que já houve 130 mm no mês de janeiro, ou seja, P(A|B): ( ) ( ) ( ) ( ) ( ) ( ) 581,0 234,0 098,0 1 BP APBP BP BAP B|AP =−= − = ∩ = b) Considere 2 eventos probabilísticos, A e B, ambos associados à possibilidade da vazão mínima de um curso d’água não atender à demanda de um projeto, que é 4 m3 /s. O evento A implica que a probabilidade da vazão do córrego A ser inferior a 2 m3 /s é de 0,0547 e do córrego B é de 0,0891. Qual a probabilidade do projeto não receber a vazão mínima projetada, sabendo-se que o evento A está condicionado a B [(P|B) = 0,65]? P(A) = 0,0547; P(B) = 0,0891. A possibilidade do projeto não ser atendido implica em ( )BAP ∪ (equação 3). Como P(A|B) é 0,65, da equação 2, tem-se: ( ) ( ) ( ) 0579,00891,065,0BPB|APBAP =×=×=∩ ( ) ( ) ( ) ( ) 0859,00579,00891,00547,0BAPBPAPBAP =−+=∩−+=∪
  • 4. 4 4.2 Freqüência de Dados Hidrológicos Os fenômenos hidrológicos podem ser caracterizados como aleatórios, podendo-se associar aos mesmos, um caráter probabilístico envolvendo estes fenômenos. Em termos de seu comportamento há de se ressaltar que, sempre haverá possibilidade de um dado evento hidrológico ser superior ou inferior a um valor histórico já registrado. Isto é essencial para o entendimento das variáveis hidrológicas, uma vez que esta é uma das principais funções da hidrologia, que consiste em observar os eventos e modelar as freqüências de ocorrência, possibilitando que sejam feitas previsões assumindo determinado risco. As variáveis hidrológicas, na maioria das vezes, são consideradas contínuas, ou seja, variáveis que em termos físicos, existem continuamente no tempo. Em termos estatísticos, são aplicadas distribuições que modelam este caráter, trabalhando com cálculos de áreas sob a curva de distribuição de probabilidades abaixo ou acima de determinado valor de interesse prático ou entre valores. Percebe-se que neste caso, não se pergunta qual a probabilidade de um determinado evento ser IGUAL a um valor específico, como no sorteio de um número, e sim, deste evento ser maior ou menor que este valor, ou estar entre 2 valores específicos. Este entendimento também é fundamental para aplicação das distribuições de probabilidades aos fenômenos hidrológicos. O primeiro passo para se modelar a freqüência de dados hidrológicos é fazer um estudo de sua ocorrência, no que se estabelece um percentual com que uma variável hidrológica pode ser maior que um dado valor. Isto é chamado freqüência de excedência e é obtida diretamente de uma série histórica de dados. Contudo, pode-se trabalhar com a freqüência de não excedência, ou seja, aquela em que se estuda o percentual de uma variável ser menor ou igual a um dado valor. A escolha depende dos objetivos, os quais serão discutidos na seqüência. Deve-se ressaltar que uma é o complemento da outra, ou seja: excnãoexc f1f −−= (4) Existem algumas definições de freqüência considerando variáveis contínuas, destacando-se:
  • 5. 5 Tabela 4.1 Equações para estimativa da freqüência observada e suas aplicações. Fórmula Autor Observações 1N i fobs + = Weibull Aplicação ao estudo de probabilidades não enviesadas (sem tendência) para qualquer modelo de Distribuição. 12,0N 44,0i fobs + − = Gringorten Aplicada para estudos associados às Distribuições Gumbel e GEV. 25,0N 375,0i fobs + − = Blom Aplicada para estudos associados às Distribuições Normal e Log-normal. N 50,0i fobs − = Hazen Aplicada para estudos associados à Distribuição Gama 3 parâmetros. 20,0N 40,0i fobs + − = Cunnane Aplicação ao estudo de probabilidades não enviesadas (sem tendência) para qualquer modelo de Distribuição. O termo i, no numerador, refere-se à posição que o dado ocupa dentro da série histórica, a qual deve ser ordena em ordem crescente para freqüências de não excedência e ordem decrescente para freqüência de excedência. Por outro lado, N, no denominador, refere-se ao tamanho da série histórica. Ressalta-se que nos exemplos de aplicação aqui desenvolvidos, será considerada apenas a equação proposta por Weibull. Com base no estudo das freqüências de ocorrência, ajusta-se uma distribuição de probabilidades e aquela que obtiver o melhor ajuste (menores diferenças entre as freqüências observadas e estimadas) deve ser a escolhida. Note que o tamanho da série histórica tem grande importância haja vista que ela representará a possibilidade de ocorrência, ou seja, quanto maior esta, maior a representatividade do evento, tendo como referência seu registro histórico. Portanto, o ajuste de uma distribuição de probabilidades busca sua aplicação para estimar as freqüências de eventos que ainda não foram registrados e que normalmente são aplicados a projetos hidráulicos. A freqüência de excedência é bastante usada em hidrologia, especialmente quando os dados a serem trabalhados constituem séries históricas de precipitação. No entanto, para estudos de vazões, esta situação é também é importante, sendo que, neste caso, pode-se gerar um gráfico conhecido como “Curva de Permanência”. Isto significa que pode-se obter a percentagem de tempo (ou permanência) no qual um determinado evento é superado ou igualado. Estudos com esta conotação têm várias importâncias práticas, como por exemplo, na determinação de uma vazão mínima de um curso d’água para abastecimento ou irrigação, ou ainda, a precipitação mínima num determinado período de um mês visando ao balanço hídrico e fornecimento da lâmina de irrigação suplementar, ambas as grandezas
  • 6. 6 associadas a uma probabilidade de excedência. A Figura 4.1 ilustra uma curva de permanência hipotética. Figura 4.1 Representação gráfica de uma curva de permanência hipotética. No gráfico acima, para um valor y de vazão, x é a percentagem de tempo com que esta vazão é igualada ou superada, ou seja, sua permanência. Um valor prático extraído da curva de permanência é o Q90%, o qual significa a vazão existente no curso d´água em 90% do tempo, sendo aplicada à gestão dos recursos hídricos. Pela curva, observa-se que se trata de uma vazão pequena. O risco assumido é de que há possibilidade de 10% da mesma ser inferior ao valor estimado e neste caso, problemas com o fornecimento de água ao projeto. Uma observação adicional pode ser feita. Quanto menor o intervalo de análise dos dados (dados diários, mensais ou anuais) mais segura será a interpretação da curva de permanência. Isto quer dizer, por exemplo, que a análise de dados diários de vazão de um determinado rio fornece um valor menor de vazão, para uma dada permanência, do que dados mensais ou anuais. Estes últimos geram valores superestimados, sendo mais útil para a gestão dos recursos hídricos, o estudo com observações diárias.
  • 7. 7 4.3 Conceito de Tempo de Retorno (TR) O tempo de retorno representa o inverso da freqüência com que um evento pode ser igualado ou superado, ou seja, reflete a probabilidade com que uma dada variável hidrológica possa ser igualada ou superada, pelo menos uma vez, num ano qualquer. Ao se ajustar uma distribuição de probabilidades aos dados de freqüência de uma série histórica, utiliza-se a probabilidade de excedência para estimar um tempo de retorno, que é obtido em anos. Por definição, tem-se: ( )xiXF 1 TR > = (5) Ao se assumir uma distribuição de probabilidades com F (X > xi) estimado por P (X > xi), tem-se: ( )xiXP 1 TR > ≅ (6) No entanto, quando o objeto de estudo consiste de uma série histórica de dados hidrológicos mínimos ou dados que apresentem distribuição normal, o tempo de retorno a ser estimado também está associado à probabilidade com que o valor mínimo considerado pode ser inferior ao esperado, ou seja: ( ) ( )xiXP 1 xiXF 1 TR ≤ ≅ ≤ = (7) Esta situação é comum quando se trabalha com dados de vazão mínima visando à gestão dos recursos hídricos e avaliação da disponibilidade de água para irrigação ou abastecimento. Uma vazão específica corresponde ao valor da Q7,10, que significa um valor mínimo de vazão em 7 dias consecutivos, com Tempo de Retorno de 10 anos. Isto significa que há probabilidade de 10% de ocorrer uma vazão mínima com 7 dias consecutivos inferior ao valor estimado, sendo interpretado como um fator de segurança, porém associado à garantia de vazão no curso d’água. Contudo, o cálculo de TR, com base no seu conceito, não é suficiente. Assim, é possível calcular o “risco hidrológico” propriamente dito, o qual está associado à probabilidade de um evento ser igualado ou superado, porém, num intervalo de tempo N menor que TR e cuja definição prática está associada à vida útil da obra. Na realidade, esta probabilidade pode ser calculada pensando-se na probabilidade de que o evento não ocorra. A linha de raciocínio é a seguinte: dados que p é a probabilidade de ocorrência de um evento num ano qualquer; seu complemento é k, ou seja, a probabilidade de não ocorrência. Assim: p1k −= (8)
  • 8. 8 Considera-se que a probabilidade do evento não ocorrer em qualquer dos anos, num intervalo de N anos, é dada por: N kK = (9) Da mesma forma, seu complemento, no sentido agora de ocorrência, será: K1R −= (10) Sendo R o risco de ocorrência do evento num período de N anos. Fazendo-se algumas substituições, chega-se a: N k1R −= (11) N )p1(1R −−= (12) N TR 1 11R −−= (13) Na realidade, esta seqüência de equações nada mais é do que a aplicação da Distribuição Binomial, considerando a probabilidade de não ocorrência, ou seja, P(x=0). A Distribuição Binomial apresenta a seguinte estrutura: ( ) ( ) xNx p1p x N xXP − −⋅⋅== (14) Assim, para a situação de não ocorrência, ou seja, P (X=0), teremos: ( ) ( ) ( )NN0 p1p1p 0 N 0XP −=−⋅⋅== (15) Para a situação de ocorrência: N )p1(1)xX(P −−== (16) Sendo P(X=x) o risco hidrológico R definido anteriormente. O desdobramento, em função de TR, é idêntico ao apresentado anteriormente.
  • 9. 9 4.4 Classificação das Principais Séries Históricas Hidrológicas Os dados históricos relativos a um evento hidrológico constituem uma série hidrológica, a qual pode ser classificada em: a) Série original: constituída por todos os valores registrados. Exemplo: 30 anos de dados de precipitação mensal. A série será constituída por 30 x 12 valores. b) Série anual: constituída por valores extremos (máximos ou mínimos) de cada ano. A partir do exemplo anterior, ter-se-ia uma série com 30 valores. Normalmente, valores mínimos anuais dizem respeito ao comportamento de vazões em cursos d’água. Este tipo de estudo visa fornecer informações para projetos de abastecimento de água e irrigação. c) Série parcial: constituída pelos “N” maiores ou menores valores ocorridos nos “N” anos de observação. A partir do exemplo inicial, ter-se-ia uma série constituída por 30 valores, os quais seriam os maiores ou menores da série original, sem haver a vinculação com o ano de ocorrência. Uma outra alternativa seria constituir a série com todos os maiores (ou menores) valores da série, referindo-se a uma situação na qual a série histórica é pequena e há utilização de mais de um valor extremo por ano. As séries históricas mais trabalhadas em hidrologia são as seguintes: a) Precipitação total anual: constituída pela soma das precipitações diárias ocorridas ao longo de 1 ano, obtendo-se, desta forma, 1 valor para a série. É estruturada, portanto, com valores totais de cada ano. Neste caso, normalmente objetiva-se ao estudo comportamental do ciclo hidrológico, sendo importante para estudos vinculados ao balanço hídrico climatológico bem como balanço hídrico anual em bacias hidrográficas. b) Precipitação total mensal, quinzenal e decendial: nestas séries históricas, pode-se trabalhar considerando um mês específico do ano (de interesse regional, por exemplo) e estudar os seus totais mensal, da 1a e 2a quinzenas e 1o , 2o e 3o decêndios. Este estudo é importante quando se realiza balanço hídrico de culturas visando ao manejo de irrigação. O produto gerado é conhecido como Precipitação Provável e trabalha-se com probabilidade de excedência, ou seja, objetiva-se garantir um valor mínimo com 75, 90 ou 95% de excedência, dependendo da cultura em questão. Culturas de maior valor econômico trabalha-se com um nível de
  • 10. 10 probabilidade de excedência maior, estimando-se um valor menor de precipitação provável, devido ao risco de prejuízos mais importantes. c) Precipitação máxima diária anual: neste caso, toma-se, em determinado ano, a maior precipitação diária registrada, sendo este valor 1 componente da série histórica. É feito desta forma para vários anos, constituindo-se a série histórica. Seu estudo é importante quando se deseja obter valores extremos máximos diários, visando ao estudo da freqüência de ocorrência de precipitações intensas, inclusive para geração das equações de chuvas intensas. Quando a disponibilidade de dados históricos é pequena, pode-se trabalhar com os 2 maiores valores anuais, a fim de melhorar a representatividade da série. d) Precipitação máxima anual correspondente a um determinado tempo de duração da precipitação: aqui, têm-se os mesmos objetivos anteriores, porém trabalhando-se com pluviogramas, separando-se o valor máximo da precipitação num determinado ano, para vários tempos de duração. Assim, constitui-se uma série histórica para cada tempo de duração. Estas séries geram resultados mais precisos para o ajuste da equação de chuvas intensas, pois trata-se de intensidades reais que ocorreram num determinado local. Valores totais diários não expressam tal característica. e) Vazões Máximas Diárias Anuais: são séries históricas aplicadas ao estudo de vazões de cheia e de projeto em cursos d´água. São séries com característica assintótica, assim como as de precipitações máximas, ou seja, com acúmulo de dados à esquerda na distribuição de freqüências, gerando-se um caudal à direita. f) Vazões Mínimas Diárias Anuais: são séries históricas muito aplicadas à hidrologia, fundamentais em estudos ligados à disponibilidade de água em cursos d’água para projetos e gestão de recursos hídricos. De forma semelhante às vazões máximas, são assintóticas, com acúmulo de dados à direita na distribuição de freqüência, gerando-se um caudal à esquerda. g) Vazões médias anuais: são séries históricas aplicadas ao estudo do comportamento do deflúvio médio anual, obtida pela média aritmética dos dados. h) Evapotranspiração: séries históricas que permitem estudar o comportamento evapotranspirativo em bacias hidrográficas. Importante nos estudos ligados ao
  • 11. 11 comportamento climático de regiões, bem como modelagem do balanço hídrico climatológico. 4.5 Histogramas de Freqüência Histogramas de freqüência dizem respeito à representação gráfica (normalmente em barras) da freqüência de ocorrência de uma dada variável, podendo ser simples ou acumulada (de excedência ou não excedência). A curva de permanência é um tipo de histograma de excedência, com as classes acumulando-se à esquerda. A seguir será apresentada a metodologia clássica para o desenvolvimento de histogramas de freqüência. 1o ) Determinação do número de classes (k) - até 100 dados = nk = - acima de 100 dados = ( )nlog5k 10⋅= onde n é o número de observações. 2o ) Amplitude total dos dados (A) mMA −= , em que M é o valor máximo observado e m, o menor valor. 3o ) Amplitude de classe (Ac) 1k xA Ac − ∆+ = , em que, x∆ é a precisão de leitura (por exemplo: dados com uma casa decimal, a precisão é de 0,1). 4o ) Limite inferior da 1a classe 2 Ac mLI 1classe −= 5o ) Limite superior da 1a Classe AcLILS 1classe1classe += 6o ) As demais classes são computadas somando-se os limites à amplitude, e assim sucessivamente. LSclasse1 = LIclasse2 LSclasse2 = LIclasse2 + Ac LSclasse2 = LIclasse3, e assim por diante.
  • 12. 12 4.6 Medidas estatísticas básicas aplicadas em hidrologia 4.6.1 Média Aritmética A média aritmétrica de um conjunto de dados é expressa por: n x X n 1i i = = − (17) 4.6.2 Moda É definida como sendo o valor que aparece com mais freqüência num conjunto de dados. Quando se tem um intervalo de classe, a moda será o ponto médio da classe que contiver o maior número de ocorrências. 4.6.3 Mediana Corresponde ao valor que representa exatamente 50% das ocorrências. Para obtê-lo basta avaliar as freqüências de ocorrência, independentemente de ser de excedência ou não-excedência. Para obter o valor exato de 50%, pode-se utilizar o procedimento de interpolação dos dados vizinhos a este valor, quando não for possível obtê-lo diretamente. 4.6.4 Variância da Amostra 1n xx s 2 n 1i i 2 − − = = − (18) 4.6.5 Desvio Padrão da Amostra 2 ss = (19) Ao se avaliar tanto o desvio padrão quanto a variância, observa-se que quanto maior ambos, maior a variação dos dados em torno da média. 4.6.6 Assimetria A assimetria é um parâmetro importante na medida em que avalia a forma como os dados estão distribuídos em relação à média. Para que os dados apresentem distribuição normal, a assimetria deve ser próxima ou igual a zero. Nesta situação, a média, a moda e a mediana são iguais. Contudo, quando este valor for distante de zero, apresentará um padrão de distribuição com a maior quantidade de dados à esquerda (assimetria positiva) ou à direita (assimetria negativa). Em termos de dados hidrológicos, por apresentarem um padrão com limitação inferior (normalmente, valor mínimo é zero) e sem limitação superior
  • 13. 13 (os eventos hidrológicos podem ser superados), a assimetria é positiva. A assimetria pode ser calculada da seguinte forma: n xx A n 1i 3 i − = = − (20) Na prática é mais comum a utilização do coeficiente de assimetria, que representa a relação entre a assimetria e o desvio padrão ao cubo. Este coeficiente pode ser do tipo corrigido ou comum. O último pode ser calculado por: 3 s A Ca = (21) O coeficiente corrigido é determinado da seguinte forma: ( ) ( ) 3 n 1i 3 i s xx 2n1n n Ca − ⋅ −⋅− = = − (22) Além da análise geral dos dados, a média, o desvio padrão e o coeficiente de assimetria são extremamente importantes, pois constituem-se nos parâmetros que permitem o ajuste das distribuições de probabilidades. 4.6.7 Curtose Quantifica o grau de “achatamento” da distribuição de freqüência de uma determinada amostra. A referência para curtose é a curva normal e pode ser calculada pela seguinte equação: 3 s 1 n xx Cu 4 n 1i 4 i −⋅ − = = − (23) Se Cu for próximo a zero, a distribuição é intermediária, sendo conhecido como “Mesocúrtica”; se for maior que zero, os dados estão distribuídos de forma “afilada” (“Leptocúrtica”); se for menor que zero, forma “achatada” (Platicúrtica) (Figura 4.2).
  • 14. 14 Figura 4.2 Comportamento da distribuição normal em função do achatamento dos dados. 4.6.8 Co-variância amostral Quando se relaciona um conjunto de dados de uma variável com valores de outra variável que possa explicar o comportamento da primeira, aplica-se a co-variância amostral, onde quanto maior este valor, maior a relação entre as variáveis, ou seja, mais uma variável explica a outra. Este coeficiente pode ser calculado pela equação: −⋅− = ⋅−⋅⋅= yxyx n 1 cov i n 1i ixy (24) A co-variância pode ser negativa ou positiva. No primeiro caso, significa que valores mais baixos de uma variável explicam valores mais altos de outra variável. No segundo, as variáveis possuem o mesmo comportamento em termos de crescimento. Em ambos os casos, quanto maior o valor, em módulo, maior a explicação da variável dependente. 4.6.9 Coeficiente de correlação É um coeficiente que adimensionaliza a co-variância e busca explicar, da mesma forma anterior, a relação entre duas variáveis. Seu valor varia de –1 a 1 e quanto mais próximo dos extremos, maior a explicação da variável. É calculada por:
  • 15. 15 ( )yx xy ss cov r ⋅ = (25) Em que sx e sy são respectivamente, o desvio padrão das variáveis x e y. 4.7 Distribuições Contínuas de Probabilidades em Hidrologia 4.7.1 Equação Geral de Ven Te Chow Há situações em que se necessita estimar valores de eventos associados a recorrências muito altas, cujas freqüências não foram ainda obtidas, como é o caso de estruturas civis, cuja falha coloque em risco vidas humanas. Nestas condições, recomenda- se o uso de Distribuições Teóricas de Probabilidades, as quais devem ser adequadas para estimativa das freqüências observadas, sendo que estas são determinadas pelas características dos dados, especialmente se forem assintóticas. Ven Te Chow1 afirma que a maioria das funções de probabilidades, aplicáveis à Hidrologia, visando associar valor (magnitude) da variável à probabilidade de sua ocorrência, pode ser representada pela seguinte equação: SKXX TRTR ⋅+= − (26) Em que XTR é o valor da variável hidrológica associada à recorrência TR, − X é a média aritmética da série histórica, S é o desvio padrão da mesma e KTR é o fator associado à freqüência, sendo função de TR e da distribuição de probabilidades. É também chamado “variável reduzida”. Basicamente, este modelo geral é aplicado em quase todos os estudos probabilísticos em hidrologia. 4.7.2 Principais Distribuições de Probabilidades em Hidrologia As distribuições de probabilidades que serão apresentadas, com as respectivas aplicações, são as seguintes: - Distribuição Normal ou de Gauss: adequada para séries originais (Ex.: totais anuais de precipitação); - Distribuição de Gumbel para máximos (ou Assintótica de Valores Máximos Extremos do tipo I): adequada para série de valores extremos máximos (série de valores máximos diários de precipitação ou vazão); 1 Haan (2002).
  • 16. 16 - Distribuição de Gumbel para mínimos (ou Assintótica de Valores Mínimos Extremos do Tipo I): adequada para valores mínimos extremos (série de valores mínimos de vazão); - Distribuição Log-Normal a 2 e 3 parâmetros: aplicável tanto a valores originais quanto máximos e estimativa da precipitação provável; - Distribuição Gama: aplicável para estimativa da precipitação provável e séries históricas de valores extremos; - Distribuição Weibull: aplicável a série histórica de vazões mínimas; - Distribuição de Extremos de Fréchet ou Log-Gumbel: aplicação voltada para séries históricas de valores extremos máximos, especialmente vazões máximas; - Distribuição Generalizada de Valores Extremos (GEV): distribuição que engloba as distribuições de extremos Tipo I (Gumbel), Tipo II (Fréchet) e Tipo III (Weibull). O ajuste de uma distribuição de probabilidades é conduzido com base em 2 ou 3 parâmetros. A estimativa destes parâmetros é feita com base na Inferência Estatística, sendo o método dos momentos, o qual calcula os parâmetros com base nos momentos estatísticos de 1a , 2a e 3a ordem, associados, respectivamente, à média, variância e assimetria, o mais simples. As distribuições Normal e de Gumbel possuem apenas os 2 primeiros parâmetros. A Log-Normal pode estar associada aos 2 primeiros, assim como a Normal, ou aos 3 parâmetros. No entanto, este método, apesar de mais aplicado, é menos preciso que outros. Os métodos da Máxima Verossimilhança e Momentos – L são também aplicados para estimativa dos parâmetros e também serão apresentados e discutidos. 4.7.2.1 Distribuição Normal ou de Gauss A distribuição de Gauss ou Normal (DN) é uma distribuição de probabilidades para variável contínua, caracterizada pela média e desvio padrão. Os valores de uma série que segue a DN se distribuem simetricamente em relação à média. Portanto, apresentam o coeficiente de assimetria igual a zero. A relação entre os valores e a probabilidade de ocorrência pode ser visualizada na Figura 4.3, cuja área até determinado ponto (ou valor), no sentido da esquerda para direita, representa a probabilidade de ocorrer valores menores ou iguais àquele valor (probabilidade de não excedência).
  • 17. 17 Figura 4.3 Representação da distribuição normal com seus principais parâmetros. A função densidade de probabilidade (FDP) é dada pela seguinte equação: ( ) ( ) 2 e 2 1 xfFDP x 5,0 σ µ− ⋅− ⋅ π⋅σ == (27) Em que σ é o desvio padrão e µ é a esperança ou média, ambos da população, que serão substituídas pelo desvio padrão e média amostrais, com o 1o e 2o momentos calculados da seguinte forma: s ^ =σ e X ^ =µ (28) A probabilidade propriamente dita é obtida pela integração da função densidade de probabilidade (FDP), gerando a Função Cumulativa de Probabilidades (FCP). A probabilidade de não-excedência é obtida pela integração da FDP de ∞− a um determinado valor X. A probabilidade de excedência é obtida com base na equação 1, já que a integração da FDP de ∞− a ∞+ é igual a 1. Desta forma, tem-se para a probabilidade de não-excedência:
  • 18. 18 ( ) ( ) ( ) dx 2 e 2 1 xxobPrxFFCP x 5,0x i σ µ− ⋅− ∞− ⋅ π⋅⋅σ =≤== (29) Para facilitar a generalização desta relação (valor e probabilidade), propõem-se a distribuição normal padrão, que utiliza a chamada variável reduzida ou padrão z, que mede o desvio de uma variável em relação à média, em termos do desvio padrão, ou seja: s xx z − = − (30) Observa-se que z faz o papel de KTR conforme equação geral proposta por Ven Te Chow (equação 26). Verifica-se, portanto, que a variável KTR é equivalente a z, no caso da DN. A distribuição normal passa a ser DN (0,1) que é a distribuição normal padrão e sua FCP calculada por: ( ) ( ) ⋅ π⋅ =≤= ∞− ⋅− z z5,0 dz 2 e 2 1 zZobPrzF (31) Em que z é a variável reduzida. Observa-se que esta integral não apresenta solução analítica. Desta forma, pode-se utilizar a tabela de distribuição de Gauss ou tabela de z (Tabela 4.2), a qual foi gerada a partir da solução numérica da equação 31. Esta tabela fornece os valores de probabilidade, de ∞− até o valor de z que corresponde ao valor da variável hidrológica X, correspondendo a uma tabela com probabilidades de não excedência. Além desta metodologia, pode-se trabalhar com uma aproximação razoável, utilizando a equação abaixo: ( ) ( ) ( )3 3 2 21 qaqaqazf1zZobPr ⋅+⋅+⋅⋅−=≤ (32) Em que: ( ) 2 e 2 1 zf z5,0 ⋅− ⋅ π⋅ = (33) ( ) 1 0 za1q − ⋅+= (34) Os valores para as constantes são: a0 = 0,33267; a1 = 0,43618; a2 = -0,12017; a3 = 0,9373 Devido à simetria da curva normal, a série pode ser dividida em valores “menores que” e “maiores que” a média. Deve-se ressaltar que variáveis afastadas da média do
  • 19. 19 mesmo valor (com os mesmos desvios) têm o mesmo tempo de recorrência, independente de ser menor ou maior que a média. Assim, se 2 valores da variável X (X1 e X2) distam da média, o mesmo desvio, tem-se o mesmo tempo de retorno para ambas. Numa situação, busca-se a possibilidade de um valor menor que a média voltar a se repetir e noutra, um valor maior que a média. Nesta situação, o cálculo de TR é conduzido considerando-se as seguintes situações: - Para valores menores que a média, objetiva-se conhecer o valor de não- excedência; - Para valores maiores que a média, objetiva a probabilidade de excedência; Pelas equações abaixo, tem-se, respectivamente, a forma de cálculo de TR para cada situação: ( )ixxP 1 TR ≤ = ; se o valor da variável for menor que a média; ( )ixxP 1 TR ≥ = ; se o valor da variável for maior que a média; Exemplo de Aplicação 4.2 Se a precipitação total anual média é de 1000 mm e o desvio padrão, 200 mm, qual o TR para as precipitações de 1200 mm e 800 mm. O cálculo de z por meio da equação 30 fornece um valor para a primeira situação, igual a 1 e para a segunda, –1. Ao se consultar a tabela de z (Tabela 4.2), encontra-se uma freqüência de não excedência para z = 1, de 0,84134 e para z = -1, 0,15865. Para o primeiro caso, o cálculo de TR é dado pela segunda equação. Assim, tem-se: anos3,6 15865,0 1 TR == ; o valor da probabilidade de excedência foi obtido por 1 – 0,84134 = 0,15865. Para o segundo caso, tem-se: anos3,6 15865,0 1 TR == ; O valor da probabilidade de não excedência, neste caso, é obtido considerando-se o aspecto de simetria dos dados, ou seja, como ( )1zP ≤ é igual a 0,84134, seu complemento ( )[ ]1zP > será 0,15865. Como os valores são simétricos, ( ) ( )1zP1zP ≥=−≤ e portanto, 0,15865.
  • 20. 20 Tabela 4.2 Tabela de z considerando probabilidade de não excedência ( ( ) −⋅ π⋅ = ∞− z 2 dz 2 z exp 2 1 zF ). z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.00 0.5 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.10 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.20 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.30 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.40 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 Exemplo de Aplicação 4.3 Com base na série histórica de alturas pluviométricas anuais de Lavras, MG, no período de 1914-1943, 1946-1949 e 1951-1991, obter: a) Distribuição de freqüência (tabela e gráfico), média, mediana, moda, desvio padrão e coeficiente de assimetria.
  • 21. 21 b) Utilize a distribuição de Gauss para calcular os valores máximos e mínimos esperados para os tempos de retorno de 10, 50, 100 e 1000 anos. c) Compare as freqüências observada e teórica, associadas às precipitações de 1068,1 mm e 2042,2 mm. d) Qual a probabilidade de ocorrer de um ano com precipitação superior a 2000 mm sabendo-se que já ocorreram 1600 mm? Tabela 4.3 Alturas pluviométricas anuais para Lavras, MG, e respectiva distribuição de freqüência. Ordem P Fnão-exc. Ordem P Fnão-exc. Ordem P Fnão-exc. 1 747,1 0,01316 29 1353,7 0,38158 57 1696,0 0,75 2 832,4 0,02632 30 1354,7 0,39474 58 1673,2 0,76316 3 999,2 0,03947 31 1355,7 0,40789 59 1683,5 0,77632 4 1001,3 0,05263 32 1374,4 0,42105 60 1686,6 0,78947 5 1068,1 0,06579 33 1377,9 0,43421 61 1689,4 0,80263 6 1093,5 0,07895 34 1380,4 0,44737 62 1705,5 0,81579 7 1109,9 0,09211 35 1393,6 0,46053 63 1719,1 0,82895 8 1170,6 0,10526 36 1398,7 0,47368 64 1726,6 0,84211 9 1171,3 0,11842 37 1413,1 0,48684 65 1728,5 0,85526 10 1183,2 0,13158 38 1427,3 0,50 66 1794,0 0,86842 11 1184,9 0,14474 39 1428,1 0,51316 67 1816,6 0,88158 12 1187,7 0,15789 40 1430,0 0,52632 68 1820,3 0,89474 13 1196,6 0,17105 41 1443,4 0,53947 69 1832,7 0,90789 14 1204,7 0,18421 42 1445,8 0,55263 70 1933,2 0,92105 15 1216,1 0,19737 43 1448,8 0,56579 71 1938,0 0,93421 16 1216,2 0,21053 44 1450,3 0,57895 72 1951,8 0,94737 17 1217,8 0,22368 45 1453,4 0,59211 73 2042,2 0,96053 18 1246,0 0,23684 46 1479,5 0,60526 74 2130,7 0,97368 19 1263,5 0,25 47 1496,3 0,61842 75 2485,6 0,98684 20 1266,7 0,26316 48 1555,8 0,63158 21 1268,6 0,27632 49 1567,4 0,64474 22 1282,5 0,28947 50 1584,3 0,65789 23 1288,8 0,30263 51 1585,1 0,67105 24 1301,2 0,31579 52 1589,1 0,68421 25 1313,0 0,32895 53 1590,0 0,69737 26 1319,8 0,34211 54 1634,1 0,71053 27 1326,6 0,35526 55 1634,1 0,72368 28 1352,8 0,36842 56 1665,3 0,73684
  • 22. 22 a) Distribuição de freqüência por classes - número de classes (k) = 866,875 ≈= classes - amplitude total (A) = 2485,6 – 747,1 = 1738,5 - amplitude de classe (Ac) = 4,248 18 1,05,1738 = − + - LIclasse 1 = 747,1 – (248,4)/2 = 622,9 - LSclasse 1 = 622,9 + 248,4 = 871,3 Tabela 4.4 Classes e distribuição de freqüência simples e acumulada. Classes No observações Ponto médio da classe F simples não-excedência F acumulada não-excedência 622,9 – 871,3 2 747,1 0,02632 0,02632 871,3 – 1119,7 3 995,5 0,06579 0,09211 1119,7 – 1368,1 24 1243,9 0,31579 0,4079 1368,1- 1616,5 22 1492,3 0,28947 0,69737 1616,5 – 1864,9 16 1740,7 0,21053 0,9079 1864,9 – 2113,3 4 1989,1 0,05263 0,96053 2113,3 – 2361,7 1 2237,5 0,01316 0,97368 2361,7 – 2610,1 1 2485,9 0,01316 0,98685 Moda: ponto da classe com maior número de observações. Portanto, 1243,9 mm. Mediana: valor que corresponde a exatamente 50% dos dados. Na Tabela 4.1, 1427,3 mm. Gráfico da distribuição de freqüência simples e acumulada.
  • 23. 23 Ca = 0,72 Observa-se que a assimetria dos dados é pequena, sugerindo-se que é possível ajustar a distribuição normal aos dados. b) Aplicação da distribuição normal de probabilidades = − x 1466,0 mm e s = 319,2 mm Equação geral de Ven Te Chow: 2,319k1466x TRTR ⋅+= Para TR = 10 anos tem-se, com base na definição deste e na condição de simetria da curva normal: P (x > xi) = 0,10; A probabilidade de não excedência é: P(x < xi) = 0,90. Consultando a tabela de z, tem-se z = 1,28. Para calcular os valores máximos e mínimos procede-se da seguinte forma: - Valor máximo xTR = 1466 + 1,28 * 319,2 = 1874,6 mm - Valor mínimo Pela simetria da curva normal, tem-se z = -1,28 e xTR = 1466 – 1,28 * 319,2 = 1057,4 mm. Os demais tempos de retorno são obtidos a partir do mesmo procedimento. c) Aplicacão da equação geral de Ven Te Chow ( ) 10628,025,1ZobPr25,1 2,319 14661,1068 s xx z =−≤→−= − = − = − ( ) 96447,081,1ZobPr81,1 2,319 14662,2042 s xx z =≤→= − = − = − d) Evento A: precipitação anual superior a 2000 mm ( )[ ]mm2000XP ≥ Evento B: precipitação anual superior a 1600 mm ( )[ ]mm1600XP ≥ Busca-se estimar o evento A condicionado ao evento B, portanto: ( ) ( ) ( ) ( ) ( ) ( )mm1600XP mm2000XPmm1600XP BP BAP B|AP ≥ ≥−≥ = ∩ =
  • 24. 24 ( ) 9525,067,1ZP67,1 2,319 14662000 s xx z =≤→= − = − = − ( ) 0475,09525,01mm2000XP =−=≥ ( ) ( ) 3372,06628,011600XP 6628,042,0ZP42,0 2,319 14661600 s xx z =−=≥ =≤→= − = − = − ( ) ( ) ( ) ( ) ( ) ( ) 859,0 3372,0 0475,03372,0 mm1600XP mm2000XPmm1600XP BP BAP B|AP = − = ≥ ≥−≥ = ∩ = Três observações sobre o exemplo são pertinentes: a) À medida que TR aumenta, aumenta-se a precipitação máxima e diminui-se a mínima. Isto ocorre porque quando o TR fica maior, menor será a probabilidade com a qual o valor será maior (no caso de máximos) ou menor (no caso de mínimos) que um determinado valor da variável. Isto significa que, como a probabilidade é cada vez menor para que o evento ocorra, mais no extremo da curva normal o mesmo se encontrará. P2 é maior que P1, assim como P1`é menor que P2`.: TR2 > TR1.
  • 25. 25 b) Pode-se observar também que, para probabilidades menores que 0,01316 e maiores que 0,98684 não é possível obter o valor com base na freqüência observada, porque as freqüências extremas correspondem a estes valores, ou seja, o tamanho da amostra (série histórica) não foi suficiente para que se pudesse detectar e comparar os estimados pela distribuição de probabilidades em relação às respectivas freqüências observadas. c) Pode-se verificar que os erros na estimativa dos eventos são pequenos, indicando que a distribuição normal pode representar bem o fenômeno das precipitações totais anuais. No entanto, deve-se aplicar um teste estatístico de aderência para se concluir de forma mais efetiva, o qual será tratado em tópico específico deste capítulo. 4.7.2.2 Distribuição de Gumbel para máximos ou assintótica de valores máximos do tipo I A Função Densidade de Probabilidade (FDP) de Gumbel é dada por: ( ) ( )−µ−α− µ−α− ⋅α= x eFDP ex (35) A integração da FDP fornece a função cumulativa de probabilidades (FCP): ( ) ( )µ−α− =≤ − x exxP e i (36) Esta distribuição apresenta os 2 primeiros parâmetros de uma distribuição de probabilidades, ou seja, σµ e , que são calculados pelas expressões abaixo, considerando- se o método dos momentos: s 2826,1^ =α (37) s45,0x ^ ⋅−=µ − (38) Em que − x e s correspondem, respectivamente, à média e o desvio padrão da série histórica.
  • 26. 26 Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação abaixo, fruto da manipulação da equação 36 e da consideração de TR como função da probabilidade de excedência: µ+ α −−− = TR 1 1LNLN xTR (39) 4.7.2.3 Distribuição Generalizada de Extremos – GEV A distribuição GEV (do inglês “Generalized Extreme Value”) foi introduzida por Jenkinson (1955), incorporando as 3 formas assintóticas: Gumbel (Tipo I), Fréchet (Tipo II) e Weibull (Tipo III). Sua FDP é dada por: ( ) σ µ− ⋅ξ+−⋅ σ µ− ⋅ξ+⋅ σ == ξ − ξ ξ+ − 11 x 1exp x 1 1 xfFDP (40) Em que ξ, σ e µ são, respectivamente, os parâmetros de forma, escala e posição. Se ξ for negativo, a GEV representa a forma assintótica de valores mínimos (Tipo III) e existe apenas para ( ) ξ σ−µ <x . Se ξ for positivo, a GEV representa uma distribuição Tipo II (Fréchet), definida para ( ) ξ σ−µ >x . Se ξ = 0 , tem-se a Distribuição Gumbel. Sua FCP é dada por: σ µ− ⋅ξ+−=≥= ξ − 1 x 1exp)xiX(PFCP (41) A Distribuição GEV apresenta 3 momentos estatísticos: [ ] ( )[ ]11xxE −ξ−Γ⋅ ξ σ +µ== (42) ( ) ( ) ( )[ ]ξ−Γ−ξ⋅−Γ⋅ ξ σ = 121xVar 2 2 (43) ( ) ( ) ( ) ( ) ( ) ( ) ( )[ ]ξ−Γ−ξ⋅−Γ ξ−Γ⋅−ξ⋅−Γ⋅ξ−Γ⋅+ξ⋅−Γ− ⋅ξ==γ 2 3 2 3 121 12211331 dealsinCA (44)
  • 27. 27 Para estimar os parâmetros da Distribuição GEV deve-se inicialmente calcular o parâmetro de forma pela equação 44. Para isto, é importante observar qual sinal ξ tem para a situação em estudo, o que é obtido mediante análise do coeficiente de assimetria (distorção). Para ξ = 0, γ = 1,1396; valores de γ superiores a este valor, ξ < 0; valores de γ menores que 1,1396 implica em ξ > 0 até o valor de -1/3. A estimativa de uma variável hidrológica associada a um tempo de retorno é dada por, considerando-se freqüência de excedência: −−−⋅ ξ σ +µ= ξ− TR 1 1LN1xTR (45) 4.7.2.4 Distribuição de Fréchet ou Log-Gumbel Também conhecida como Distribuição de Fréchet, consiste da aplicação da Distribuição Gumbel aos valores logaritmizados da variável hidrológica. Fréchet aplicou-a para estudar as freqüências de vazões de cheias, sendo muito útil aos estudos que envolvem variáveis hidrológicas máximas. Sua FDP e FCP são, respectivamente: ( ) λ −⋅ λ ⋅ λ θ == θ+θ x exp x xfFDP 1 (46) ( ) λ −−=≥= θ x exp1xiXPFCP para x > 0; θ, λ > 0 (47) Sendo F(x) a freqüência de excedência. São 3 momentos estatísticos: ( ) θ −Γ⋅λ=µ= 1 1xE para θ > 1 (48) ( ) θ −Γ− θ −Γ⋅λ=σ= 1 1 2 1xVar 222 x para θ > 2 (49) 1 1 1 2 1 CV 2 − θ −Γ θ −Γ = para θ > 2 (50)
  • 28. 28 A obtenção dos parâmetros desta distribuição começa com a equação 50 a partir do coeficiente de variação; em seguida, calcula-se o parâmetro λ com a equação 48, partindo- se da média. A estimativa de um valor x, associado a um TR, é dada por: θ − − ⋅λ= 1 TR 1TR TR LNx (51) 4.7.2.5 Distribuição de Gumbel para mínimos ou assintótica de valores mínimos extremos do tipo I Esta distribuição de probabilidades consiste de uma versão da Distribuição de Gumbel, com a diferença de se trabalhar com séries históricas de valores mínimos, normalmente vazões mínimas. Na estimativa do parâmetro µ, troca-se o sinal. A definição dos parâmetros da distribuição, pelo método dos momentos, é dada por: s 2826,1^ =α (52) s45,0x ^ ⋅+=µ − (53) A FDP é definida por: ( ) ( )−µ−⋅α µ−α ⋅α= x eFDP ex (54) A FCP é dada pela probabilidade de não excedência: ( ) ( )µ−α− −=≤ xe i e1xxP (55) Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação abaixo, fruto da manipulação da equação 55 e da consideração de TR como função da probabilidade de não excedência: µ+ α −− = TR 1 1LNLN xTR (56)
  • 29. 29 Exemplo de Aplicação 4.4 Dada uma série histórica de 16 anos de precipitação máxima diária anual para a cidade de Lavras, MG, no período de 1915 a 1930 (Tabela 4.5). Determinar: a) Distribuição de freqüência simples de não-excedência dos dados; b) Aplicar as distribuições Gumbel, GEV e Fréchet e determinar a precipitação máxima diária para TR de 5, 10 e 20 anos; c) Determinar o TR para as precipitações máximas diárias anuais de 80 e 90 mm; Tabela 4.5 Precipitações máximas diárias anuais para Lavras, MG no período de 1915 a 1930 e respectivas freqüências observadas de não excedência. Ordem Precipitação (mm) F não exced. Ordem Precipitação (mm) F não exced. 1 46,2 0,05882 9 64,2 0,52941 2 50,0 0,11765 10 66,9 0,58824 3 50,4 0,17647 11 78,2 0,64706 4 57,0 0,23529 12 78,6 0,70588 5 58,7 0,29412 13 78,7 0,76471 6 60,2 0,35294 14 80 0,82353 7 61,6 0,41176 15 85,5 0,88240 8 63,4 0,47059 16 88,5 0,94120
  • 30. 30 Observa-se que as distribuições se ajustaram de forma razoável às freqüências observadas, com destaque para a distribuição GEV para os valores mais baixos da série, Fréchet para os intermediários e Gumbel para os maiores. Contudo, nenhuma delas se ajustou bem aos dados próximos ao valor de 80 mm, uma vez que são números muito próximos e com freqüências distintas, dificultando o ajuste da distribuição. a) Estimativa dos valores de precipitação associados aos TRs de 5, 10 e 20 anos Distribuição Gumbel Os parâmetros ajustados para esta distribuição foram: α = 0,0968; µ = 60,80. Aplicando-se estes parâmetros à equação 39 chega-se aos seguintes valores: TR = 5 anos.: XTR = 76,30 mm TR = 10 anos.: XTR = 84,05 mm TR = 20 anos.: XTR = 91,50 mm Distribuição GEV Para esta distribuição, os parâmetros estimados foram: ξ = 0,2329; σ = 10,69; µ = 60,8685. Aplicando-se a equação 45, chega-se aos seguintes valores: TR = 5 anos . : XTR = 73,56 mm; TR = 10 anos . : XTR = 77,94 mm; TR = 20 anos . : XTR = 81,24 mm; Distribuição Fréchet Os parâmetros estimados para esta distribuição foram: θ = 7,313; λ = 60,68. Aplicando-se a equação 51, chega-se aos seguintes valores: TR = 5 anos.: XTR = 74,5 mm; TR = 10 anos.: XTR = 82,54 mm; TR = 20 anos.: XTR = 91,08 mm;
  • 31. 31 b) Estimativa de TR para as precipitações de 80 e 100 mm Distribuição de Gumbel Aplicando o inverso do complemento da equação 36, chega-se a: P = 80 mm.: TR = 7 anos P= 90 mm.: TR = 17,4 anos Distribuição GEV Aplicando-se a inversa da equação 41, chega-se aos seguintes valores: P = 80 mm.: TR = 10,6 anos P = 90 mm.: TR = 76 anos Distribuição Fréchet Aplicando-se o inverso da equação 47, chega-se aos seguintes valores: P = 80 mm.: TR = 8,1 anos P = 90 mm.: TR = 13,4 anos Observa-se que a Distribuição GEV tende a superestimar o TR, especialmente para valores mais altos, por se caracterizar, neste caso como uma distribuição Tipo III, a qual para valores máximos, consiste de uma exponencial apenas, refletindo em valores mais elevados. A partir de valores em torno de 80 mm (observar gráfico de ajuste), a distribuição GEV proporciona ajustes mais distantes dos valores de freqüência observados, o que não ocorre com as outras duas distribuições. 4.7.2.6 Distribuição Log-normal a 2 parâmetros A função densidade de probabilidades (FDP) desta distribuição a seguinte: ( ) 2 n n e 2x 1 FDP xLn 5,0 n σ µ− ⋅− ⋅ π⋅⋅σ⋅ = (57) Os parâmetros são determinados por: ( )( ) n xLn n 1i n =µ = (58)
  • 32. 32 =σn desvio padrão dos dados transformados. Os valores dos parâmetros desta distribuição podem ser estimados com base na média e desvio padrão dos dados sem transformação logarítmica. As equações são: + ⋅=µ − − 2 2 4 n sx x Ln 2 1 (59) + =σ − − 2 2 2 n x sx Ln (60) Esta distribuição se assemelha à Normal, porém, trabalhando-se com o logarítmo dos dados. A variável reduzida kTR é o próprio valor de z utilizado na Distribuição Normal. Assim, a equação geral de Ven Te Chow é trabalhada da seguinte forma: nTRn k TR ex σ⋅+µ = (61) 4.7.2.7 Distribuição Log-normal a 3 parâmetros Neste caso, a FDP é dada em função de 3 parâmetros, tendo-se a seguinte estrutura: ( ) ( ) ( ) 2 n n e 2x 1 xf:FDP xLn 5,0 n σ µ−β− ⋅− ⋅ π⋅⋅σ⋅β− = , com x ≥ β . (62) Para estimar os parâmetros da distribuição log-normal, com base numa série histórica de dados, as seguintes equações são aplicadas: y s x η −=β − (63) ( ) 31 32 y 1 φ φ− =η (64) ( ) 2 4 5,02 +γ+γ− =φ (65)
  • 33. 33 Com base no coeficiente de assimetria - Ca (equação 22) calcula-se γ . Com isto, estima-se φ (equação 65), yη (equação 64) e com base neste último valor e na média e desvio padrão dos dados, o parâmetro β , na equação 63. Os parâmetros nn e σµ são calculados com base nas seguintes equações: ( )1Ln5,0 s Ln 2 y y n +η⋅− η =µ (66) ( )1Ln 2 yn +η=σ (67) Neste caso, a variável xTR é calculada por: β+= σ⋅+µ nTRkn TR ex (68) Exemplo de Aplicação 4.5 Determinar a precipitação provável para 10, 75 e 90% de probabilidade, com base na série histórica de precipitação associada ao 1o decêndio (Tabela 4.6) do mês de janeiro, de 1960 a 1981, para a cidade de Lavras, MG. Calcule também, o TR para uma precipitação decendial de 310 mm nos primeiros 10 dias de janeiro. Aplique as distribuições log-normal 2P, log-normal 3P e GEV. 1o ) Aplicação da Distribuição Log-normal a 2 parâmetros A precipitação provável sugere um estudo probabilístico de valores mínimos a serem garantidos, ou seja, visa-se à uma probabilidade de um dado valor x superar um xi. Esta situação diz respeito, portanto, à probabilidade de excedência. O cálculo dos parâmetros nn e σµ foi feito com base no cálculo da média dos dados logaritmizados, obtendo-se para o primeiro 4,358 e para o segundo 0,8985. - Para 10% de probabilidade, P(x>xi) = 10% .: P(x<xi) = 90%. Da tabela de z, o valor deste, para 90% de probabilidade, é 1,28. Assim, a precipitação provável associada a esta probabilidade: mm7,246eex 8985,028,1358,4nTRkn TR === ⋅+σ⋅+µ . Disto conclui-se que, com uma probabilidade de 10%, a precipitação provável para os primeiros 10 dias de janeiro é de 246,7 mm.
  • 34. 34 - Para 75% de probabilidade, P(x>xi) = 75%.: P(x<xi) = 0,25%. Da tabela de z, obtém-se valor aproximadamente igual a –0,67. Da mesma forma anterior, a precipitação provável será 42,78 mm. Espera-se uma precipitação mínima para os primeiros 10 dias de janeiro, de 42,78 mm, com 75% de probabilidade. - Para 90% de probabilidade, P(x>xi) = 90%.: P(x<xi) = 10%. Da tabela de z, obtém-se este aproximadamente igual a –1,28. Da mesma forma anterior, a precipitação provável será 24,7 mm. Tabela 4.6 Série histórica de precipitação associada ao 1ºdecêndio de janeiro para Lavras, MG, no período de 1960 a 1981, e respectivas freqüências observadas. Ordem Precipitação (mm) Fexcedência Ordem Precipitação (mm) Fexcedência 1 290 0,04545 12 84,8 0,54545 2 253,2 0,09091 13 78,5 0,59091 3 189,9 0,13636 14 69,9 0,63636 4 162,8 0,18182 15 53,5 0,68182 5 144,8 0,22727 16 52,4 0,72727 6 141,2 0,27273 17 42,2 0,77273 7 140,3 0,31818 18 29,2 0,81818 8 135,3 0,36364 19 25,5 0,86364 9 111,7 0,40909 20 17,6 0,90909 10 97,8 0,45455 21 8,4 0,95455 11 95,9 0,50000 Analisando os resultados, observa-se que quanto maior a probabilidade de um evento exceder um dado valor, menor será o evento, uma vez que a probabilidade do valor ser superado aumenta. Em contrapartida, quanto menor a probabilidade de excedência, maior será o valor, haja vista que o risco assumido é maior (a probabilidade do valor ser superado é maior). Para determinar o TR para uma precipitação mínima de 340 mm, com base nesta série histórica, procede-se da seguinte forma: Determina-se kTR e com este valor, na tabela de z, a probabilidade de não- excedência. Determina-se então a de excedência, e aplica-se na definição de TR para variáveis cujos estudos interessam a sua superioridade.
  • 35. 35 64,1k e340ex TR 8985,0TRk358,4nTRkn TR = === ⋅+σ⋅+µ Na tabela de z, obtém-se uma P(x<xi) = 0,94949 e P(x>xi) = 0,05051. O TR será então igual a 19,8 anos. A probabilidade do valor de 340 mm ser igualado ou superado, pelo menos uma vez, em 20 anos, é de 0,05051. 2o ) Aplicando-se o modelo Log-normal a 3 parâmetros Neste caso, o procedimento consiste no cálculo da média, desvio padrão e coeficiente de assimetria dos dados. Assim: − x = 105,95 mm s = 75,07 mm Ca = 0,9845 Aplicando a equação 65, em que Ca = γ , determina-se φ : ( ) ( ) 6223,0 2 49845,09845,0 2 4 5,025,02 = ++− = +γ+γ− =φ Na seqüência, aplicando-se a equação 64, obtém-se: ( ) 3175,0 6223,0 6223,01 1 3 1 3 2 31 32 y = − = φ φ− =η Com a equação 63, determina-se o 3o parâmetro, que representa a assimetria dos dados: 47,130 3175,0 07,75 95,105 s x y −=−= η −=β − Com estas informações, estima-se nn e σµ com nas equações 66 e 67: ( ) ( ) 418,513175,0Ln5,0 3175,0 07,75 Ln1Ln5,0 s Ln 22 y y n =+⋅−=+η⋅− η =µ
  • 36. 36 ( ) ( ) 3099,013175,0Ln1Ln 22 yn =+=+η=σ - Para P(x>xi) = 10%, o valor de z, conforme exemplo anterior,,é 1,28. Assim, a precipitação será: - mm71,20447,130eex 3099,028,1418,5nTRkn TR =−=β+= ⋅+σ⋅+µ - Para P(x>xi) = 75%, o valor de z é –0,67, e a precipitação mínima será: xTR = 52,7 mm - Para P(x>xi) = 90%, o valor de z é de –1,28 e a precipitação será: xTR = 21,1 mm. Cálculo de TR para 340 mm com base na distribuição com 3 parâmetros: kTR = 2,37.: P(x<xi) = 0,9911 e P(x>xi) = 0,0089 e TR = 112,4 anos. Nota-se uma grande diferença entre os cálculos dos dois modelos para a estimativa deste TR. 3o Aplicando a Distribuição GEV O cálculo da assimetria dos dados produziu um valor de 0,9845. Aplicando-se a equação 44, considerando sinal negativo, chega-se ao valor do parâmetro de forma desta distribuição, o qual é igual a 0,02742. Na seqüência, aplicando o momento de segunda ordem, encontra-se o parâmetro de escala igual a 60,587. Com a equação 42 e os demais parâmetros, é possível estimar o parâmetro de posição µ como sendo igual a 72,58. Desta forma, com a equação 41, são estimados os valores de precipitação associados aos níveis de probabilidade de excedência. Para Prob (x>xi) = 90%: P = 21,5 mm; Para Prob (x>xi) = 75%: P = 52,7 mm; Para Prob (x>xi) = 10%: P = 204,8 mm. Comparando-se as estimativas da precipitação pelas três distribuições ao valor obtido com base na freqüência observada, é possível desenvolver o seguinte quadro resumo dos resultados:
  • 37. 37 P(x>xi) LN 2P (mm) LN 3P (mm) GEV (mm) 10 246,7 204,7 204,8 75 42,8 52,7 52,7 90 24,7 21,1 21,5 Obs.: A análise da distribuição de probabilidades que é mais precisa pode ser obtida mediante testes estatísticos apropriados, os quais permitirão verificar a adequação da distribuição bem como inferir sobre sua precisão propriamente dito. 4.7.2.8 Distribuição Gama Consiste de uma distribuição de probabilidades com ampla aplicação à hidrologia, com destaque para precipitação provável e vazões de maneira geral. Sua Função Densidade de Probabilidades (FDP), considerando sua versão a 2 parâmetros, é: ( ) ( ) β − −υ υ ⋅⋅ υΓ×β = x 1 ex 1 xf:FDP (69) Os parâmetros desta distribuição são β e υ, os quais podem ser obtidos por: X s2 =β (70) ( ) 2 2 s X =υ (71) A função Gama de um número qualquer pode ser aproximada por2 : ( ) ( ) ( )5.5n5.0n5 1i i o e5.5n in p p n 2 n +−+ = ⋅+⋅ + +⋅ π =Γ (72) Para esta estimativa considerar: po = 1,000000000190015; p1 = 76,180091729471460; p2 = -86,505320329416770; p3 = 24,014098240830910; p4 = -1,231739572450155; p5 = 1,208650973866179x10-3 No entanto, com auxílio do software Excel, é possível obter a função gama de um número qualquer de forma rápida e precisa, utilizando a função “exp(LNGAMA(n))”, sendo n o número cujo gama deseja-se obter. 2 Trabalho desenvolvido por Press et al. (1992) com erro absoluto menor que 2x10-10 e citado por Ferreira (2005).
  • 38. 38 A Função Cumulativa de Probabilidades (FCP) deve ser obtida, primeiramente, entre cada um dos valores da variável x de forma ordenada, para posterior somatório. Para isto, procede-se calculando as integrais para cada intervalo de x de forma numérica: ( ) ( ) ( ) ( )[ ]+ ⋅−=⋅ + + + 1ix ix 1ii i1i 2 xfxf xxdxxf (73) Portanto, a FCP é calculada por: ( ) ( )⋅=≤ x 0 dxxfxXP (74) A FDP para a versão a 3 parâmetros é: ( ) ( ) ( ) ( ) β µ−− −υ υ ⋅µ−⋅ υΓ×β = x 1 ex 1 xf:FDP (75) A estimativa dos parâmetros desta equação, com base no método dos momentos, é: 2 as 4 =υ (76) 2 sas ⋅ =β (77) as s2 X ⋅ −=µ (78) Em que s é o desvio padrão e as é o coeficiente de assimetria. A versão desta distribuição a 3 parâmetros pode produzir melhores resultados, contudo, os graus de liberdade do ajuste também podem ficar comprometidos. Alguns estudos desenvolvidos para precipitação provável têm mostrado desempenho similar destas distribuições, optando- se, normalmente pela versão a 2 parâmetros. 4.7.2.9 Distribuição Weibull Esta distribuição apresenta aplicações a séries históricas de valores mínimos, sendo, normalmente trabalhada para séries de vazões mínimas ou similares. A distribuição de Weibull é uma derivação da distribuição Assintótica de Valores Extremos. Sua FDP é dada por:
  • 39. 39 ( ) β⋅λ−−β ⋅⋅β⋅λ= x1 exxf:FDP (79) A Função Cumulativa de Probabilidades (FCP) é dada por: ( ) β⋅λ− −=≤ x e1xXP:FCP (80) Os parâmetros desta distribuição são λ e β, que estão associados à média e variância, respectivamente, por: β +Γ⋅ λ ==µ β 1 1 1 X 1 ^ (81) β +Γ− β +Γ⋅ λ ==σ β 22 2 ^ 2 1 1 2 1 1 s (82) O valor da variável x associada ao tempo de retorno (TR) pode ser calculado por: β λ − = 1 - TR 1 1Ln x (83) Exemplo de Aplicação 4.6 Com base nas distribuições de probabilidade Weibull, Gumbel e GEV determinar a vazão mínima de sete dias consecutivos para os TRs de 10, 20 e 50 anos, com base numa série histórica de vazão mínima com 7 dias consecutivos, de 68 anos para o Rio Grande, sul de Minas Gerais (Tabela 4.7). Calcule também, o TR para uma vazão mínima esperada de 6 m3 s-1 por ambas as distribuições.
  • 40. 40 Tabela 4.7 Série histórica de vazões mínimas com 7 dias consecutivos do Rio Grande com seção de controle em Madre de Deus e respectivas freqüências observadas. Ordem Vazão Fnão-excedência Ordem Vazão Fnão-excedência 1 8,97 0.01449 35 19.49 0.50725 2 10,41 0.02899 36 19.53 0.52174 3 11,32 0.04348 37 19.67 0.53623 4 11,50 0.05797 38 19.87 0.55072 5 13,10 0.07246 39 19.89 0.56522 6 13,15 0.08696 40 19.98 0.57971 7 13,57 0.10145 41 20.11 0.59420 8 14,46 0.11594 42 20.21 0.60870 9 14,95 0.13043 43 20.39 0.62319 10 14,95 0.14493 44 20.83 0.63768 11 15,66 0.15942 45 21.08 0.65217 12 16,04 0.17391 46 21.61 0.66667 13 16,06 0.18841 47 22.11 0.68116 14 16,18 0.20290 48 22.16 0.69565 15 16,20 0.21739 49 22.40 0.71014 16 16,32 0.23188 50 22.41 0.72464 17 16,39 0.24638 51 22.72 0.73913 18 17,00 0.26087 52 22.84 0.75362 19 17,02 0.27536 53 23.19 0.76812 20 17,04 0.28986 54 23.79 0.78261 21 17,04 0.30435 55 24.76 0.79710 22 17,48 0.31884 56 24.78 0.81159 23 17,57 0.33333 57 25.16 0.82609 24 17,66 0.34783 58 25.24 0.84058 25 17,72 0.36232 59 25.41 0.85507 26 17,88 0.37681 60 25.72 0.86957 27 18,09 0.39130 61 26.60 0.88406 28 18,77 0.40580 62 26.62 0.89855 29 18,79 0.42029 63 26.96 0.91304 30 18,79 0.43478 64 27.90 0.92754 31 18,80 0.44928 65 29.24 0.94203 32 19,04 0.46377 66 30.30 0.95652 33 19,41 0.47826 67 32.50 0.97101 34 19,48 0.49275 68 38.25 0.98551 1o ) Aplicação da distribuição de Weibull Trabalhando com os dados da Tabela 4.7, calcula-se a média e desvio padrão dos dados da mesma. Assim, tem-se: − x = 20,01 m3 s-1 s = 5,276 m3 s-1 Manipulando as equações 81 e 82, pode-se chegar à seguinte equação:
  • 41. 41 β +Γ− β +Γ⋅ β +Γ µ =σ 2 2 2 1 1 2 1 1 1 (84) Com isto, é possível estimar o parâmetro β e a partir daí, com a média dos dados, o parâmetro λ na equação 81. Respectivamente, tem-se: β = 4,283378; λ = 1,78219 x 10-6 Aplicando-se a equação 83, para todos os TRs , tem-se: TR = 10 anos: Q = 13 m3 /s; TR = 20 anos: Q = 10,99 m3 /s; TR = 50 anos: Q = 8,84 m3 /s; Com base na equação abaixo, calcula-se TR para Q = 6 m3 s-1 , ou seja: β⋅λ− − = x e1 1 TR (85) TR = 261 anos 2o ) Aplicação da distribuição Gumbel (série de mínimos) Cálculo dos parâmetros da distribuição: 38,22276,545,001,20s45,0X 2431,0 s 2826,1 ^ ^ =⋅+=⋅+=µ ==α Para TR = 10 anos 12,1338,22 2431,0 10 1 1LNLN TR 1 1LNLN xTR =+ −− =µ+ α −− = m3 /s Valendo-se do mesmo procedimento, tem-se para os demais tempos de retorno: TR = 20 anos: Q = 10,16 m3 s-1 TR = 50 anos: Q = 6,33 m3 s-1
  • 42. 42 Determinação de TR: ( ) ( )( )( )µ−⋅α−− = ≤ = xexpexp1 1 xiXP 1 TR ( )( )( ) 12,54 38,2262431,0expexp1 1 TR = −⋅−− = anos 3o Aplicando-se a Distribuição GEV O coeficiente de assimetria da série histórica é igual a 0,7195, gerando os seguintes parâmetros da GEV: σ = 0,5332; α= 5,7207; β = 18,8035. Com estes valores e aplicando a equação correspondente, tem-se: Para TR = 10 anos: Q = 12,79 m3 /s; Para TR = 20 anos: Q = 10,27 m3 /s; Para TR = 50 anos: Q = 7,33 m3 /s. O cálculo de TR para uma vazão mínima de 7 dias consecutivos igual a 6 m3 /s, produziu um valor de 78,5 anos. Observações A comparação das distribuições mostra que para valores mais altos de vazão, a estimativa da freqüência tende a ser próxima, especialmente Weibull e GEV. Para valores menores, observa-se discrepância nas estimativas, com a GEV mais próxima da Distribuição Gumbel. 4.8 Estimação dos parâmetros das distribuições de probabilidades com base na Máxima Verossimilhança 4.8.1 Definições O Método da Máxima Verossimilhança consiste de uma metodologia desenvolvida por Fisher em 1922, no qual se busca a maximização da probabilidade (plausibilidade) de um parâmetro representar uma população, maximizando a densidade conjunta dos elementos amostrais. A função de verossimilhança é matematicamente definida pelo produtório das densidades de cada valor amostral, sendo este dado por x1, x2, x3, etc, ou seja: ( ) ( ) ( ) ( ) ( )∏=⋅⋅= = n 1i xifxnf...3xf2xf1xfL (86)
  • 43. 43 Assim, a máxima verossimilhança consiste em encontrar o ponto de máximo da função acima, derivando-a em relação a cada um dos seus parâmetros, e igualando-se a zero. Supondo uma distribuição de probabilidades com 1 parâmetro, como, por exemplo, Poisson, tem-se: ( ) x !x e xP λ⋅= λ− (87) Em que λ é o parâmetro e x uma variável aleatória discreta. Uma pergunta pode ser feita: “Qual o melhor parâmetro λ que maximizará a probabilidade de x ser igual a 10?” Assim, a idéia geral dos estimadores de Máxima Verossimilhança é a seguinte: Pelo esquema acima, percebe-se que existem vários valores do parâmetro que podem ser utilizados para calcular a probabilidade de x ser igual a 10. Matematicamente, o que maximizará esta probabilidade é o valor de λ que satisfará a equação abaixo: 0 d dP = λ (88) Para distribuições contínuas com mais de um parâmetro, tem-se uma superfície e duas outras equações, constituindo um sistema para obtenção dos parâmetros correspondentes ao ponto de máximo. Para facilitar a solução matemática do ponto de
  • 44. 44 máximo, é necessário linearizar a equação 86, obtendo-se a função logaritmo de verossimilhança (log (L)): ( ) ( ) ( ) ( ) ( ) ( )=++++= = n 1i xiflogxiflog...3xflog2xflog1xflogLlog (89) Considerando uma distribuição contínua com parâmetros θ1 e θ2, tem-se: ( ) ( ) = θ∂ ∂ = θ∂ ∂ 0 2 Llog 0 1 Llog Sistema de Equações para obtenção dos parâmetros θ1 e θ2. A seguir serão apresentadas as soluções do sistema acima para as distribuições de probabilidades apresentadas anteriormente. 4.8.2 Distribuição Normal A Distribuição Normal é caracterizada pela seguinte expressão: ( ) ( ) σ⋅ µ− −⋅ σ⋅π =σµ 2 2 2 2 2 x exp 2 1 ,;xf:.FDP (90) Aplicando-se o conceito definido pela equação 89, tem-se: ( ) ( ) ( ) ( )µ− σ − σ⋅π =∏ σ⋅ µ− −⋅ σ⋅π =∏= === n 1i 2 2 2 n 2 n 1i 2 2 2 n 1i xi 2 1 exp 2 1 2 x exp 2 1 xifL (91) Linearizando a equação 91, tem-se: ( ) ( ) ( ) ( )µ− σ −σ−π−= = n 1i 2 2 2 xi 2 1 ln 2 n 2ln 2 n Lln (92) Finalmente, derivando-se a equação acima em relação a µ e σ2 , igualando-se a zero, tem-se:
  • 45. 45 ( ) ( )µ−⋅ σ + σ⋅ −= σ∂ ∂ = n 1i 2 2222 xi 2 1 2 nLln (93) ( )µ−⋅ σ = µ∂ ∂ = n 1i 2 xi 1Lln (94) Assim, igualando as equações acima a zero, é possível resolver em função dos parâmetros µ e σ2 , obtendo-se sua estimativa por Máxima Verossimilhança: x n xi n 1i − = ==µ (95) ( ) 22 S n 1n ⋅ − =σ (96) Observa-se que estas equações são utilizadas na maioria das vezes em que a Distribuição Normal é aplicada. 4.8.3 Distribuição Gumbel para máximos A FDP da distribuição Gumbel é dada por: ( ) ( ) ( )µ−⋅α−−µ−⋅α− ⋅α=µα xex e,;xf (97) Sua função logaritmo de verossimilhança é: ( ) ( ) ( ) ⋅α= = µ−α−−µ−⋅α−n 1i xiexi elnLln (98) ( ) ( ) ( )+µ−⋅α−+α⋅= = µ−⋅α− = n 1i xi n 1i exiln n 1 Lln (99) Derivando-se em relação a α e µ, igualando-se a zero, tem-se: ( ) ( ) = = ⋅α− ⋅α−⋅ −= α n 1i i n 1i ii xexp xexpx X 1 (100)
  • 46. 46 ( ) ( ) n xexp exp n 1i i = ⋅α− =µ⋅α− (101) A solução deste sistema de equações é desenvolvida solucionando-se a equação 100 para α e substituindo-se este valor na equação 101, encontrando-se µ. Exemplo de Aplicação 4.7 Compare o comportamento das freqüências estimadas pela distribuição Gumbel, com parâmetros obtidos pelos Métodos dos Momentos e da Máxima Verossimilhança. A série histórica de chuvas máximas diárias anuais apresentada na Tabela 4.8 é do município de Barbacena, MG. A distribuição Gumbel ajustada com base no método dos momentos propiciou a estimativa dos parâmetros α e µ, respectivamente iguais a 0,064829 e 68,57729. Pelo método da máxima verossimilhança obteve-se, respectivamente, 0,0557329 e 67,74231. Os gráficos da Figura 4.4, na seqüência, representam os ajustes das freqüências teóricas às observadas. Figura 4.4 Ajustes da distribuição Gumbel, por Máxima Verossimilhança (MV) e Método dos Momentos (MM), para série histórica de precipitação máxima diária anual para a cidade de Barbacena, MG.
  • 47. 47 Tabela 4.8 Série histórica de precipitação máxima diária para o município de Barbacena, MG. Ordem hdia Ordem hdia Ordem hdia 1 43.20 25 73.20 49 97.20 2 43.80 26 74.00 50 97.60 3 47.60 27 74.20 51 100.00 4 47.60 28 75.40 52 100 5 49.00 29 77.00 53 100.20 6 49.40 30 78.20 54 101.00 7 49.80 31 79.00 55 105.50 8 50.00 32 81.00 56 111.50 9 50.20 33 82.00 57 116.40 10 53.20 34 82.60 58 121.00 11 57.00 35 83.00 12 58.00 36 86.40 13 58.40 37 88.20 14 60 38 88.20 15 63.20 39 89.00 16 65.00 40 90.00 17 65.00 41 90.40 18 65.60 42 92.60 19 66.00 43 93.00 20 66.00 44 93.20 21 68.00 45 95.00 22 70.00 46 95.00 23 72.60 47 96.20 24 72.60 48 96.60 É possível observar um melhor ajuste da distribuição Gumbel ajustada com base em parâmetros estimados pela Máxima Verossimilhança, avaliando maior proximidade entre as freqüências estimadas pela distribuição e as freqüências observadas. Isto também pode ser comprovado pelo teste Qui-quadrado, onde obteve-se um valor de 7,3 para a distribuição ajustada por máxima verossimilhança e 13,9 para a distribuição ajustada pelo método dos momentos, enquanto o Qui-quadrado tabelado é de 14,1. Avalia-se que por este último método, a distribuição quase não foi adequada e a grande diferença entre os valores de Qui- quadrado reflete a precisão do ajuste3 . Detalhes da aplicação do teste de Qui-quadrado serão apresentados em tópico específico sobre Testes de Aderência. 3 Conforme Walpole & Mayers (1978).
  • 48. 48 4.8.4 Distribuição Gama A distribuição Gama possui a seguinte formulação, na forma incompleta, para sua FDP: ( ) ( ) β − −υ υ ⋅⋅ υΓ⋅β =υβ x 1 ex 1 ,;xf (102) Sua função log-verossimilhança é dada por: ( ) ( ) ( )[ ] ( ) ( ) β −⋅−υ+υΓ⋅−β⋅υ⋅−=υβ = = n 1i n 1i xi xilnln1lnnlnn,Lln (103) As derivadas parciais de ln (L) em relação a α e β igualadas a zero produz: ( ) ( )=υψ−υ GX X lnln (104) Em que ψ(υ) corresponde à função digama de υ e GX é a média geométrica dos dados. A função digama pode ser aproximada por uma série de potência da seguinte forma: ( ) ( ) ... 240 1 252 1 120 1 12 1 2 1 ln 8642 υ⋅ + υ⋅ − υ⋅ + υ⋅ − υ⋅ −υ≅υψ (105) A solução da equação 105 permite estimar o valor de υ e assim, calcula-se β da seguinte forma: υ =β X (106) 4.8.5 Log-normal 3 parâmetros A FDP da distribuição log-normal 3 parâmetros é dada por: ( ) ( ) ( )( )µ−−⋅ σ⋅ − ⋅ π⋅σ⋅− =µσ 2axlog 22 1 e 2ax 1 ,,a;xf (107)
  • 49. 49 Para a estimativa dos parâmetros pela Máxima Verossimilhança, adota-se o seguinte procedimento: Faz-se x* = x – a e os parâmetros µ e σ são obtidos por: ( ) n xlog n 1i * i =µ = (108) ( ) n xlog n 1i 2* i µ− =σ = (109) Assim, o parâmetro a é testado, avaliando-se a função log-verossimilhança, até que haja maximização desta função. A função de log-verossimilhança é dada por: ( ) ( ) ( ) ( ) ( )µ−⋅ σ⋅ −− π⋅ −σ⋅−=σµ == n 1i 2* i2 n 1i * i xlog 2 1 xlog 2 2logn logna,,;xLln (110) Exemplo de Aplicação 4.8 Compare os ajustes das freqüências teóricas às observadas para vazões mínimas anuais do Rio Aiuruoca, região Alto Rio Grande, MG, produzidos pelas distribuições Gama Incompleta e Log-normal 3 parâmetros, ajustadas por máxima verossimilhança à série histórica apresentada na Tabela 4.9.
  • 50. 50 Tabela 4.9 Série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, região Alto Rio Grande. Ordem Vazão Ordem Vazão 1 4,71 15 7,48 2 5,34 16 7,53 3 5,72 17 7,57 4 6,00 18 7,62 5 6,18 19 7,70 6 6,43 20 7,92 7 6,45 21 8,01 8 6,72 22 8,09 9 6,81 23 8,22 10 6,87 24 8,77 11 6,95 25 8,94 12 7,05 26 9,75 13 7,13 27 10,25 14 7,40 28 10,69 29 17,50 É possível observar um ligeiro melhor ajuste da distribuição log-normal 3 parâmetros, o que pode ser constatado também pelos valores de Qui-quadrado calculados para ambos, onde para a distribuição log-normal 3 parâmetros este valor foi de 0,233 enquanto para distribuição Gama de 0,297. Figura 4.5 Ajustes das distribuições Gama e log-normal 3 parâmetros, ajustadas pela Máxima Verossimilhança, para série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, Alto Rio Grande, MG.
  • 51. 51 Exemplo de Aplicação 4.9 Comparar o ajuste das distribuições Gama, Log-normal 3 parâmetros e Gumbel, ajustadas por máxima verossimilhança, às freqüências observadas da série de vazões máximas diárias anuais do Rio Aiuruoca, apresentadas na Tabela 4.10. Com base nos gráficos da Figura 4.6, verifica-se que a distribuição Gumbel apresentou um melhor ajustamento das freqüências teóricas às observadas, seguida da distribuição log-normal 3 parâmetros. Isto pode ser comprovado pelos valores de Qui- quadrado das distribuições, sendo igual a 3,423 para distribuição Gumbel; 4,048 para log- normal 3 parâmetros e 4,315 para a distribuição Gama. Tabela 4.10 Série histórica de vazões máximas diárias anuais do Rio Aiuruoca, região Alto Rio Grande. Ordem Vazão Ordem Vazão 1 53,8 15 95,5 2 54,3 16 98,4 3 57,8 17 105 4 66,3 18 106 5 74,9 19 120 6 75,2 20 120 7 77,3 21 136 8 77,8 22 147 9 79,4 23 155 10 85,7 24 159 11 86,8 25 162 12 88,4 26 163 13 89,2 27 174 14 93,8 28 179 29 179
  • 52. 52 Figura 4.6. Distribuições Gumbel, log-normal 3 parâmetros e Gama, ajustadas por Máxima Verossimilhança, para série histórica de vazões máximas diárias anuais do Rio Aiuruoca, Alto Rio Grande, MG. 4.8.6 Weibull A distribuição de Weibull possui sua FDP caracterizada por: ( ) β⋅λ− −β ⋅β⋅⋅λ=βα x 1 ex,;xf (111) Em que: 0x ≥ ;λ, β > 0 Aplicando-se os conceitos de máxima verossimilhança, chega-se ao seguinte sistema de equações: =λ = βn 1i ix n (112) ( )( ) ( )−⋅⋅λ =β = = βn 1i n 1i ii xlnxilnx n (113)
  • 53. 53 Utilizando-se o método de Newton-Raphson, obtém-se simultaneamente, β e λ. 4.8.7 GEV A distribuição GEV possui sua FDP dada por: ( ) σ µ− ⋅ξ+−⋅ σ µ− ⋅ξ+⋅ σ = ξ − ξ ξ+ − 11 x 1exp x 1 1 xf (114) Aplicando-se os conceitos de verossimilhança, chega-se à seguinte equação: ( ) ( ) σ µ− ⋅ξ+− σ µ− ⋅ξ+⋅ σ ==ξσµ ∏∏ = ξ − = ξ ξ+ − = n 1i 1 i n 1i 1 i n n 1i i x 1exp x 1 1 xf,,L (115) O logaritmo da função de verossimilhança produz: ( ) ( ) σ µ− ⋅ξ+− σ µ− ⋅ξ+⋅ ξ ξ+ −σ−=µσξ = ξ − n 1i 1 ii x 1 x 1ln 1 ln,,;xl (116) Derivando-se a equação 115 em relação aos respectivos parâmetros e fazendo-se uma série de manipulações, chega-se ao seguinte sistema de equações: ( ) ( ) ( ) ( ) ( ) = ξ − = ξ − = ξ − = ⋅σ µ− − ⋅σ⋅ξ µ− −⋅ ξ ⋅− = −ξ+⋅µ− ⋅ σ + σ − = σ −ξ+ ⋅ σ n 1i i i i i i2 1 i n 1i i 1 ii 2 n 1i 1 i 0 y x y x yln 1 y1 0 y y1x 1n 0 y11 (117) Neste caso, tem-se que:
  • 54. 54 σ µ− ⋅ξ+= i i x 1y (118) Para solução do sistema de equações, sugere-se iniciá-lo com base nos parâmetros µ, σ e ξ oriundos do método dos momentos (equações 42, 43 e 44). Exemplo de Aplicação 4.10 Ajustar a distribuição Weibull à série histórica de vazões mínimas de 7 dias consecutivos do Rio Grande, na Região Alto Rio Grande (Tabela 4.7). Os parâmetros ajustados foram: λ = 5,6482 x 10-6 ; β = 3,908993 e a aderência das freqüências observadas às teóricas representada na Figura 4.7. Figura 4.7 Ajuste da Distribuição Weibull à série histórica de vazões mínimas de 7 dias consecutivos do Rio Grande, seção de Madre de Deus, MG. Exemplo de Aplicação 4.11 Ajustar a distribuição GEV ajustada por Máxima Verossimilhança e Método dos Momentos para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6.
  • 55. 55 Parâmetro MV MM σ 54,08 60,59 µ 70,74 72,58 ξ 0,088 0,0274 Gráfico dos ajustes A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em relação às observadas foi de 9,70% para o método dos momentos e de 9,49% para o método da Máxima Verossimilhança, com o erro máximo de 52% para MM e de 44% para MV. Segundo alguns autores, o desempenho da MV será superior quanto maior a série histórica, que no caso deste exemplo, apesar de apenas 21 dados da série histórica, esta metodologia mostrou-se ligeiramente superior. 4.9 Estimação de parâmetros das Distribuições de Probabilidades com base nos Momentos – L O método dos momentos – L consiste de uma abordagem estatística que permite estimar os parâmetros de uma distribuição de probabilidades com base em mais momentos estatísticos de ordem superior a 3, podendo permitir, em casos de pequenas amostras, ajustar, com maior precisão, uma distribuição de probabilidades do que o Método da Máxima Verossimilhança.
  • 56. 56 Hosking (1990) menciona que os valores numéricos de momentos amostrais, em especial de pequenas amostras, podem ser muito diferentes daqueles que de fato caracterizam uma determinada população, constituindo-se em erros de elevada magnitude na estimativa da freqüência. Desta forma, foram introduzidos os conceitos de momentos ponderados por probabilidades (MPP), apresentando a seguinte expressão para estimativa dos momentos amostrais: i N 1i ^ s x s 1N s iN N 1 ⋅ − − ⋅=α = (119) Em que N é o tamanho da amostra, s é um número inteiro que varia de 0 a 3 e xi a variável hidrológica em questão. Os termos entre parênteses são obtidos pela análise combinatória, ou seja: ( ) ( ) !s!siN !iN s iN ⋅−− − = − (120) Os momentos que podem ser estimados pela equação 119 podem ser linearizados de acordo com Hosking (1990), uma vez que, nesta forma, os momentos são de difícil aplicação para modelagem (caracterização da forma e escala) de uma distribuição de probabilidades. Assim, os momentos podem então ser estimados pelas equações, sendo conhecidos como Momentos - L: 32104 2103 102 01 203012 66 2 α⋅−α⋅+α⋅−α=λ α⋅+α⋅−α=λ α⋅−α=λ α=λ (121) O momento – L λ1 é equivalente à média. O coeficiente de variação, o qual está associado ao parâmetro de escala, é dado por: 1 2 λ λ =τ (122) Os coeficientes de assimetria e curtose são obtidos respectivamente, por:
  • 57. 57 2 3 3 λ λ =τ (123) 2 4 4 λ λ =τ (124) 4.9.1 Aplicação às Distribuições de Probabilidades apresentadas a) Distribuição Normal 01 ^ α=λ=µ (125) ( )102 ^ 2 α⋅−α⋅π=λ⋅π=σ (126) b) Distribuição Gumbel para Máximos ( ) 2 ^ 2ln λ =α (127) ^1 ^ 5772,0 α −λ=µ (128) c) Distribuição Gumbel para Mínimos ( ) 2 ^ 2ln λ =α ^1 ^ 5772,0 α +λ=µ (129) d) Distribuição Gama ( ) ( )1 5,0 1 2 +υΓ⋅π +υΓ = λ λ (130) υ λ =β 1 (131)
  • 58. 58 e) GEV ( ) ( )2 ^ C9554,2C859,71 ⋅+⋅⋅−=ξ (132) ( ) ( )3ln 2ln 3 2 C 3 − τ+ = (133) ( ) ( )ξ− ξ− − −⋅ +−=τ 21 312 33 (134) ( ) ( )ξ− −⋅ξ+Γ ξ⋅λ =σ 211 2 ^ (135) ( )[ ]ξ+Γ−⋅ ξ α −λ=µ 111 ^ (136) f) Log-normal 2 z 2 ^ N ⋅=σ (137) Sendo z a variável Normal padrão correspondente à probabilidade +τ 2 1 . ( ) ( ) 2 ln 2 N 1N ^ σ −λ=µ (138) Exemplo de Aplicação 4.12 Compare o ajuste da distribuição GEV obtido pela Máxima Verossimilhança (MV), Método dos Momentos (MM) e Método dos Momentos – L (MML) para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6. Os ajuste por MV e MM foram apresentados no Exemplo de Aplicação 4.11. Parâmetro MV MM MML σ 54,08 60,59 60,93 µ 70,74 72,58 70,77 ξ 0,088 0,0274 0,00000104
  • 59. 59 Gráfico dos ajustes A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em relação às observadas foi de 9,70% para o método dos momentos, de 9,49% para o método da Máxima Verossimilhança e 8,54% para o método dos momentos-L, com o erro máximo de 52% para MM, de 44% para MV e 46,3% para MML. O desempenho de MML normalmente é superior, especialmente para séries históricas menores, conforme comentado anteriormente. Exemplo de Aplicação 4.13 Com base na série histórica do Exemplo de Aplicação 4.4 (série da Tabela 4.5), a qual diz respeito à precipitação máxima diária anual, ajuste a Distribuição de Gumbel pelo método dos Momentos-L (ML), comparando o ajuste ao obtido pelo Método dos Momentos (MM) e calcule a precipitação máxima diária anual para os TRs de 5, 10, 50 e 100 anos. Os respectivos ajustes produziram os seguintes parâmetros, calculando-se os erros médios absolutos entre as freqüências observadas e estimadas em cada um dos métodos.
  • 60. 60 Parâmetros MM ML 0,09683 0,08930 60,7957 60,2926 Erro (%) 16,81 13,64 Graficamente: TR MM ML 5 76,29 77,09 10 84,04 85,49 50 101,09 104,00 100 108,30 111,81 Com base nos dados de erro absoluto acima, há indicativo de que o Método dos Momentos-L gerou maior precisão do que o Método dos Momentos. No entanto, é importante que esta análise possa ser conduzida com base em algum teste estatístico, permitindo uma conclusão mais apropriada.
  • 61. 61 Exemplo de Aplicação 4.14 Ajuste as distribuições Gama 2P e GEV pelo método dos Momentos-L, comparando os ajustes, à mesma série histórica do Exemplo 4.13 (Série da Tabela 4.5). Os ajustes produziram um erro médio absoluto de estimativa das freqüências observadas de 9,94% para a Distribuição Gama e de 13,81% para a Distribuição GEV. O erro máximo observado na primeira situação foi de 24,1% e para a segunda, de 37,6%, apontando para um melhor desempenho da distribuição Gama quando este método de ajuste é aplicado. Graficamente, é possível perceber o melhor ajustamento das freqüências estimadas às observadas pela Distribuição Gama. Exemplo de Aplicação 4.15 Com base na série histórica de vazões mínimas consecutivas de 7 dias, do Rio Grande (Tabela 4.7), ajuste as distribuições GEV e log-normal 2P pelo método dos Momentos-L e calcule o valor correspondente ao TR de 10 anos por ambos os modelos. Os parâmetros ajustados para a distribuição GEV foram: = 6,91x10-5 ; = 4,191; = 17,588 Os parâmetros ajustados da distribuição log-normal 2P foram: N = 0,2588; N = 2,963
  • 62. 62 Para um TR de 10 anos, correspondendo a valores mínimos, portanto, probabilidade de não excedência, estima-se uma Q7,10 para o Rio Grande na seção de controle de Madre de Deus, um valor de 14,1 m3 /s com aplicação da GEV e de 13,9 m3 /s aplicando-se a distribuição log-normal 2P. O desempenho das distribuições é semelhante. Graficamente, tem-se: 4.10 Adequação Estatística de uma Distribuição de Probabilidades Para a aplicação de uma distribuição de probabilidades é indispensável analisar se a mesma representa adequadamente bem a relação funcional entre os valores do evento e as respectivas freqüências de ocorrência dos mesmos. Para isto, há necessidade de se comprovar previamente se a distribuição é adequada para a série histórica a ser trabalhada. A comprovação é feita com base em testes estatísticos não paramétricos, os quais, na seqüência, serão apresentados de forma detalhada aqueles mais usuais em hidrologia, sendo que também são conhecidos como Testes de Aderência Estatística. 4.10.1 Teste de Kolmogorov-Smirnov Neste teste, promove-se o cálculo da diferença entre as freqüências observadas (amostrais) e as freqüências esperadas com base na distribuição de probabilidades, comparando-se a maior diferença obtida a um valor que correspondente à estatística do teste (Tabela 4.11). Esta estatística é obtida em função do tamanho da amostra (n) e nível
  • 63. 63 de significância ( )α a ser adotado (5% na maioria das vezes). A hipótese de nulidade a ser testada é a Hipótese Ho de que a freqüência observada poderá ser estimada pela distribuição de pobabilidades, ou seja, como o valor tabelado é estatisticamente nulo, pode- se concluir que valores menores ou iguais a este serão também estatisticamente nulos. Desta forma, tem-se: ( )α ∆≤∆ n,tabelaáximocalculadom FF (139) Nesta situação, a distribuição de probabilidades será adequada, pois [ ] máximocalculadoF∆ será nulo estatisticamente e, portanto, a freqüência observada não difere da esperada. Observa-se que apenas a máxima diferença entre as freqüências é considerada neste teste. Desta forma, o Teste de Kolmogorov-Smirnov é inteiramente qualitativo, significando que o mesmo permite apenas a conclusão de que a distribuição de probabilidades é adequada ou não, não havendo embasamento suficiente para se concluir a respeito da precisão e comparação entre distribuições distintas. Se na equação 139 ocorrer o contrário, a distribuição não será adequada, devendo-se buscar o ajuste de outra.
  • 64. 64 Tabela 4.11 Valores críticos do teste de Kolmogorov-Smirnov (Adaptado de Haan, 2002). Nível de SignificânciaTamanho da Amostra (N) 0,20 0,15 0,10 0,05 0,01 1 0,900 0,925 0,950 0,975 0,995 2 0,684 0,726 0,776 0,842 0,929 3 0,565 0,597 0,642 0,708 0,829 4 0,494 0,525 0,564 0,624 0,734 5 0,446 0,474 0,510 0,563 0,669 6 0,410 0,436 0,470 0,521 0,618 7 0,381 0,405 0,438 0,486 0,577 8 0,358 0,381 0,411 0,457 0,543 9 0,339 0,360 0,388 0,432 0,514 10 0,322 0,342 0,368 0,409 0,486 15 0,268 0,283 0,304 0,338 0,404 20 0,231 0,246 0,264 0,294 0,352 25 0,210 0,220 0,240 0,264 0,320 30 0,190 0,200 0,220 0,242 0,290 40 - - - 0,210 0,250 50 - - - 0,190 0,230 60 - - - 0,170 0,210 70 - - - 0,160 0,190 80 - - - 0,150 0,180 90 - - - 0,140 - 100 - - - 0,140 - 4.10.2 Teste de Qui-quadrado Este teste é mais rigoroso que o anterior por agrupar os dados da série histórica em classes de freqüência e acumular os erros entre as freqüências observada e teórica, com participação de todas as classes e não apenas a máxima diferença. A soma destes erros (obtida pela soma dos erros de todas as classes) gera o valor de λ2 calculado. A estatística do teste é obtida por meio da tabela de λ2 (Tabela 4.12), adotando-se o valor tabelado com base em graus de liberdade da distribuição e nível de significância. Para que a distribuição de probabilidades tenha aderência aos dados, o valor de λ2 calculado deve ser menor que o de tabela. Assim, tem-se:
  • 65. 65 ( )− =χ = n 1i teoricoi 2 teoricoiobsi calculado 2 f ff (140) Em que n é o número de classes, fobsi e fteóricoi são, respectivamente, as freqüências observada e teórica na classe i. As classes com menos de 3 valores devem ser agrupadas com as classes vizinhas, seguindo os critérios de aplicação do teste. Os Graus de Liberdade a serem adotados neste teste podem ser obtidos considerando-se uma situação intermediária entre o número de classes menos 1 e o número de classes menos número de parâmetros da distribuição menos 1. Por exemplo: para 6 classes, os graus de liberdade devem estar, para uma Distribuição Normal (2 parâmetros) entre 5 e 3, adotando-se 4. Ressalta-se que para um pequeno número de classes o teste perde precisão. Para maiores detalhes para aplicação deste teste, consultar Ferreira (2005) e Haan (2002). Um detalhe adicional é de que a equação 140 representa uma forma de cálculo do quadrado médio do erro e todas as freqüências participam do mesmo. Desta forma, Walpole & Myers (1978) consideram o teste de λ2 um cálculo de precisão do ajuste da distribuição de probabilidades.
  • 66. 131 Tabela 4.12 Quantis superiores da distribuição Qui-quadrado associados aos graus de liberdade (v) e diferentes níveis de significância (adaptado de Ferreira 2005). Nível de SignificânciaGraus de Liberdade (v) 0,995 0,975 0,950 0,900 0,750 0,500 0,100 0,050 0,010 0,005 1 0,000039 0,000982 0,003932 0,015791 0,101532 0,455 2,706 3,841 6,635 7,879 2 0,010025 0,050636 0,102587 0,210721 0,575364 1,386 4,605 5,991 9,210 10,597 3 0,071721 0,215793 0,351843 0,584369 1,213 2,366 6,251 7,815 11,345 12,838 4 0,206989 0,484418 0,710723 1,064 1,923 3,357 7,779 9,488 13,277 14,860 5 0,411742 0,831212 1,145 1,610 2,675 4,351 9,236 11,070 15,086 16,750 6 0,675727 1,237 1,635 2,204 3,455 5,348 10,645 12,592 16,812 18,548 7 0,989256 1,690 2,167 2,833 4,255 6,346 12,017 14,067 18,475 20,278 8 1,344 2,180 2,733 3,490 5,071 7,344 13,362 15,507 20,090 21,955 9 1,735 2,700 3,325 4,168 5,899 8,343 14,684 16,919 21,666 23,589 10 2,156 3,247 3,940 4,865 6,737 9,342 15,987 18,307 23,209 25,188 15 4,601 6,262 7,261 8,547 11,037 14,339 22,307 24,996 30,578 32,801 20 7,434 9,591 10,851 12,443 15,452 19,337 28,412 31,410 37,566 39,997 25 10,520 13,120 14,611 16,473 19,939 24,337 34,382 37,652 44,314 46,928 30 13,787 16,791 18,493 20,599 24,478 29,336 40,256 43,773 50,892 53,672 40 20,707 24,433 26,509 29,051 33,660 39,335 51,805 55,758 63,691 66,766 50 27,991 32,357 34,764 37,689 42,942 49,335 63,167 67,505 76,154 79,490 60 35,534 40,482 43,188 46,459 52,294 59,335 74,397 79,082 88,379 91,952 120 83,852 91,573 95,705 100,624 109,220 119,334 140,233 146,567 158,950 163,648 240 187,324 198,984 205,135 212,386 224,882 239,334 268,471 277,138 293,888 300,182 480 403,949 421,189 430,198 440,745 458,754 479,334 520,11 532,075 555,006 563,561 ∞ 850,891 876,028 889,081 904,291 930,093 959,333 1016,566 1033,193 1064,867 1076,621
  • 67. 132 4.10.3 Teste de Filliben Este teste foi introduzido por Filliben em 1975 para testar (verificar) a hipótese H0 de normalidade, tendo sido adaptada para outras distribuições. Isto significa que o teste verificará se uma determinada amostra y1, y2, y3, ..., yN, extraída de uma população Y com distribuição de probabilidade F(y) também poderá ser representada pela mesma distribuição. Para isto, o teste de aderência estimará um coeficiente de correlação (r) entre as observações yi e os quantis teóricos wi. Os valores de wi são obtidos pela inversa da FCP, ou seja: ( )qi1Fwi 1 y −= − (141) Sendo Fy -1 a função inversa da distribuição F(y). Isto significa obter o valor da variável hidrológica associada à freqüência observada q. Para a distribuição Normal, o software Excel possui uma função conhecida como INV.NORM. Para as demais, procede-se aplicando a estrutura da própria distribuição. A freqüência observada qi é obtida pela seguinte equação: a21N ai qi ⋅−+ − = (142) Sendo i a posição ocupada pelo valor na série amostrada, de preferência em ordem crescente, N é o tamanho da amostra e a é um parâmetro a ser adotado de acordo com a distribuição. Para a distribuição Normal e log-normal, a = 0,375; para Weibull, a = 0; Gumbel, a = 0,44; GEV e outras, a = 0,40. O coeficiente de correlação entre wi e yi é dado por: ( ) ( ) ( ) ( )−⋅− −⋅− = == = N 1i 2 i N 1i 2 i N 1i ii calc wwyy wwyy r (143) Este valor deverá ser comparado a um valor crítico de r, considerando a distribuição em questão. Se rcalc > rcr´tic, a amostra poderá ser representada pela respectiva distribuição. Os valores de rcritic estão apresentados nas Tabelas 4.13, 4.14 e 4.15, respectivamente para as Distribuições Normal (log-normal), Gumbel (Weibull) e GEV (adaptadas de Stedinger et al., 1993 por Naghettini & Pinto, 2007).
  • 68. 133 Tabela 4.13 Valores de rcritic para as Distribuições Normal e Log-Normal. Significância (α)Tamanho da Amostra (N) 0,10 0,05 0,01 10 0,9347 0,9180 0,8804 15 0,9506 0,9383 0,9110 20 0,9600 0,9503 0,9290 30 0,9707 0,9639 0,9490 40 0,9767 0,9715 0,9597 50 0,9807 0,9764 0,9664 60 0,9835 0,9799 0,9710 75 0,9865 0,9835 0,9757 100 0,9893 0,9870 0,9812 Tabela 4.14 Valores de rcritic para as Distribuições Gumbel para máximos e Weibull. Significância (α)Tamanho da Amostra (N) 0,10 0,05 0,01 10 0,9260 0,9084 0,8630 20 0,9517 0,9390 0,9060 30 0,9622 0,9526 0,9191 40 0,9689 0,9594 0,9286 50 0,9729 0,9646 0,9389 60 0,9760 0,9685 0,9467 70 0,9787 0,9720 0,9506 80 0,9804 0,9747 0,9525 100 0,9831 0,9779 0,9596
  • 69. 134 Tabela 4.15 Valores de rcritic para a Distribuição GEV. Valores do Parâmetro σ Significância (α) N σ = -0,30 σ = -0,20 σ = -0,10 σ = 0 σ = 0,10 σ = 0,20 5 0,777 0,791 0,805 0,817 0,823 0,825 10 0,836 0,845 0,856 0,866 0,876 0,882 0,01 20 0,839 0,855 0,878 0,903 0,923 0,932 30 0,834 0,858 0,890 0,920 0,942 0,953 50 0,825 0,859 0,902 0,939 0,961 0,970 100 0,815 0,866 0,920 0,959 0,978 0,985 5 0,853 0,863 0,869 0,874 0,877 0,880 10 0,881 0,890 0,900 0,909 0,916 0,920 0,05 20 0,898 0,912 0,926 0,938 0,948 0,953 30 0,903 0,920 0,937 0,952 0,961 0,967 50 0,908 0,929 0,950 0,965 0,974 0,979 100 0,914 0,940 0,963 0,978 0,985 0,989 5 0,888 0,892 0,896 0,899 0,901 0,903 10 0,904 0,912 0,920 0,927 0,932 0,936 0,10 20 0,920 0,932 0,943 0,952 0,958 0,962 30 0,928 0,941 0,953 0,962 0,969 0,973 50 0,935 0,950 0,963 0,973 0,979 0,982 100 0,944 0,961 0,974 0,983 0,988 0,991 4.10.4 Teste de Anderson-Darling Este teste tem grande aplicabilidade em situações nas quais os dados apresentam assimetria nas suas distribuições de freqüência, ou seja, séries históricas caracterizadas por valores extremos, tanto no contexto de mínimos quanto de máximos. Os demais testes analisam e comparam as freqüências observadas às teóricas e normalmente verificam distorção significativa apenas em freqüências intermediárias e não analisam de forma mais específica, os dados extremos (caudais). Assim, distribuições do tipo Gumbel, log-normal, Weibull, GEV e log-Gumbel, dentre outras, devem ser testadas por este teste sempre que possível. Além desta aplicação, segundo Sharda et al. (2008) e D’Agostino & Stephens (1986), este teste pode ser aplicado para analisar a “bondade do ajuste”, ou seja, a precisão do mesmo quando se deseja comparar duas ou mais distribuições. A estatística deste teste é a seguinte: ( ) ( ) ( )( )[ ] = −+−⋅⋅−−= N 1i ii 2 P1lnPln1i2 N 1 NAD (144)
  • 70. 135 Em que N é o tamanho da amostra, i é a posição de cada um dos dados na série histórica posicionada em ordem crescente e Pi é o corresponde à probabilidade calculada pela respectiva distribuição. O valor de AD2 deve ser comparado a um valor crítico p, considerando um nível de significância α. Se AD2 > p (α), rejeita-se a hipótese Ho de que a distribuição se ajusta de forma adequada aos dados de freqüência. Na Tabela 4.16 estão apresentados os valores da estatística p (α) do teste para as distribuições log-normal (normal), Weibull ou Gumbel, de acordo com D’Agostino & Stephens (1986) e Naghettini & Pinto (2007). Tabela 4.16 Valores críticos de p (α) para as distribuições log-normal (ou normal) e Weibull e Gumbel. Dsitribuição αααα p (αααα) Correção de A2 0,10 0,631 0,05 0,752 0,025 0,873 Normal ou log-normal 0,01 1,035 ++ 2 N 25,2 N 75,0 1 0,10 0,637 0,05 0,757 0,025 0,877 Weibull ou Gumbel para máximos 0,01 1,038 + N 2,0 1 Adaptado de D”Agostino & Stephens (1986) e Naghettini & Pinto (2007). Exemplo de Aplicação 4.16 Verificar pelos testes de adequação de Kolmogorov-Smirnov, Qui-quadrado, Filliben e Anderson-Darling a aplicação da Distribuição Normal à série histórica de precipitação total anual do Exemplo de Aplicação 4.3.