Apresentação topicos em probabilidade (2.pptx

SEGUNDO TRABALHO
AVALIATIVO
MULTIVARIADA II

Sumário
❖ Análise de Discriminantes
Banco de dados
Apresentação no R
❖ Análise de Agrupamento
Banco de dados
Métodos Hierárquicos
Métodos Não Hierárquicos

Distribuição Binomial Negativa
Antes de dissertar sobre a distribuição binomial negativa é importante entender
o pensamento que a gerou, ela obviamente partiu da distribuição binomial, que nos dá uma
ferramenta para calcular a probabilidade de “r” sucessos, ocorram dentro de “x” tentativas.
Porém limitar as tentativas necessárias para se conseguir um número determinado de
sucessos, é uma ideia muito mais produtiva, pois com isso reduzimos os ensaios de Bernoulli
no estudo, o que pode facilitar nos cálculos. Segue análise da distribuição

Função de Densidade de Probabilidade
“x” é o número de tentativas necessárias para conseguir os “r” sucessos

Como a ideia é obtermos um sucesso na última tentativa, então “p” será o último resultado
obtido;

Enquanto isso as tentativas anteriores, geram uma combinação E uma permutação dos
possíveis sucessos e fracassos do estudo;

Logo como temos a interseção de dois eventos independentes, nos dando assim a
função de densidade de probabilidade da Binomial Negativa

Função Geradora de Momentos
A “fgm” é uma importante ferramenta para obter informações que descrevem bem
qualquer distribuição, logo a aplicação na Distribuição Binomial Negativa se faz necessária

A “fgm” é uma importante ferramenta para obter informações que descrevem bem
qualquer distribuição, logo a aplicação na Distribuição Binomial Negativa se faz necessária
𝑀𝑥 𝑡 = 𝐸 𝑒𝑡∗𝑋 =
𝑥=𝑟
∞
𝑒𝑡∗𝑋 ∗ 𝑃(𝑋 = 𝑥)

• Desenvolvendo a função de probabilidade, obs: trocamos o “q”
pelo seu equivalente “(1-p)”;

𝐸 𝑒𝑡∗𝑋 = 𝑥=𝑟
∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 𝑝𝑟
∗ (1 − 𝑝)𝑥−𝑟

∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 𝑝𝑟
∗ (1 − 𝑝)𝑥−𝑟
• Para melhor trabalha-la iremos multiplicar e dividir a fórmula por ;
(𝑒𝑡
)
𝑟

∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 𝑝𝑟
∗ (1 − 𝑝)𝑥−𝑟
• Para melhor trabalha-la iremos multiplicar e dividir a fórmula por ;
(𝑒𝑡
)
𝑟
𝐸 𝑒𝑡∗𝑋
= 𝑥=𝑟
∞
𝑒𝑡∗𝑥
∗ 𝑥−1
𝑟−1
∗ 𝑝𝑟
∗ 1 − 𝑝 𝑥−𝑟
∗ ((𝑒𝑡
)
𝑟
/(𝑒𝑡
)
𝑟
)

• Como “𝑝𝑟
” e “(𝑒𝑡
)
𝑟
” não dependem de “𝑥”, pode-se move-los para fora do
somatório;

𝐸 𝑒𝑡∗𝑋 = 𝑝𝑟 ∗ (𝑒𝑡)
𝑟
∗ 𝑥=𝑟
∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 1 − 𝑝 𝑥−𝑟 ∗ (𝑒𝑡)
−𝑟
” e “(𝑒𝑡
)
𝑟
somatório;

𝑟
∗ 𝑥=𝑟
∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 1 − 𝑝 𝑥−𝑟 ∗ (𝑒𝑡)
−𝑟
” e “(𝑒𝑡
)
𝑟
somatório;
• Desta forma podemos unificar os termos que possuem “𝑒” com os termos
que possuíssem o mesmo expoente;

𝑟
∗ 𝑥=𝑟
∞ 𝑒𝑡∗𝑥 ∗ 𝑥−1
𝑟−1
∗ 1 − 𝑝 𝑥−𝑟 ∗ (𝑒𝑡)
−𝑟
” e “(𝑒𝑡
)
𝑟
somatório;
• Desta forma podemos unificar os termos que possuem “𝑒” com os termos
que possuíssem o mesmo expoente;
𝐸 𝑒𝑡∗𝑋 = (𝑝 ∗ 𝑒𝑡)
𝑟
∗ 𝑥=𝑟
∞ 𝑥−1
𝑟−1
∗ 1 − 𝑝 ∗ 𝑒𝑡 𝑥−𝑟

• Visando uma mudança de índice aplicaremos uma constante “k = x − r”

= (𝑝 ∗ 𝑒𝑡
)
𝑟
∗ 𝑘=0
∞ 𝑘+𝑟−1
𝑟−1
∗ 1 − 𝑝 ∗ 𝑒𝑡 𝑘

= (𝑝 ∗ 𝑒𝑡
)
𝑟
∗ 𝑘=0
∞ 𝑘+𝑟−1
𝑟−1
∗ 1 − 𝑝 ∗ 𝑒𝑡 𝑘
• Podemos ver que agora que o somatório se tornou um binômio de Newton
gerando a fórmula;

= (𝑝 ∗ 𝑒𝑡
)
𝑟
∗ 𝑘=0
∞ 𝑘+𝑟−1
𝑟−1
∗ 1 − 𝑝 ∗ 𝑒𝑡 𝑘
• Podemos ver que agora que o somatório se tornou um binômio de Newton
gerando a fórmula;
= (𝑝 ∗ 𝑒𝑡
)
𝑟
∗ 1 − 1 − 𝑝 ∗ 𝑒𝑡 −𝑟

• Podemos reescrever essa “fgm” da seguinte forma:

=
(𝑝 ∗𝑒𝑡)
𝑟
1− 1−𝑝 ∗𝑒𝑡 𝑟

=
(𝑝 ∗𝑒𝑡)
𝑟
1− 1−𝑝 ∗𝑒𝑡 𝑟
• Uma “fgm” só existe se for finito. Então, tudo o que precisamos fazer é observar
quando 𝑀𝑥 𝑡 é finito. Bem, isso acontece quando 1 − 𝑝 ∗ 𝑒𝑡
< 1, ou para ficar
mais claro o seu equivalentemente quando 𝑡 < ln(1 − 𝑝).

Esperança
Podemos fazer a comprovação da média pela primeira derivada centrada em 0
da “fgm”, mas optaremos em resolver pela definição de esperança
por objetividade na economia de tempo.

Esperança
Podemos fazer a comprovação da média pela primeira derivada centrada em 0
da “fgm”, mas optaremos em resolver pela definição de esperança
por objetividade na economia de tempo.
• Pode-se destacar o trecho , pois ele pode ser reescrito da forma : isso
para facilitar a conclusão;

Esperança
• Vemos que “r” não está dependente do somatório, então podemos multiplica-lo, e
também iremos criar um “y = x+1” e um “1/p” extraído de 𝑝𝑟
;

Esperança
• Vemos que “r” não está dependente do somatório, então podemos multiplica-lo, e
também iremos criar um “y = x+1” e um “1/p” extraído de 𝑝𝑟
;
• Vemos que S1 = 1 pois S1 é a soma da função de probabilidade de
Y ∼ BinNeg(r + 1, p) para todos y ∈ Im(Y ). Com isso confirmamos o resultado.

Variância
Da mesma forma que a Esperança, iremos usar a definição de variância com relação
ao valor esperado como já temos , então vamos focar em

Variância
Da mesma forma que a Esperança, iremos usar a definição de variância com relação
ao valor esperado como já temos , então vamos focar em
• Podemos perceber que a forma da equação acima é muito parecida com a da
esperança calculada anteriormente, com isso em mente podemos desenvolve-la de
forma similar

Variância
• Vemos que 𝑆2 = E(Y − 1), com Y ∼ BinNeg(r + 1, p) que pode ser reescrito . Agora
aplicando esse resultado em ;

Variância
• Com esse resultado em mãos, temos:

Variância
• Com esse resultado em mãos, temos:
• Ou também:

Informações sobre o banco de dados

Gráfico dos pontos da função discriminante 1

Gráfico de dispersão de FD 1 e FD 2

Análise de Agrupamento
● BANCO DE DADOS
Para realizar a análise de agrupamento foi elaborado um banco de dados pelas integrantes do
presente trabalho, ele é composto por 8 indivíduos que são as disciplinas do curso de Bacharelado
em Estatística são elas:
Estatística Descritiva (Est.Desc), Geometría Analítica (Geom.), Álgebra Linear (Algebra), Algoritmo e
programação de Computadores (algor.), Probabilidade (Probab.), Inferência, Análise multivariada
(Multiv.) e Softwares Estatísticos(soft.).
Estas disciplinas foram avaliadas com um pontuação de 1 a 8, sendo 1 a que menos se adequada
para as variáveis e 8 a que está mais de acordo com a variável. As variáveis são:
A dificuldade da disciplina(dif), a utilização do soft R(R), a Utilização da disciplina de Cálculo(calc), e
as disciplinas que mais causam reprovação (reprov).

Calculando a matriz de distância
(euclidiana)
D2Mqt = vegdist(dads, method = "euclidean")
● Quanto menor a distância nessa matriz mais similares serão as observações.

Métodos Hierárquicos
avg1qt = hclust(D2Mqt, method='average')
par(mfrow = c(1, 1), mar = c(5.5, 4, 2, 2))
plot(avg1qt,hang=-1,col=1,ylab="Euclidean
distance",xlab="User",main = "");box()
● O Dendrograma foi gerado utilizando a
distância Euclidiana usando o método
de agrupamento de distância média
(Average Linkage).

Calculando a correlação entre a cofenética e a
matriz euclidiana
● Obtivemos um valor consideravelmente alto, então significa que o método de
agrupamento foi bom.
● Matriz de distâncias cofenéticas - UPGMA
distance_a1qt = cophenetic(avg1qt)
● Correlação entre as duas matrizes de distância
ccavg1qt = cor(D2Mqt, distance_a1qt);ccavg1qt

Fazendo pelo método de Ward
w1qt = hclust(D2Mqt, method="ward.D2")
par(mfrow = c(1, 1), mar = c(5.5, 4, 2, 2))
plot(w1qt,hang=-1,col=1,ylab="Euclidean
distance", xlab="User",main = ""); box()
● Matriz de distâncias cofenéticas
distance_w1qt = cophenetic(w1qt)
● Correlação entre as duas matrizes de
distância
ccw1qt = cor(D2Mqt, distance_w1qt);ccw1qt

Fazendo pelo método de Single
s1qt = hclust(D2Mqt, method="single")
par(mfrow = c(1, 1), mar = c(5.5, 4, 2, 2))
plot(s1qt,hang=-1,col=1,ylab="Euclidean distance",
xlab= "User", main = "");box()
distance_s1qt = cophenetic(s1qt)
distância
ccs1qt = cor(D2Mqt, distance_s1qt);ccs1qt

Fazendo pelo método do
Complete
distance_c1qt = cophenetic(c1qt)
distância
c1qt = hclust(D2Mqt, method="complete")
par(mfrow = c(1, 1), mar = c(5.5, 4, 2, 2))
plot(c1qt,hang=-1,col=1,ylab="Euclidean
distance",xlab="User",main = "");box()

Fazendo a correlação cofenética

● Método de otimização de Tocher
E

● Método não hierárquico (k-means)

● Fazendo o método de bootstrap
plot(avgbqt ,hang=-1,col=1,main = "",ylab="Euclidean distance",xlab="User");box()

Apresentação topicos em probabilidade (2.pptx

Apresentação topicos em probabilidade (2.pptx

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Apresentação topicos em probabilidade (2.pptx

Semelhante a Apresentação topicos em probabilidade (2.pptx (20)

Mais de LarissaB6

Mais de LarissaB6 (6)

Apresentação topicos em probabilidade (2.pptx