【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models.pptx

ARISE analytics
ARISE analyticsARISE analytics
[公開情報]
Analytic-DPM
An Analytic Estimate of
The Optimal Reverse Variance
in Diffusion Probabilistic Models
株式会社ARISE analytics
Marketing Solution Div. OMO Marketing Unit. 伊藤光祐
2022/07/07
©2022 ARISE analytics Reserved.
[公開情報]
どんな論文?
©2022 ARISE analytics Reserved. 1
画像生成などで注目されているDiffusion Probabilistic Modelに2つの工夫を組み込
むことで、精度を向上させつつ20~80倍高速化することができた
概要
1
2
各計算ステップで推定する正規分布の分散をモデルの出力か
ら解析的に計算
サンプリング時の計算ステップの省略方法を最適化
上記の工夫は既存手法に簡単に組み込むことが可能
[公開情報]
アジェンダ
©2022 ARISE analytics Reserved. 2
1 Diffusion Probabilistic Model(DPM)とは
2 各計算ステップでの分散の推定
3 サンプリング方法の最適化
4 実験結果
[公開情報]
アジェンダ
©2022 ARISE analytics Reserved. 3
1 Diffusion Probabilistic Model(DPM)とは
2 各計算ステップでの分散の推定
3 サンプリング方法の最適化
4 実験結果
[公開情報]
Diffusion Probabilistic Model(DPM)とは
©2022 ARISE analytics Reserved.
データにノイズをかけていく処理を逆向きにして、ノイズからデータを作成す
るモデル。画像生成分野で注目されている手法の一つ。
4
?
?
ノイズ付与
(順過程)
ノイズ除去
(逆過程)
 元データに順番に少しずつガウスノイズをかけていく
 最終的にはデータがただのガウスノイズになる
 ただのノイズから少しずつガウスノイズを除去していくことでデータを生成
 この過程をニューラルネットなどで学習する
データ 処理の途中 ノイズ
今回はAnalytic-DPMの説明にフォーカスするため、基本的な学習方法などの詳細は他の資料を参考にしてくだ
さい
[公開情報]
DPMの課題
©2022 ARISE analytics Reserved. 5
課
題
1
課
題
2
分散の推定が難しい
 分散は固定パラメータとするのが一般的
 分散を学習パラメータとすると精度が上がる可能性があるが
学習が不安定になることもある
サンプリング時の反復計算に時間がかかる
 ノイズを除去するステップが数千になることもありとても時
間がかかる
 ノイズ除去のステップをいくつか省略することで解決する方
法が提案されているが、省略する場所をうまく調整する必要
がある
[公開情報]
アジェンダ
©2022 ARISE analytics Reserved. 6
1 Diffusion Probabilistic Model(DPM)とは
2 各計算ステップでの分散の推定
3 サンプリング方法の最適化
4 実験結果
[公開情報]
各ステップで推定する分布の分散の最適解
©2022 ARISE analytics Reserved.
※数式は論文の式から変形して掲載
この論文において、各ステップで最適となる正規分布の平均と分散がモデルの
出力から解析的に求められるということが証明された。(証明は省略)
7
ステップ𝒏で
の最適な平
均※
ステップ𝒏で
の最適な分
散
𝜇𝑛
∗
𝑥𝑛 =
𝛼𝑛−1
𝛼𝑛
𝑥𝑛 +
𝛽𝑛 𝛼𝑛−1
𝛼𝑛
+ 𝛽𝑛−1 − 𝜆𝑛
2
∙ 𝛽𝑛 ∇𝑥𝑛
log 𝑞𝑛(𝑥𝑛)
𝜎𝑛
∗
= 𝜆𝑛
2
+
𝛽𝑛
𝛼𝑛
− 𝛽𝑛−1 − 𝜆𝑛
2
2
1 − 𝛽𝑛𝔼𝑞𝑛 𝑥𝑛
∇𝑥𝑛
log 𝑞𝑛 𝑥𝑛
2
𝑑
補足
 ∇𝑥𝑛
log 𝑞𝑛(𝑥𝑛)はデータの周辺分布の
スコア関数
 ニューラルネットなどで学習す
る
 𝛼𝑛は各ステップごとのハイパーパラ
メータ
 𝛼𝑛 = Π𝑖=1
𝑛
𝛼𝑖
 𝛽𝑛 = 1 − 𝛼𝑛
 𝜆𝑛
2
=
𝛽𝑛−1
𝛽𝑛
𝛽𝑛
 𝑑はデータの次元数
[公開情報]
実際の分散の算出方法
©2022 ARISE analytics Reserved.
最適な分散を計算するにはモデル出力の2乗ノルムの平均が必要となる。実際
に計算するときには、モンテカルロ法で2乗ノルムを計算することで分散を導
出することができる。
8
実際の分散
モデル出力
の2乗ノルム
の平均
Γ𝑛 =
1
𝑀
𝑚=1
𝑀
𝑠𝑛(𝑥𝑛,𝑚)
2
𝑑
𝜎𝑛
∗
= 𝜆𝑛
2
+
𝛽𝑛
𝛼𝑛
− 𝛽𝑛−1 − 𝜆𝑛
2
2
1 − 𝛽𝑛Γ𝑛
補足
 𝑠𝑛(𝑥𝑛,𝑚)はモデルの出力
 𝑀はモンテカルロ法のサンプル数
 10~100回ほどで十分
 一度そのステップの分散を計算したら、あとの同じステップの計算では結果
を使いまわすことができる
[公開情報]
分散の下限と上限
©2022 ARISE analytics Reserved.
モデルの近似誤差によっては分散に大きなバイアスがかかる。解析的に求まる
分散の上限値・下限値でクリッピングすることでDPMの精度が向上する。(証
明は省略)
9
分散の上限
と下限
元データの
値の範囲が
𝒂, 𝒃 の場合
𝜆𝑛
2
≤ 𝜎𝑛
∗
≤ 𝜆𝑛
2
+
𝛽𝑛
𝛼𝑛
− 𝛽𝑛−1 − 𝜆𝑛
2
2
𝜎𝑛
∗
≤ 𝜆𝑛
2
+ 𝛼𝑛−1 − 𝛽𝑛−1 − 𝜆𝑛
2
∙
𝛼𝑛
𝛽𝑛
2
𝑏 − 𝑎
2
2
[公開情報]
アジェンダ
©2022 ARISE analytics Reserved. 10
1 Diffusion Probabilistic Model(DPM)とは
2 各計算ステップでの分散の推定
3 サンプリング方法の最適化
4 実験結果
[公開情報]
推論過程の最適化
©2022 ARISE analytics Reserved.
学習時のステップ数から推論時のステップ数を適切に減らすことで精度を保ち
つつ計算を高速化できる。適切なステップは動的計画法で求めることができる。
11
ステップ数を減らし
た時の逆過程
適切なステップを選
択する際に最小化す
る式
𝒩 𝑥𝜏𝐾
Πk=1
𝐾
𝒩(𝑥𝜏𝑘−1
|𝜇𝜏𝑘−1|𝜏𝑘
(𝑥𝜏𝐾
), 𝜎𝜏𝑘−1|𝜏𝑘
2
𝐼)
min
𝜏1,…,𝜏𝐾
𝑑
2
𝑘=2
𝐾
log 𝜎∗
𝜏𝑘−1|𝜏𝑘
2
/𝜆𝜏𝑘−1|𝜏𝑘
2
+ 𝑐
 𝜏𝑘は元のステップのうちどれか(ただし、𝜏1 = 1)
 𝜇𝜏𝑘−1|𝜏𝑘
(𝑥𝜏𝐾
)、 𝜎𝜏𝑘−1|𝜏𝑘
2
はP7の𝑥𝑛を𝑥𝜏𝐾
にしたもの
 最小化は動的計画法の一種で解ける(ここでは解き方は省略)
ステップ数を𝑵から𝑲にする場合
補足
[公開情報]
アジェンダ
©2022 ARISE analytics Reserved. 12
1 Diffusion Probabilistic Model(DPM)とは
2 各計算ステップでの分散の推定
3 サンプリング方法の最適化
4 実験結果
[公開情報]
指標の比較結果
©2022 ARISE analytics Reserved.
既存手法とAnalytic-DPMを様々なシチュエーションで評価。ほとんどの場合
においてAnalytic-DPMが最も優れた結果に。
13
②FIDでの評価
①負の対数尤度での評価
サンプリングの方法が確率的
(DDPM)・決定的(DDIM)どち
らの場合でも、基本的に
Analytic-DPMの方が優れてい
た。
既存手法で(ET)と本論文の手
法(OT)でステップを減らした
場合の両方においてAnalytic-
DPMの性能が最も高かった。
1
2
[公開情報]
生成した画像の例(もう少し大きい画像が欲しかっ
た。。。)
©2022 ARISE analytics Reserved. 14
[公開情報]
実験用コード(GitHubで公開中)
©2022 ARISE analytics Reserved. 15
https://github.com/baofff/Analytic-DPM
[公開情報]
Best Partner for innovation, Best Creator for the future.
1 de 17

Recomendados

近年のHierarchical Vision Transformer por
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision TransformerYusuke Uchida
13.9K visualizações46 slides
【論文読み会】Self-Attention Generative Adversarial Networks por
【論文読み会】Self-Attention Generative  Adversarial Networks【論文読み会】Self-Attention Generative  Adversarial Networks
【論文読み会】Self-Attention Generative Adversarial NetworksARISE analytics
5.3K visualizações23 slides
実装レベルで学ぶVQVAE por
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAEぱんいち すみもと
12.6K visualizações23 slides
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models por
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion ModelsDeep Learning JP
2.6K visualizações15 slides
Transformerを雰囲気で理解する por
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解するAtsukiYamaguchi1
4.8K visualizações37 slides
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision por
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
[DL輪読会]Learning Transferable Visual Models From Natural Language SupervisionDeep Learning JP
46.5K visualizações25 slides

Mais conteúdo relacionado

Mais procurados

深層生成モデルを用いたマルチモーダル学習 por
深層生成モデルを用いたマルチモーダル学習深層生成モデルを用いたマルチモーダル学習
深層生成モデルを用いたマルチモーダル学習Masahiro Suzuki
9.5K visualizações23 slides
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? por
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? Deep Learning JP
1.1K visualizações27 slides
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions por
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
[DL輪読会]Glow: Generative Flow with Invertible 1×1 ConvolutionsDeep Learning JP
5.9K visualizações26 slides
Transformer メタサーベイ por
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイcvpaper. challenge
27.3K visualizações181 slides
全力解説!Transformer por
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
9.6K visualizações43 slides
【メタサーベイ】数式ドリブン教師あり学習 por
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
5.9K visualizações33 slides

Mais procurados(20)

深層生成モデルを用いたマルチモーダル学習 por Masahiro Suzuki
深層生成モデルを用いたマルチモーダル学習深層生成モデルを用いたマルチモーダル学習
深層生成モデルを用いたマルチモーダル学習
Masahiro Suzuki9.5K visualizações
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? por Deep Learning JP
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks? 【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP1.1K visualizações
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions por Deep Learning JP
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
[DL輪読会]Glow: Generative Flow with Invertible 1×1 Convolutions
Deep Learning JP5.9K visualizações
Transformer メタサーベイ por cvpaper. challenge
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
cvpaper. challenge27.3K visualizações
全力解説!Transformer por Arithmer Inc.
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
Arithmer Inc.9.6K visualizações
【メタサーベイ】数式ドリブン教師あり学習 por cvpaper. challenge
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge5.9K visualizações
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021) por Deep Learning JP
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP3.7K visualizações
MLP-Mixer: An all-MLP Architecture for Vision por Kazuyuki Miyazawa
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
Kazuyuki Miyazawa1.5K visualizações
【DL輪読会】ViT + Self Supervised Learningまとめ por Deep Learning JP
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP4K visualizações
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition por YosukeKashiwagi1
論文紹介  wav2vec: Unsupervised Pre-training for Speech Recognition論文紹介  wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
YosukeKashiwagi12.6K visualizações
(文献紹介)Deep Unrolling: Learned ISTA (LISTA) por Morpho, Inc.
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Morpho, Inc.6.3K visualizações
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​ por SSII
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII3.2K visualizações
[DL輪読会]Flow-based Deep Generative Models por Deep Learning JP
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP14.6K visualizações
Attentionの基礎からTransformerの入門まで por AGIRobots
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
AGIRobots40.4K visualizações
Layer Normalization@NIPS+読み会・関西 por Keigo Nishida
Layer Normalization@NIPS+読み会・関西Layer Normalization@NIPS+読み会・関西
Layer Normalization@NIPS+読み会・関西
Keigo Nishida23.5K visualizações
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders por Satoshi Hara
KDD'17読み会:Anomaly Detection with Robust Deep AutoencodersKDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
Satoshi Hara16.8K visualizações
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten... por Deep Learning JP
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
Deep Learning JP5.7K visualizações
backbone としての timm 入門 por Takuji Tahara
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara7.4K visualizações
画像処理AIを用いた異常検知 por Hideo Terada
画像処理AIを用いた異常検知画像処理AIを用いた異常検知
画像処理AIを用いた異常検知
Hideo Terada3.2K visualizações
【論文読み会】Universal Language Model Fine-tuning for Text Classification por ARISE analytics
【論文読み会】Universal Language Model Fine-tuning for Text Classification【論文読み会】Universal Language Model Fine-tuning for Text Classification
【論文読み会】Universal Language Model Fine-tuning for Text Classification
ARISE analytics1.9K visualizações

Mais de ARISE analytics

【論文レベルで理解しよう!】​ 欠測値処理編​ por
【論文レベルで理解しよう!】​ 欠測値処理編​【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​ARISE analytics
87 visualizações19 slides
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​ por
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​ARISE analytics
118 visualizações20 slides
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho... por
【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...ARISE analytics
184 visualizações32 slides
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (... por
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...ARISE analytics
122 visualizações24 slides
教師なしGNNによるIoTデバイスの異常通信検知の検討 por
教師なしGNNによるIoTデバイスの異常通信検知の検討教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討ARISE analytics
1K visualizações21 slides
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri... por
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...ARISE analytics
578 visualizações18 slides

Mais de ARISE analytics(16)

【論文レベルで理解しよう!】​ 欠測値処理編​ por ARISE analytics
【論文レベルで理解しよう!】​ 欠測値処理編​【論文レベルで理解しよう!】​ 欠測値処理編​
【論文レベルで理解しよう!】​ 欠測値処理編​
ARISE analytics87 visualizações
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​ por ARISE analytics
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
ARISE analytics118 visualizações
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho... por ARISE analytics
【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...【論文読み会】Signing at Scale: Learning to Co-Articulate  Signs for Large-Scale Pho...
【論文読み会】Signing at Scale: Learning to Co-Articulate Signs for Large-Scale Pho...
ARISE analytics184 visualizações
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (... por ARISE analytics
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
Hierarchical Metadata-Aware Document Categorization under Weak Supervision​ (...
ARISE analytics122 visualizações
教師なしGNNによるIoTデバイスの異常通信検知の検討 por ARISE analytics
教師なしGNNによるIoTデバイスの異常通信検知の検討教師なしGNNによるIoTデバイスの異常通信検知の検討
教師なしGNNによるIoTデバイスの異常通信検知の検討
ARISE analytics1K visualizações
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri... por ARISE analytics
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
【論文読み会】Pyraformer_Low-Complexity Pyramidal Attention for Long-Range Time Seri...
ARISE analytics578 visualizações
【論文読み会】Autoregressive Diffusion Models.pptx por ARISE analytics
【論文読み会】Autoregressive Diffusion Models.pptx【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx
ARISE analytics5.3K visualizações
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx por ARISE analytics
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
ARISE analytics555 visualizações
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx por ARISE analytics
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
【論文読み会】PiCO_Contrastive Label Disambiguation for Partial Label Learning.pptx
ARISE analytics497 visualizações
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice por ARISE analytics
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
【論文読み会】Deep Reinforcement Learning at the Edge of the Statistical Precipice
ARISE analytics699 visualizações
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3) por ARISE analytics
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
【論文読み会】Alias-Free Generative Adversarial Networks(StyleGAN3)
ARISE analytics2.7K visualizações
【論文読み会】On the Expressivity of Markov Reward por ARISE analytics
【論文読み会】On the Expressivity of Markov Reward【論文読み会】On the Expressivity of Markov Reward
【論文読み会】On the Expressivity of Markov Reward
ARISE analytics583 visualizações
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive... por ARISE analytics
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
【論文読み会】MAUVE: Measuring the Gap Between Neural Text and Human Text using Dive...
ARISE analytics699 visualizações
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds por ARISE analytics
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
【論文読み会】Moser Flow: Divergence-based Generative Modeling on Manifolds
ARISE analytics701 visualizações
Counterfaual Machine Learning(CFML)のサーベイ por ARISE analytics
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics29.9K visualizações
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features por ARISE analytics
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics7.8K visualizações

Último

定例会スライド_キャチs 公開用.pdf por
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdfKeio Robotics Association
132 visualizações64 slides
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) por
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
29 visualizações38 slides
SNMPセキュリティ超入門 por
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門mkoda
453 visualizações15 slides
The Things Stack説明資料 by The Things Industries por
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things IndustriesCRI Japan, Inc.
76 visualizações29 slides
IPsec VPNとSSL-VPNの違い por
IPsec VPNとSSL-VPNの違いIPsec VPNとSSL-VPNの違い
IPsec VPNとSSL-VPNの違い富士通クラウドテクノロジーズ株式会社
543 visualizações8 slides
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 por
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PC Cluster Consortium
23 visualizações36 slides

Último(12)

定例会スライド_キャチs 公開用.pdf por Keio Robotics Association
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdf
Keio Robotics Association132 visualizações
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) por NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
SNMPセキュリティ超入門 por mkoda
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門
mkoda453 visualizações
The Things Stack説明資料 by The Things Industries por CRI Japan, Inc.
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.76 visualizações
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 por PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PC Cluster Consortium23 visualizações
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 por Hitachi, Ltd. OSS Solution Center.
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Windows 11 information that can be used at the development site por Atomu Hidaka
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development site
Atomu Hidaka90 visualizações
SSH応用編_20231129.pdf por icebreaker4
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdf
icebreaker4380 visualizações
光コラボは契約してはいけない por Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga25 visualizações
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... por NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
NTT DATA Technology & Innovation151 visualizações
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 por PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PC Cluster Consortium45 visualizações

【論文読み会】Analytic-DPM_an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models.pptx

  • 1. [公開情報] Analytic-DPM An Analytic Estimate of The Optimal Reverse Variance in Diffusion Probabilistic Models 株式会社ARISE analytics Marketing Solution Div. OMO Marketing Unit. 伊藤光祐 2022/07/07 ©2022 ARISE analytics Reserved.
  • 2. [公開情報] どんな論文? ©2022 ARISE analytics Reserved. 1 画像生成などで注目されているDiffusion Probabilistic Modelに2つの工夫を組み込 むことで、精度を向上させつつ20~80倍高速化することができた 概要 1 2 各計算ステップで推定する正規分布の分散をモデルの出力か ら解析的に計算 サンプリング時の計算ステップの省略方法を最適化 上記の工夫は既存手法に簡単に組み込むことが可能
  • 3. [公開情報] アジェンダ ©2022 ARISE analytics Reserved. 2 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
  • 4. [公開情報] アジェンダ ©2022 ARISE analytics Reserved. 3 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
  • 5. [公開情報] Diffusion Probabilistic Model(DPM)とは ©2022 ARISE analytics Reserved. データにノイズをかけていく処理を逆向きにして、ノイズからデータを作成す るモデル。画像生成分野で注目されている手法の一つ。 4 ? ? ノイズ付与 (順過程) ノイズ除去 (逆過程)  元データに順番に少しずつガウスノイズをかけていく  最終的にはデータがただのガウスノイズになる  ただのノイズから少しずつガウスノイズを除去していくことでデータを生成  この過程をニューラルネットなどで学習する データ 処理の途中 ノイズ 今回はAnalytic-DPMの説明にフォーカスするため、基本的な学習方法などの詳細は他の資料を参考にしてくだ さい
  • 6. [公開情報] DPMの課題 ©2022 ARISE analytics Reserved. 5 課 題 1 課 題 2 分散の推定が難しい  分散は固定パラメータとするのが一般的  分散を学習パラメータとすると精度が上がる可能性があるが 学習が不安定になることもある サンプリング時の反復計算に時間がかかる  ノイズを除去するステップが数千になることもありとても時 間がかかる  ノイズ除去のステップをいくつか省略することで解決する方 法が提案されているが、省略する場所をうまく調整する必要 がある
  • 7. [公開情報] アジェンダ ©2022 ARISE analytics Reserved. 6 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
  • 8. [公開情報] 各ステップで推定する分布の分散の最適解 ©2022 ARISE analytics Reserved. ※数式は論文の式から変形して掲載 この論文において、各ステップで最適となる正規分布の平均と分散がモデルの 出力から解析的に求められるということが証明された。(証明は省略) 7 ステップ𝒏で の最適な平 均※ ステップ𝒏で の最適な分 散 𝜇𝑛 ∗ 𝑥𝑛 = 𝛼𝑛−1 𝛼𝑛 𝑥𝑛 + 𝛽𝑛 𝛼𝑛−1 𝛼𝑛 + 𝛽𝑛−1 − 𝜆𝑛 2 ∙ 𝛽𝑛 ∇𝑥𝑛 log 𝑞𝑛(𝑥𝑛) 𝜎𝑛 ∗ = 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 1 − 𝛽𝑛𝔼𝑞𝑛 𝑥𝑛 ∇𝑥𝑛 log 𝑞𝑛 𝑥𝑛 2 𝑑 補足  ∇𝑥𝑛 log 𝑞𝑛(𝑥𝑛)はデータの周辺分布の スコア関数  ニューラルネットなどで学習す る  𝛼𝑛は各ステップごとのハイパーパラ メータ  𝛼𝑛 = Π𝑖=1 𝑛 𝛼𝑖  𝛽𝑛 = 1 − 𝛼𝑛  𝜆𝑛 2 = 𝛽𝑛−1 𝛽𝑛 𝛽𝑛  𝑑はデータの次元数
  • 9. [公開情報] 実際の分散の算出方法 ©2022 ARISE analytics Reserved. 最適な分散を計算するにはモデル出力の2乗ノルムの平均が必要となる。実際 に計算するときには、モンテカルロ法で2乗ノルムを計算することで分散を導 出することができる。 8 実際の分散 モデル出力 の2乗ノルム の平均 Γ𝑛 = 1 𝑀 𝑚=1 𝑀 𝑠𝑛(𝑥𝑛,𝑚) 2 𝑑 𝜎𝑛 ∗ = 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 1 − 𝛽𝑛Γ𝑛 補足  𝑠𝑛(𝑥𝑛,𝑚)はモデルの出力  𝑀はモンテカルロ法のサンプル数  10~100回ほどで十分  一度そのステップの分散を計算したら、あとの同じステップの計算では結果 を使いまわすことができる
  • 10. [公開情報] 分散の下限と上限 ©2022 ARISE analytics Reserved. モデルの近似誤差によっては分散に大きなバイアスがかかる。解析的に求まる 分散の上限値・下限値でクリッピングすることでDPMの精度が向上する。(証 明は省略) 9 分散の上限 と下限 元データの 値の範囲が 𝒂, 𝒃 の場合 𝜆𝑛 2 ≤ 𝜎𝑛 ∗ ≤ 𝜆𝑛 2 + 𝛽𝑛 𝛼𝑛 − 𝛽𝑛−1 − 𝜆𝑛 2 2 𝜎𝑛 ∗ ≤ 𝜆𝑛 2 + 𝛼𝑛−1 − 𝛽𝑛−1 − 𝜆𝑛 2 ∙ 𝛼𝑛 𝛽𝑛 2 𝑏 − 𝑎 2 2
  • 11. [公開情報] アジェンダ ©2022 ARISE analytics Reserved. 10 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
  • 12. [公開情報] 推論過程の最適化 ©2022 ARISE analytics Reserved. 学習時のステップ数から推論時のステップ数を適切に減らすことで精度を保ち つつ計算を高速化できる。適切なステップは動的計画法で求めることができる。 11 ステップ数を減らし た時の逆過程 適切なステップを選 択する際に最小化す る式 𝒩 𝑥𝜏𝐾 Πk=1 𝐾 𝒩(𝑥𝜏𝑘−1 |𝜇𝜏𝑘−1|𝜏𝑘 (𝑥𝜏𝐾 ), 𝜎𝜏𝑘−1|𝜏𝑘 2 𝐼) min 𝜏1,…,𝜏𝐾 𝑑 2 𝑘=2 𝐾 log 𝜎∗ 𝜏𝑘−1|𝜏𝑘 2 /𝜆𝜏𝑘−1|𝜏𝑘 2 + 𝑐  𝜏𝑘は元のステップのうちどれか(ただし、𝜏1 = 1)  𝜇𝜏𝑘−1|𝜏𝑘 (𝑥𝜏𝐾 )、 𝜎𝜏𝑘−1|𝜏𝑘 2 はP7の𝑥𝑛を𝑥𝜏𝐾 にしたもの  最小化は動的計画法の一種で解ける(ここでは解き方は省略) ステップ数を𝑵から𝑲にする場合 補足
  • 13. [公開情報] アジェンダ ©2022 ARISE analytics Reserved. 12 1 Diffusion Probabilistic Model(DPM)とは 2 各計算ステップでの分散の推定 3 サンプリング方法の最適化 4 実験結果
  • 14. [公開情報] 指標の比較結果 ©2022 ARISE analytics Reserved. 既存手法とAnalytic-DPMを様々なシチュエーションで評価。ほとんどの場合 においてAnalytic-DPMが最も優れた結果に。 13 ②FIDでの評価 ①負の対数尤度での評価 サンプリングの方法が確率的 (DDPM)・決定的(DDIM)どち らの場合でも、基本的に Analytic-DPMの方が優れてい た。 既存手法で(ET)と本論文の手 法(OT)でステップを減らした 場合の両方においてAnalytic- DPMの性能が最も高かった。 1 2
  • 16. [公開情報] 実験用コード(GitHubで公開中) ©2022 ARISE analytics Reserved. 15 https://github.com/baofff/Analytic-DPM
  • 17. [公開情報] Best Partner for innovation, Best Creator for the future.