Início
Conheça mais
Enviar pesquisa
Carregar
Entrar
Cadastre-se
Anúncio
Check these out next
画像生成・生成モデル メタサーベイ
cvpaper. challenge
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
(DL hacks輪読) How to Train Deep Variational Autoencoders and Probabilistic Lad...
Masahiro Suzuki
【DL輪読会】WIRE: Wavelet Implicit Neural Representations
Deep Learning JP
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
Deep Learning JP
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII
1
de
18
Top clipped slide
Transformerを用いたAutoEncoderの設計と実験
11 de Mar de 2023
•
0 gostou
0 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
3,820 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Baixar agora
Baixar para ler offline
Denunciar
Engenharia
VRChat ML集会 2023-01-11
myxymyxomatosis
Seguir
Anúncio
Anúncio
Anúncio
Recomendados
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Deep Learning JP
8.6K visualizações
•
58 slides
【チュートリアル】コンピュータビジョンによる動画認識 v2
Hirokatsu Kataoka
4.9K visualizações
•
67 slides
【メタサーベイ】Video Transformer
cvpaper. challenge
1.6K visualizações
•
42 slides
Introduction to YOLO detection model
Takamitsu Oomasa
60.3K visualizações
•
36 slides
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
Deep Learning JP
6.3K visualizações
•
28 slides
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
Deep Learning JP
2.1K visualizações
•
20 slides
Mais conteúdo relacionado
Apresentações para você
(20)
画像生成・生成モデル メタサーベイ
cvpaper. challenge
•
7.8K visualizações
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
•
25.4K visualizações
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
•
2.6K visualizações
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
•
819 visualizações
(DL hacks輪読) How to Train Deep Variational Autoencoders and Probabilistic Lad...
Masahiro Suzuki
•
3.4K visualizações
【DL輪読会】WIRE: Wavelet Implicit Neural Representations
Deep Learning JP
•
400 visualizações
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
Deep Learning JP
•
916 visualizações
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII
•
1.7K visualizações
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
Deep Learning JP
•
3.7K visualizações
【DL輪読会】Unbiased Gradient Estimation for Marginal Log-likelihood
Deep Learning JP
•
247 visualizações
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
•
9K visualizações
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
Deep Learning JP
•
1.3K visualizações
【DL輪読会】Mastering Diverse Domains through World Models
Deep Learning JP
•
582 visualizações
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Kento Doi
•
2.5K visualizações
【DL輪読会】A Path Towards Autonomous Machine Intelligence
Deep Learning JP
•
13.2K visualizações
論文紹介 No-Reward Meta Learning (RL architecture勉強会)
Yusuke Nakata
•
1.5K visualizações
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
•
245 visualizações
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
•
6.3K visualizações
[DL輪読会]Understanding deep learning requires rethinking generalization
Deep Learning JP
•
3.9K visualizações
深層学習の数理
Taiji Suzuki
•
78.4K visualizações
Similar a Transformerを用いたAutoEncoderの設計と実験
(20)
[Cloud OnAir] Google Cloud Next '18 最新情報 2018年7月26日 放送
Google Cloud Platform - Japan
•
5K visualizações
Async deepdive before de:code
Kouji Matsui
•
24.1K visualizações
Visual Studioで始めるTypeScript開発入門
Narami Kiyokura
•
14.6K visualizações
音声認識技術の最新状況とあるべき未来
Akira Hatsune
•
1.3K visualizações
東京工業大学「ロボット技術・ロボットミドルウェア」
NoriakiAndo
•
546 visualizações
pgCafeMitaka20090723
Noriyuki Nonomura
•
582 visualizações
Fabric + Amazon EC2で快適サポート生活 #PyFes
Sho Shimauchi
•
2.7K visualizações
100mpusとopc brick ev3 ご紹介
Akira Hatsune
•
558 visualizações
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
infinite_loop
•
66.4K visualizações
Edge から Cloud, Beginner から Professional までサポートする Azure AI プラットフォーム
IoTビジネス共創ラボ
•
607 visualizações
TypeScript and Visual Studio Code
Akira Inoue
•
1.2K visualizações
はじめよう TypeScript - 入門から実践まで - 素の JavaScript とはさようなら!
Jun-ichi Sakamoto
•
15.8K visualizações
Japan Robot Week 2014けいはんなロボットフォーラム
Komei Sugiura
•
4.1K visualizações
明治大学理工学部 特別講義 AI on Azure
Daiyu Hatakeyama
•
966 visualizações
マルウェア分類に用いられる特徴量 Kaggle - Malware Classification Challenge勉強会
Takeshi Ishita
•
5.3K visualizações
An overview of query optimization in relational systems 論文紹介
Kumazaki Hiroki
•
974 visualizações
メディアコンテンツ向け記事検索DBとして使うElasticsearch
Yasuhiro Murata
•
1.9K visualizações
おとなのテキストマイニング
Munenori Sugimura
•
3.2K visualizações
Good Parts of PHP and the UNIX Philosophy
Yuya Takeyama
•
3.8K visualizações
PhpStormで始める快適なWebアプリケーション開発 #phpcon2013
晃 遠山
•
19.3K visualizações
Anúncio
Último
(20)
AI予約サービスのMLOps事例紹介
Takashi Suzuki
•
4 visualizações
☀️《UMKC毕业证仿真》
DFFFFG
•
2 visualizações
204-杨百翰大学.pdf
fdhrtf
•
2 visualizações
134-休斯敦大学.pdf
fdhrtf
•
2 visualizações
★可查可存档〖制作贝桑松大学文凭证书毕业证〗
tujjj
•
2 visualizações
★可查可存档〖制作波恩大学文凭证书毕业证〗
tujjj
•
9 visualizações
★可查可存档〖制作魁北克大学文凭证书毕业证〗
mmmm282537
•
2 visualizações
★可查可存档〖制作密德萨斯大学文凭证书毕业证〗
vgfg1
•
2 visualizações
★可查可存档〖制作卡尔顿大学文凭证书毕业证〗
mmmm282537
•
2 visualizações
143-南卫理公会大学.pdf
dsadasd17
•
3 visualizações
SPECIALIZED heavy racks.pdf
FernandoRivasCortes1
•
2 visualizações
APM.pptx
SatishKotwal
•
2 visualizações
☀️《Curtin毕业证仿真》
hjhgg1
•
2 visualizações
ChatGPTをもっと使いたい.pptx
TokioMiyaoka
•
325 visualizações
12莫纳什.pdf
dsadasd17
•
3 visualizações
★可查可存档〖制作乌尔姆大学文凭证书毕业证〗
tujjj
•
18 visualizações
☀️《UMB毕业证仿真》
hjhgg
•
2 visualizações
★可查可存档〖制作奥克兰商学院文凭证书毕业证〗
tujjj
•
2 visualizações
☀️《Ohio毕业证仿真》
DFFFFG
•
2 visualizações
办加拿大多伦多大学假文凭毕业证
JhhhfGffh
•
3 visualizações
Transformerを用いたAutoEncoderの設計と実験
Transformerを用いた AutoEncoderの設計と実験 発表者:myxy ML集会
誰? ● myxy(みきしぃ) ● 本業はプログラマ ●
機械学習は完全に趣味で勉強してる アバター作ったりもする アバターワールドの検索・表示システムとか作った
Transformerを用いた AutoEncoderの設計と実験 発表者:myxy ML集会
Transformer "Attention is All
You Need"より引用 ● 自然言語処理で活躍 ● 言語・音声等系列データの処理 ● パラメータが増えるほど強いらしい
Transformerを用いた AutoEncoderの設計と実験 発表者:myxy ML集会
AutoEncoder ● 入力次元より低い次元に圧縮してから 元のデータを復元する ● 入力と出力の誤差を最小化 ●
データに対して低次元の 特徴量が得られる 英語版wikipedia "AutoEncoder"より引用 (CC-BY-SA)https://en.wikipedia.org/wiki/Autoencoder#/ media/File:Autoencoder_structure.png
動機 通常のAutoEncoderは入出力次元数が固定されており 長さが変化する系列データの処理はできない Transformerを使って 系列データのAutoEncoderを作りたい
既存研究 "Masked Autoencoders Are
Scalable Vision Learners"より引用 AutoEncoderと銘打っているが やってることはマスクしたパッチの補間
出力次元数を下げる ● 系列長は減らない ● あまり次元を下げると 位置情報が保持できなくなる 次元数を減らすのではなく 系列長を減らせるだろうか? ナイーブな方法 Transformer
Encoder 系列長n × 次元数256 ・・・ ・・・ 系列長n × 次元数128
V K Q Transformerに使われる Query-Key-Value型のAttentionでは Queryに入力した系列と 同じ長さの系列が出力される 系列長n ・・・ 系列長n ・・・
V K Q Transformerに使われる Query-Key-Value型のAttentionでは Queryに入力した系列と 同じ長さの系列が出力される 系列長n ・・・ 系列長n ・・・ Key-Valueの方に入力すれば 系列長を圧縮できるのでは?
位置エンコーディング (潜在ベクトル用) ・・・ 潜在ベクトル系列 ・・・ Encoder (Transformer Decoder) 提案手法 Decoder (Transformer Decoder) 入力ベクトル系列 ・・・ 位置エンコーディング (入力ベクトル用) ・・・ + 位置エンコーディング (入力ベクトル用) ・・・ 出力ベクトル系列 ・・・ Key-Value Key-Value Query Query 同じ位置エンコーディ ングを使用 x
N x N 空間的な位置というより 潜在ベクトルを識別するIDに近い
実験 ● CIFAR-10の画像データ(32x32)を 4x4のパッチに分割(64個x48次元) ● Encoder,
Decoderはそれぞれ6層の TransformerDecoder ● 位置エンコーディングは正規分布で初期化して 学習可能な位置埋め込みとした ● 詳しくはコード見て https://gist.github.com/myxyy/0e06c430652b35cd a4d56aaf21eb7fa9
潜在ベクトルが16個の16次元ベクトルの場合 ● 左から入力画像、潜在ベクトル、出力画像 画像の位置埋め込み、潜在ベクトルの位置埋め込み ● 500epoch時点のvalidationのMSELossは0.00805
● 500epoch時点のvalidationのMSELossは0.00646 ● 16x16よりちょっと鮮明になった 潜在ベクトルが32個の16次元ベクトルの場合
● 500epoch時点のvalidationのMSELossは0.00480 ● 32x16よりも性能が良い 潜在ベクトルが16個の32次元ベクトルの場合
考察 ● なんで32x16より16x32の方が性能いいの? ○ Transformerの系列は並び替えで変化しない ○
16x16は256次元ベクトルより16!倍弱い ○ 系列長を倍にしても情報量が倍にならない ○ ベクトルの次元数を増やす方が効率が良い
今後の課題 ● 文字列等の本来やりたかった可変長系列の処理 ○ 画像をパッチ分割することで様々な解像度の 画像を処理可能? ●
潜在ベクトルから位置情報を分離したい ○ VAEのような正則化が必要?
Anúncio