Início
Conheça mais
Enviar pesquisa
Carregar
Entrar
Cadastre-se
Anúncio
Check these out next
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
Semantic segmentation
Takuya Minagawa
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
【DL輪読会】DayDreamer: World Models for Physical Robot Learning
Deep Learning JP
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
Shota Imai
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
1
de
20
Top clipped slide
【DL輪読会】HexPlaneとK-Planes
17 de Feb de 2023
•
0 gostou
0 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
1,078 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Baixar agora
Baixar para ler offline
Denunciar
Tecnologia
2023/2/17 Deep Learning JP http://deeplearning.jp/seminar-2/
Deep Learning JP
Seguir
Deep Learning JP
Anúncio
Anúncio
Anúncio
Recomendados
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
3.7K visualizações
•
23 slides
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
Deep Learning JP
957 visualizações
•
12 slides
Deep Learningによる超解像の進歩
Hiroto Honda
28.9K visualizações
•
36 slides
ドメイン適応の原理と応用
Yoshitaka Ushiku
4.8K visualizações
•
50 slides
画像生成・生成モデル メタサーベイ
cvpaper. challenge
7.8K visualizações
•
118 slides
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
4.4K visualizações
•
33 slides
Mais conteúdo relacionado
Apresentações para você
(20)
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
•
85.4K visualizações
Semantic segmentation
Takuya Minagawa
•
106.7K visualizações
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
•
56.6K visualizações
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
•
3.2K visualizações
【DL輪読会】DayDreamer: World Models for Physical Robot Learning
Deep Learning JP
•
565 visualizações
強化学習エージェントの内発的動機付けによる探索とその応用(第4回 統計・機械学習若手シンポジウム 招待公演)
Shota Imai
•
1.7K visualizações
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
•
38.5K visualizações
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
•
19.6K visualizações
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
cvpaper. challenge
•
885 visualizações
3D CNNによる人物行動認識の動向
Kensho Hara
•
23.4K visualizações
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
•
2.7K visualizações
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
•
8K visualizações
[DL輪読会]画像を使ったSim2Realの現況
Deep Learning JP
•
2.1K visualizações
Lucas kanade法について
Hitoshi Nishimura
•
20K visualizações
SSII2019企画: 点群深層学習の研究動向
SSII
•
8K visualizações
【DL輪読会】Mastering Diverse Domains through World Models
Deep Learning JP
•
588 visualizações
全力解説!Transformer
Arithmer Inc.
•
7.5K visualizações
[DL輪読会]ICLR2020の分布外検知速報
Deep Learning JP
•
5.1K visualizações
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
•
71.7K visualizações
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
Yusuke Uchida
•
7.4K visualizações
Mais de Deep Learning JP
(20)
【DL輪読会】マルチモーダル 基盤モデル
Deep Learning JP
•
60 visualizações
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
Deep Learning JP
•
19 visualizações
【DL輪読会】HyperDiffusion: Generating Implicit Neural Fields withWeight-Space Dif...
Deep Learning JP
•
19 visualizações
【DL輪読会】大量API・ツールの扱いに特化したLLM
Deep Learning JP
•
270 visualizações
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
Deep Learning JP
•
93 visualizações
【DL輪読会】Poisoning Language Models During Instruction Tuning Instruction Tuning...
Deep Learning JP
•
159 visualizações
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
Deep Learning JP
•
101 visualizações
【DL輪読会】Flow Matching for Generative Modeling
Deep Learning JP
•
803 visualizações
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
•
1.4K visualizações
【DL輪読会】GPT-4Technical Report
Deep Learning JP
•
963 visualizações
【DL輪読会】Emergent World Representations: Exploring a Sequence ModelTrained on a...
Deep Learning JP
•
241 visualizações
【DL輪読会】Reward Design with Language Models
Deep Learning JP
•
627 visualizações
【DL輪読会】Foundation Models for Decision Making: Problems, Methods, and Opportun...
Deep Learning JP
•
292 visualizações
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
•
229 visualizações
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
•
390 visualizações
【DL輪読会】Hyena Hierarchy: Towards Larger Convolutional Language Models
Deep Learning JP
•
887 visualizações
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
1.1K visualizações
【DL輪読会】Segment Anything
Deep Learning JP
•
2K visualizações
【DL輪読会】Is Conditional Generative Modeling All You Need For Decision-Making?
Deep Learning JP
•
256 visualizações
【DL輪読会】Decoupling Human and Camera Motion from Videos in the Wild (CVPR2023)
Deep Learning JP
•
427 visualizações
Anúncio
Último
(20)
JSONEncoderで詰まった話
とん とんぼ
•
144 visualizações
統計学の攻略_正規分布ファミリーの全体像.pdf
akipii Oga
•
318 visualizações
開発環境向けEKSのコスト最適
ducphan87
•
13 visualizações
ChatGPT + LlamaIndex 0 .6 による チャットボット の実装
Takanari Tokuwa
•
73 visualizações
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
NTT DATA Technology & Innovation
•
204 visualizações
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
•
27 visualizações
mi-3. データサイエンス・AIの演習
kunihikokaneko1
•
4 visualizações
社内ソフトスキルを考える
infinite_loop
•
91 visualizações
MC-800DMT intrusion detector manual
Vedard Security Alarm System Store
•
3 visualizações
GitHub と Azure でアプリケーションとインフラストラクチャの守りを固めるDevSecOps
Kazumi IWANAGA
•
6 visualizações
生成AIのビルド方法 (ChatGPT)
Citynow Asia Inc
•
41 visualizações
Wandb LLM Webinar May 30 2023 (配布用).pdf
Yuya Yamamoto
•
141 visualizações
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
Rakuten Group, Inc.
•
40 visualizações
20230601_Visual_IoTLT_vol14_kitazaki_v1.pdf
Ayachika Kitazaki
•
73 visualizações
mi-1. 人工知能の概要
kunihikokaneko1
•
5 visualizações
ChatGPT触ってみた
infinite_loop
•
64 visualizações
DrupalをDockerで起動してみる
iPride Co., Ltd.
•
22 visualizações
GraalVMでのFlight Recorderを使ったパフォーマンス解析(JJUG CCC 2023 Spring)
NTT DATA Technology & Innovation
•
12 visualizações
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
314 visualizações
Transformerについて解説!!
Yosuke Horio
•
10 visualizações
【DL輪読会】HexPlaneとK-Planes
DEEP LEARNING JP [DL
Papers] 論文紹介: HexPlaneとK-Planes Ryosuke Ohashi, bestat Inc. http://deeplearning.jp/
書誌情報① 2 - arxivプレプリント (2023/1/23) -
matrix-vector分解を(3+1)Dに応用&改良 - 動画のRF化時間短縮
書誌情報② 3 - arxivプレプリント (2023/1/24) -
tri-plane表現を(3+1)Dに応用&改良 - 動画のRF化時間短縮
背景:場,信号 4 空間・時空間に広がる何らかの物理量のこと 場や信号は,空間Xから物理量の値域Yへの関数として書ける 平面上の磁場 https://en.wikipedia.org/wiki/Vector_field M: R^2 →
R^2 M(x, y) = (M_x, M_y)
背景:場,信号の例 5 RGB画像 I: R^2 →
R^3 I(u, v) = (I_R, I_G, I_B) 輝度場 (Radiance Field,以下RF) c: R^3 x S^2 → R^3 c(r, d) = (c_R, c_G, c_B) https://www.matthewtancik.com/nerf 謎のガスが各方向にいろんな色の光を発しているイメージ
背景:DyNeRF 6 “Neural 3D Video
Synthesis from Multi-view Video” T. Li et al. (CVPR2022) 動画のRF化に関する論文 綺麗に作れるが,最適化にとても時間がかかる
背景:パラメトリック関数 vs グリッド 7 場・信号の関数近似方法 ①パラメトリック関数 -
パラメーター数が少ない - 遅い - 扱いが難しい ②グリッド(ルックアップテーブル) - パラメーター数が多い - 高速 - 扱いが簡単 https://mathworld.wolfram.com/FourierSeries.html Fourier級数展開 vs 折れ線グラフ
8 静的シーンのRF化では,グリッドベース手法が主流化している DVGO, Plenoxels, EG3D,
Instant-NGP, TensoRF, ... → 動画のRF化もグリッドベースでやりたい!! 背景:グリッドベースでやりたい
問題:N^4 9 とはいえ,時空間のグリッド化はメモリ消費量が非現実的 - 空間方向を512分割(5mの範囲を1cm刻み) - 時間方向を512分割(60sec
* 10FPS) → 512^4 * 4byte = 256GB
解決方法:テンソル分解 10 HexPlaneやK-Planesでは,テンソル分解を使うアプローチが採用 されている 直観的には,高次元の量を低次元の量の積で分解表示する,というイメージ
K-Planes 11 ①動画の場合,XY, YZ, ZX,
XT, YT, ZT平面に特徴グリッドを設ける → 512分割の場合,6 * 512^2 * 4byte = 6MB ②(x, y, z, t)に対し,各平面に射影した点から特徴を拾ってきて要素 毎積をとり,MLPに流す
K-Planes:積をとるのが大事 12 各平面から拾ってきた特徴の和をとると,局在するシグナルの表現が難しい 積をとれば容易に表現可能
K-Planes:積をとるのが大事 13 特徴の積をとる方式だと,MLPを線形にしても高い性能がでる
K-Planes:実験結果 14 ←特定データセットでの値のため,全データセット平均ならもっと高いはず,らしい 短時間で良い感じに動画をRF化できている ↓マルチビュー動画 ↑旅行者が撮った時間・天気が違う多視点画像
HexPlane 15 最終的に提案しているアーキテクチャはK-Planesと本質的には同じ TensoRFに基づき,matrix-vector分解を出発点にいろいろ考察・比 較実験している
HexPlane:matrix-vector分解 16 matrix-vector分解 XY平面上の特徴とZ軸上の特徴の積 YZ … X
… ZX … Y … を使ってXYZ空間上の特徴をつくる “TensoRF: Tensorial Radiance Fields” A. Chen et al. https://arxiv.org/abs/2203.09517
HexPlane:アーキテクチャ 17 交差が0次元になる平面ペアでのみ積をとっている
HexPlane:やはり積をとるのが大事 18 Fusion-Two(左図の+のとこ)で積をとると,平面 の交差が1次元になり局在化しきらないので,Fusion- Oneで積をとるより弱い?
HexPlane:実験結果 19 短時間で良い感じに動画をRF化できている
まとめ・雑感 20 まとめ - テンソル分解することで動画のときでもグリッドベース手法が使える - 現実的な時間でいい感じに動画をRF化できて嬉しい 雑感 -
積をとるとシグナルを局在化しやすくて良い,という気付きはパラメトリック関数を使うとき にも有用そう - ハッシュグリッドを使う場合に,2Dハッシュグリッドに分解したほうがコリジョンが緩和され ないか? - ほぼ同じタイミングで根本的に同じアイデアの論文が出てたのが面白かった
Notas do Editor
Beyond Reward Based End-to-End RL: Representation Learning and Dataset Optimization Perspective
Anúncio