SlideShare uma empresa Scribd logo
1 de 30
AnnoTone: 
高周波音の映像収録時 
埋め込みによる編集支援 
鈴木良平 
坂本大介 
五十嵐健夫 
東京大学大学院情報理工学系研究科 
1
高性能カメラの普及映像共有文化の発達 
映像制作の大衆化 
さまざまな人々が、さまざまな目的で 
映像コンテンツを作っている 
2
問題 
魅力的な映像の編集は依然として難しい 
なぜか? 
3 
1. オーサリングソフトの習熟コストの高さ 
2. 映像の文脈的内容を反映した編集は手間が掛かる 
…エフェクト追加、カット、キャプションなど 
少しでも自動化できないか?
本研究の目的 
■ ビデオ撮影時に映像に意味情報を注釈し 
■ 注釈情報を用いて映像編集を支援する 
ワークフローと基礎技術の提案 
(対象:実写映像) 
4
AnnoToneの基本アイデア 
■ 注釈情報を不可聴な高周波音に変調 
■ 撮影中、カメラのマイクから重畳録音 
利点 
• ほぼあらゆるビデオカメラで利用できる 
• 映像データそのものに情報を格納できる 
• 不要時には簡単なフィルタ処理で除去できる 
5
Workflow 
AnnoToneを用いた 
映像編集のワークフロー 
6
1. 機材のセットアップ 
■ ビデオカメラにスマートフォンを固定 
■ スマートフォン上でAnnoToneアプリを起動 
スマートフォンの取り付けアプリの起動 
7
2. 映像の撮影 
■ 撮影中、スマートフォンがユーザー入力や 
センサデータを取得、ビデオカメラに吹き込む 
ユーザー入力 
センサデータ 
撮影シーン 
音声透かし信号 
8
注釈済み映像の編集 
■ 注釈付き音声から注釈情報を抽出、編集に利用 
■ 編集完了後、透かし除去器により注釈シグナルを除去 
9
Applications 
AnnoToneの利用例 
10
撮影時映像編集 
• 映像撮影中に演技の良し悪しのヒントを記録 
• 成功した部分だけを自動的に抽出し、結合 
収録時の様子 
Good! Bad! Good! 
成功失敗成功 
成功成功 
自動結合結果 
(時間) 
11
位置情報を用いた映像編集 
• 移動撮影中のカメラのGPS座標系列を編集に利用 
地図上のスケッチによる 
対応映像の切り出し 
地図画像の重畳 
12
グラフィックの自動合成 
• チェス試合撮影時に棋譜をタッチパネルで記録 
• 棋譜から試合状況のグラフィックを自動合成 
棋譜記録用UI グラフィックが合成された映像13
AfterEffectsとの統合 
• AnnoToneプラグインが注釈情報を抽出 
• エフェクトやアニメーションの生成に利用可能 
⇒ 既存の映像制作ノウハウの有効活用 
14
Related work 
関連研究 
15
ContextCam 
[Patel & Abowd, 2004] 
■ 撮影時に位置・場面等の注釈を記録し、映像管理に活用 
■ 注釈情報は映像の各フレームに画像透かしとして埋込み 
既存のビデオカメラと組み合わせることは出来ない 
16
Cryptone 
[Hirabayashi & Shimizu, 2012] 
■ 高周波音を用いた、ライブ会場でのインタラクション 
■ ラウドスピーカーと観客手持ちスマートフォンとの連携 
本研究では編集支援のために同様の音声透かし技術を利用 
17 
01001 
11010
Methods 
注釈埋め込みの手法 
18
高可聴域を用いた音声透かし 
 音声透かし(Bender et al., 1996) 
• 人間には分からない形で音声信号に情報を埋め込む 
• 多くの手法はオフラインな埋め込み 
 高可聴域への情報コーディング 
Frequency (Hz) 
22k 
20k 
18k 
20 
高可聴域 
(ほぼ不可聴) 
情報埋め込み可能 
+信号除去が容易 
19 
音声データ 
記録域 
ヒト 
可聴域
DTMFベースの埋め込みプロトコル 
 Dual-Tone Multi-Frequency (DTMF) 
• 7周波数のうち2正弦波の重ねあわせで4bitを表現 
 USC [Hirabayashi&Shimizu, 2012] を拡張 
• 可変長のパケットを表現するプロトコルを開発 
• シグナルあたり10msで、400bpsのグロスレート 
音声透かし信号のスペクトログラム20
Evaluations 
性能評価 
21
音声透かしの信頼性 
■ 埋め込んだ音声透かしの抽出成功率 
– 様々な音響条件(静音・街中・音楽再生)で試験 
– いずれの条件でも95%以上の成功率を検証 
■ 音声圧縮に対する透かしの保存率 
– Ogg Vorbis, AC-3, AACでは中音質以上で損失なし 
– MP3では高音質でも半数以上損失(∵コーデック特性) 
※ デコード速度(Java実装) 
– 約11倍速(2GHz Intel Core i7, 8GB RAM) 
22
音声透かしの不可聴性 
■ 注釈済み音源からの検知が可能か実験(6人) 
• 透かしは完全に不可聴ではない(個人差・年齢依存) 
• 透かし除去器の適用後はほぼ完全に不可聴となった 
100 
80 
60 
40 
20 
0 
silent public rock electronic 
Noticed Watermark Rate (%) 
Before Erasure 
After Erasure 
23
Quiz 1 
Q. どちらが透かし入り? 
24 
A B
Quiz 2 
Q. どちらが透かし(フィルタ済み)入り? 
25 
A B
Conclusions 
まとめ 
26
研究の目的 
• 映像編集を支援するための注釈手法の開発 
• 注釈付ビデオを編集するワークフローの提案 
アプローチ 
• 注釈情報を音声透かし信号として重畳録音 
• カメラに取り付けたスマートフォンからの吹込み 
• 編集ソフト用ライブラリやAEプラグインの開発 
27
利点 
• 特殊な機材が不要 
• ファイル形式に非依存 
• 映像との同期性に優れる 
⇒ 映像制作プロセスへの導入が容易 
制約 
• 目的ごとのアプリ開発必要性(AnnoToneはToolkit) 
• 透かし除去時の音質低下 
28
29
注)スマートフォン記録に対する比較 
※スマホ撮影時には直接メタデータを書き出せる 
– e.g., Adobe XMP 
• ビデオカメラ自体の性能差 
– 画質、機能面など 
• 外部ファイルとの対応付けが不要 
– 編集ソフトを選ばない 
– 切り出し処理などで時間対応が崩れない 
30

Mais conteúdo relacionado

Semelhante a AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援

複数話者WaveNetボコーダに関する調査
複数話者WaveNetボコーダに関する調査複数話者WaveNetボコーダに関する調査
複数話者WaveNetボコーダに関する調査Tomoki Hayashi
 
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVC
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVCMy MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVC
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVCOsaka University
 
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告Shinnosuke Takamichi
 
インターネット上の多目的な 音声伝送システムに関する研究
インターネット上の多目的な音声伝送システムに関する研究インターネット上の多目的な音声伝送システムに関する研究
インターネット上の多目的な 音声伝送システムに関する研究Takashi Kishida
 
Ustreamで広報力UP講座資料
Ustreamで広報力UP講座資料Ustreamで広報力UP講座資料
Ustreamで広報力UP講座資料Takeo Noda
 
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術実環境音響信号処理における収音技術
実環境音響信号処理における収音技術Yuma Koizumi
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例Yahoo!デベロッパーネットワーク
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムKomei Sugiura
 
インターネット上の高品質な 遠隔コラボレーションに関する研究
インターネット上の高品質な遠隔コラボレーションに関する研究インターネット上の高品質な遠隔コラボレーションに関する研究
インターネット上の高品質な 遠隔コラボレーションに関する研究Takashi Kishida
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略NVIDIA Japan
 
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術NU_I_TODALAB
 
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...cvpaper. challenge
 
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>デジタル・ナレッジ はが弘明
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告Yuki Saito
 
なぜ標準化技術は使われないか
なぜ標準化技術は使われないかなぜ標準化技術は使われないか
なぜ標準化技術は使われないかguest797b90
 
なぜ標準化技術は使われないか
なぜ標準化技術は使われないかなぜ標準化技術は使われないか
なぜ標準化技術は使われないかTakuya Nishimoto
 
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning   画像×言語の大規模基盤モ...【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning   画像×言語の大規模基盤モ...
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...Deep Learning JP
 
音情報処理における特徴表現
音情報処理における特徴表現音情報処理における特徴表現
音情報処理における特徴表現NU_I_TODALAB
 

Semelhante a AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援 (20)

複数話者WaveNetボコーダに関する調査
複数話者WaveNetボコーダに関する調査複数話者WaveNetボコーダに関する調査
複数話者WaveNetボコーダに関する調査
 
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVC
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVCMy MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVC
My MPEG life: MPEG-2, MPEG-4, H264/AVC and H.265/HEVC
 
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
 
インターネット上の多目的な 音声伝送システムに関する研究
インターネット上の多目的な音声伝送システムに関する研究インターネット上の多目的な音声伝送システムに関する研究
インターネット上の多目的な 音声伝送システムに関する研究
 
Ustreamで広報力UP講座資料
Ustreamで広報力UP講座資料Ustreamで広報力UP講座資料
Ustreamで広報力UP講座資料
 
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術実環境音響信号処理における収音技術
実環境音響信号処理における収音技術
 
Kameoka2016 miru08
Kameoka2016 miru08Kameoka2016 miru08
Kameoka2016 miru08
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラム
 
インターネット上の高品質な 遠隔コラボレーションに関する研究
インターネット上の高品質な遠隔コラボレーションに関する研究インターネット上の高品質な遠隔コラボレーションに関する研究
インターネット上の高品質な 遠隔コラボレーションに関する研究
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
 
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...
【ECCV 2018】Audio-Visual Scene Analysis with Self-Supervised Multisensory Feat...
 
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>
小松★企業内研修における動画教材活用例★ラボイベント<学習スタイルコーディネート>
 
大規模発話ログデータを活用した音声対話処理
大規模発話ログデータを活用した音声対話処理大規模発話ログデータを活用した音声対話処理
大規模発話ログデータを活用した音声対話処理
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告
 
なぜ標準化技術は使われないか
なぜ標準化技術は使われないかなぜ標準化技術は使われないか
なぜ標準化技術は使われないか
 
なぜ標準化技術は使われないか
なぜ標準化技術は使われないかなぜ標準化技術は使われないか
なぜ標準化技術は使われないか
 
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning   画像×言語の大規模基盤モ...【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning   画像×言語の大規模基盤モ...
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
 
音情報処理における特徴表現
音情報処理における特徴表現音情報処理における特徴表現
音情報処理における特徴表現
 

Mais de Ryohei Suzuki

Transformer based approaches for visual representation learning
Transformer based approaches for visual representation learningTransformer based approaches for visual representation learning
Transformer based approaches for visual representation learningRyohei Suzuki
 
Paper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsPaper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsRyohei Suzuki
 
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Ryohei Suzuki
 
Basic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresBasic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresRyohei Suzuki
 
Disentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsDisentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsRyohei Suzuki
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"Ryohei Suzuki
 
Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Ryohei Suzuki
 
等号と不等号の物理学
等号と不等号の物理学等号と不等号の物理学
等号と不等号の物理学Ryohei Suzuki
 
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...Ryohei Suzuki
 
コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?Ryohei Suzuki
 
身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線Ryohei Suzuki
 
Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Ryohei Suzuki
 
Collaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdCollaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdRyohei Suzuki
 
アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―Ryohei Suzuki
 
立体音響とインタラクション
立体音響とインタラクション立体音響とインタラクション
立体音響とインタラクションRyohei Suzuki
 
SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionRyohei Suzuki
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User InterfacesRyohei Suzuki
 
Brief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesBrief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesRyohei Suzuki
 
Generalization of the Concept of Pattern Language
Generalization of the Concept of Pattern LanguageGeneralization of the Concept of Pattern Language
Generalization of the Concept of Pattern LanguageRyohei Suzuki
 
iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"Ryohei Suzuki
 

Mais de Ryohei Suzuki (20)

Transformer based approaches for visual representation learning
Transformer based approaches for visual representation learningTransformer based approaches for visual representation learning
Transformer based approaches for visual representation learning
 
Paper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsPaper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problems
 
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
 
Basic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresBasic Concepts of Entanglement Measures
Basic Concepts of Entanglement Measures
 
Disentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsDisentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative Models
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
 
Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"
 
等号と不等号の物理学
等号と不等号の物理学等号と不等号の物理学
等号と不等号の物理学
 
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
Wolf et al. "Graph abstraction reconciles clustering with trajectory inferen...
 
コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?
 
身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線
 
Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向
 
Collaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdCollaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the Crowd
 
アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―
 
立体音響とインタラクション
立体音響とインタラクション立体音響とインタラクション
立体音響とインタラクション
 
SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" Session
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User Interfaces
 
Brief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesBrief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial Interfaces
 
Generalization of the Concept of Pattern Language
Generalization of the Concept of Pattern LanguageGeneralization of the Concept of Pattern Language
Generalization of the Concept of Pattern Language
 
iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"
 

Último

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Último (9)

NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援

Notas do Editor

  1. Situation: ビデオ撮影やコンテンツ制作の普及
  2. 何度もプレビューする必要があったり、映像をよく
  3. カメラにスマートフォンを固定する AnnoTone用のアプリを起動する
  4. 3. 映像を撮影する 4. 撮影中、スマートフォンを操作したり、センサーを使って注釈情報を取得する 5. スマートフォンのスピーカーから注釈情報を変調した不可聴音が発生、 ビデオカメラのマイクから映像データ中に情報が埋め込まれる
  5. (ワークフローの全体図) 今回は全体的なワークフローおよび、基本技術を提案している スマホアプリ・編集アプリはライブラリを提供 従来のワークフローに組み込んで、すぐに使える ごちゃごちゃしていてわかりづらい ワークフローの順を追ってアニメーションにする 中央にわくをつける
  6. ビデオを流す(またはデモ) ビデオ講義の撮影など、何度も撮り直しテイクを管理する手間を省く ----- 会議メモ (2014/11/25 15:23) ----- このデモをやりたい
  7. アニメーション ->説明図
  8. 説明が長すぎる ひとことですませる
  9. 図が分からない ラウドスピーカーを使うことをちゃんと説明する、頭を入れる(絵を描く)
  10. 箱は横幅に意味があるように見えて不適切
  11. 100%という表現は誤解を招く 下側の%表記をやめる
  12. A: default B: watermarked
  13. 制約 ・目的ごとにアプリケーションを作らなければならないこと 発表後にその場で聞こえるか試せるように(デモはできるように) ----- 会議メモ (2014/11/25 15:23) ----- デモ