Enviar pesquisa
Carregar
統計的ボイチェン研究事情
•
6 gostaram
•
2,149 visualizações
Shinnosuke Takamichi
Seguir
VRSionUP!6 「先端ボイチェン研究」 招待講演
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 13
Baixar agora
Baixar para ler offline
Recomendados
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
Shinnosuke Takamichi
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
Shinnosuke Takamichi
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
Shinnosuke Takamichi
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用
NU_I_TODALAB
WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響
NU_I_TODALAB
個人/グループサーベイ法(早稲田大学講演)
個人/グループサーベイ法(早稲田大学講演)
cvpaper. challenge
#FTMA15 第一回 鬼コース 全PDF
#FTMA15 第一回 鬼コース 全PDF
Yoichi Ochiai
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
Shinnosuke Takamichi
Recomendados
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
Shinnosuke Takamichi
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
Shinnosuke Takamichi
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
Shinnosuke Takamichi
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用
NU_I_TODALAB
WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響
NU_I_TODALAB
個人/グループサーベイ法(早稲田大学講演)
個人/グループサーベイ法(早稲田大学講演)
cvpaper. challenge
#FTMA15 第一回 鬼コース 全PDF
#FTMA15 第一回 鬼コース 全PDF
Yoichi Ochiai
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
Shinnosuke Takamichi
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
Hirokatsu Kataoka
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
Shinnosuke Takamichi
深層学習と音響信号処理
深層学習と音響信号処理
Yuma Koizumi
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
Shinnosuke Takamichi
Interspeech2022 参加報告
Interspeech2022 参加報告
Yuki Saito
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
YosukeKashiwagi1
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
Shinnosuke Takamichi
音声生成の基礎と音声学
音声生成の基礎と音声学
Akinori Ito
深層学習を利用した音声強調
深層学習を利用した音声強調
Yuma Koizumi
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
NU_I_TODALAB
Neural text-to-speech and voice conversion
Neural text-to-speech and voice conversion
Yuki Saito
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
Shinnosuke Takamichi
音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用
Yuma Koizumi
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
Naoya Takahashi
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
Daichi Kitamura
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
JunSuzuki21
異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例
NU_I_TODALAB
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
諒介 荒木
ICASSP 2019での音響信号処理分野の世界動向
ICASSP 2019での音響信号処理分野の世界動向
Yuma Koizumi
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
GREE VR Studio Lab
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料
Yasuhisa Kondo
Mais conteúdo relacionado
Mais procurados
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
Hirokatsu Kataoka
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
Shinnosuke Takamichi
深層学習と音響信号処理
深層学習と音響信号処理
Yuma Koizumi
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
Shinnosuke Takamichi
Interspeech2022 参加報告
Interspeech2022 参加報告
Yuki Saito
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
YosukeKashiwagi1
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
Shinnosuke Takamichi
音声生成の基礎と音声学
音声生成の基礎と音声学
Akinori Ito
深層学習を利用した音声強調
深層学習を利用した音声強調
Yuma Koizumi
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
NU_I_TODALAB
Neural text-to-speech and voice conversion
Neural text-to-speech and voice conversion
Yuki Saito
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
Shinnosuke Takamichi
音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用
Yuma Koizumi
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
Naoya Takahashi
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
Daichi Kitamura
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
JunSuzuki21
異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例
NU_I_TODALAB
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
諒介 荒木
ICASSP 2019での音響信号処理分野の世界動向
ICASSP 2019での音響信号処理分野の世界動向
Yuma Koizumi
Mais procurados
(20)
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
深層学習と音響信号処理
深層学習と音響信号処理
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
Interspeech2022 参加報告
Interspeech2022 参加報告
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
音声生成の基礎と音声学
音声生成の基礎と音声学
深層学習を利用した音声強調
深層学習を利用した音声強調
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
Neural text-to-speech and voice conversion
Neural text-to-speech and voice conversion
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
音響信号に対する異常音検知技術と応用
音響信号に対する異常音検知技術と応用
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
異常音検知に対する深層学習適用事例
異常音検知に対する深層学習適用事例
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
ICASSP 2019での音響信号処理分野の世界動向
ICASSP 2019での音響信号処理分野の世界動向
Semelhante a 統計的ボイチェン研究事情
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
GREE VR Studio Lab
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料
Yasuhisa Kondo
学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割
Takuya Nishimoto
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション
Akiko Orita
人間と機械と音のコミュニケーション
人間と機械と音のコミュニケーション
Akinori Ito
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
nico_ura
20110708 ウラ懇談会第一回会合議事内容
20110708 ウラ懇談会第一回会合議事内容
uracon
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
nico_ura
“ゲームの力”で教育・社会を変える試み
“ゲームの力”で教育・社会を変える試み
Yoshihiro Kishimoto
ビブリオバトルにおける コミュニティ形成のダイナミクス
ビブリオバトルにおける コミュニティ形成のダイナミクス
Tadahiro Taniguchi
検索力ってどうよ(PCカンファレンス2006分科会)
検索力ってどうよ(PCカンファレンス2006分科会)
Sunami Hokuto
音声コーパス設計と次世代音声研究に向けた提言
音声コーパス設計と次世代音声研究に向けた提言
Shinnosuke Takamichi
Semelhante a 統計的ボイチェン研究事情
(12)
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料
学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション
人間と機械と音のコミュニケーション
人間と機械と音のコミュニケーション
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
20110708 ウラ懇談会第一回会合議事内容
20110708 ウラ懇談会第一回会合議事内容
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
20110708 周波数オークションに関するウラ懇談会第一回会合議事内容
“ゲームの力”で教育・社会を変える試み
“ゲームの力”で教育・社会を変える試み
ビブリオバトルにおける コミュニティ形成のダイナミクス
ビブリオバトルにおける コミュニティ形成のダイナミクス
検索力ってどうよ(PCカンファレンス2006分科会)
検索力ってどうよ(PCカンファレンス2006分科会)
音声コーパス設計と次世代音声研究に向けた提言
音声コーパス設計と次世代音声研究に向けた提言
Mais de Shinnosuke Takamichi
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
Shinnosuke Takamichi
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
Shinnosuke Takamichi
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
Shinnosuke Takamichi
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Shinnosuke Takamichi
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
Shinnosuke Takamichi
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
Shinnosuke Takamichi
音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン
Shinnosuke Takamichi
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
Shinnosuke Takamichi
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus
Shinnosuke Takamichi
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
Shinnosuke Takamichi
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
Shinnosuke Takamichi
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
Shinnosuke Takamichi
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
Shinnosuke Takamichi
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
Shinnosuke Takamichi
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
Shinnosuke Takamichi
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
Shinnosuke Takamichi
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
Shinnosuke Takamichi
End-to-end 韻律推定に向けた subword lattice 構造を考慮した DNN 音響モデル学習
End-to-end 韻律推定に向けた subword lattice 構造を考慮した DNN 音響モデル学習
Shinnosuke Takamichi
外国人留学生日本語の音声合成における話者性を保持した韻律補正
外国人留学生日本語の音声合成における話者性を保持した韻律補正
Shinnosuke Takamichi
Generative moment matching net に基づく歌声のランダム変調ポストフィルタと double-tracking への応用
Generative moment matching net に基づく歌声のランダム変調ポストフィルタと double-tracking への応用
Shinnosuke Takamichi
Mais de Shinnosuke Takamichi
(20)
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
End-to-end 韻律推定に向けた subword lattice 構造を考慮した DNN 音響モデル学習
End-to-end 韻律推定に向けた subword lattice 構造を考慮した DNN 音響モデル学習
外国人留学生日本語の音声合成における話者性を保持した韻律補正
外国人留学生日本語の音声合成における話者性を保持した韻律補正
Generative moment matching net に基づく歌声のランダム変調ポストフィルタと double-tracking への応用
Generative moment matching net に基づく歌声のランダム変調ポストフィルタと double-tracking への応用
統計的ボイチェン研究事情
1.
07/16/2019©Shinnosuke Takamichi, The University
of Tokyo 統計的ボイチェン研究事情 高道 慎之介 @forthshinji (東京大学) #VRSionUp!6「先端ボイチェン研究」招待講演 本発表の一部 (p.4, 5) は総務省の委託「知覚モデルに基づくストレスフリーな リアルタイム広帯域音声変換の研究」を受けて実施したものです.
2.
統計的ボイチェン研究事情 平たく言えば「音声と機械学習 (ディープラーニングなど)を使って 構築するボイチェン」
3.
/13 私の研究グループの目標 3 音声変換 音声合成 全ての人間・計算機が 身体・文化・時間を超えて 音声でコミュニケーション できる社会を目指して HOYA NPSS
4.
/13 今日お話しする内容 4 特定の他者にリアルタイムでなりきるボイスチェンジャ 他人との「声のつながり」を見つけるボイスグラフ 「声の誤り」を学習・付与するボイスエフェクタ 次世代ボイスチェンジャに向けた我々の試み
5.
/13 リアルタイムボイスチェンジャー (話者変換) 5 https://www.youtube.com/watch?v=P9rGqoYnfCg [Arakawa19] 音声合成・変換コンペ (2015,
2016) で品質世界一になった技術と 森勢先生のWORLDを利用.普通の laptop PC で50msレイテンシで動作.
6.
/13 技術の中身 6 基本周波数 スペクトル包絡 非周期性指標 基本周波数 スペクトル包絡 非周期性指標 DNN (ディープ ニューラル ネットワーク) 単純な変換規則では,特定の他者への声変換は難しい.なので, 話者の声を事前収録して,その音声データから変換規則を自動学習
7.
/137 クラウドソーシングを用いた 話者間類似度の大規模主観スコアリング [Saito19] 人間の声の関係性を計算できないか? このアンケートを4,000人に対して実施
8.
/138 類似度スコアに基づく話者グラフを用いた 話者間類似度の可視化 F051 F146B F048 特定の話者に 類似した話者 多数の話者に 類似した話者F093 F127 [Saito19] このデータは 数カ月以内に公開予定 (ただし研究用データベース向け)
9.
/13 音声の特徴量から「声の関係」を当てる 9 基本周波数 包絡 非周期 基本周波数 包絡 非周期 基本周波数 包絡 非周期 [Saito19] 手元の音声データを使って,音声から 「声の関係性」を当てるDNNを作れば… 新しい声が入っても「声の 関係性」を自動で見つけられる! → 声のユニーク性調査も可能?
10.
/13 ニューラル・ダブル・トラッキング 10 [Tamaru19] NDT Random pitch modulation based
on deep generative models 深層生成モデルを用いて「人間の音声はこう間違う」を学習 (理論上は1秒レイテンシーくらいで動く)
11.
/13 原理 11 基本周波数 包絡 非周期 基本周波数 包絡 非周期 [Tamaru19] 人間の繰り返し歌唱データから,DNNは「声の間違い方」を事前学習 加工時には「自然な声の間違い方」をランダムで付与 正しい間違い方を付与
12.
/13 総務省SCOPE:知覚モデルに基づくストレス フリーなリアルタイム広帯域音声変換 12 通常の遠隔コミュニケーション リアルタイム音声変換を介した遠隔コミュニケーション 言語情報 (音韻など) パラ言語情報 (感情など) 非言語情報
(話者性など) 自己聴取音による情報確認 言語 パラ言語 非言語 言語 パラ言語 非言語 音 声 変 換 意図しない情報変換が行われる恐れ エラーを含む音声のフィードバックでユーザに負荷 https://sites.google.com/site/shinnosuketakamichi/research-topics/scope2019
13.
/13 今後のボイチェンに期待すること 現在の統計的ボイチェン研究 – 高品質化・高速化がメイン
これからのボイチェンに期待すること (我々が目指すこと) – ヒトとコトをどこまで分離できる? • 今は,人間の肉体と生成できる音声コンテンツが紐づいている • 聞き手の音声知覚モデリングが必要 – 話し手の人格をどこまで制御できる? • リアルタイムボイチェンは,自分で聴く自分の声を制御できる • 話し手の音声知覚モデリングが必要 – 音声コンテンツ制作をどう変えられる? • 「この研究は声優の仕事を奪うのでは」と言われるが個人的には 「奪うことはあり得ないが,声優の在り方が変わる」と考える. 13
Baixar agora