SlideShare uma empresa Scribd logo
1 de 71
Baixar para ler offline
「進化する⾳声翻訳機」
VoiceWorld Z Meetup vol.5 多言語対応システム
2019/7/8
音声翻訳機YouTuber なかちょん (中畑隆拓)
http://bit.ly/nakachon
www.youtube.com/nakachon
チャンネル登録お願いします︕
本当はIoT・設備制御系のYouTuber
YouTubeチャンネル視聴回数推移
IoT系に⽐べて
⾳声翻訳機の動画の⽅が
視聴回数が稼げる︕
⾳声翻訳機を購⼊してコンテンツ作成
本⽇のお話
「進化する⾳声翻訳機」
⾳声翻訳機1.0
https://www.indiegogo.com/projects/travis-i-speak-80-languages-so-can-you#/
⾳声翻訳機1.0
Travis Pocketalk ili
オンライン オフライン
オフライン型の翻訳機
ili
オフライン
• 一方向
• 早い
• 旅行に特化!
翻訳例) これは辛いですか?
>> Is this spicy?
オンライン型 >> Is this painful?
オフライン型の翻訳機
ili
オフライン
音声からテキストに変換
テキストのキーワードを抽出
該当する回答を発音
*あくまでも個人の推測です
AIスピーカーのアプリに近い?
オンライン型の翻訳機
Pocketalk
オンライン
• 双方向
• 言語数が多い
• 長い文章に対応
オンライン型の翻訳機
Pocketalk
オンライン
音声からテキストに変換
テキストをAIが解釈
テキストを音声に変換
テキストを翻訳したテキストに変換
*あくまでも個人の推測です
音声翻訳
エンジン
音声翻訳エンジン
IBM Watson
音声翻訳エンジンは、言語の得意不得意がある
多言語音声翻訳アプリ VoiceTraについて
The First Asian Network-Based Speech-to-Speech
Translation System by the A-STAR Consortium
https://www.youtube.com/watch?v=H1GjJFhuWLU
2010年4月
https://gcp.nict.go.jp/news/products_and_services_GCP.pdf
音声翻訳エンジン
IBM Watson
言語ごとの音声翻訳エンジンの組み合わせが重要
https://youtu.be/ANwO7lUbEJE
⾳声翻訳機1.0
オンライン vs オフライン
⾳声翻訳機2.0
https://www.makuake.com/project/ezcommu/
WiFiルーター機能
32カ国語(現在は48カ国)
音声言語自動判断
オフライン翻訳エンジン + 接客用
オフライン翻訳エンジン
音声からテキストに変換
テキストをAIが解釈
テキストを音声に変換
テキストを翻訳したテキストに変換
*あくまでも個人の推測です
音声翻訳
エンジン
ili PROはインバウンドビジネスをターゲット
https://www.indiegogo.com/projects/travis-touch-i-speak-105-languages-so-can-you--2#/
WiFiルーター機能
100言語以上
ワイヤレス給電
Pocketalk から 新型Pocketalk Wは
使い勝手が大幅に良くなった!
PocketalkW
Pocketalk W
オンライン
音声からテキストに変換
テキストをAIが解釈
テキストを音声に変換
テキストを翻訳したテキストに変換
*あくまでも個人の推測です
音声翻訳
エンジン
音声合成
ソフト
RECAIUS 音声合成ミドルウェア ToSpeak™
https://www.toshiba-sol.co.jp/pro/recaius/lineup/tospeak.html
⾳声翻訳機2.0
多様性
https://youtu.be/sKDFzC4WAls
⾳声翻訳機3.0
写真を翻訳 (Google翻訳)
機能全部盛り
• WiFiのみ対応(SIM非対応)
• オンライン28言語
• オフライン3言語(日・英・中)
• カメラ翻訳
• WiFiのみ対応(SIM非対応)
• オンライン28言語
• オフライン3言語(日・英・中)
• カメラ翻訳
機能絞り込み
⾳声翻訳機3.0
KAZUNA eTalk5
機能全部盛り
arrows hello
機能絞り込み
2018年9月 なかちょんチャンネルの視聴者属性
⾳声翻訳機3.0
KAZUNA eTalk5
機能全部盛り
arrows hello
機能絞り込み
⾳声翻訳機3.0
ユーザー特定
⾳声翻訳機
現在のバージョンは
3.0 です︕
(あくまでも俺基準)
https://www.bcnretail.com/market/detail/20190704_127562.html
https://response.jp/article/2019/03/29/320734.html
⾳声翻訳機の進化
1.0
オンライン・オフライン
3.0
ユーザー特定
2.0
多様性
⾳声翻訳機YouTuberが
考える
次の⾳声翻訳機は︖
小型のGPUを積んだエッジ処理型翻訳機
音声翻訳エンジン
IBM Watson
この数年で大量のデータが集まったはず
音声翻訳機 今後の予想
学習データの精査&コンパクト化
GPUをつかったエッジ端末での高速処理
⾳声翻訳機4.0
GPU搭載
さらにその先
音声翻訳機 今後の予想
学習データの精査&コンパクト化
GPUをつかったエッジ端末での高速処理
スピードアップ
(リアルタイムへと近づく)
オフライン機能の大幅な向上
視覚データ(映像)の
機械学習による物体認識データの活用
5G
まとめ
今は直接関係ない新しい技術が、
次々と音声翻訳機に取り込まれて、
さらに便利なものになるでしょう!
http://bit.ly/nakachon
www.youtube.com/nakachon
チャンネル登録お願いします︕
ソフトウェアのマニュアル動画作成してます
1.シナリオの作成
2.撮影
3.編集
4. 出演
の全てをお任せいただけます。
「No.6 ゼロから始めるJetson nano / VisionWorks
Tracking 多摩センターの動画で実験」
https://youtu.be/WwzSj9DCAac → スマートライトへご連絡を!
https://smartlight.jp/

Mais conteúdo relacionado

Mais de Takahiro Nakahata

Mais de Takahiro Nakahata (20)

勉強会動画配信方法とYouTubeチャンネル 運営について語るMeetUp
勉強会動画配信方法とYouTubeチャンネル運営について語るMeetUp勉強会動画配信方法とYouTubeチャンネル運営について語るMeetUp
勉強会動画配信方法とYouTubeチャンネル 運営について語るMeetUp
 
SWEETS with DALI勉強会
SWEETS with DALI勉強会SWEETS with DALI勉強会
SWEETS with DALI勉強会
 
KNXによる映像連動のDALI照明制御とKNXのビジネスについて
KNXによる映像連動のDALI照明制御とKNXのビジネスについてKNXによる映像連動のDALI照明制御とKNXのビジネスについて
KNXによる映像連動のDALI照明制御とKNXのビジネスについて
 
今ある予算で考えます!AI-IoTショールームのススメ!
今ある予算で考えます!AI-IoTショールームのススメ!今ある予算で考えます!AI-IoTショールームのススメ!
今ある予算で考えます!AI-IoTショールームのススメ!
 
アップリンク吉祥寺 KNXによる映像連動のDALI照明制御
アップリンク吉祥寺KNXによる映像連動のDALI照明制御アップリンク吉祥寺KNXによる映像連動のDALI照明制御
アップリンク吉祥寺 KNXによる映像連動のDALI照明制御
 
第3回Control(制御)IoTLTオープニング資料
第3回Control(制御)IoTLTオープニング資料第3回Control(制御)IoTLTオープニング資料
第3回Control(制御)IoTLTオープニング資料
 
Instruction DALI IoT Kit
Instruction DALI IoT Kit Instruction DALI IoT Kit
Instruction DALI IoT Kit
 
IBM CloudとWatsonとFirebaseとNode-REDとKNXを使ってガチな設備制御をする方法
IBM CloudとWatsonとFirebaseとNode-REDとKNXを使ってガチな設備制御をする方法IBM CloudとWatsonとFirebaseとNode-REDとKNXを使ってガチな設備制御をする方法
IBM CloudとWatsonとFirebaseとNode-REDとKNXを使ってガチな設備制御をする方法
 
IoT皇居ラン
IoT皇居ランIoT皇居ラン
IoT皇居ラン
 
第2回ControlIoTLTについて
第2回ControlIoTLTについて第2回ControlIoTLTについて
第2回ControlIoTLTについて
 
保守的な設備制御業界の人間だってクラウドサービスを使いたい!
保守的な設備制御業界の人間だってクラウドサービスを使いたい!保守的な設備制御業界の人間だってクラウドサービスを使いたい!
保守的な設備制御業界の人間だってクラウドサービスを使いたい!
 
オープンプロトコル(KNX/DALI)を利用した照明制御システムの紹介
オープンプロトコル(KNX/DALI)を利用した照明制御システムの紹介オープンプロトコル(KNX/DALI)を利用した照明制御システムの紹介
オープンプロトコル(KNX/DALI)を利用した照明制御システムの紹介
 
IoTLT放送部の紹介
IoTLT放送部の紹介IoTLT放送部の紹介
IoTLT放送部の紹介
 
KNXと機械学習・拡張現実・ロボットとつなげることで見える世界
KNXと機械学習・拡張現実・ロボットとつなげることで見える世界KNXと機械学習・拡張現実・ロボットとつなげることで見える世界
KNXと機械学習・拡張現実・ロボットとつなげることで見える世界
 
僕はIoT・設備制御系YouTuber
僕はIoT・設備制御系YouTuber僕はIoT・設備制御系YouTuber
僕はIoT・設備制御系YouTuber
 
第2回オープン設備制御研究会「さわって覚えるDALI制御」
第2回オープン設備制御研究会「さわって覚えるDALI制御」第2回オープン設備制御研究会「さわって覚えるDALI制御」
第2回オープン設備制御研究会「さわって覚えるDALI制御」
 
あかりサロン26「Light Design Control・2018欧州照明展示会最新レポート」
あかりサロン26「Light Design Control・2018欧州照明展示会最新レポート」あかりサロン26「Light Design Control・2018欧州照明展示会最新レポート」
あかりサロン26「Light Design Control・2018欧州照明展示会最新レポート」
 
Node-RED対応 ローコストDALIゲートウェイ
Node-RED対応ローコストDALIゲートウェイNode-RED対応ローコストDALIゲートウェイ
Node-RED対応 ローコストDALIゲートウェイ
 
看板業界におけるIoTと 「DALI」による照明制御とは?
看板業界におけるIoTと「DALI」による照明制御とは?看板業界におけるIoTと「DALI」による照明制御とは?
看板業界におけるIoTと 「DALI」による照明制御とは?
 
DALI-APIによる照明制御 国内初納入実績の紹介
DALI-APIによる照明制御 国内初納入実績の紹介DALI-APIによる照明制御 国内初納入実績の紹介
DALI-APIによる照明制御 国内初納入実績の紹介
 

Último

Último (12)

知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

進化する音声翻訳機