SlideShare uma empresa Scribd logo
1 de 16
Baixar para ler offline
Unsupervised Multilingual Word Embeddings
Xilun Chen, Claire Cardie
EMNLP 2018
紹介者:本間広樹
要約
• 多言語単語埋め込み(MWEs)は複数(3つ以上)の言語から
単一の分散ベクトル空間内に単語を表すもの
• 教師なしMWE(UMWE)は言語横断的な教師無しでMWEを
得る
• しかし従来のUMWEは2言語単語埋め込み(UBWEs)に依存
• この欠点に対応するため、全ての言語対の間の関係を直接
利用する、MWEを学習するための完全に教師なしのフレー
ムワークを提案
• 多言語単語翻訳と言語横断単語類似性において性能向上
要約
• 多言語単語埋め込み(MWEs)は複数(3つ以上)の言語から
単一の分散ベクトル空間内に単語を表すもの
• 教師なしMWE(UMWE)は言語横断的な教師無しでMWEを
得る
• しかし従来のUMWEは2言語単語埋め込み(UBWEs)に依存
• この欠点に対応するため、全ての言語対の間の関係を直接
利用する、MWEを学習するための完全に教師なしのフレー
ムワークを提案
• 多言語単語翻訳と言語横断単語類似性において性能向上
従来の教師ありに比べて大きな利点
低リソース言語に新しい可能性!
要約
• 多言語単語埋め込み(MWEs)は複数(3つ以上)の言語から
単一の分散ベクトル空間内に単語を表すもの
• 教師なしMWE(UMWE)は言語横断的な教師無しでMWEを
得る
• しかし従来のUMWEは2言語単語埋め込み(UBWEs)に依存
• この欠点に対応するため、全ての言語対の間の関係を直接
利用する、MWEを学習するための完全に教師なしのフレー
ムワークを提案
• 多言語単語翻訳と言語横断単語類似性において性能向上
問題点
これだと多くの言語に存在する相互依存性
を活用することができていない!
要約
• 多言語単語埋め込み(MWEs)は複数(3つ以上)の言語から
単一の分散ベクトル空間内に単語を表すもの
• 教師なしMWE(UMWE)は言語横断的な教師無しでMWEを
得る
• しかし従来のUMWEは2言語単語埋め込み(UBWEs)に依存
• この欠点に対応するため、全ての言語対の間の関係を直接
利用する、MWEを学習するための完全に教師なしのフレー
ムワークを提案
• 多言語単語翻訳と言語横断単語類似性において性能向上
しかも言語横断リソースで学習された
教師ありのアプローチに勝った!
はじめに
単語分散表現 Supervised Unsupervised
Bilingual
Mikolov ら(2013)
Zou ら(2013)
︙
Zhang ら(2017)
Conneau ら(2017)
Artetxe ら(2017; 2018)
Multilingual
Ammar ら(2016)
Duong ら(2017)
この研究!
モデル
―――――――――― ゴール ――――――――――
言語横断の 教師無し で 𝑵言語の多言語埋め込み を得る
――――――――――――――――――――――――――――――
ℒ : 言語集合, ℒ = 𝑁
𝑙 ∈ ℒ : 各言語,語彙 𝒱𝑙
ℰ𝑙 : 𝑑 次元の単言語単語埋め込み,サイズ 𝒱𝑙 × 𝑑
ℰ ⊢ 𝒮 : ℰ が 単語埋め込み空間 𝒮 に含まれる
ℳ𝑙 : 各言語 𝑙 に対するエンコーダ(𝒯: ℳ𝑙(ℰ𝑙) ⊢ 𝒯)
ℳ𝑙
−1
: 各言語 𝑙 に対するデコーダ(𝒯から𝒮𝑙に戻す)
モデル
ℳ𝑙 を直交行列にする
ℳ𝑙
−1
= ℳ𝑙
T
埋め込みベクトルをベクトルと行列の掛け算で算出可能
ターゲット空間に特定の言語の埋め込み空間にする
学習する写像が 𝑁 − 1 個ですむ
Multilingual Adversarial Training と Multilingual Pseudo-
Supervised Refinement の2つのコンポーネントを提案
Multilingual Adversarial Training(MAT)
Multilingual Pseudo-Supervised Refinement(MPSR)
MATから得られた
埋め込みを反復
的な手法で改善
はℳ𝑖ℰ𝑖とℳ𝑗ℰ𝑗の
間の頻度の高い
15kの単語間の最
近隣から構築
直交化は↓
𝛽 = 0.001
Cross-Lingual Similarity Scaling (CSLS)
一般的なユークリッド距離とかcos類似度だとハブが出現する
問題に当たる
→ 解決策の1つのCSLSという代替の距離メトリックを使う
計算方法は➢
NY(x)はYの要素yのベクトル空間内のxのn最近傍の集合
Unsupervised Multilingual Validation
• 教師無しでモデル選択を行うには、検証データを使えないと
き、バイリンガルデータに依存しない代理の検証基準が必要
• 𝑝𝑖𝑗 : probability simplex ここでは 𝑝𝑖𝑗 =
1
𝑁 𝑁−1
・mean_csls(): 最も高頻度の10kの単語とそれらの翻訳の
平均CSLS類似度(Lampleら、2018)
実験
2つのベンチマークタスクで検証
Wikipediaコーパスで事前学習した300次元の fastText (単一言語)を使用
Multilingual Word Translation
SemEval2017 Cross-Lingual Word Similarity
実験 - Multilingual Word Translation
6つの言語
train:5k, test:1.5k
Pivot:特定の単語
(英語)を経由した
BWEの組合わせ
Direct:言語対ご
とのBWE
実験 - Cross-Lingual Word Similarity
5つの言語(英語、ドイツ語、スペイン語、イタリア語、ペルシア語)
Luminoso, NASARI:SemEval-2017におけるtop-2
EuroparlとOpenSubtitles2016 パラレルコーパスにアクセス可能
結論
• 完全に教師なしのMWEを学習するモデルを提案した
• 高品質の教師なしBWEはすでにあるが、多言語設定はない
• 今までの研究は教師なしBWEモデルにのみ依存している
• それだと言語間の相互依存性を十分に活用できていない
• そこで、計算コスト増加させることなくすべての言語対の関係を明示的
に利用するMAT+MPSR法を提案
• 多言語単語翻訳と言語間類似性タスクで既存の教師なしモ
デルを超えた
• 展望として、他のBWEフレームワークと連携する拡張を検討

Mais conteúdo relacionado

Mais de 広樹 本間 (8)

2019 dynamically composing_domain-data_selection_with_clean-data_selection_by...
2019 dynamically composing_domain-data_selection_with_clean-data_selection_by...2019 dynamically composing_domain-data_selection_with_clean-data_selection_by...
2019 dynamically composing_domain-data_selection_with_clean-data_selection_by...
 
論文紹介 Star-Transformer (NAACL 2019)
論文紹介 Star-Transformer (NAACL 2019)論文紹介 Star-Transformer (NAACL 2019)
論文紹介 Star-Transformer (NAACL 2019)
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 
Improving neural machine translation by incorporating hierarchical subword fe...
Improving neural machine translation by incorporating hierarchical subword fe...Improving neural machine translation by incorporating hierarchical subword fe...
Improving neural machine translation by incorporating hierarchical subword fe...
 
A deep relevance model for zero shot document filtering
A deep relevance model for zero shot document filteringA deep relevance model for zero shot document filtering
A deep relevance model for zero shot document filtering
 
Reusing weights in subword aware neural language models
Reusing weights in subword aware neural language modelsReusing weights in subword aware neural language models
Reusing weights in subword aware neural language models
 
最終発表
最終発表最終発表
最終発表
 
企画書 VirtualDarts v2
企画書 VirtualDarts v2企画書 VirtualDarts v2
企画書 VirtualDarts v2
 

Último

Último (11)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

Unsupervised multilingual word embeddings