SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
ー文献紹介ー
換言事例の収集
-日英基本構文を対象として-
白井 諭、山本 和英
ATR音声言語通信研究所
言語処理学会 第7回年次大会 発表論文集
長岡技術科学大学 自然言語処理研究室 高橋寛治
はじめに
●
日英基本構文の対応付け
●
日本語語彙大系の構文大系により14,000文ほど可能
●
問題点
●
用言の種類および用言ごとの用法の網羅性
●
同じ意味を表すことが可能な表現の種類の多様性
●
構文における制約条件の記述
網羅性の問題
●
人間用辞書と機械用辞書の性格の違い
●
人間
●
目的とする語彙・用法がなければ、類義表現に言い換えて辞書
引き
●
機械
●
人間と同様の機構は困難
●
語彙・用法を網羅的に収録
多様性の問題
●
機械翻訳の利点の1つである訳語の統一性に起
因
●
訳語の統一性は、場合により訳文の単調性を招く
●
多様化の手法として、後編集
条件記述の問題
●
構文体系は解析用に設計
●
「犬が子犬を生む」「猫が子猫を生む」
●
<動物>が<動物>を生む
●
ガ格とヲ格の名詞の相互の関連性が失われる
●
人手で設計
●
抽象化にばらつきが生じることがある
本稿では
●
検討の概要と言い換え文の収集状況を報告
●
検討:日英対訳用例文を題材
●
日本文と英文の意味的対応を制約として、日本文の
別の言い方の収集
収集条件
●
従来
●
構文体系の網羅性向上を主な狙いとし内省により例文
作英
●
本手法
●
網羅的な用例の収集
●
多様な用例の収集
網羅的な用例の収集
●
2段階
●
様々な用法を例文という形で内省により網羅
●
例文に基づいて抽象化
●
生成した例文が自然な表現か
●
同じ作業者が時間が経ってから見直し・別の作業者と相互検査
●
作業に条件を加える
多様な用例の収集
●
1つの日本語表現に対する複数の英訳を得る
●
→英語表現を換言と言える
●
ただし
●
ある英語表現が必ず特定の日本語表現から生成され
なければならないわけでもない
多様な用例の収集
●
日英の対訳対の存在を前提として、換言事例を収集
●
日本語の用言に対する日英の対訳例文対を対象とする
●
日本語の換言は、英文に多様な和訳をつけるつもりで行う
●
原則として、特殊な場面設定を必要としない中立的な表現を
作成
収集情況と考察
●
和語動詞の対訳換言例文
●
J0 条件が揃った。
●
J1 条件が満たされた。
●
E0 The conditions were satisfied.
●
E1 The conditions were met.
●
イ型形容詞の対訳換言例文
●
J0 その2つの三角形の面積は等しい。
●
J1 その2つの三角形の面積は同じだ。
●
E0 The areas of those two triangles are the same.
●
ナ型形容詞の対訳換言例文
●
J0 私は彼の考えと同じだ。
●
E0 I have the same idea as he does.
用言の種類と例文数
●
1〜3人年の作業量
考察と今後の課題
●
作業の習熟度
●
初期は習熟度が低い → 質や量が習熟度により異なる
●
動詞か形容詞か
●
一般的か慣用的か
●
換言という観点から慣用的なものも網羅しておく必要あり
●
多義的か個別的か
●
多義は例文作成数が多い。個別は例文生成が困難。
●
換言の程度
おわりに
●
日本語用言の多様な用法とその換言事例作成の
現状を紹介
●
経験を積み重ねながら作業形態を進化させているた
め初期に作成した例文には見直すべき点がある

Mais conteúdo relacionado

Mais procurados (6)

判読眼の仕組みについて
判読眼の仕組みについて判読眼の仕組みについて
判読眼の仕組みについて
 
読解支援@2015 06-12
読解支援@2015 06-12読解支援@2015 06-12
読解支援@2015 06-12
 
日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価日本語の語彙的換言知識の質的評価
日本語の語彙的換言知識の質的評価
 
読解支援@2015 05-22
読解支援@2015 05-22読解支援@2015 05-22
読解支援@2015 05-22
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用
 
読解支援6 26
読解支援6 26読解支援6 26
読解支援6 26
 

Destaque (6)

La ofensa
La ofensaLa ofensa
La ofensa
 
第4回 日英機械翻訳のための日本語長文自動短文分割と主語の補完
第4回 日英機械翻訳のための日本語長文自動短文分割と主語の補完第4回 日英機械翻訳のための日本語長文自動短文分割と主語の補完
第4回 日英機械翻訳のための日本語長文自動短文分割と主語の補完
 
0903はじめに
0903はじめに0903はじめに
0903はじめに
 
英語論文を書くときに便利なコロケーション確認ツール
英語論文を書くときに便利なコロケーション確認ツール英語論文を書くときに便利なコロケーション確認ツール
英語論文を書くときに便利なコロケーション確認ツール
 
TermLink:言語横断論文推薦のための専門用語処理
TermLink:言語横断論文推薦のための専門用語処理TermLink:言語横断論文推薦のための専門用語処理
TermLink:言語横断論文推薦のための専門用語処理
 
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
 

Semelhante a MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー

さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
 
読解支援@2015 05-15
読解支援@2015 05-15読解支援@2015 05-15
読解支援@2015 05-15
sekizawayuuki
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
Yuya Unno
 
日英機械翻訳のための構文辞書
日英機械翻訳のための構文辞書日英機械翻訳のための構文辞書
日英機械翻訳のための構文辞書
Kanji Takahashi
 

Semelhante a MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー (17)

さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
 
固有表現抽出について
固有表現抽出について固有表現抽出について
固有表現抽出について
 
日本語学習者属性別の言語行為の対話自動生成への適用に関する 一考察 太田博三
日本語学習者属性別の言語行為の対話自動生成への適用に関する 一考察 太田博三日本語学習者属性別の言語行為の対話自動生成への適用に関する 一考察 太田博三
日本語学習者属性別の言語行為の対話自動生成への適用に関する 一考察 太田博三
 
自由文と自然言語、どちらがすぐれている?
自由文と自然言語、どちらがすぐれている?自由文と自然言語、どちらがすぐれている?
自由文と自然言語、どちらがすぐれている?
 
読解支援@2015 05-15
読解支援@2015 05-15読解支援@2015 05-15
読解支援@2015 05-15
 
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
 
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
20180602 kawamura presentation_final
20180602 kawamura presentation_final20180602 kawamura presentation_final
20180602 kawamura presentation_final
 
1 3-2
1 3-21 3-2
1 3-2
 
20170114 lod challenge
20170114 lod challenge20170114 lod challenge
20170114 lod challenge
 
SDMT:用例翻訳への新しいアプローチ
SDMT:用例翻訳への新しいアプローチSDMT:用例翻訳への新しいアプローチ
SDMT:用例翻訳への新しいアプローチ
 
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
 
コーパスに基づく認知意味論研究 20150613.key
コーパスに基づく認知意味論研究 20150613.keyコーパスに基づく認知意味論研究 20150613.key
コーパスに基づく認知意味論研究 20150613.key
 
Essential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em JaponêsEssential japanese expressions - Expressões Essenciais em Japonês
Essential japanese expressions - Expressões Essenciais em Japonês
 
日英機械翻訳のための構文辞書
日英機械翻訳のための構文辞書日英機械翻訳のための構文辞書
日英機械翻訳のための構文辞書
 

Mais de Kanji Takahashi

Mais de Kanji Takahashi (20)

20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み20180718Eightニュースフィード活性化のための自然言語処理の取り組み
20180718Eightニュースフィード活性化のための自然言語処理の取り組み
 
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
 
論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information
 
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
 
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
 
言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告
 
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
 
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
 
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
 

Último

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 

Último (7)

生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 

MT勉強会 第4回 換言事例の収集ー日英基本構文を対象としてー