SlideShare uma empresa Scribd logo
1 de 29
Baixar para ler offline
Neirontulkojumu atkļūdošana
Matīss Rikters
LU 76. konference, Datorlingvistikas sekcija
Rīgā, 2018. gada 1. martā
Saturs
Neirontulkošana
Neural Machine Translation (NMT)
Neirontulkošana
▪ Forcada & Ñeco, 1997
▪ Castaño & Casacuberta, 1997
▪ Kalchbrenner & Blunsom, 2013
▪ Sutskever et al., 2014
▪ Cho et al., 2014
Uzmanības mehānisms
Uzmanības mehānisms
“You can’t cram the meaning of a whole %&!$# sentence into a single $&!#* vector!”
/Ray Mooney/
Bahdanau et al., 2015
Uzmanības vizualizēšana
http://attention.lielakeda.lv
Tulkojumi
▪ Spridzeklis kopā ar dokumentiem un mobilajiem tālruņiem bija atstāts arī pārnēsātājiem.
▪ Tāpēc tiesas lēmums Riodežaneiro ir pārāks par Latviju.
Tulkojumi
A bag with documents and mobile phone was also left in the strollers.
▪ Spridzeklis kopā ar dokumentiem un mobilajiem tālruņiem bija atstāts arī pārnēsātājiem.
Therefore the judo contest in Rio is over for Latvia.
▪ Tāpēc tiesas lēmums Riodežaneiro ir pārāks par Latviju.
Car accident in Riga center involves a police car.
▪ Automašīna, kas atrodas Rīgas centrā, ir policijas automašīna.
A bag with documents and mobile phone was also left in the strollers.
Spridzeklis kopā ar dokumentiem un mobilajiem tālruņiem bija atstāts arī pārnēsātājiem.
Therefore the judo contest in Rio is over for Latvia.
Tāpēc tiesas lēmums Riodežaneiro ir pārāks par Latviju.
Car accident in Riga center involves a police car.
Automašīna, kas atrodas Rīgas centrā, ir policijas automašīna.
Tulkojumu salīdzināšana
By comparison, the starch found for example in vegetables is a polysaccharide.
Salīdzinot ar dārzeņiem, ir konstatēts, ka cietes, piemēram, dārzeņi, ir polisaharīds.
Salīdzinot, piemēram, dārzeņi, piemēram, dārzeņi, ir polysvēharīds.
By comparison, the starch found for example in vegetables is a polysaccharide.
Salīdzinot ar dārzeņiem, ir konstatēts, ka cietes, piemēram, dārzeņi, ir polisaharīds.
Salīdzinot, piemēram, dārzeņi, piemēram, dārzeņi, ir polysvēharīds.
Kenny next competes in the sprint, which begins on today and plays out over three days.
Kenny next konkurtes in the sprint, which begins on today and plays out over three days.
Kenijs nākamreiz konkurē sprinteri, kas sākas šodien un spēlē vairāk nekā trīs dienas.
Kenny next competes in the sprint, which begins on today and plays out over three days.
Kenny next konkurtes in the sprint, which begins on today and plays out over three days.
Kenijs nākamreiz konkurē sprinteri, kas sākas šodien un spēlē vairāk nekā trīs dienas.
Avota teikuma un tulkojuma pārklājums
Vizualizēšanas rīks
Vizualizēšanas rīks
https://github.com/M4t1ss/SoftAlignments
▪ Saderīgs ar populārām NMT rīkkopām
▪ Nematus
▪ Neural Monkey
▪ Marian
▪ OpenNMT
▪ Sockeye
▪ Spēj attēlot mašīntulkojumu sastatījumus arī komandrindā
Vizualizēšanas rīks
Tīmekļa vidē ļauj kārtot tulkojumus pēc
▪ Teikuma garuma simbolos
▪ Pārliecības (Confidence)
▪ Pārklājuma novirzes soda (CDP)
▪ Ievaddatu piemērotības soda (APin)
▪ Izvaddatu piemērotības soda (APout)
▪ Avota teikuma un tulkojuma pārklājuma (Overlap)
▪ BLEU
Avota teikuma un tulkojuma pārklājums
Paraugtulkojums un BLEU
Atkļūdošana – kļūdu meklēšana
Aizdomīgi mēdz būt
▪ Īsi teikumi ar zemu pārliecību, CDP, APin vai Apout
▪ Gari teikumi ar lielu avota teikuma un tulkojuma pārklājumu
▪ Zemu BLEU, bet augstiem citiem rādītājiem
Aktuālas problēmas
Konvolūciju neironu tīkli
http://attention.lielakeda.lv

Mais conteúdo relacionado

Mais de Matīss ‎‎‎‎‎‎‎  

Mais de Matīss ‎‎‎‎‎‎‎   (20)

ラトビア大学
ラトビア大学ラトビア大学
ラトビア大学
 
私の趣味
私の趣味私の趣味
私の趣味
 
富士山りょこう
富士山りょこう富士山りょこう
富士山りょこう
 
Tips and Tools for NMT
Tips and Tools for NMTTips and Tools for NMT
Tips and Tools for NMT
 
Hybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation SystemsHybrid Machine Translation by Combining Multiple Machine Translation Systems
Hybrid Machine Translation by Combining Multiple Machine Translation Systems
 
The Impact of Corpora Qulality on Neural Machine Translation
The Impact of Corpora Qulality on Neural Machine TranslationThe Impact of Corpora Qulality on Neural Machine Translation
The Impact of Corpora Qulality on Neural Machine Translation
 
Advancing Estonian Machine Translation
Advancing Estonian Machine TranslationAdvancing Estonian Machine Translation
Advancing Estonian Machine Translation
 
Debugging neural machine translations
Debugging neural machine translationsDebugging neural machine translations
Debugging neural machine translations
 
Effective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translationEffective online learning implementation for statistical machine translation
Effective online learning implementation for statistical machine translation
 
Hybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systemsHybrid machine translation by combining multiple machine translation systems
Hybrid machine translation by combining multiple machine translation systems
 
Paying attention to MWEs in NMT
Paying attention to MWEs in NMTPaying attention to MWEs in NMT
Paying attention to MWEs in NMT
 
Searching for the Best Machine Translation Combination
Searching for the Best Machine Translation CombinationSearching for the Best Machine Translation Combination
Searching for the Best Machine Translation Combination
 
CoLing 2016
CoLing 2016CoLing 2016
CoLing 2016
 
Neural Network Language Models for Candidate Scoring in Multi-System Machine...
 Neural Network Language Models for Candidate Scoring in Multi-System Machine... Neural Network Language Models for Candidate Scoring in Multi-System Machine...
Neural Network Language Models for Candidate Scoring in Multi-System Machine...
 
Doktorantūras semināra 3. prezentācija
Doktorantūras semināra 3. prezentācijaDoktorantūras semināra 3. prezentācija
Doktorantūras semināra 3. prezentācija
 
Searching for the best translation combination
Searching for the best translation combinationSearching for the best translation combination
Searching for the best translation combination
 
K translate - Baltic DBIS2016
K translate - Baltic DBIS2016K translate - Baltic DBIS2016
K translate - Baltic DBIS2016
 
Automated Translation of Multi-word Expressions Application in English-Latvia...
Automated Translation of Multi-word Expressions Application in English-Latvia...Automated Translation of Multi-word Expressions Application in English-Latvia...
Automated Translation of Multi-word Expressions Application in English-Latvia...
 
CICLing 2016
CICLing 2016CICLing 2016
CICLing 2016
 
Combining machine translated sentence chunks from multiple MT systems
Combining machine translated sentence chunks from multiple MT systemsCombining machine translated sentence chunks from multiple MT systems
Combining machine translated sentence chunks from multiple MT systems
 

Neirontulkojumu atkļūdošana