SlideShare uma empresa Scribd logo
1 de 29
Neural Machine Translation
Il futuro è già presente
Convegno Unilingue
Villa Cagnola
Gazzada Schianno (VA)
26 maggio 2017
Luigi Muzii
Hicsuntleones
1940 1950 1960 1970 1980 1990 20202000 2010
Qualità
RbMT
SMT
HMT
NMT
Evoluzione della
traduzione automatica
t
Strato di uscitaStrati nascostiStrato di
ingresso
RbMT
PB-SMT
NMT
Sorgente IDC, a market-research firm, predicts that the “digital universe” (the data
created and copied every year) will reach 180 zettabytes (180 followed by
21 zeros) in 2025 (see chart). Pumping it all through a broadband internet
connection would take over 450m years. To speed the transfer into its data
centres, Amazon, an e-commerce giant with a fast-growing cloud-
computing arm, uses trucks pulling shipping containers each packed with
storage devices holding 100 petabytes (a mere 15 zeros).
PB-SMT
(Google Translate)
IDC, un'azienda di ricerca di mercato, prevede che l'universo digitale (i dati
creati e copiati ogni anno) raggiungerà 180 zettebiti (180 seguiti da 21 zeri)
nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga richiederebbe 450 milioni di anni. Per velocizzare il
trasferimento nei propri data center, Amazon, un gigante di e-commerce
con un braccio cloud computing in rapida crescita, utilizza camion che
tirapidano contenitori di trasporto ciascuno confezionati con dispositivi di
storage che dispongono di 100 petabyte (meri 15 zeri).
NMT
(Systran Pure neural MT)
IDC, azienda di scienza di mercato, prevede che conosce l'universo digitale
(i dati creati e copiati in farina) raggiungerà 180 zettebiti (180 seguiti da 21
zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga 450 msec. per velocizzare il trasferimento il propri
centre centre, Amazon, nu un di e-commerce con con cloud cloud
computing computing computing che che di che con di che di con di
storage di 100 petabyte (stravaganti 15 zeri).
Approccio Pro Contro
RbMT
• Modello linguistico
• Adatto per lingue con risorse limitate
• Agevole analisi degli errori
• Ridotto consumo di risorse
computazionali
• Necessari regole linguistiche e dizionari
• Coppia linguistica vincolante
• Problemi di disambiguazione
• Sviluppo e manutenzione impegnativi
PB-SMT
• Non richiede conoscenze linguistiche
• Agnostico
• Sviluppo e manutenzione accessibili
• Necessari testi paralleli
• Problemi con coppie linguistiche con
diversa morfologia
• Analisi degli errori impegnativa
NMT
• Non richiede conoscenze linguistiche
• Agnostico
• Sviluppo incrementale
• Limitata manutenzione
• Modesta dimensione del modello
• Autoapprendimento dinamico
• Necessari testi paralleli
• Necessarie risorse computazionali
specifiche (GPGPU)
• Analisi degli errori impraticabile
• Impossibile usare corpus monolingue
• Modesta personalizzazione
Attività a basso
valore aggiunto: i
professionisti
svolgono quelle più
impegnative a
elevato valore
aggiunto
Scomposizione del
processo in attività
elementari per
individuare quelle
da automatizzare
Automazione
dell’intero processo
con espulsione delle
risorse umane
Integrazione delle
competenze umane
con strumenti ad
alta tecnologia per
facilitare lo
svolgimento delle
attività
Alleggerire
(Relieve)
Scomporre
(Split-up)
Sostituire
(Replace)
Estendere
(Augment)
Chatbot PEMT UGC CAT avanzati
Adattamento dei
contenuti
Registrazione e
archiviazione dati
Profilazione contenuti
Post-editing Selezione risorse Distribuzione contenuti
Project management Allocazione risorse
Determinazione dei
prezzi
Estrazione
terminologica
Valutazione qualità Pianificazione
Alleggerite Estese Sostituite
s-quid.it/30min

Mais conteúdo relacionado

Semelhante a Convegno Unilingue 2017

Smau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSmau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSMAU
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesGiulio Roggero
 
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...CONFINDUSTRIA TOSCANA NORD
 
Web service persino nei sistemi embedeed
Web service persino nei sistemi embedeedWeb service persino nei sistemi embedeed
Web service persino nei sistemi embedeedAntonio Cafiero
 
Roadshow2014 social
Roadshow2014 socialRoadshow2014 social
Roadshow2014 socialASEM S.p.A.
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BILorenzo Ridi
 
Quando il gioco si fa duro, i duri iniziano a giocare
Quando il gioco si fa duro, i duri iniziano a giocareQuando il gioco si fa duro, i duri iniziano a giocare
Quando il gioco si fa duro, i duri iniziano a giocareCherry Consulting by S.M.
 
La Modernizzazione dei Dati come base per La Trasformazione Digitale
La Modernizzazione dei Dati come base per La Trasformazione DigitaleLa Modernizzazione dei Dati come base per La Trasformazione Digitale
La Modernizzazione dei Dati come base per La Trasformazione DigitaleMongoDB
 
Smau Milano 2013 - Premio Innovazione ICT
Smau Milano 2013 - Premio Innovazione ICTSmau Milano 2013 - Premio Innovazione ICT
Smau Milano 2013 - Premio Innovazione ICTSMAU
 
Open source and new architectures
Open source and new architecturesOpen source and new architectures
Open source and new architecturesSergio Patano
 
Procedimento per la generazione automatica di codice di calcolo parallelo
Procedimento per la generazione automatica di codice di calcolo paralleloProcedimento per la generazione automatica di codice di calcolo parallelo
Procedimento per la generazione automatica di codice di calcolo paralleloToscana Open Research
 
Una crescita in più direzioni per la stampa 3D
Una crescita in più direzioni per la stampa 3DUna crescita in più direzioni per la stampa 3D
Una crescita in più direzioni per la stampa 3DCherry Consulting by S.M.
 
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...festival ICT 2016
 
Newsletter Lika Electronic Febbraio 2017 in italiano
Newsletter Lika Electronic Febbraio 2017 in italianoNewsletter Lika Electronic Febbraio 2017 in italiano
Newsletter Lika Electronic Febbraio 2017 in italianoLika Electronic
 
Cloud, IoT and Big Data
Cloud, IoT and Big DataCloud, IoT and Big Data
Cloud, IoT and Big DataSolidQIT
 
Il futuro prossimo del mainframe: nuove sfide per i CIO
Il futuro prossimo del mainframe: nuove sfide per i CIOIl futuro prossimo del mainframe: nuove sfide per i CIO
Il futuro prossimo del mainframe: nuove sfide per i CIOAlberto Fietta
 
2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer
2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer
2015 CLOUD LOGIN - Servizi su Piattaforma SoftlayerServiceCloud - Esprinet
 

Semelhante a Convegno Unilingue 2017 (20)

Evoluzionecomputer
EvoluzionecomputerEvoluzionecomputer
Evoluzionecomputer
 
Smau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazioneSmau Padova 2011 Leonardo Torretta - virtualizzazione
Smau Padova 2011 Leonardo Torretta - virtualizzazione
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with Kubernetes
 
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...
Industria 4.0. Lucca, 5 luglio 2017 - Integrazione delle reti di automazione ...
 
Web service persino nei sistemi embedeed
Web service persino nei sistemi embedeedWeb service persino nei sistemi embedeed
Web service persino nei sistemi embedeed
 
Roadshow2014 social
Roadshow2014 socialRoadshow2014 social
Roadshow2014 social
 
Cata case study jcb v2
Cata case study jcb   v2Cata case study jcb   v2
Cata case study jcb v2
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BI
 
Cloud in Action_6 giugno 2014
Cloud in Action_6 giugno 2014Cloud in Action_6 giugno 2014
Cloud in Action_6 giugno 2014
 
Quando il gioco si fa duro, i duri iniziano a giocare
Quando il gioco si fa duro, i duri iniziano a giocareQuando il gioco si fa duro, i duri iniziano a giocare
Quando il gioco si fa duro, i duri iniziano a giocare
 
La Modernizzazione dei Dati come base per La Trasformazione Digitale
La Modernizzazione dei Dati come base per La Trasformazione DigitaleLa Modernizzazione dei Dati come base per La Trasformazione Digitale
La Modernizzazione dei Dati come base per La Trasformazione Digitale
 
Smau Milano 2013 - Premio Innovazione ICT
Smau Milano 2013 - Premio Innovazione ICTSmau Milano 2013 - Premio Innovazione ICT
Smau Milano 2013 - Premio Innovazione ICT
 
Open source and new architectures
Open source and new architecturesOpen source and new architectures
Open source and new architectures
 
Procedimento per la generazione automatica di codice di calcolo parallelo
Procedimento per la generazione automatica di codice di calcolo paralleloProcedimento per la generazione automatica di codice di calcolo parallelo
Procedimento per la generazione automatica di codice di calcolo parallelo
 
Una crescita in più direzioni per la stampa 3D
Una crescita in più direzioni per la stampa 3DUna crescita in più direzioni per la stampa 3D
Una crescita in più direzioni per la stampa 3D
 
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...
Innovazione infrastrutturale per l'erogazione di servizi applicativi su x86. ...
 
Newsletter Lika Electronic Febbraio 2017 in italiano
Newsletter Lika Electronic Febbraio 2017 in italianoNewsletter Lika Electronic Febbraio 2017 in italiano
Newsletter Lika Electronic Febbraio 2017 in italiano
 
Cloud, IoT and Big Data
Cloud, IoT and Big DataCloud, IoT and Big Data
Cloud, IoT and Big Data
 
Il futuro prossimo del mainframe: nuove sfide per i CIO
Il futuro prossimo del mainframe: nuove sfide per i CIOIl futuro prossimo del mainframe: nuove sfide per i CIO
Il futuro prossimo del mainframe: nuove sfide per i CIO
 
2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer
2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer
2015 CLOUD LOGIN - Servizi su Piattaforma Softlayer
 

Mais de Luigi Muzii

Measuring for success: Goals, performances, and outcomes
Measuring for success: Goals, performances, and outcomesMeasuring for success: Goals, performances, and outcomes
Measuring for success: Goals, performances, and outcomesLuigi Muzii
 
Sharing efforts to get the most from MT+PE
Sharing efforts to get the most from MT+PESharing efforts to get the most from MT+PE
Sharing efforts to get the most from MT+PELuigi Muzii
 
Getting the Most from MT + PE
Getting the Most from MT + PEGetting the Most from MT + PE
Getting the Most from MT + PELuigi Muzii
 
Standards, terminology and Europe
Standards, terminology and EuropeStandards, terminology and Europe
Standards, terminology and EuropeLuigi Muzii
 
TLC 2015 Warsaw - The Rumble Seat - Presentation
TLC 2015 Warsaw - The Rumble Seat - PresentationTLC 2015 Warsaw - The Rumble Seat - Presentation
TLC 2015 Warsaw - The Rumble Seat - PresentationLuigi Muzii
 
TLC 2015 Warsaw - The Rumble Seat - Companion Text
TLC 2015 Warsaw - The Rumble Seat - Companion TextTLC 2015 Warsaw - The Rumble Seat - Companion Text
TLC 2015 Warsaw - The Rumble Seat - Companion TextLuigi Muzii
 
Introduzione alla terminologia
Introduzione alla terminologiaIntroduzione alla terminologia
Introduzione alla terminologiaLuigi Muzii
 
KPIs and Capability Statements
KPIs and Capability StatementsKPIs and Capability Statements
KPIs and Capability StatementsLuigi Muzii
 
Europeo, Feb 1, 1991
Europeo, Feb 1, 1991Europeo, Feb 1, 1991
Europeo, Feb 1, 1991Luigi Muzii
 
Term Mining and Terminology Management in a Corporate Setting Perspective
Term Mining and Terminology Management in a Corporate Setting PerspectiveTerm Mining and Terminology Management in a Corporate Setting Perspective
Term Mining and Terminology Management in a Corporate Setting PerspectiveLuigi Muzii
 
Let's call the whole thing off
Let's call the whole thing offLet's call the whole thing off
Let's call the whole thing offLuigi Muzii
 
Diversità in rete: distanza che si trasforma in ricchezza
Diversità in rete: distanza che si trasforma in ricchezzaDiversità in rete: distanza che si trasforma in ricchezza
Diversità in rete: distanza che si trasforma in ricchezzaLuigi Muzii
 
Terminologia per la traduzione
Terminologia per la traduzioneTerminologia per la traduzione
Terminologia per la traduzioneLuigi Muzii
 
Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Luigi Muzii
 
Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Luigi Muzii
 
Vendor & Project Management
Vendor & Project ManagementVendor & Project Management
Vendor & Project ManagementLuigi Muzii
 

Mais de Luigi Muzii (20)

Measuring for success: Goals, performances, and outcomes
Measuring for success: Goals, performances, and outcomesMeasuring for success: Goals, performances, and outcomes
Measuring for success: Goals, performances, and outcomes
 
Hic et Nunc
Hic et NuncHic et Nunc
Hic et Nunc
 
Sharing efforts to get the most from MT+PE
Sharing efforts to get the most from MT+PESharing efforts to get the most from MT+PE
Sharing efforts to get the most from MT+PE
 
Getting the Most from MT + PE
Getting the Most from MT + PEGetting the Most from MT + PE
Getting the Most from MT + PE
 
White Noise
White NoiseWhite Noise
White Noise
 
Standards, terminology and Europe
Standards, terminology and EuropeStandards, terminology and Europe
Standards, terminology and Europe
 
ATC 2015
ATC 2015ATC 2015
ATC 2015
 
TLC 2015 Warsaw - The Rumble Seat - Presentation
TLC 2015 Warsaw - The Rumble Seat - PresentationTLC 2015 Warsaw - The Rumble Seat - Presentation
TLC 2015 Warsaw - The Rumble Seat - Presentation
 
TLC 2015 Warsaw - The Rumble Seat - Companion Text
TLC 2015 Warsaw - The Rumble Seat - Companion TextTLC 2015 Warsaw - The Rumble Seat - Companion Text
TLC 2015 Warsaw - The Rumble Seat - Companion Text
 
Introduzione alla terminologia
Introduzione alla terminologiaIntroduzione alla terminologia
Introduzione alla terminologia
 
KPIs and Capability Statements
KPIs and Capability StatementsKPIs and Capability Statements
KPIs and Capability Statements
 
Europeo, Feb 1, 1991
Europeo, Feb 1, 1991Europeo, Feb 1, 1991
Europeo, Feb 1, 1991
 
Term Mining and Terminology Management in a Corporate Setting Perspective
Term Mining and Terminology Management in a Corporate Setting PerspectiveTerm Mining and Terminology Management in a Corporate Setting Perspective
Term Mining and Terminology Management in a Corporate Setting Perspective
 
Let's call the whole thing off
Let's call the whole thing offLet's call the whole thing off
Let's call the whole thing off
 
Diversità in rete: distanza che si trasforma in ricchezza
Diversità in rete: distanza che si trasforma in ricchezzaDiversità in rete: distanza che si trasforma in ricchezza
Diversità in rete: distanza che si trasforma in ricchezza
 
Terminologia per la traduzione
Terminologia per la traduzioneTerminologia per la traduzione
Terminologia per la traduzione
 
Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?
 
Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?Is quality under pressure? Or is translation?
Is quality under pressure? Or is translation?
 
Vendor & Project Management
Vendor & Project ManagementVendor & Project Management
Vendor & Project Management
 
It101
It101It101
It101
 

Convegno Unilingue 2017

  • 1. Neural Machine Translation Il futuro è già presente Convegno Unilingue Villa Cagnola Gazzada Schianno (VA) 26 maggio 2017
  • 3.
  • 4.
  • 6.
  • 7.
  • 8. 1940 1950 1960 1970 1980 1990 20202000 2010 Qualità RbMT SMT HMT NMT Evoluzione della traduzione automatica t
  • 9.
  • 10. Strato di uscitaStrati nascostiStrato di ingresso
  • 11.
  • 12. RbMT
  • 14. NMT
  • 15.
  • 16.
  • 17. Sorgente IDC, a market-research firm, predicts that the “digital universe” (the data created and copied every year) will reach 180 zettabytes (180 followed by 21 zeros) in 2025 (see chart). Pumping it all through a broadband internet connection would take over 450m years. To speed the transfer into its data centres, Amazon, an e-commerce giant with a fast-growing cloud- computing arm, uses trucks pulling shipping containers each packed with storage devices holding 100 petabytes (a mere 15 zeros). PB-SMT (Google Translate) IDC, un'azienda di ricerca di mercato, prevede che l'universo digitale (i dati creati e copiati ogni anno) raggiungerà 180 zettebiti (180 seguiti da 21 zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a Internet a banda larga richiederebbe 450 milioni di anni. Per velocizzare il trasferimento nei propri data center, Amazon, un gigante di e-commerce con un braccio cloud computing in rapida crescita, utilizza camion che tirapidano contenitori di trasporto ciascuno confezionati con dispositivi di storage che dispongono di 100 petabyte (meri 15 zeri). NMT (Systran Pure neural MT) IDC, azienda di scienza di mercato, prevede che conosce l'universo digitale (i dati creati e copiati in farina) raggiungerà 180 zettebiti (180 seguiti da 21 zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a Internet a banda larga 450 msec. per velocizzare il trasferimento il propri centre centre, Amazon, nu un di e-commerce con con cloud cloud computing computing computing che che di che con di che di con di storage di 100 petabyte (stravaganti 15 zeri).
  • 18.
  • 19.
  • 20.
  • 21. Approccio Pro Contro RbMT • Modello linguistico • Adatto per lingue con risorse limitate • Agevole analisi degli errori • Ridotto consumo di risorse computazionali • Necessari regole linguistiche e dizionari • Coppia linguistica vincolante • Problemi di disambiguazione • Sviluppo e manutenzione impegnativi PB-SMT • Non richiede conoscenze linguistiche • Agnostico • Sviluppo e manutenzione accessibili • Necessari testi paralleli • Problemi con coppie linguistiche con diversa morfologia • Analisi degli errori impegnativa NMT • Non richiede conoscenze linguistiche • Agnostico • Sviluppo incrementale • Limitata manutenzione • Modesta dimensione del modello • Autoapprendimento dinamico • Necessari testi paralleli • Necessarie risorse computazionali specifiche (GPGPU) • Analisi degli errori impraticabile • Impossibile usare corpus monolingue • Modesta personalizzazione
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27. Attività a basso valore aggiunto: i professionisti svolgono quelle più impegnative a elevato valore aggiunto Scomposizione del processo in attività elementari per individuare quelle da automatizzare Automazione dell’intero processo con espulsione delle risorse umane Integrazione delle competenze umane con strumenti ad alta tecnologia per facilitare lo svolgimento delle attività Alleggerire (Relieve) Scomporre (Split-up) Sostituire (Replace) Estendere (Augment) Chatbot PEMT UGC CAT avanzati
  • 28. Adattamento dei contenuti Registrazione e archiviazione dati Profilazione contenuti Post-editing Selezione risorse Distribuzione contenuti Project management Allocazione risorse Determinazione dei prezzi Estrazione terminologica Valutazione qualità Pianificazione Alleggerite Estese Sostituite