17. Sorgente IDC, a market-research firm, predicts that the “digital universe” (the data
created and copied every year) will reach 180 zettabytes (180 followed by
21 zeros) in 2025 (see chart). Pumping it all through a broadband internet
connection would take over 450m years. To speed the transfer into its data
centres, Amazon, an e-commerce giant with a fast-growing cloud-
computing arm, uses trucks pulling shipping containers each packed with
storage devices holding 100 petabytes (a mere 15 zeros).
PB-SMT
(Google Translate)
IDC, un'azienda di ricerca di mercato, prevede che l'universo digitale (i dati
creati e copiati ogni anno) raggiungerà 180 zettebiti (180 seguiti da 21 zeri)
nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga richiederebbe 450 milioni di anni. Per velocizzare il
trasferimento nei propri data center, Amazon, un gigante di e-commerce
con un braccio cloud computing in rapida crescita, utilizza camion che
tirapidano contenitori di trasporto ciascuno confezionati con dispositivi di
storage che dispongono di 100 petabyte (meri 15 zeri).
NMT
(Systran Pure neural MT)
IDC, azienda di scienza di mercato, prevede che conosce l'universo digitale
(i dati creati e copiati in farina) raggiungerà 180 zettebiti (180 seguiti da 21
zeri) nel 2025 (vedi grafico). Pompando tutto attraverso una connessione a
Internet a banda larga 450 msec. per velocizzare il trasferimento il propri
centre centre, Amazon, nu un di e-commerce con con cloud cloud
computing computing computing che che di che con di che di con di
storage di 100 petabyte (stravaganti 15 zeri).
18.
19.
20.
21. Approccio Pro Contro
RbMT
• Modello linguistico
• Adatto per lingue con risorse limitate
• Agevole analisi degli errori
• Ridotto consumo di risorse
computazionali
• Necessari regole linguistiche e dizionari
• Coppia linguistica vincolante
• Problemi di disambiguazione
• Sviluppo e manutenzione impegnativi
PB-SMT
• Non richiede conoscenze linguistiche
• Agnostico
• Sviluppo e manutenzione accessibili
• Necessari testi paralleli
• Problemi con coppie linguistiche con
diversa morfologia
• Analisi degli errori impegnativa
NMT
• Non richiede conoscenze linguistiche
• Agnostico
• Sviluppo incrementale
• Limitata manutenzione
• Modesta dimensione del modello
• Autoapprendimento dinamico
• Necessari testi paralleli
• Necessarie risorse computazionali
specifiche (GPGPU)
• Analisi degli errori impraticabile
• Impossibile usare corpus monolingue
• Modesta personalizzazione
22.
23.
24.
25.
26.
27. Attività a basso
valore aggiunto: i
professionisti
svolgono quelle più
impegnative a
elevato valore
aggiunto
Scomposizione del
processo in attività
elementari per
individuare quelle
da automatizzare
Automazione
dell’intero processo
con espulsione delle
risorse umane
Integrazione delle
competenze umane
con strumenti ad
alta tecnologia per
facilitare lo
svolgimento delle
attività
Alleggerire
(Relieve)
Scomporre
(Split-up)
Sostituire
(Replace)
Estendere
(Augment)
Chatbot PEMT UGC CAT avanzati
28. Adattamento dei
contenuti
Registrazione e
archiviazione dati
Profilazione contenuti
Post-editing Selezione risorse Distribuzione contenuti
Project management Allocazione risorse
Determinazione dei
prezzi
Estrazione
terminologica
Valutazione qualità Pianificazione
Alleggerite Estese Sostituite