A reading of ibm research innovations - for 2018 and ahead
Pietro leo - IBM Watson
1. Pietro LEO
Il sistema WATSON e la nuova frontiera dei sistemi
intelligenti in grado di sfidare l’uomo
Executive Architect
Member of IBM Academy of Technology
Email: pietro_leo@it.ibm.com
Twitter: @pieroleo
Linkedin: http://it.linkedin.com/in/pieroleo
7. Come si gioca a ?
• 3 concorrenti che si sfidano a rispondere a delle domande in una partita
basata su 3 turni
• Uno dei 3 concorrenti sceglie una “categoria di domande” tra 6 possibili e non
note a priori e sceglie il livello di difficoltà (tra 5) delle domande
• Il conduttore formula la domanda e risponde chi si prenota per primo: vinci il
denaro associato al livello di difficoltà della domanda se c’azzecchi o perdi il
denaro se sbagli la risposta
• Vince il concorrente che alla fine delle 3 puntate ha accumulato più soldi
8. Come si gioca a ?
Precisione
$600 $400
Popular culture
Vasti domini di Tweens watching this One type of this aquatic
Mammals
conoscenza young man's video "baby" animal gives milk that’s
on youtube helped it to a 65% fat; pups are
record 260 million views weaned in 4 days, the
as of summer 2010 least of any mammal
Velocità
National Football Leagu
Mark Twain Shall Meet
Linguaggio $200 $800
complesso New Orleans Saints kicker ...this poet, whose "idylls of
Tom Dempsey's record the king" started an Strategia
63-yard field goal was Arthurian craze that
kicked in this school's inspired "a Connecticut
stadium Yankee"
9. Perchè Jeopardy! è sfidante?
1. In un’analisi di un campione random
di 20.000 domande abbiamo contato
oltre 2.500 tipologie diverse di
L’approccio di Watson è quello di NON
domande*.
2. La tipologia più frequente ricorre in usare una lista di risposte
meno del 3% dei casi. preconfezionate attingendo da un
database di possibili risposte
3. La distribuzione si presenta come
una curva con una coda
estremamente lunga Watson NONcerca di costruire
4. E per ciascuna tipologia migliaia di un modelo formale, una
differenti domande possono essere knowledge base delle conoscenze del
mondo
chieste
Il focus principale è quello di sviluppare un framework di tecnologie in grado di
comprendere il linguaggio naturale per analizzare grandi quantità di dati testuali
così come sono
9 Sorgenti strutturate (Database e Knowledge Base) forniscono ulteriore background knowledge
per interpretare il testo
*13% sono tipologie non distintive
10. In May 1898 Portugal In May, Gary arrived in
Domanda celebrated the 400th
anniversary of this
India after he celebrated
his anniversary in Evidenza
explorer’s arrival in India. Portugal.
arrived in
celebrated Keyword Matching
Keyword Matching celebrated
In May
Keyword Matching
Keyword Matching In May
1898
400th
Keyword Matching
Keyword Matching anniversary
anniversary
L’evidenza
suggerisce che Portugal Keyword Matching in Portugal
Keyword Matching
“Gary” potrebbe
essere la risposta arrival in
MA il sistema deve
comprende che la
semplice India Keyword Matching
Keyword Matching India
“corrispondenza”
delle parole conta
poco rispetto ad altri explorer Gary
tipi di verifiche, prove
ed altre evidenze
11. Domanda Evidenze!
In May 1898 Portugal On the 27th of May 1498, Vasco da
On the 27th of May 1498, Vasco da
celebrated the 400th Gama landed in Kappad Beach.
On the 27th of May 1498, Vasco da
Gama landed in Kappad Beach.
anniversary of this Gama landed in Kappad Beach.
explorer’s arrival in India.
Ricerca ampia e approfondita
Esplorazione di molte ipotesi
Diversi algoritmi di inferenza
Valutazione delle evidenze
celebrated
Portugal landed in
May 1898
Temporal 27th May 1498
400th anniversary
Reasoning Data math
Statistical
arrival in
Paraphrasing Parapharase
India GeoSpatial Kappad Beach
Differenti tipi Reasoning GeoKB
di evitenze
portano a
credere che
explorer Vasco da Gama
la risposta
sia “Vasco da
Gama” L’ipotesi fatta non è comunque certa al 100%!
13. Information-based Intelligence
“Metodi statistici e di Analytics” abbinati alla forza bruta computazionale,
per analizzare un numero incredibimente grande di dati (BIG Data) attraverso
algoritmi e computer ad alte prestazioni
“Scalare” più informazione hai, più potenti sono i computer, più sofisticati sono
gli algorimi…. Migliori risultati hai!
Orginata dagli approcci empirici adottati per lo studio e l’interpretazione di
enormi moli di dati generati nell’ambito degli esperimenti di fisica delle alte energie
Data mining durante gli anni ‘90
Business
IBM Deep Blue (1997) Analytics and
Deep Q&A - IBM Watson (2011) Optimization....
(Content analytics)
17. Information-
based Tasks:
1. Analisi, Riconoscimento di Supporto alla
Frodi Diagnosi
decomposizione e
ricostruzione di Fatti
2. Generazione di
Ipotesi
Supporto al
3. Gestione della Analisi e correlazione tra
ritrovamento e
fatti investigativi
conoscenza all’analisi di evidenze
4. Supporto alle
decisioni
5. Deep Q&A: Sistemi
di domande e
Customer Service Gestione della Conoscenza
risposte….
18. Grazie!!!
Executive Architect
Member of IBM Academy of Technology
Email: pietro_leo@it.ibm.com
Twitter: @pieroleo
Linkedin: http://it.linkedin.com/in/pieroleo
b