Asiantuntijapuheenvuoro Valtio Expo 2017.
Tekoälyn ominaisuudet, puhekäyttöliittymät, kuuleminen, neuroverkko, puheen syntetisointi, keskustelu, konenäkö, neuvonanto, liikkuminen, sovelluskohteet.
Asko Relas, Head of Innovation, Talent Base Oy.
4. Tekoälyn ominaisuudet
Kuuleminen: Puheen tunnistus eri kielillä ja muiden audiosignaalien tulkitseminen
Puhuminen eri kielillä
Keskustelun käyminen
Näkeminen: Kuvien ja videokuvan tulkitseminen
Neuvonanto, kysymyksiin vastaaminen
Liikkuminen ja esineiden liikuttelu
6. Kuuleminen
• Kyky ymmärtää puhetta eri kielillä ja tunnistaa muitakin äänisignaaleja
• Ei erityisen uutta: puheentunnistus jo Nokia 3310:ssa (v. 2000) ja Windows
Vistassa (2006)
• Edistystä ymmärrettyjen kielten määrässä ja tarkkuudessa
• Nykytoteutukset ns. rekursiivisilla neuroverkoilla (recurrent neural net)
8. Puheen syntetisointi
• Tehty jo pitkään:
• Ensimmäinen englanninkielinen järjestelmä 1968 (Electrotechnical
Laboratory, Japan)
• Kuluttajakäyttöön Sound Blaster 16 (1992)
• Viimeaikoina saavutettu hyviä tuloksia käyttämällä
konvolutionaalisia neuroverkkoja, esim. WaveNet
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
9. Aloitus
Mitä
näet?
Kuinka
monta?
Kuinka
vahna?
”What do you see?”
”What do you see here?”
”Now what do you see?”
”How many X do you see?
”How many X in this picture?”
”How old am I?”
”How old do you think I am?”
• Puu- tai verkkomainen malli mahdollisista toimenpiteistä
• Jokaisessa haarassa esimerkkejä, miten asian voi ilmaista
• Käyttäjän tavoite tunnistetaan siitä, mihin haaraan se todennäköisimmin
kuuluu
Keskustelu
10. Konenäkö
• Konenäkö (computer vision) viittaa kykyyn
tunnistaa asioita valokuvista ja videosta
• Kuvien ja videoiden luokittelu / tägäys
• Objektien tunnistus: liikennemerkit, kaistaviivat,
autot, ihmiset
• Kts. esimerkiksi TensorFlow, Caffe,
OpenCV
11. Neuvonanto
• Kysymys-vastaus-järjestelmät (question answering systems)
osaavat vastata luonnollisella kielellä kysyttyyn kysymykseen
• Tyypillisesti kolmivaiheinen prosessi:
1. Kysymyksen tulkinta: kieli, tyyppi ja aihe
2. Potentiaalisten vastausten haku ja pisteytys
3. Vastauksen muotoilu
12. Liikkuminen
• Vahvistusoppiminen (reinforcement learning) on tämän hetken
varteenotettavimpia keinoja itsenäisen liikkumisen opettamiseen
• Toimija (robotti, auto, …) kokeilee erilaisia toimenpiteitä eri
tilanteissa, ja saa palautetta onnistumisesta, esim. kuinka
pitkälle se pääsi kaatumatta
• Kokeiluista muodostetaan tilastollista mallia siitä, millainen
toimenpide toimii missäkin tilanteessa
• Opettelu kannattaa tehdä aluksi simulaatiossa, josta opittu
toimintamalli siirretään fyysiseen maailmaan
13. Mitä tekoäly siis on?
Näkeminen: Konvolutionaaliset neuroverkot, konenäkö
Kuuleminen: Rekursiiviset neuroverkot
Puhuminen: Puheen syntetisointi nykyään neuroverkoilla
Keskustelu: Keskustelumallit, tekstisyötteen luokittelu
Neuvonanto: Kysymys-vastaus-järjestelmät
Liikkuminen: Vahvistusoppiminen
14. Tekoälyn sovelluskohteet
• Tyypillisesti soveltuu tilanteisiin joissa
1. Täytyy tulkita rakenteetonta dataa (video, kuva, ääni, vapaa teksti)
2. Ei löydy selvästi muotoiltavissa olevia sääntöjä
• Tekoäly usein sekoitetaan seuraaviin:
1. Tilastotiede
2. Matemaattinen optimointi
3. Sääntöpohjaiset järjestelmät