Kui kaugele on süvaõpe ja AlphaGo jõudnud? Uurime tugeva tehisintellekti võimalusi ja tulevikku ning kaalume eesootavaid väljakutseid.
Süvaõpe ja AlphaGo: tehisintellekti areng
Märts 2016 Kui te just ei ela keset eikusagit, muust maailmast eraldatuna, olete ilmselt vähemalt korra kuulnud AlphaGost ja tehisintellektist. Olete ilmselt otsinud nende kohta infot, mõeldes, milles kogu see kära seisneb, ning kuulnud termineid süvaõpe ja masinõpe. Aga kui paljud meist teavad neist kasvõi natukenegi? Enamik meist teab mõne sõna, näiteks suurandmed, nime, aga mitte palju rohkem. Selles artiklis heidame pilgu süvaõppe ajaloole ja tehnilistele teoreetilistele alustele, mis on praegu tehisintellekti üks kuumimaid teemasid, ning räägime lühidalt „Deep Q Networkist“, AlphaGo taga olevate süvamerede vaimusünnitusest.
Süvaõppe ülevaade ja ajalugu
Enne kui süvaõppest räägime, räägime „õppimisest“ ehk masinõppest. Ameerika arvutiteadlase Tom M. Mitchelli sõnul võib masinõpet defineerida kui „kogemuse kasutamist ülesande täitmisel selle ülesande soorituse või tulemuse parandamiseks“. Masinõppe mõte ongi korduva kogemusega paremaks muutumine. Nii nagu inimesed muutuvad treeninguga paremaks, on masinõpe loodud jäljendama seda, kuidas inimesed „õpivad“.
Süvaõpe on tehisnärvivõrgu tehnoloogial põhinev masinõppe tüüp. Tehisnärvivõrk on tehisintellekti valdkonna mudel, mis jäljendab närvivõrku, mis koosneb suurest hulgast ajus asuvatest neuronitest, millest igaüks saadab ja võtab vastu signaale sünapside kaudu, ning süvaõpe on loodud tehisnärvivõrgu hierarhilises struktuuris mitme kihiga. Need kihid eristavad süvaõpet traditsioonilisest masinõppest. Kui traditsiooniline masinõpe nõuab sisendandmetest soovitud tulemuse saamiseks eelnevalt põhitunnuste eraldamist, siis süvaõpe saab töötada väga põhiandmetega (näiteks piltide puhul pikslitega), et luua väljund ilma tunnuseid eraldamata.
Süvaõppe areng ja selle tänapäevane tähtsus
Süvaõppe ehk tehisnärvivõrkude kontseptsiooni arutati enam kui 30 aastat tagasi. Tavaliselt peetakse selle alguseks Frank Rosenblatti Perceptroni 1950. aastate keskel. See oli ühekihiline närvivõrk, mis töötas lineaarsete, kuid mitte mittelineaarsete mudelite puhul, ja tolleaegne riistvara ei suutnud arvutustega sammu pidada. Hiljem aga näidati, et mitmekihilised süvanärvivõrgud, näiteks süvaõpe, suutsid analüüsida mittelineaarseid mudeleid ja lahendada selliseid probleeme nagu ületreenimine, mis viis taas huvi tekkimiseni.
Tänapäeval on süvaõppest saanud üks kiiremini kasvavaid valdkondi, kus riistvara ja suurandmete valdkonnas on toimunud märkimisväärsed edusammud. See on viinud innovatsioonini mitmesugustes rakendustes, sealhulgas isejuhtivate autode, kõnetuvastuse, pildituvastuse ja muu valdkonnas. Näiteks kasutavad isejuhtivad autod süvaõpet, et analüüsida teeolusid reaalajas ja määrata kindlaks ohutud sõidumarsruudid. Kõnetuvastustehnoloogia kasutab süvaõpet ka inimkõne täpsemaks äratundmiseks ja mõistmiseks. Need tehnoloogiad muudavad meie igapäevaelu ja nende mõju eeldatavasti kasvab tulevikus veelgi.
Deep Mindi Deep Q võrgustik
Deep Mind, mida enamik meist tuntakse paremini kui AlphaGo, kasutab oma tehisintellektis algoritmi nimega Deep Q Network (DQN). DQN on sügavate närvivõrkude ja tugevdusõppe kombinatsioon. Tugevdusõppe teooria sarnaneb majandusteaduse kasulikkuse teooriaga, mis väidab, et ratsionaalne käitumine on iga objekti kasulikkuse arvutamine ja kõrgeima kasulikkuse väärtusega objekti valimine. Kui aga käitumine õppimise tulemusena muutub, tähendab see, et kasulikkuse väärtused muutuvad. Tugevdusõppe teooria on teooria, mis selgitab, kuidas kasulikkuse väärtused kogemusega muutuvad. See lihtsalt muudab terminoloogiat kasulikkusest väärtusfunktsiooniks.
DQN-i ilu seisneb selles, et see suudab hakkama saada väga lihtsa teabega ning toimib hästi enamikes võistluslikes või keerulistes ülesannetes. Deep Mind demonstreeris seda, rakendades seda Atari 2600-l mängitud klassikalistes mängudes: plokke murdvate mängude puhul oli ainsaks antavaks teabeks skoor ja ekraan. Alguses polnud masin mängus eriti hea, kuid see hakkas saama üha paremaid tulemusi ja lõpuks õppis ise paremaid tulemusi saama.
Süvaõppe tulevik ja meie roll
Siiani oleme käsitlenud süvaõppe ajalugu, selle teoreetilisi aluseid ja Deep Mindi Deep Q võrgustikku. Asjaolu, et sellesse on lihtsam andmeid sisestada kui ühtegi teist masinõpet minevikus ja ikkagi suurepäraseid tulemusi anda, teebki süvaõppe praegu nii põnevaks. Mõned inimesed näevad süvaõppes potentsiaali „tugeva tehisintellekti“ tekkeks, mis on samm edasi praeguse tehisintellekti tasemega võrreldes ja ületab inimesi kõiges. Tegelikult on see mõnes valdkonnas inimesi juba edestanud.
Tehisintellekti ajastu pole enam kaugel. Sellises olukorras on olulisem kui kunagi varem tehisintellekti kohta rohkem teada saada ja endalt küsida, mida sel ajastul teha. Kuna tehisintellekt mõjutab meie igapäevaelu ja tööstusharusid kõikjal, peame sammu pidama tehnoloogia arenguga, aga mõtlema ka sügavalt tekkivatele eetilistele ja sotsiaalsetele küsimustele. Näiteks on mure, et tehisintellekti areng võib kaasa tuua töökohtade kaotuse. Meie ees seisab väljakutse välja mõelda, kuidas sellega toime tulla ja leida viise tehisintellektiga koos eksisteerimiseks.