Kaip toli pažengė gilus mokymasis ir „AlphaGo“? Tiriame stiprios AI galimybes ir ateitį bei svarstome būsimus iššūkius.
Gilus mokymasis ir AlphaGo: dirbtinio intelekto evoliucija
2016 m. kovo mėn. Jei negyvenate vidury niekur, atskirtas nuo viso pasaulio, tikriausiai bent kartą esate girdėję apie AlphaGo ir dirbtinį intelektą. Tikriausiai jas peržiūrėjote ir susimąstėte, dėl ko čia tas triukšmas, ir girdėjote terminus gilus mokymasis ir mašininis mokymasis. Tačiau kiek iš mūsų bent šiek tiek apie juos žino? Daugelis iš mūsų žino kelių žodžių pavadinimus, pvz., didieji duomenys, bet ne daugiau. Šiame straipsnyje apžvelgsime „gilaus mokymosi“ – vienos iš karščiausių dirbtinio intelekto temų šiuo metu – istoriją ir techninius teorinius pagrindus ir trumpai pakalbėsime apie „Deep Q Network“ – AlphaGo slypinčių protų protą.
Gilaus mokymosi apžvalga ir istorija
Prieš kalbėdami apie gilųjį mokymąsi, pakalbėkime apie „mokymąsi“: mašininį mokymąsi. Pasak amerikiečių kompiuterių mokslininko Tomo M. Mitchello, mašininį mokymąsi galima apibrėžti kaip „patirties panaudojimą atliekant užduotį, siekiant pagerinti tos užduoties atlikimą ar rezultatą“. Mašininio mokymosi tikslas – tobulėti naudojant pakartotinę patirtį. Kaip žmonėms tobulėja mokymasis, mašininis mokymasis sukurtas taip, kad imituotų tai, kaip žmonės „mokosi“.
Gilusis mokymasis yra mašininio mokymosi tipas, pagrįstas dirbtinio neuroninio tinklo technologija. Dirbtinis neuroninis tinklas yra dirbtinio intelekto srities modelis, imituojantis neuronų tinklą, susidedantį iš daugybės neuronų smegenyse, kurių kiekvienas siunčia ir priima signalus per sinapses, o gilusis mokymasis sukurtas naudojant kelis hierarchijos sluoksnius. dirbtinio neuroninio tinklo struktūra. Dėl šių sluoksnių gilusis mokymasis skiriasi nuo tradicinio mašininio mokymosi. Nors tradicinis mašininis mokymasis reikalauja iš anksto išgauti pagrindines funkcijas, kad būtų galima mokytis iš įvesties duomenų ir pasiekti norimą rezultatą, gilusis mokymasis gali veikti naudojant labai pagrindinius duomenis (pvz., vaizdo pikselius), kad būtų gauta išvestis neišskiriant funkcijų.
Giluminio mokymosi raida ir šiuolaikinė jo svarba
Gilaus mokymosi arba dirbtinių neuroninių tinklų koncepcija buvo aptarta daugiau nei prieš 30 metų. Paprastai manoma, kad tai prasidėjo nuo šeštojo dešimtmečio vidurio Franko Rosenblatto „Perceptron“, kuris buvo vieno sluoksnio neuroninis tinklas, kuris veikė tiesiniams modeliams, bet ne tiesiniams modeliams, o to meto aparatinė įranga negalėjo neatsilikti nuo skaičiavimų. Tačiau vėliau buvo įrodyta, kad gilieji neuroniniai tinklai su keliais sluoksniais, pavyzdžiui, gilus mokymasis, gali analizuoti netiesinius modelius ir išspręsti tokias problemas kaip persitreniravimas, o tai paskatino susidomėjimo atgimimą.
Šiuolaikinėje eroje gilus mokymasis tapo viena iš sparčiausiai augančių sričių, kurioje padaryta didelė aparatinės įrangos ir didelių duomenų pažanga. Tai paskatino naujoves įvairiose programose, įskaitant savarankiškai važiuojančius automobilius, kalbos atpažinimą, vaizdo atpažinimą ir kt. Pavyzdžiui, savarankiškai važiuojantys automobiliai naudoja gilų mokymąsi, kad realiuoju laiku analizuotų kelio sąlygas, kad nustatytų saugų važiavimo maršrutus. Kalbos atpažinimo technologija taip pat naudoja gilųjį mokymąsi, kad būtų galima tiksliau atpažinti ir suprasti žmogaus kalbą. Šios technologijos keičia mūsų kasdienį gyvenimą ir tikimasi, kad jų poveikis ateityje didės.
Deep Mind's Deep Q tinklas
Deep Mind, daugumai mūsų geriau žinomas kaip AlphaGo, savo dirbtiniame intelekte naudoja algoritmą, vadinamą Deep Q Network (DQN). DQN yra giliųjų neuroninių tinklų ir sustiprinimo mokymosi derinys. Mokymosi pastiprinimo teorija yra panaši į naudingumo teoriją ekonomikoje, kuri teigia, kad racionalus elgesys yra apskaičiuoti kiekvieno objekto naudingumą ir pasirinkti tą, kurio naudingumo vertė yra didžiausia. Tačiau kai elgesys pasikeičia dėl mokymosi, tai reiškia, kad keičiasi naudingumo vertybės. Sustiprinimo mokymosi teorija yra teorija, kuri paaiškina, kaip naudingumo vertybės keičiasi kartu su patirtimi. Tai tiesiog pakeičia terminologiją iš naudingumo į vertės funkciją.
DQN grožis yra tas, kad jis gali veikti naudojant labai paprastą informaciją ir puikiai atlieka daugumą konkurencinių ar sudėtingų užduočių. „Deep Mind“ tai pademonstravo taikydamas klasikiniams žaidimams „Atari 2600“: bloko laužymo žaidimo atveju vienintelė pateikta informacija buvo rezultatas ir ekranas. Iš pradžių mašina nebuvo labai gera žaidime, tačiau ji pradėjo gauti vis geresnius rezultatus ir galiausiai išmoko pati gauti geresnių rezultatų.
Gilaus mokymosi ateitis ir mūsų vaidmuo
Iki šiol apžvelgėme gilaus mokymosi istoriją, jo teorinius pagrindus ir Deep Mind's Deep Q tinklą. Tai, kad į jį lengviau įvesti duomenis nei į bet kurį kitą mašininį mokymąsi praeityje ir vis dar duoda puikių rezultatų, dabar gilų mokymąsi daro tokį įdomų. Kai kurie žmonės giluminiame mokyme mato „stipraus dirbtinio intelekto“ potencialą, kuris yra žingsnis į priekį nuo dabartinės dirbtinio intelekto būklės ir viskuo pranoksta žmones. Tiesą sakant, kai kuriose srityse jis jau pranoko žmones.
AI era jau ne už kalnų. Šiuo metu kaip niekad svarbu sužinoti apie AI ir paklausti savęs, ką turėtumėte daryti šioje eroje. Kadangi dirbtinis intelektas daro įtaką mūsų kasdieniam gyvenimui ir pramonei visame pasaulyje, turime neatsilikti nuo technologijų pažangos, bet taip pat giliai galvoti apie iškylančias etines ir socialines problemas. Pavyzdžiui, nerimaujama, kad dirbtinio intelekto pažanga gali lemti darbo vietų praradimą. Iššūkis mums bus išsiaiškinti, kaip su tuo susidoroti ir rasti būdų, kaip sugyventi su AI.