Vil maskiner som forstår og kommuniserer følelser slik som AI-en i filmen Her noen gang bli virkelighet? Vi utforsker fremskrittene og mulighetene for maskinlæring.
OS og maskinlæring i filmen Her
I filmen Her finnes det et operativsystem (OS) med stemmen til Amanda Seyfried. Operativsystemet fungerer som om det har følelser, lagrer ord-for-ord-transkripsjoner av samtaler med en person og analyserer dem for å trekke ut hobbyene, smaken og egenskapene hans/hennes. Dette fører til interessante samtaleemner og empati, og mange mennesker, inkludert hovedpersonen Theodore, forelsker seg i operativsystemet. Du tenker kanskje at dette datamaskinoperativsystemet er noe tatt ut av en science fiction-film. Dette er fordi maskinen lærer som et menneske gjennom samtaler og mye erfaring, og tar nye handlinger basert på det. Men disse læringsmaskinene er allerede rundt oss. Teorien bak disse maskinene er samlet kjent som maskinlæring.
Hva er maskinlæring?
Maskinlæring er akkurat hva det høres ut som: maskiner som lærer å lære seg selv, nærmere bestemt ved å analysere og lære fra ulike typer data de har tilegnet seg på en eller annen måte, og deretter gi et matematisk grunnlag som kan brukes på nye typer data. Nøkkelen til dette er at du ikke trenger å programmere en datamaskin eksplisitt til å lære, du må bare gi den input. Hvis du for eksempel lærer en datamaskin å gjenkjenne et bilde av et eple, vil den gjenkjenne at det er et eple hvis du viser den et bilde av et eple som er forskjellig fra det forrige, selv om du ikke spesifiserer egenskapene til et eple.
Maskinlæring kan deles inn i to hovedkategorier basert på hvordan den lærer. Den ene er overvåket læring, der resultatet (eller etiketten) for dataene som trenes er kjent. Når du for eksempel legger ut et bilde på Facebook, gjenkjenner den automatisk ansiktet ditt og viser det som en firkant. Dette gjøres ved å lære hvilke bilder som er ansikter og hvilke bilder som ikke er ansikter. Med andre ord, hvis dataene er en bildefil som består av RGB-verdier av piksler, er resultatet om det er et ansikt eller ikke.
På den annen side innebærer en annen metode for maskinlæring, kalt uovervåket læring, å mate et bilde inn i en maskin og la den kjøre uten å spesifisere hvordan det skal klassifiseres. I ansiktsgjenkjenningsprogrammet ovenfor kan maskinen finne trekk i bildet og skille mellom et menneske eller en katt, til tross for at den ikke får beskjed om hva den skal gjøre med bildet, dvs. om det er et ansikt eller noe annet. Et annet eksempel er et nyhetskategoriseringsprogram på en portalside. Hvis du ser på nyhetsartikler på en portalside, kan du legge merke til at de er kategorisert i forskjellige områder, for eksempel politikk, liv, underholdning og så videre, og at lignende nyheter grupperes sammen og anbefales. For å gjøre dette spesifiserer ikke portalsideadministratoren til læringsmaskinen hvilke artikler som er relatert til politikk, hvilke som er relatert til underholdning, hvilke som er relatert til sport og så videre, men når et stort antall artikler av forskjellige typer mates inn i læringsmaskinen, analyserer den ordfrekvensen i artiklene på egenhånd og klassifiserer nye artikler med høy nøyaktighet.
Veiledede læringsmetoder
Læringsmetoden som for tiden brukes for mesteparten av maskinlæringen er veiledet læring. Den står for omtrent 95 % av alle lærende maskiner. En grunn til dette er at den krever mindre treningsdata for å oppnå et visst ytelsesnivå enn en autonom læringsmetode, siden et menneske direkte spesifiserer resultatene på dataene. Dette er fordi autonome læringsmetoder trenger mer data for å finne egenskapene i disse dataene som kan skille mellom objekter på egenhånd – for eksempel mellom et menneske og en katt, mellom en politisk artikkel og en underholdningsartikkel. Veiledede læringsmetoder kan derimot fungere bra med relativt små mengder data fordi de styres av mennesker, noe som reduserer tiden det tar å samle inn dataene og tiden det tar å kjøre selve treningen.
Veiledet læring har imidlertid en stor ulempe: den kan ikke lære om ting som ikke er lært den av mennesker, og ytelsen kan synke dramatisk i miljøer som er litt forskjellige fra de som er lært den av mennesker. For eksempel kan en maskin som er trent på et bilde av en person i et lyst miljø, ikke gjenkjenne personen i ujevn belysning eller svakt lys, eller den gjenkjenner kanskje ikke siden av en person når bare forsiden av ansiktet sendes inn.
Autonome læringsmetoder
Selvlæringsmetoder kan håndtere manglene og begrensningene ved veiledet læring. Denne læringsmetoden nådde imidlertid sine grenser for flere tiår siden. Dataene som kreves var for store, beregningskompleksiteten var for høy, maskinvaren var ikke i stand til å håndtere det, og det var for tidkrevende til å være praktisk. I de senere årene har imidlertid selvlæringsmetoder fått fornyet oppmerksomhet fordi maskinvarens generelle ytelse har blitt forbedret, inkludert økt minne- og CPU-ytelse, og det har blitt mye enklere å samle inn, lagre og dele data hvor som helst via mobil tilkobling, inkludert skybaserte datamaskiner.
Midt i disse endringene leder en gren av selvlæring kalt «dyp læring» an. Dyp læring er en læringsmetode som har en lignende struktur som den menneskelige hjernen. Den menneskelige hjernen har nevroner som forbinder hver del av hjernen, og det er kjent at etter hvert som vi lærer, blir nettverket av forbindelser mellom delene sterkere og oftere brukt. Dette er inspirasjonen til dyp læring, som i likhet med nevroner har en forbindelsesstruktur mellom hver læringsdel, og denne strukturen endrer seg stadig etter hvert som ytterligere treningsdata kommer inn, noe som skaper tilbakemeldinger mellom læringsdelene. Derfor kan den resirkulere tidligere læring og tilpasse seg nye miljøer basert på den.
Maskinlæringens nåtid og fremtid
Både autonome og veiledede læringsmetoder brukes for tiden til forskjellige formål. Veiledet læring brukes til rask utvikling som bare trenger å brukes i et spesifikt miljø, mens autonom læring brukes i felt som krever maskiner som kan brukes i en rekke miljøer. Én ting er imidlertid klart: det foregår mye forskning i begge retninger.
I det siste har mange globale selskaper, inkludert Facebook og Google, investert mye energi i utviklingen av maskinlæring. Facebook jobber hardt med å utvikle ansiktsgjenkjenningsmaskiner ved hjelp av veiledede læringsmetoder, og Google kjøpte nylig opp et risikokapitalselskap ledet av dyp læringseksperter kalt DeepMind for rundt 440 milliarder won. Det faktum at selskapet bare var tre år gammelt og ikke hadde solgt et eneste produkt, viser hvor mye Google investerer i maskinlæring. For øyeblikket er maskinlæring bare i stand til å gjenkjenne objekter, så det er langt unna å kunne ha samtaler med mennesker med følelser, slik som operativsystemet i filmen Her. Den raske utviklingen i det siste tyder imidlertid på at dagen for å snakke med Her ikke er langt unna.
Mulighetene for maskinlæring er uendelige. Innen helsevesenet utvikles AI-systemer for å hjelpe med å diagnostisere og behandle pasienter, og innen finans introduseres systemer for å forutsi markedssvingninger og ta investeringsbeslutninger. Teknologiene som gjør livene våre enklere, som selvkjørende biler, smarthus og stemmeassistenter, blir også mer sofistikerte og intelligente etter hvert som maskinlæringen utvikler seg. Vi lever i en tid der maskinlæring er i stadig utvikling, og dens fremtidige fremskritt er utenkelige.
Derfor er maskinlæring ikke bare en teknologi som behandler og analyserer data, men forventes å berike menneskelivet og bidra til å løse ulike problemer. Maskiner som kan få følelsesmessige forbindelser med mennesker, som i filmen «Her», kan virke som noe fra en fjern fremtid, men muligheten blir mer og mer reell. Maskinlæring er allerede dypt forankret i vårt daglige liv, og fremtidig utvikling vil bringe oss flere overraskelser og innovasjoner.