I dette blogginnlegget skal vi utforske årsakene til at vi ikke kan legge fra oss telefonene sent på kvelden, og hvilken innvirkning stordata har bak dette.
Du har nettopp kommet hjem fra en lang dag på jobb, og klokken er allerede elleve. Du har hatt en travel og hektisk dag, og både kropp og sinn er utmattet. Mens du setter heisen opp, gjentar du dagens hendelser. En rask samtale med sjefen min, en vits med en kollega og en rekke oppgaver som må gjøres. Rutinen er alltid den samme, men følelsene er alltid forskjellige. Du kommer hjem, åpner inngangsdøren og blir møtt av stillhet. Det er et øyeblikk av frihet og ensomhet som følger med å leve som enslig person uten familie.
Jeg tar en rask dusj og føler meg oppfrisket. Det varme vannet kjærtegner min slitne kropp og lindrer meg fra dagens tretthet. Etter dusjen nipper jeg til en kopp varm te og ser ut av vinduet. Det er allerede natt, og bylysene slukkes ett etter ett. Men tankene mine raser fortsatt. Jeg er glad for å være i seng og klar til å sove, men søvnen unnslipper meg. Jeg innser at det å sove nå er det klokeste valget for i morgen, men før jeg vet ordet av det, er hånden min på smarttelefonen. Skjermens glød lyser opp det mørklagte rommet, og den lille pausen på slutten av dagen begynner.
Jeg blar gjennom sosiale medier, og før jeg vet ordet av det, slår klokken 12. Jeg er fristet til å skrive et øyeblikk, for å dokumentere hva som skjedde med meg i løpet av dagen, men jeg motstår trangen av utmattelse. I stedet tenker jeg for meg selv: «Dette er det siste jeg skal se på!» og sjekker favorittkanalene mine på YouTube for å se om de har lastet opp noen videoer. Dessverre er det ingen i dag. Fortsatt skuffet sjekket jeg den personlige videolisten på YouTubes hovedside. Jeg sjekket den personlige videolisten på hovedsiden til YouTube og fant ut at det var videoer fra andre kanaler som lignet på de typene videoer jeg vanligvis ser på. Faktisk er det slik jeg oppdaget YouTube-kanalen jeg har sett på i det siste.
Men siden jeg ikke ser hver eneste video på YouTube, hvordan foreslår YouTube lignende videoer til meg? Er det bare basert på tittelen eller nøkkelordene til videoen jeg har sett før? Eller ligger det en mer kompleks algoritme bak? En av de nyeste teknologitrendene er stordataanalyse. Stordata refererer til data av en størrelse som overskrider grensene for behandlingsmetodene som tidligere ble brukt til å samle inn og administrere data. Generelt er det informasjon som sendes og mottas via ulike kanaler som internett, sosiale medier, GPS-informasjon, værinformasjon osv.
Stordataanalyse er prosessen med å analysere disse enorme datamengdene, alt fra titalls terabyte til petabyte. Men hvorfor er alle disse dataene viktige? Poenget med stordata er ikke bare å ha tonnevis av data. Det handler om å oppdage meningsfulle mønstre i dem og lage forutsigelser basert på dem. For eksempel kan bedrifter analysere kundeadferdsmønstre for å tilby personlige tjenester, og myndigheter kan identifisere trender i samfunnet generelt og bruke dem til å formulere politikk. Med andre ord er stordata i ferd med å bli mer enn bare en samling tall, men et kraftig verktøy for å forutsi fremtiden og løse problemer.
YouTubes personlige videofunksjon ovenfor er et eksempel på hvordan stordataanalyse kan brukes. Facebook tilbyr også personlige annonser, og Amazon.com analyserer kundenes kjøpshistorikk for å forstå deres smak og interesser. Stordata brukes ikke bare i næringslivet, men også i politikken. Under det amerikanske presidentvalget i 2008 brukte kandidat Barack Obama stordata for å vinne valget. Barack Obama klarte å vinne valget ved å undersøke ikke bare den grunnleggende demografien til velgerne, men også informasjon knyttet til personlige preferanser som tidligere stemmeatferd og magasinabonnementer. Andre bruksområder inkluderer DNA-analyse innen bioteknologi, datadrevet forretningsstyring og analyse av værinformasjon.
Så hvordan analyserer vi så store mengder data? De fleste stordataanalyseteknikkene anvender metodene som brukes innen statistikk og databehandling, men ettersom antallet ustrukturerte data har økt på grunn av den nylige aktiveringen av sosiale nettverk, brukes hovedsakelig teknikker som tekstutvinning, meningsutvinning og analyse av sosiale nettverk.
Tekstutvinning er en teknikk som utvinner ønsket informasjon ved å behandle ustrukturerte skriftlige data, og er basert på teknologi for naturlig språkbehandling. Den generelle prosessen med tekstutvinning involverer følgende trinn: tekstforbehandling, semantisk informasjonskonvertering, semantisk informasjonsutvinning, mønster- og trendanalyse, samt informasjonsrepresentasjon og -evaluering. I tekstforbehandlingsfasen deles teksten inn i ord eller setninger og behandles for videre behandling. Fasen for semantisk informasjonskonvertering skiller meningsfulle data fra de forhåndsbehandlede dataene. Den komplekse semantiske informasjonen forenkles i fasen for semantisk informasjonsutvinning. Etter analyse i mønster- og trendanalysefasen tegnes resultatene av analysen og evalueres ved hjelp av visualiseringsverktøy i fasen for informasjonsrepresentasjon og -evaluering. Denne informasjonen brukes til å klassifisere eller oppsummere dokumenter.
Meningsutvinning er en type tekstutvinning som brukes til å analysere nylige innlegg på sosiale medier for å avgjøre om det er en positiv eller negativ preferanse for et bestemt emne. For eksempel skrives «Jeg liker designet til MacBooken veldig godt» på sosiale medier. I dette tilfellet er evalueringsobjektet «MacBook» og målet er «Jeg liker designet veldig godt», så det analyseres som en positiv evaluering. I dette tilfellet gis en numerisk vurdering til hvert ord som uttrykker følelser, og deretter kategoriseres vurderingen i henhold til poengsummen.
Analyse av sosiale nettverk er en teknikk som analyserer forbindelsene mellom individer eller grupper på sosiale nettverk og styrken på disse forbindelsene. Hvis du tenker på individer eller grupper som noder og forbindelsene mellom dem som lenker, er forbindelsene mellom individer eller grupper på sosiale nettverk representert som en graf. I denne grafen bestemmes viktigheten av en node ved å se på hvor mange andre noder den er direkte koblet til.
I 2020 avslørte Facebook at de behandler mer enn 4 petabyte med data per dag, og YouTube laster opp 50 år med video på én dag. Og IBM estimerte mengden data verden produserer hver dag til 2.3 billioner gigabyte. Det er som et stort datasmell, med en overveldende mengde data som skapes hver dag. Teknikker for stordataanalyse er nyttige verktøy som hjelper oss med å finne juvelene som er skjult i dataene.