Stordata gjør livene våre enklere, men det øker også risikoen for brudd på personopplysninger. Er vi trygge?
Er det tilfeldighet? Er det timingmarkedsføring?
«○○Åh, du kommer til å bli forsinket til timen. Skynd deg og kom deg på skolen!»
«Ja, jeg vil være der, jeg vil være der, jeg er på vei.»
Morgenene for studenter er ikke avslappende. Hver morgen, uansett hvor travel jeg er, er det ett trinn jeg aldri hopper over: å sminke meg! Etter å ha renset ansiktet med en god rensemiddel, rister jeg huden. Noen få dråper kommer ut, men så stopper det. Mangelen på hud gjør ansiktet hennes tørt og rødt. Mens hun skynder seg ut av huset, mottar hun en tekstmelding fra ㅇㅇCosmetics, et selskap hun har handlet fra flere ganger før.
Spesialsalg kun for medlemmer, 30 % rabatt på hudprodukter, kun i to dager, ikke gå glipp av denne muligheten~!
Et smil brer seg over ansiktet til ○○. «Wow, det er flott. Et salg akkurat når jeg trenger det, woohoo.» Innen tre minutter etter at hun mottok tekstmeldingen, bestilte og betalte hun for huden på smarttelefonen sin. Er det virkelig en tilfeldighet at ○○, som trengte hud, mottok en reklametekst fra et kosmetikkselskap?
I det 21. århundre ligger det penger i data
Noen har karakterisert den moderne verden som dataflommens tidsalder. Dette er fordi vi genererer en enorm mengde data i samfunnet vi lever i. Et område som har fått oppmerksomhet de siste årene er stordatafeltet. Stordata refererer til enorme mengder data som er vanskelige å samle inn, lagre, hente og analysere ved hjelp av konvensjonelle metoder fordi mengden, hyppigheten og formatet for datagenerering er for stor sammenlignet med konvensjonelle data.
I eksemplet ovenfor, anta at det ikke er en tilfeldighet at reklameteksten kom da huden falt av, men en strategisk markedsføring av selskapet ved bruk av stordata. Hvilken passasje kan være et sterkt bevis for å støtte dette? Svaret er uttrykket «kjøpt et par ganger». Hvis en forbruker kjøper et hud og deretter kjøper det på nytt med noen få gangers mellomrom, kan selskapet analysere forbrukerens forbruksmønstre med denne kjøpsinformasjonen. Disse dataene kan brukes til å analysere forbrukerens forbruksmønstre, og når det er på tide for forbrukeren å kjøpe produktet på nytt, kan selskapet kjøre ulike reklameaktiviteter.
Dette er ikke noe som kommer til å skje i fremtiden, det er noe som skjer rundt oss akkurat nå. Faktisk har kreditt- og lojalitetskortselskaper svært nøyaktig informasjon om kundenes forbruksmønstre gjennom kortbrukshistorikken sin. De bruker ikke bare denne informasjonen til å analysere kortinnehavernes forbruksmønstre, men de selger den også til ulike produsenter som verdifull markedsføringsinformasjon. Det er ikke bare økonomisk informasjon som registreres. Sosiale medier, nettportalhistorikk, medisinske journaler, GPS-posisjonsdata og mye mer registreres uten vår viten.
Datautvinning: å finne de skjulte skattene i stordata
Men er all denne nesten uendelige mengden data meningsfull og verdifull? Svaret er nei. Ikke bare er det umulig å analysere all denne informasjonen, men det ville være ganske ineffektivt å analysere alt. Med andre ord, vi må bare velge ut det vi trenger, analysere det og bestemme verdien, og dette er feltet data mining.
«Mining» er et ord som betyr «utvinning», og data mining betyr «å utvinne data», så du kan tenke på det som et felt som kan øke effektiviteten av dataanalyse ved å velge kun de nødvendige dataene fra en enorm mengde data. Det krever avanserte statistiske analyse- og modelleringsteknikker som er svært krevende, og det er et studiefelt innen industriell ingeniørfag.
Datautvinning er fortsatt i en tidlig fase av utviklingen i Korea, men jeg er veldig optimistisk med tanke på fremtiden. Det er to grunner til dette: for det første, uten datautvinning ville dataanalyse vært betydelig mindre meningsfull og effektiv. Dette betyr at uten riktig datautvelgelse er det umulig å oppnå riktige analyseresultater. Den andre grunnen er at datautvinning er en nøkkelteknologi for kundehåndtering, som er et av de viktigste aspektene ved forretningsdrift i disse dager.
Stordata, allrounderen
Det er tydelig at stordata har vært et hett tema i det siste. Bruksområdene for stordataanalyse gjennom datautvinning er svært varierte. Et av de mest vellykkede eksemplene på stordataanalyse er Seoul Metropolitan Governments Owl Bus. Dette er en nattbussrute som ble etablert ved å analysere KTs samtalevolumdata, som registrerer innkommende og utgående posisjoner for innringere i løpet av sene nattetimer, og Seouls trafikkdata. Dette er et eksempel på svært nøyaktig dataanalyse for å finne den optimale ruten, noe som resulterer i høy brukertilfredshet.
Eksperter spår at stordata vil bli brukt i et mye bredere spekter av felt i fremtiden. En av de tidligste bruksområdene er personlig markedsføring. Dette betyr at målet for markedsføring vil endre seg fra hele forbrukerpopulasjonen eller en spesifikk gruppe til et individ, noe som er et paradigmeskifte i selve markedsføringen. Innen det medisinske feltet kan stordataanalyse brukes til å forutsi når en pasient vil bli syk eller til å behandle uhelbredelige sykdommer. Stordata forventes å bli utviklet og brukt i andre felt som landbruk, politikk og administrasjon. Noen forskere spår til og med at stordata kan brukes til å forutsi og overvinne naturkatastrofer, som tidligere ble antatt å være utenfor menneskelig kontroll.
De to ansiktene til stordata
Det er imidlertid også problemer med å bruke stordata, som blir behandlet som en «verdifull kropp» og får mye oppmerksomhet. Et av de viktigste og mest kontroversielle temaene er datalekkasje. En liten kategori av informasjonslekkasje er lekkasje av personlig informasjon. Det er veldig enkelt å finne ut personlig informasjon ved å kombinere stordata. Et enkelt eksempel på dette er at ved å statistisk analysere en persons internettsurfing, besøkte nettsteder og bruk av sosiale medier, er det mulig å finne ut ikke bare kjønnet deres, men også svært detaljert informasjon som graviditet eller LHBT-status. Dette er ikke bare en krenkelse av privatlivet, men har også potensial til å bli brukt til kriminelle formål.
Utover dette personlige nivået finnes det også potensial for nasjonale problemer, som lekkasje av statshemmeligheter eller militære hemmeligheter. Nå som vi står på terskelen til den såkalte «big data-æraen», må vi være forsiktige med å fokusere utelukkende på de kommersielle aspektene ved stordata. Hvis vi ignorerer bivirkningene som stordata kan medføre, er det bare et spørsmål om tid før samfunnet vårt lider av «big data-sykdom». Før vi bruker stordata for alvor, tror jeg det er moderne intelligente menneskers stolthet å utarbeide en plan for å forhindre bivirkningene av stordata.
Kombinere stordata og kunstig intelligens
Betydningen av stordata er knyttet til fremskritt innen kunstig intelligens (KI). KI kan lære av enorme mengder data for å løse komplekse problemer som mennesker ikke kan håndtere. Innen helsevesenet, for eksempel, revolusjonerer kombinasjonen av KI og stordata måten pasienter blir diagnostisert og behandlet på. KI-algoritmer kan analysere en pasients medisinske journaler, genetisk informasjon og livsstilsdata for å forutsi sannsynligheten for å utvikle en sykdom og foreslå personlige behandlinger.
Rollen til stordata og kunstig intelligens er også viktig innen autonome kjøretøy. Selvkjørende biler analyserer veiforhold, trafikksignaler og avstander mellom kjøretøy i sanntid for å sikre trygg og effektiv kjøring. Denne analysen ville ikke vært mulig uten kunstig intelligens-teknologi som kan behandle og lære av enorme mengder data. Kombinasjonen av stordata og kunstig intelligens åpner for nye muligheter på tvers av bransjer og vil ha en betydelig innvirkning på fremtidens teknologi.
Kombinasjonen av stordata og kunstig intelligens muliggjør nye innovasjoner vi aldri har forestilt oss, og som vil spille en enorm rolle i fremtidens sosiale endringer. Men med disse teknologiske fremskrittene følger etiske og sosiale spørsmål som må tas tak i. Å finne balansen mellom å bruke og beskytte data vil være en utfordring for oss alle, og vil hjelpe oss med å bygge et mer avansert samfunn.