Tässä blogikirjoituksessa näytämme sinulle, kuinka tiedon louhintaa käytetään tunnistamaan vaippojen ja olutmyynnin välinen korrelaatio ja kuinka voit käyttää sitä myynnin lisäämiseen.
Olet suuren L-Martin myymälän A myymäläpäällikkö. Kilpailija H-Mart on hiljattain avannut lähistölle, ja olet huolissasi siitä, että myymäläsi myynti on laskenut merkittävästi. Päätät pyytää apua päämajasta. Pääkonttorin työntekijä esittelee sinulle myymälää ja pyytää sinua lähettämään hänelle kolmen kuukauden myyntihistorian. Muutamaa päivää myöhemmin työntekijä antaa sinulle paperin, jossa on ohjeet hyllyjen asettelun muuttamiseksi. Mitä? Olut vauvan vaippojen vieressä? Olut vaippojen vieressä, jotka eivät ole nenäliinoja tai vauvan leluja, ei ole järkevää. Mutta olet liian arka valittamaan päämajaan, joten päätät järjestää asiat uudelleen ohjeiden mukaan. Kuukautta myöhemmin tarkistat myyntisi ja huomaat, että oluen myynti on kasvanut dramaattisesti.
Tämä ei ole fiktiivinen versio tosielämän tarinasta. Aiemmin yhdysvaltalainen Walmart analysoi tietoja ja havaitsi, että vaipojen ja oluen myynti korreloi, mikä tarkoittaa, että lasten isät ostivat usein olutta ostaessaan vaippoja. He pystyivät hyödyntämään tätä asettamalla vaipat ja oluen yhteen, mikä johti oluen myynnin merkittävään kasvuun.
Palataan myymälän A esimerkkiin. Miten päämajan henkilökunta havaitsi tämän korrelaation? Vastaus on tiedon louhinta. Tiedonlouhinta on prosessi, jolla poimitaan arvokasta tietoa suurista tietomääristä tunnistamalla yhteyksiä, yhtäläisyyksiä, kuvioita ja niin edelleen. Päivittäin keräämämme data on vain kasa numeroita, ja se on "käsiteltävä", jotta siitä tulee arvokasta. Konkreettinen analogia tälle on "roskataide". Roskakoritaide on sitä, kun teet taidetta roskista tai roskista. Kauniita ja upeita taideteoksia syntyy kasoista jäterenkaita, tupakantumppeja, pullonkorkkeja ja muuta roskaa, jota useimmat eivät edes katsoisi. Roskataiteilijat lajittelevat ja yhdistävät nämä esineet saavuttaakseen haluamansa värin, rakenteen ja kiillon, ja lopputuloksena on taideteos. Samoin suurella osalla datasta ei ole arvoa sellaisenaan, mutta kun se lajitellaan ja yhdistetään jollain tarkoituksella, se luo jotain arvokasta.
Tiedonlouhintaa on viisi päätyyppiä: luokkakuvaus ja luokkaerottelu, klusterianalyysi, assosiaatioanalyysi, outlier-analyysi ja peräkkäinen kuvioanalyysi. Kun tietyillä kriteereillä ryhmiteltyä datajoukkoa kutsutaan luokaksi, annettujen tietokohteiden ominaisuuksien löytämistä kutsutaan luokkakuvaukseksi, erityisominaisuuksien löytämistä, jotka voivat jakaa tiedot kahteen ryhmään, kutsutaan kerrostukseksi, käytetään klusterianalyysiä. löytää uusia luokkia, ja assosiaatioanalyysiä käytetään linkkien etsimiseen tietoryhmien välillä. Keskiarvosta merkittävästi poikkeavien tietojen löytämistä kutsutaan outlier-analyysiksi, ja käyttäytymismallien analysointia ajan mittaan kutsutaan peräkkäismallianalyysiksi.
Esimerkissämme käytetty tiedon louhintatyyppi on assosiaatioanalyysi. Assosiaatioanalyysissä käytetään kolmea mittaa assosiaatioasteen määrittämiseen. Ensimmäinen on "tuki", joka on prosenttiosuus kaikista transaktioista, joissa kahdella erällä (A ja B) käydään kauppaa yhdessä. Toinen on "luottamus", joka on prosenttiosuus kaikista A:n liiketoimista, joilla käydään kauppaa yhdessä. Viimeinen on "parannus", joka on A:n ja B:n prosenttiosuus (luottamus) kaikista kaupoista, joissa B:llä vaihdettiin. Jos parannusten arvo on 1, ne ovat toisistaan riippumattomia, ja jos ne ovat suurempia kuin 1, ne korreloivat positiivisesti, ja jos ne ovat pienempiä kuin 1, ne korreloivat negatiivisesti. Ensin lasketaan tuki kaikille kohteille ja sitten luotettavuus kohteille, joilla on tietty tukitaso. Tietojen kaivosmies päättää, mikä tukitaso on. Sitten laskemme niiden kohteiden parannuksen, joiden uskomme liittyvän jonkin verran toisiinsa, ja selvitämme, miten ne korreloivat. Näin huomasimme, että vaipat ja olut liittyvät toisiinsa ja korreloivat positiivisesti.
Vaikka olemme vain keskustelleet siitä, kuinka tiedonlouhintaa voidaan käyttää markkinoinnissa, sitä voidaan käyttää monilla aloilla. Rahoitusalalla sitä käytetään luottopisteytykseen, luottokorttipetosten havaitsemiseen ja osakekurssien ennustamiseen; televiestinnässä sitä käytetään asiakkaiden vaihtuvuuden estämiseen, hahmojen ja kuvioiden tunnistamiseen sekä turvallisuuden hallintaan; terveydenhuollossa sitä käytetään sairauksien diagnosointiin ja geneettiseen analyysiin; energiassa sitä käytetään sähkön kysynnän ennustamiseen ja resurssien etsimiseen; ja valmistuksessa sitä käytetään uuden tuotteen/uuden palvelun kehittämiseen, vikojen ennustamiseen, tehdasautomaatioon, varaston ja kysynnän hallintaan. Lisäksi sitä voidaan käyttää tapana ymmärtää mennyttä tai nykyistä tilannetta tai ennustaa tulevaa annetuista tiedoista.
Big data on nykyään muotia ympäri maailmaa. IT-laitteiden arjen käytön myötä dataa syntyy jatkuvasti. Erään tilaston mukaan pelkästään vuonna 120 tuotettiin ja kulutettiin maailmanlaajuisesti noin 2024 ZB (Zettabyyttiä) dataa. Tiedonlouhinta on olennaista, jotta tästä tiedosta olisi hyötyä sen sijaan, että se heitettäisi pois, ja kun Internet-pohjaisen elinympäristön odotetaan kehittyvän edelleen tulevaisuudessa, tiedon louhinnan merkityksen odotetaan kasvavan entisestään.
Tiedonlouhintaa voidaan käyttää paitsi lisäämään myyntiä, myös tunnistamaan asiakkaiden ostotottumuksia, toteuttamaan räätälöityä markkinointia, parantamaan varastonhallinnan tehokkuutta ja kehittämään erilaisia strategioita asiakastyytyväisyyden maksimoimiseksi. Data on nykymaailman raakaöljy, ja se, kuinka hyvin louhit ja käsittelet sitä, voi tehdä tai rikkoa yrityksesi, minkä vuoksi on niin tärkeää tunnustaa tiedon louhinnan merkitys ja hyödyntää sitä.