Hvordan data mining avslørte en sammenheng mellom bleier og ølsalg og hvordan man kan øke salget

I dette blogginnlegget viser vi deg hvordan du bruker data mining for å identifisere en sammenheng mellom bleier og ølsalg og hvordan du kan bruke det til å øke salget.

 

Du er butikksjef for Store A i L-Mart, et stort supermarked. En konkurrent, H-Mart, har nylig åpnet i nærheten, og du er bekymret for at butikkens salg har falt betydelig. Du bestemmer deg for å be om hjelp fra hovedkvarteret. En ansatt fra hovedkontoret viser deg rundt i butikken og ber deg sende ham tre måneders salgshistorikk. Noen dager senere gir den ansatte deg et stykke papir med instruksjoner for å endre utformingen av hyllene dine. Hva? Øl ved siden av babybleier? Øl ved siden av bleier, som verken er vev eller babyleker, gir ingen sunn fornuft. Men du er for sjenert til å klage til hovedkvarteret, så du bestemmer deg for å omorganisere varene som anvist. En måned senere sjekker du salget ditt og innser at ølsalget har økt dramatisk.
Dette er ikke en fiksjonalisert versjon av en virkelighetshistorie. Tidligere analyserte Walmart i USA data og fant ut at bleier og ølsalg var korrelert, noe som betyr at barnefedre ofte kjøpte øl når de kjøpte bleier. Dette kunne de utnytte ved å legge bleier og øl sammen, noe som resulterte i en betydelig økning i ølsalget.
La oss gå tilbake til eksemplet med Store A. Hvordan fant hovedkvarterets ansatte denne sammenhengen? Svaret er data mining. Data mining er prosessen med å trekke ut verdifull informasjon fra store mengder data ved å identifisere forbindelser, likheter, mønstre og så videre. Dataene vi akkumulerer hver dag er bare en haug med tall alene, og den må "behandles" for å gjøre den verdifull. En håndgripelig analogi for dette er "søppelkunst". Søppelkunst er når du lager kunst av søppel eller søppel. Vakre og fantastiske kunstverk er laget av hauger med avfallsdekk, sigarettsneiper, flaskekorker og annet søppel som folk flest ikke en gang ville se på. Søppelkunstnere sorterer og kombinerer disse elementene for å oppnå fargen, teksturen og glansen de leter etter, og sluttresultatet er et kunstverk. På samme måte har mye data ingen verdi alene, men når det sorteres og kombineres med en eller annen intensjon, skaper det noe verdifullt.
Det er fem hovedtyper av datautvinning: klassebeskrivelse og klassediskriminering, klyngeanalyse, assosiasjonsanalyse, uteliggeranalyse og sekvensiell mønsteranalyse. Når et sett med data som er gruppert sammen etter noen kriterier kalles en klasse, kalles det å finne egenskapene til de gitte dataelementene klassebeskrivelse, å finne de spesielle egenskapene som kan dele dataene i to grupper kalles stratifisering, klyngeanalyse brukes for å finne nye klasser, og assosiasjonsanalyse brukes til å finne koblinger mellom datagrupper. Å finne data som avviker betydelig fra gjennomsnittet kalles outlier-analyse, og å analysere atferdsmønstre over tid kalles sekvensiell mønsteranalyse.
Typen datautvinning som brukes i vårt eksempel er assosiasjonsanalyse. I assosiasjonsanalyse brukes tre mål for å bestemme graden av assosiasjon. Den første er 'støtte', som er prosentandelen av alle transaksjoner der to varer (A og B) handles sammen. Den andre er "Confidence", som er prosentandelen av totale transaksjoner av A som omsettes sammen. Den siste er "forbedring", som er prosentandelen av A og B som ble handlet sammen (tillit) av prosentandelen av alle handler der B ble handlet. Hvis forbedringene har en verdi på 1, er de uavhengige av hverandre, og hvis de er større enn 1, er de positivt korrelert, og hvis de er mindre enn 1, er de negativt korrelerte. Først beregnes støtten for alle varer, og deretter beregnes tilliten for varer som har et visst støttenivå. Data miner bestemmer hva støttenivået skal være. Deretter beregner vi forbedringen for elementene som vi tror er noe relatert og finner ut hvordan de er korrelert. Slik fant vi ut at bleier og øl er relatert og positivt korrelert.
Selv om vi bare har diskutert hvordan datautvinning kan brukes i markedsføring, kan det brukes på et bredt spekter av felt. I finans brukes det til kredittscoring, oppdagelse av kredittkortsvindel og aksjekursprediksjon; innen telekommunikasjon brukes den til forebygging av kundefragang, gjenkjenning av karakter og mønster og sikkerhetsstyring; i helsevesenet brukes det til sykdomsdiagnose og genetisk analyse; innen energi brukes det til prognoser for etterspørsel etter strøm og ressursutforskning; og i produksjon brukes den til utvikling av nye produkter/nye tjenester, defektprediksjon, fabrikkautomatisering, lager- og etterspørselsstyring. I tillegg kan det brukes som en måte å forstå tidligere eller nåværende situasjon eller forutsi fremtiden fra gitte data.
I dag er big data i raseri rundt om i verden. Med den allestedsnærværende bruken av IT-enheter genereres data konstant. I følge en statistikk ble rundt 120 ZB (Zettabyte) med data produsert og konsumert over hele verden i 2024 alene. Data mining er avgjørende for å gjøre disse dataene nyttige i stedet for å bli kastet, og ettersom det internettbaserte bomiljøet forventes å utvikle seg videre i fremtiden, forventes viktigheten av data mining å vokse enda mer.
Data mining kan brukes ikke bare til å øke salget, men også til å identifisere kundenes kjøpsmønstre, gjennomføre tilpasset markedsføring, forbedre lagerstyringseffektiviteten og utvikle ulike strategier for å maksimere kundetilfredsheten. Data er råoljen i den moderne verden, og hvor godt du utvinner og behandler det kan gjøre eller ødelegge virksomheten din, og det er derfor det er så viktig å erkjenne viktigheten av datautvinning og dra nytte av det.

 

Om forfatteren

Forfatter

Jeg er en «kattedetektiv» og hjelper til med å gjenforene bortkomne katter med familiene deres.
Jeg lader opp med en kopp café latte, liker å gå turer og reise, og utvider tankene mine gjennom skriving. Ved å observere verden nøye og følge min intellektuelle nysgjerrighet som bloggskribent, håper jeg at ordene mine kan gi hjelp og trøst til andre.