In dit blogbericht laten we je zien hoe je data mining kunt gebruiken om een verband te vinden tussen luiers en bierverkoop en hoe je dit kunt gebruiken om de verkoop te verhogen.
U bent de filiaalmanager van winkel A van L-Mart, een grote supermarkt. Een concurrent, H-Mart, is onlangs in de buurt geopend en u maakt zich zorgen dat de verkoop van uw winkel aanzienlijk is gedaald. U besluit om hulp te vragen aan het hoofdkantoor. Een medewerker van het hoofdkantoor laat u de winkel zien en vraagt u om hem drie maanden aan verkoopgeschiedenis te sturen. Een paar dagen later geeft de medewerker u een stuk papier met instructies om de indeling van uw schappen te veranderen. Wat? Bier naast babyluiers? Bier naast luiers, wat noch zakdoekjes noch babyspeelgoed is, is niet logisch. Maar u bent te timide om bij het hoofdkantoor te klagen, dus besluit u de artikelen te herschikken zoals aangegeven. Een maand later controleert u uw verkoop en realiseert u zich dat, alsof het zo hoort, de bierverkoop dramatisch is gestegen.
Dit is geen fictieve versie van een waargebeurd verhaal. In het verleden analyseerde Walmart in de Verenigde Staten gegevens en ontdekte dat luiers en bierverkoop gecorreleerd waren, wat betekent dat vaders van kinderen vaak bier kochten als ze luiers kochten. Zij konden hiervan profiteren door luiers en bier bij elkaar te plaatsen, wat resulteerde in een aanzienlijke stijging van de bierverkoop.
Laten we teruggaan naar het voorbeeld van winkel A. Hoe vond het hoofdkantoorpersoneel deze correlatie? Het antwoord is data mining. Data mining is het proces van het extraheren van waardevolle informatie uit grote hoeveelheden data door verbindingen, overeenkomsten, patronen, enzovoort te identificeren. De data die we elke dag verzamelen is op zichzelf slechts een stapel getallen en moet worden "verwerkt" om het waardevol te maken. Een tastbare analogie hiervoor is 'junk art'. Junk art is wanneer je kunst maakt van rommel of afval. Prachtige en verbluffende kunstwerken worden gemaakt van stapels afgedankte banden, sigarettenpeuken, flessendoppen en ander afval waar de meeste mensen niet eens naar zouden kijken. Junk-kunstenaars sorteren en combineren deze items om de kleur, textuur en glans te bereiken die ze zoeken, en het eindresultaat is een kunstwerk. Op dezelfde manier heeft veel data op zichzelf geen waarde, maar wanneer het wordt gesorteerd en gecombineerd met een bepaalde intentie, creëert het iets waardevols.
Er zijn vijf hoofdtypen datamining: klassenbeschrijving en klassendiscriminatie, clusteranalyse, associatieanalyse, uitbijteranalyse en sequentiële patroonanalyse. Wanneer een set gegevens die op basis van bepaalde criteria is gegroepeerd, een klasse wordt genoemd, wordt het vinden van de kenmerken van de gegeven gegevensitems klassebeschrijving genoemd. Het vinden van de speciale kenmerken die de gegevens in twee groepen kunnen verdelen, wordt stratificatie genoemd, er wordt clusteranalyse gebruikt. om nieuwe klassen te vinden, en associatieanalyse wordt gebruikt om verbanden tussen gegevensgroepen te vinden. Het vinden van gegevens die aanzienlijk afwijken van het gemiddelde wordt uitbijteranalyse genoemd, en het analyseren van gedragspatronen in de loop van de tijd wordt sequentiële patroonanalyse genoemd.
Het type data mining dat in ons voorbeeld wordt gebruikt, is associatieanalyse. Bij associatieanalyse worden drie metingen gebruikt om de mate van associatie te bepalen. De eerste is 'support', wat het percentage is van alle transacties waarbij twee items (A en B) samen worden verhandeld. De tweede is 'Confidence', wat het percentage is van de totale transacties van A die samen worden verhandeld. De laatste is 'enhancement', wat het percentage is van A en B die samen worden verhandeld (confidence) van het percentage van alle transacties waarbij B werd verhandeld. Als de enhancements een waarde van 1 hebben, zijn ze onafhankelijk van elkaar, en als ze groter zijn dan 1, zijn ze positief gecorreleerd, en als ze kleiner zijn dan 1, zijn ze negatief gecorreleerd. Eerst wordt de support berekend voor alle items, en vervolgens wordt het confidence berekend voor items die een bepaald supportniveau hebben. De data miner beslist wat het supportniveau zou moeten zijn. Vervolgens berekenen we de enhancement voor de items waarvan we denken dat ze enigszins gerelateerd zijn en ontdekken we hoe ze gecorreleerd zijn. Zo ontdekten we dat luiers en bier met elkaar verbonden zijn en positief gecorreleerd zijn.
Hoewel we alleen hebben besproken hoe data mining kan worden gebruikt in marketing, kan het worden gebruikt in een breed scala aan velden. In de financiële wereld wordt het gebruikt voor kredietscores, detectie van creditcardfraude en voorspelling van aandelenkoersen; in de telecommunicatie wordt het gebruikt voor het voorkomen van klantverloop, karakter- en patroonherkenning en beveiligingsbeheer; in de gezondheidszorg wordt het gebruikt voor ziektediagnostiek en genetische analyse; in de energiesector wordt het gebruikt voor het voorspellen van de vraag naar elektriciteit en het verkennen van hulpbronnen; en in de productie wordt het gebruikt voor de ontwikkeling van nieuwe producten/nieuwe diensten, defectvoorspelling, fabrieksautomatisering, inventaris- en vraagbeheer. Daarnaast kan het worden gebruikt als een manier om de situatie in het verleden of heden te begrijpen of de toekomst te voorspellen op basis van gegeven gegevens.
Tegenwoordig is big data wereldwijd razend populair. Met het alomtegenwoordige gebruik van IT-apparaten worden er voortdurend gegevens gegenereerd. Volgens een statistiek werd er alleen al in 120 wereldwijd ongeveer 2024 ZB (Zettabytes) aan gegevens geproduceerd en verbruikt. Data mining is essentieel om deze gegevens bruikbaar te maken in plaats van weggegooid te worden, en aangezien de op internet gebaseerde leefomgeving zich in de toekomst naar verwachting verder zal ontwikkelen, zal het belang van data mining naar verwachting nog verder toenemen.
Data mining kan niet alleen worden gebruikt om de verkoop te verhogen, maar ook om aankooppatronen van klanten te identificeren, aangepaste marketing te voeren, de efficiëntie van voorraadbeheer te verbeteren en verschillende strategieën te ontwikkelen om de klanttevredenheid te maximaliseren. Data is de ruwe olie van de moderne wereld, en hoe goed u het mijnt en verwerkt, kan uw bedrijf maken of breken. Daarom is het zo belangrijk om het belang van data mining te erkennen en er uw voordeel mee te doen.