Az adatbányászat nagy adatbázisok keresésének folyamata, hogy hasznos információkat találjon, amelyek felhasználhatók a döntéshozatalban. Az angol "data mining" kifejezést is használják.
Felfogható a viselkedésminták megtalálásához használt technológiának és szoftvernek az adatbázisban. Ennek alapvető alapja, hogy ezek a minták segítik a döntéshozatalt. Például segíthet a vállalatoknak abban, hogy megértsék ügyfeleik viselkedési szokásait. Olyan módon, hogy megkönnyítse az eladások növelésére vagy a költségek csökkentésére irányuló stratégiák kialakítását.
Az adatbányászat előnyei
Ennek az adatelemzési folyamatnak az alapvető előnye az üzleti forgatókönyvek nagy száma, amelyekre alkalmazható, példaként:
- Jóslás: A vállalat eladásainak előrejelzése.
- Valószínűség: A legjobb ügyfelek kiválasztása közvetlen kapcsolatfelvétel céljából telefonon vagy e-mailben.
- Szekvenciaelemzés: A vásárlók által megvásárolt termékek elemzése és a köztük lévő kapcsolatok ellenőrzése.
Az adatbányászat szakaszai
Az adatbányászati folyamaton belül öt fázist találhatunk:
- Célkitűzés és adatgyűjtés: Először arra kell összpontosítanunk, hogy milyen típusú információkat szeretnénk megszerezni. Képzeljük el azt a példát, hogy egy szupermarket szeretné tudni, hogy melyik napszakban van a legtöbb vásárló. Ez lenne az a cél és információ, amelyet a kereskedelem ebben az esetben meg akar szerezni.
- Adatfeldolgozás és -kezelés: Miután megismertük az összegyűjteni kívánt adatokat, működésbe hozzuk az adatokat. Talán ez a folyamat legnehezebb szakasza. Nos, ehhez meg kell választani azt a reprezentatív mintát, amelyen az elemzést végezni fogják. A minta kiválasztása után elemezni kell, hogy milyen típusú változókat vagy regressziós modellt fogunk végrehajtani a mintán.
- Modell kiválasztása: Szorosan összefügg az előző fázissal. Olyan modell vagy algoritmus létrehozásáról van szó, amely a lehető legjobb eredményt nyújtja számunkra. Ehhez el kell végezni a modellbe beépítendő változók teljes elemzését. Ez bonyolult feladattá válik, mivel az elemzendő információk típusától függ. Ezért az adatbányászok különböző teszteket hajtanak végre az algoritmuson, például: lineáris regresszió, döntési fa, idősor, neurális hálózat stb.
- Az eredmények elemzése és áttekintése: Alapvetően az eredmények elemzése az, hogy vajon logikus magyarázatot adnak-e. Magyarázat, amely megkönnyíti a döntéshozatalt az eredmények által szolgáltatott információk alapján.
- Modell frissítés: A folyamat utolsó lépése a modell frissítése lenne. Nagyon fontos, hogy idővel megtörténjen, hogy ne váljon elavulttá. A modell változói jelentéktelenné válhatnak, ezért a modell időszakos ellenőrzésére van szükség.