Adatbányászat - mi ez, meghatározása és fogalma

Tartalomjegyzék:

Anonim

Az adatbányászat nagy adatbázisok keresésének folyamata, hogy hasznos információkat találjon, amelyek felhasználhatók a döntéshozatalban. Az angol "data mining" kifejezést is használják.

Felfogható a viselkedésminták megtalálásához használt technológiának és szoftvernek az adatbázisban. Ennek alapvető alapja, hogy ezek a minták segítik a döntéshozatalt. Például segíthet a vállalatoknak abban, hogy megértsék ügyfeleik viselkedési szokásait. Olyan módon, hogy megkönnyítse az eladások növelésére vagy a költségek csökkentésére irányuló stratégiák kialakítását.

Az adatbányászat előnyei

Ennek az adatelemzési folyamatnak az alapvető előnye az üzleti forgatókönyvek nagy száma, amelyekre alkalmazható, példaként:

  • Jóslás: A vállalat eladásainak előrejelzése.
  • Valószínűség: A legjobb ügyfelek kiválasztása közvetlen kapcsolatfelvétel céljából telefonon vagy e-mailben.
  • Szekvenciaelemzés: A vásárlók által megvásárolt termékek elemzése és a köztük lévő kapcsolatok ellenőrzése.

Az adatbányászat szakaszai

Az adatbányászati ​​folyamaton belül öt fázist találhatunk:

  • Célkitűzés és adatgyűjtés: Először arra kell összpontosítanunk, hogy milyen típusú információkat szeretnénk megszerezni. Képzeljük el azt a példát, hogy egy szupermarket szeretné tudni, hogy melyik napszakban van a legtöbb vásárló. Ez lenne az a cél és információ, amelyet a kereskedelem ebben az esetben meg akar szerezni.
  • Adatfeldolgozás és -kezelés: Miután megismertük az összegyűjteni kívánt adatokat, működésbe hozzuk az adatokat. Talán ez a folyamat legnehezebb szakasza. Nos, ehhez meg kell választani azt a reprezentatív mintát, amelyen az elemzést végezni fogják. A minta kiválasztása után elemezni kell, hogy milyen típusú változókat vagy regressziós modellt fogunk végrehajtani a mintán.
  • Modell kiválasztása: Szorosan összefügg az előző fázissal. Olyan modell vagy algoritmus létrehozásáról van szó, amely a lehető legjobb eredményt nyújtja számunkra. Ehhez el kell végezni a modellbe beépítendő változók teljes elemzését. Ez bonyolult feladattá válik, mivel az elemzendő információk típusától függ. Ezért az adatbányászok különböző teszteket hajtanak végre az algoritmuson, például: lineáris regresszió, döntési fa, idősor, neurális hálózat stb.
  • Az eredmények elemzése és áttekintése: Alapvetően az eredmények elemzése az, hogy vajon logikus magyarázatot adnak-e. Magyarázat, amely megkönnyíti a döntéshozatalt az eredmények által szolgáltatott információk alapján.
  • Modell frissítés: A folyamat utolsó lépése a modell frissítése lenne. Nagyon fontos, hogy idővel megtörténjen, hogy ne váljon elavulttá. A modell változói jelentéktelenné válhatnak, ezért a modell időszakos ellenőrzésére van szükség.