A statisztikai folyamat azon szakaszok vagy fázisok összessége, amelyeket teljesíteni kell a kvantitatív információkon alapuló vizsgálat elvégzéséhez és a vizsgált valósághoz hű eredmények megszerzéséhez.
Amikor a statisztikai folyamatról beszélünk, olyan lépések sorozatáról beszélünk, amelyeket célszerű elvégezni annak érdekében, hogy olyan eredményeket kapjunk, amelyek hűek ahhoz a valósághoz, amelyet az elvégzendő statisztikai tanulmányban tanulmányozunk. Erre azért van szükség, mivel ha nem hajtjuk végre ezeket a lépéseket, téves következtetéseket vonhatunk le, és ezért rossz döntéseket hozhatunk.
Képzeljük el például, hogy van egy fagylaltozónk. Körülbelül tudnunk kell, mennyi fagylaltot kell vásárolnunk a kereslet mennyisége alapján. Tehát, ha elmaradunk, az ügyfelek elérhetnék, akinek meg kell mondanunk nekik, hogy ebben a fagyizóban nincs fagylalt. Éppen ellenkezőleg, ha túl sok van, akkor az elrontott lehet. Ezért meg kell próbálni megbecsülni, hogy mennyit kell vásárolnunk, vagy legalább egy hozzávetőleges tartományt. Ha ennek a tartománynak a kiszámításához olyan adatokat gyűjtünk, amelyek nem reprezentatívak (például egy másik városban található fagylaltozó, ahol kisebb a gazdagság), tévedhetünk.
Tehát ennek tisztázásával tudnunk kell a lépések és részletek sorozatát, amelyeket követnünk kell, hogy az eredményeket a valósághoz igazítsuk, és jobb döntéseket hozzunk.
A statisztikai folyamat szakaszai
A meglátogatott kézikönyvtől vagy a szerzőtől függően különböző szakaszokat láthattunk különböző nevekkel. Lényegében a témával kapcsolatos szinte összes dokumentum ugyanazokat a szakaszokat tartalmazza, csak az, hogy egyesek több fázist tartalmaznak egyben, mások pedig jobban szétaprózzák a folyamatot.
Esetünkben úgy gondoljuk, hogy a statisztikai folyamat a következőkből áll:
Probléma nyilatkozat
A probléma megállapításában a központi tengely található, amelyen minden mást meg lehet fogalmazni. Ez a szakasz a következő kérdésre ad választ: Mit kell tanulnom és miért? Néha, bármennyire is hihetetlennek tűnik a probléma, ez arra a következtetésre vezethet bennünket, hogy valójában nincs szükségünk statisztikai tanulmányra.
Adatgyűjtés
Miután felvetettük a problémát, össze kell gyűjtenünk az adatokat. Itt fontos a módszertan. Tehát különböző szempontok vannak. Így meg kell állapítanunk a mintavétel típusát, a minta méretét, az adatgyűjtés típusát (például adatbázisok vagy személyre szabott felmérések útján), személyesen, online vagy telefonon stb.
Adatszervezés
Ha minden adat megvan, akkor marad az egységesítés és a rendszerezés. Mint mindenben, úgy itt is meg kell adnunk az adatokat egy programban vagy platformban, amely lehetővé teszi számunkra bizonyos mutatók kiszámítását és helyes elemzést. Ehhez mindig kényelmes az adatok rendezése. Sőt, néha különböző adatbázisokat kell gyűjtenünk, amelyek különböző fájlformátumokat kínálnak, és mindent egységes formátumban kell egyesíteni.
Adatelemzés
Miután felmerült a probléma, az összegyűjtött és rendszerezett adatok, hatékonyan elemezhetjük azokat. A problémamegállapítástól függően egyik vagy másik típusú elemzést hajtanak végre. Például, ha meg akarjuk tudni, hogy két változó függ-e, használhatunk kointegrációs elemzést. Míg ha egy pénzügyi eszköz teljes diszperzióját szeretnénk tanulmányozni, akkor kiszámoljuk a statisztikai tartományt.
Az adatok értelmezése
Végül, de nem utolsósorban megvan az adatok értelmezése. Hiába végezzük a statisztikai folyamat összes szakaszát helyesen, ha az értelmezés végül téves. Ugyanis ha az értelmezés téves, akkor a döntéseknek nem kívánt hatása lesz. Tegyük fel például, hogy tanulmányt készítünk a vállalat értékesítésének változékonyságáról. Ha az eredmények megszerzése után kiderül, hogy sok a diszperzió, akkor csökkenteni kell, és értelmezzük, hogy nem, ez negatívan érintheti a vállalatot.
Az öt lépést a következő ábra mutatja:
Leíró statisztika