A kategorikus változó az, amely lehetővé teszi az adatsorok osztályozását egy adott minőséghez vagy kategóriához tartozó rögzített értékek segítségével.
A kategorikus változó a kardinális vagy folytonos változókkal ellentétben (amelyek számszerű számításokat tesznek lehetővé) osztályozza az egyéneket vagy eseteket. Rendszerint egész számokkal ábrázolt értékeket vesznek fel, mint például egy vagy nulla, de ezek csak reprezentációk.
A példában részletesebben fogjuk látni.
A kategorikus és a folytonos változó közötti különbségek
Van néhány különbség a kategorikus változó és a folytonos vagy kardinális változó között, amelyeket ismerni kell. Lássuk a legrelevánsabbakat.
- Először a kategorikus változót használjuk a csoportosításhoz, a folyamatos változót pedig a számláláshoz. Más szavakkal, az első lehetővé teszi kategóriák kialakítását adatsorral. Például a nemek vagy a gyermekek száma. A második számszerű információkat ad nekünk. Például az életkor.
- A kardinális változó numerikus számításokat tesz lehetővé, a többi nem. Ily módon az előbbiben ismerhetjük az átlagokat vagy a varianciákat, míg a többiben csak néhány adatot, például a módot vagy a kategóriák százalékos arányát.
- A kategorikusak nagyon hasznosak a kvalitatív információk, vagyis az adatok bizonyos minőségének megismeréséhez. A folytonosak mennyiségi adatokat, azaz számokkal ábrázolt mennyiségeket és értékeket szolgáltatnak számunkra.
Statisztikai technikák kategorikus változókhoz
Ezután nézzük meg a kategorikus változókban leggyakrabban alkalmazott statisztikai technikákat, összehasonlítva azokat a folyamatos vagy kardinális változókéval.
- Leíró statisztika: Az ilyen típusú változókban az elemzések általában többek között oszlop- és százalékos diagramokon alapulnak. A bíborosok lehetővé teszik az elemzési technikák alkalmazását a helyzetstatisztikák, például a kvantilisek, vagy a diszperziós statisztikák, például a szórások kiszámításához.
- Hipotézis kontraszt: A kategoriában az eredményeket nem paraméteres hipotézis tesztek segítségével extrapolálhatjuk. Másrészt a folytonosak paraméteres kontrasztokat használnak, amelyekre szintén lehet következtetni.
- Regressziós technikák: Ebben az esetben az előbbieknél többek között logisztikai regressziót vagy hasonlót alkalmaznak. A másik típusú változók esetében a leggyakrabban alkalmazott módszer a lineáris regresszió.
Kategorikus változó példa
Befejezésül nézzünk meg egy nagyon gyakori példát a marketing terén. Képzeljük el, hogy el akarunk adni egy terméket, és érdekel bennünket a családi állapot ismerete.
Ehhez 1-et nevezünk egyedülállónak, 2-et házasnak, 3-at elváltnak, 4-et élettársnak és 5-öt másoknak.
Lássuk a képet, majd kommenteljük:
Láthatjuk, hogy az egyének legnagyobb arányban egyedülállók, házasok és elváltak, a másik két lehetőség csak 5%.
Mint láthatjuk, a kategorikus változók hasznosak a csoportosításhoz. Az oszlopdiagram lehetővé teszi számunkra, hogy jobban megfigyeljük ezeket a százalékokat, mivel könnyebb összehasonlítani az oszlopok méretét.