A Spearman-féle rho egy nem parametrikus függőségi mérőszám, amelyben kiszámítják a megfigyelések átlagos hierarchiáját, a különbségeket négyzetre emelik és beépítik a képletbe.
Más szavakkal, rangsorolást rendelünk az egyes változók megfigyeléseihez, és tanulmányozzuk két adott változó függőségi viszonyát.
Az osztályozott korrelációk nem paraméteres alternatívát jelentenek két változó függőségének mérésére, amikor nem alkalmazhatjuk Pearson korrelációs együtthatóját.
Általában a giega betű van hozzárendelve rho a korrelációs együtthatóhoz.
Spearman rho-becslését a következők adják:
Rho Spearman-eljárás
0. mintából indulunk ki n megfigyelések (Aén, Bén).
1. Besorolja az egyes változók megfigyeléseit a kapcsolatokhoz igazítva.
- Olyan excel függvényt használunk, amely osztályozza számunkra a megfigyeléseket és automatikusan kiigazítja őket, ha kapcsolatokat talál az elemek között. Ezt a függvényt HERARCH.MEDIA-nak hívják (A besorolásén; Besorolásn;rendelés).
- A függvény utolsó tényezője nem kötelező, és megmondja, hogy milyen sorrendben szeretnénk megrendelni a megfigyeléseket. A nem nulla szám a növekvő sorrendben rendezi a megfigyeléseket. Például a legkisebb elemnek 1-es rangot fog rendelni. Ha nulla értéket adunk a változóba rendelés, a legnagyobb tételhez 1-es rangot rendel (csökkenő sorrendben).
Gyakorlati példa
- Esetünkben a sorrendváltozóhoz nem nulla számot rendelünk, hogy a megfigyeléseket növekvő sorrendbe rendezzük. Vagyis a változó legkisebb elemének 1-es rangot rendel.
- Ellenőrizzük, hogy a. Oszlopainak teljes összege Osztályozás A Y Besorolás B egyenlőek egymással és találkoznak:
Ebben az esetben n = 10, mert minden változóban összesen 10 elem / megfigyelés van NAK NEK Y B.
Az A osztályozás teljes összege megegyezik az Y osztályozás teljes összegével, és a fenti képletet is teljesítik.
NAK NEK | B | Osztályozás A | Besorolás B | Négyzetbeli különbségek |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Teljes | 55 | 55 | 130 |
2. Adja hozzá a rangsorok közötti különbségeket, és négyzetezze őket.
- Miután megkapta az összes osztályozott megfigyelést, figyelembe véve a közöttük lévő kapcsolatokat, kiszámoljuk a különbséget a következő formában:
dén = Aén - Bén
Meghatározzuk (dén), mint az A besorolása közötti különbségén és a B osztályozásaén.
- Amint a különbség megvan, négyzetre emeljük. A különbségek négyzeteit úgy alkalmazzuk, hogy csak pozitív értékeik legyenek.
Meghatározzuk dén2 mint az A osztályozása közötti négyzetbeli különbségén és a B osztályozásaén.
A négyzetes különbségek oszlopában:
dén2 = (Aén - Bén)2
3. Számítsa ki Spearman rho értékét:
- Kiszámoljuk az űrlap négyzetbeli különbségeinek teljes összegét:
Példánkban:
- Az eredményt beépítjük Spearman rho-képletébe:
Példánkban:
Összehasonlítás: Pearson vs Spearman
Ha kiszámoljuk a Pearson-féle korrelációs együtthatót az előző megfigyelések alapján, és összehasonlítjuk Spearman-féle korrelációs együtthatóval, akkor a következőket kapjuk:
- Pearson = 0,1109
- Spearman = 0,2121
Láthatjuk, hogy az A és B változók közötti függőség még akkor is gyenge marad, ha Pearson helyett Spearman-t használunk.
Ha a kiugró értékek nagy hatással lennének az eredményekre, akkor nagy különbséget találnánk Pearson és Spearman között, ezért a Spearmant kell használnunk a függőség mérésére.