A kvartilis eltérés a diszperzió statisztikai mértéke, amely az interkvartilis tartomány középértékét adja vissza, és amelyet ferde adatsorokban használnak.
Más szavakkal, a kvartilis eltérés az interkvartilis tartomány (IQR) mediánjának kiszámítása, és elég sok szélső értékkel rendelkező adatsorokban használják.
A kvartilis eltérés rövidítése DQ.
Interquartilis tartomány
Az interkvartilis tartomány a dobozdiagramban általánosan használt adatkészlet diszperziójának mértéke. Más szavakkal, az interkvartilis tartomány a boxdiagramon használt eloszlás utolsó előtti és első kvartilisének különbsége.
IQR = Q3 - Q1
Az interkvartilis tartomány használatának előnye, hogy a kvartilis eltérés (DQ) kiszámítható, ami nagyon diszperziós mérték, ha torzított adatsorok vannak.
Kvartilis eltérés képlete
A kvartilis eltérést az interkvartilis tartomány 2-vel való felosztásaként kell kiszámítani.
DQ = (Q3 - Q1) / 2 = RIC / 2
Mivel csak a harmadik és az első kvartilis közötti diszperziót vesszük figyelembe, figyelmen kívül hagyunk minden adatot, amely ezen a tartományon kívül esik. Ezért minden érték közel áll ahhoz, hogy szélsőséges legyen. Tehát, ha ketté osztjuk az interkvartilis tartományt, megkapjuk a diszperzió középértékét.
Példa a kvartilis eltérésre
Feltételezzük, hogy ki akarjuk számolni az interkvartilis hatótávolságot és az év során a házunk mellett áthaladó kerékpárosok számának kvartilis eltérését.
- Először megszámoljuk a kerékpárosokat és összegyűjtjük az információkat egy táblázatban.
- Másodszor kiszámítjuk az első és a harmadik kvartilit, hogy megkapjuk az interkvartilis tartományt.
Q3 = 550
Q1 = 200
IQR = Q3 - Q1 = 550 - 200 = 350
- Harmadszor, kiszámítjuk a kvartilis diszperziót úgy, hogy egyszerűen elosztjuk az interkvartilis tartományt kettővel.
DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175
Ennek az adatkészletnek a kvartilis eloszlása 175. Ez a szám az interkvartilis tartomány központi értéke.
Fontos megjegyezni, hogy a július hónap adatai extrém adatok, mivel többszörösen magasabbak, mint az összes többi adat. Tehát azt mondhatnánk, hogy ez az adatkészlet elfogult az adott hónap felé. A kvartilis diszperzió extrém adatok felé történő „tudatlanságának” köszönhetően ennek az intézkedésnek az eredménye nagyon hasonló ahhoz, mintha csak 600 kerékpáros keringett volna júliusban. Ha csak 600 kerékpáros lenne júliusban, a kvartilis diszperzió 162,5 lenne, ami nagyon megközelíti a 175-et, figyelembe véve, hogy a kerékpárosok száma ebben a hónapban tízszer kevesebb.