Kvartilis eltérés - mi ez, definíció és fogalom

Tartalomjegyzék:

Anonim

A kvartilis eltérés a diszperzió statisztikai mértéke, amely az interkvartilis tartomány középértékét adja vissza, és amelyet ferde adatsorokban használnak.

Más szavakkal, a kvartilis eltérés az interkvartilis tartomány (IQR) mediánjának kiszámítása, és elég sok szélső értékkel rendelkező adatsorokban használják.

A kvartilis eltérés rövidítése DQ.

Interquartilis tartomány

Az interkvartilis tartomány a dobozdiagramban általánosan használt adatkészlet diszperziójának mértéke. Más szavakkal, az interkvartilis tartomány a boxdiagramon használt eloszlás utolsó előtti és első kvartilisének különbsége.

IQR = Q3 - Q1

Az interkvartilis tartomány használatának előnye, hogy a kvartilis eltérés (DQ) kiszámítható, ami nagyon diszperziós mérték, ha torzított adatsorok vannak.

Kvartilis eltérés képlete

A kvartilis eltérést az interkvartilis tartomány 2-vel való felosztásaként kell kiszámítani.

DQ = (Q3 - Q1) / 2 = RIC / 2

Mivel csak a harmadik és az első kvartilis közötti diszperziót vesszük figyelembe, figyelmen kívül hagyunk minden adatot, amely ezen a tartományon kívül esik. Ezért minden érték közel áll ahhoz, hogy szélsőséges legyen. Tehát, ha ketté osztjuk az interkvartilis tartományt, megkapjuk a diszperzió középértékét.

Példa a kvartilis eltérésre

Feltételezzük, hogy ki akarjuk számolni az interkvartilis hatótávolságot és az év során a házunk mellett áthaladó kerékpárosok számának kvartilis eltérését.

  1. Először megszámoljuk a kerékpárosokat és összegyűjtjük az információkat egy táblázatban.
  1. Másodszor kiszámítjuk az első és a harmadik kvartilit, hogy megkapjuk az interkvartilis tartományt.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Harmadszor, kiszámítjuk a kvartilis diszperziót úgy, hogy egyszerűen elosztjuk az interkvartilis tartományt kettővel.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Ennek az adatkészletnek a kvartilis eloszlása ​​175. Ez a szám az interkvartilis tartomány központi értéke.

Fontos megjegyezni, hogy a július hónap adatai extrém adatok, mivel többszörösen magasabbak, mint az összes többi adat. Tehát azt mondhatnánk, hogy ez az adatkészlet elfogult az adott hónap felé. A kvartilis diszperzió extrém adatok felé történő „tudatlanságának” köszönhetően ennek az intézkedésnek az eredménye nagyon hasonló ahhoz, mintha csak 600 kerékpáros keringett volna júliusban. Ha csak 600 kerékpáros lenne júliusban, a kvartilis diszperzió 162,5 lenne, ami nagyon megközelíti a 175-et, figyelembe véve, hogy a kerékpárosok száma ebben a hónapban tízszer kevesebb.