A boxplot, angol nyelvből, boxplot, egy mennyiségi vagy kategorikus változó ábrázolása az adatkészlet kvartiliseinek gyors azonosítása céljából.
Más szavakkal, a boxplot egy olyan grafikon, amely egy kvantitatív vagy kvalitatív változót képvisel a kvartiliseken keresztül.
A statisztikában hasznos eszköz mind diszkrét, mind folytonos adatkészletek ábrázolásához.
Fontos szem előtt tartani, hogy a kvalitatív változóváltozókat, illetve azokat, amelyek sorrendet vagy kategóriát kívánnak képviselni, mindig 0-nál nagyobb numerikus indexhez kell kapcsolni, hogy azok megjelenhessenek a grafikonon és kiszámíthatók legyenek a megfelelő statisztikák.
Dobozdiagram és hisztogram
A dobozdiagram nem más, mint egy felülről nézett hisztogram, és ugyanígy a hisztogram oldalról nézve is. Az alábbiakban egy példa látható.
Az első jellemző, amelyet mindkét diagram megoszt, az adatkészlet minimuma és maximuma. A kötőjelek utáni végsávok jelzik a minimumot (alsó sáv) és a maximumot (felső sáv). A kiugró értékeket a maximum és a minimum tartományán kívül képviselnék. Vagyis a kötőjelek után a rácsokon túl. Találhatunk vízszintes dobozos ábrákat is.
Egy pillanat alatt láthatja, hogy az adatok nagy része mindkét grafikonon a minimum közelében lévő megfigyelésekre összpontosul. Ezt jelzi az a dobozdiagram, amelyben a doboz közelebb van a minimumhoz, mint a maximumhoz. Ha megnézzük a hisztogramot, látni fogjuk, hogy a leggyakoribb megfigyelések azok, amelyek közel állnak a minimumhoz és messze vannak a maximumtól.
Doboz telek adatai
A dobozdiagram által nyújtott információk a következők:
- A doboz alja az első kvartilis (Q1).
- A mező közepén található oszlop a medián vagy a második kvartilis (Q2).
- A doboz teteje a harmadik kvartilis (Q3).
- Az interkvartilis tartomány vagy IQR lenne a doboz magassága, vagyis a Q3 és Q1 közötti különbség.
Doboz telek kulcsa
Ezt a grafikus ábrázolást dobozdiagramnak hívják, mert úgy néz ki, mint egy doboz. Ezért, hogy emlékezzünk erre a grafikonra, csak négyzet alakú objektumra vagy dobozra kell gondolnunk.
Azok az olvasók, akik ismerik a pénzügyi eszközök árát, nagyobb hasonlóságot fognak látni egy gyertyával. Az árajánlatban látható gyertyák a kiválasztott időablakhoz igazított dobozdiagramok.
A dobozos cselekmény előnyei és hátrányai
A diagram előnyei és hátrányai között a következőket találjuk:
Előny
- A kvantitatív vagy kvalitatív változó abszolút gyakoriságának globalizált jövőképe.
- Az adatsor minimumának, maximumának és kvartilisének ismerete anélkül, hogy azokat ki kellene számítani.
- A szélsőséges értékek felismerése gyorsabb, mint a hisztogrammal, mert a szélsőséges értékeket a maximumon és a minimumon kívüli körök jelzik.
Hátrányok
- Ha az adatkészlet kicsi, akkor egy dobozdiagram készítése az adatok kifejezésére megnehezíti a megértést.
Box plot példa
Feltételezzük, hogy szeretnénk képviselni azon kerékpárosok számát, akik egy év alatt elhaladnak a házunk mellett. Először megszámoljuk a kerékpárosokat és összegyűjtjük az információkat egy táblázatban.
Egyes programok, például az R vagy az Excel segítségével előállíthatjuk az alább látható grafikont.
Hála a kerékpárosok számának a dobozos ábrázoláson keresztüli képviseletéhez, gyorsan megérthetjük, hol van a medián, a többi kvartilis, a maximum és a minimum. Ebben az esetben nincsenek atipikus adataink, mivel a maximumon és a minimumon túl nincs semmi.
Az ilyen típusú grafikonok alkalmazása nagyon elterjedt, tekintettel annak egyszerűségére és hasznosságára a pénzügyi és közgazdasági területeken kívül számos területen.