A konfidenciaintervallum a statisztikai következtetések során alkalmazott becslési technika, amely lehetővé teszi egy vagy több értékpár korlátozását, amelyeken belül a kívánt pontbecslés megtalálható (bizonyos valószínűséggel).
A konfidencia intervallum lehetővé teszi számunkra, hogy két mintát átlag körül két értéket számítsunk ki (egy felső és egy alsó). Ezek az értékek korlátozni fogják azt a tartományt, amelyen belül - bizonyos valószínűséggel - a populációs paraméter található.
Konfidencia intervallum = átlag + - hibahatár
A valódi népesség ismerete általában nagyon bonyolult. Vegyük figyelembe 4 millió ember lakosságát. Megtudhatnánk e népesség háztartásonkénti átlagos fogyasztási kiadásait? Elvileg igen. Egyszerűen fel kellene mérnünk az összes háztartást és ki kellene számolnunk az átlagot. E folyamat követése azonban rendkívül fáradságos lenne, és meglehetősen bonyolulttá tenné a tanulmányt.
Ilyen helyzetekben megvalósíthatóbb egy statisztikai minta kiválasztása. Például 500 ember. És az említett mintán számítsa ki az átlagot. Bár még mindig nem tudnánk a valódi népességértéket, feltételezhetjük, hogy az közel lesz a minta értékéhez. Ehhez hozzáadjuk a hibahatárt, és megkapjuk a konfidencia intervallum értékét. Másrészt levonjuk ezt a hibahatárt az átlagból, és lesz egy másik értékünk. E két érték között lesz a népesség átlaga.
Összegzésként elmondható, hogy a konfidencia intervallum nem szolgál a populációs paraméter pontszerű becslésének megadására, ha ez segít nekünk abban, hogy hozzávetőleges képet alkossunk arról, hogy melyik lehet az igazi. Lehetővé teszi számunkra, hogy két érték között korlátozzuk, hol található a népesség átlag.
variációs együtthatóKumulatív gyakoriságOlyan tényezők, amelyektől a konfidencia intervallum függ
A megbízhatósági intervallum kiszámítása főként a következő tényezőktől függ:
- Kiválasztott minta mérete: A minta értékének kiszámításához felhasznált adatok mennyiségétől függően többé-kevésbé közel lesz a valódi populációs paraméterhez.
- Bizalmi szint: Tájékoztat minket arról, hogy az esetek hány százaléka helyes. A szokásos szint 95% és 99%.
- Becslésünk hibahatára: Ezt hívják alfának, és tájékoztat minket annak valószínűségéről, hogy a populáció értéke kívül esik a tartományunkon.
- A mintában becsült érték (átlag, variancia, az átlagok különbsége …): Az intervallum kiszámításához használt pivot statisztika ettől függ.
Példa az átlag megbízhatósági intervallumára, feltételezve a normalitást és az ismert szórást
A számításhoz használt pivot statisztika a következő lenne:
A kapott intervallum a következő lenne:
Látjuk, hogy az egyenlőtlenség bal és jobb oldali intervallumában hogyan van az alsó, illetve a felső határ. Ezért a kifejezés azt mondja nekünk, hogy a populáció átlagának valószínűsége ezen értékek között van, 1-alfa (konfidenciaszint).
Nézzük meg jobban a fentieket egy példaként megoldott gyakorlattal.
Meg akarja becsülni, hogy egy futó átlagosan mennyi ideig tart egy maraton teljesítéséhez. Ehhez 10 maratont időzítettek, és átlagosan 4 órát kaptak 33 perc (0,55 óra) szórással. 95% -os megbízhatósági intervallumot szeretne elérni.
Az intervallum megszerzéséhez csak az intervallumképlet adatait kellene helyettesítenünk.
A konfidencia intervallum lenne az eloszlás kékkel árnyékolt része. Az ezzel határolt 2 érték megegyezik a 2 piros vonallal. Az eloszlást 2-re osztó központi vonal lenne a valódi népességérték.
Fontos megjegyezni, hogy ebben az esetben, mivel az N (0,1) eloszlás sűrűségfüggvénye megadja a kumulatív valószínűséget (balról a kritikus értékre), meg kell találnunk azt az értéket, amely 0,975-et hagy bennünk a bal% (ez 1,96).