A releváns változó kihagyása egy fontos magyarázó változó regresszióba való beiktatását jelenti. A Gauss-Markov feltételezéseket figyelembe véve ez a kihagyás elfogultságot és következetlenséget okozna becsléseinkben.
Más szavakkal, egy releváns változó kihagyása akkor következik be, amikor beépítjük az u hibatagba, mert nem vesszük figyelembe. Ez összefüggést okoz a függő változó és az u hibatag között.
Matematikailag azt feltételezzük, hogy:
Cov (x, u) = 0
Ha egy releváns változót beépítünk a hiba kifejezésbe vagy, azután:
Cov (x, u) ≠ 0
A Gauss-Markov feltételezéseket figyelembe véve ez az összefüggés:
(ρ (x, u) ≠ 0)
Nem teljesítené ezt:
E (u | x) = E (u) = 0
Vagyis a magyarázókhoz kondicionált hibák várakozása megegyezik a hiba várakozásával, és hogy ez is nulla. Ezek az elfogulatlanság feltételezései (szigorú exogenitás + null átlag)
A releváns változó kihagyása esetén az OLS becslő elfogult és következetlenné válik. Tehát megsérti a becslő tulajdonságai közül kettőt, és becslésünket tévesé teszi.
Elméleti példa
Feltételezzük, hogy a szezonális síelők számát (t) szeretnénk megvizsgálni, figyelembe véve több tényezőt: a síbérletek (síbérletek) árát és a nyitott pályák számát (pályák), valamint a hó minőségét (hó).
0. modell
Feltételezzük, hogy a magyarázó változók (síbérletek, lejtők és hó) releváns változók a 0 modell számára, mivel a populációs modellhez tartoznak. Más szavakkal, a 0-as modellünk magyarázó változói részleges hatást gyakorolnak a populációs modell függő változó síelőire. Ezután mind a populációs, mind a mintamodellekben (0. modell) nulla értéktől eltérő együtthatók lesznek.
Értelmezés
A hó (hó) minőségének és a nyitott futások (pályák) számának növekedése a β becslésének növekedését okozza2 és β3. Következésképpen ez tükröződik a síelők (síelők) számában.
A síbérlet árak százalékos növekedése a β csökkenését okozza1/ 100 a síelők (síelők) számában
Folyamat
A hóváltozót a modellből kihagyott változóként kezeljük. Azután:
1. modell
Az u hibaterméket megkülönböztetjük a 0 modelltől, az v hibatagot pedig az 1 modelltől, mert az egyik nem tartalmazza a releváns változó havat, a másik pedig.
Az 1. modellben kihagytunk egy releváns változót a modellből, és bevezettük az u hibatagba. Ez azt jelenti:
- Cov (hó, v) ≠ 0 → ρ (hó, v) ≠ 0
- E (v | hó) ≠ 0
Ha az 1. modellünkben elhagyjuk a releváns változó havat, akkor az OLS-becslő torzítást és következetlenséget fog mutatni. Tehát a szezonális síelők számára vonatkozó becslésünk téves lesz. A sípálya súlyos pénzügyi gondokba ütközhet, ha figyelembe veszi az 1. modell becslését.