Mikä on varianssi-inflaatiokerroin?
Varianssi-inflaatio fVarianssi-inflaatiokerroin (VIF) on mitta monikollineaarisuuden määrästä joukossa useita regressiomuuttujia. Matemaattisesti regressiomallimuuttujan VIF on yhtä suuri kuin yleisen mallin varianssin suhde mallin varianssiin, joka sisältää vain kyseisen yksittäisen riippumattoman muuttujan. Tämä suhde lasketaan jokaiselle riippumattomalle muuttujalle. Korkea VIF osoittaa, että liittyvä riippumaton muuttuja on erittäin kolineaarinen mallin muiden muuttujien kanssa.
Avainsanat
- Varianssi-inflaatiokerroin (VIF) tarjoaa monikollineaarisuuden mittaa monimuotoisella regressiomallilla olevien riippumattomien muuttujien joukossa. Monikollineaarisuuden määrittäminen on tärkeää, koska vaikka se ei vähennä mallin selittävää voimaa, se vähentää riippumattomien muuttujien tilastollista merkitsevyyttä. Suuri riippumattoman muuttujan VIF osoittaa erittäin kolineaarisen suhteen muihin muuttujiin, joita tulisi ottaa huomioon tai mukauttaa mallin rakenteessa ja riippumattomien muuttujien valinnassa.
Varianssi-inflaatiokertoimen ymmärtäminen
Moninkertaista regressiota käytetään, kun henkilö haluaa testata useiden muuttujien vaikutuksen tiettyyn lopputulokseen. Riippuvainen muuttuja on tulos, johon riippumattomat muuttujat, jotka ovat mallin tuloja, reagoivat. Monikollineaarisuus esiintyy, kun yhden tai useamman riippumattoman muuttujan tai tulon välillä on lineaarinen yhteys tai korrelaatio. Monikollineaarisuus luo ongelman moniregressiossa, koska koska kaikki sisääntulot vaikuttavat toisiinsa, ne eivät ole tosiasiallisesti riippumattomia, ja on vaikea testata, kuinka paljon riippumattomien muuttujien yhdistelmä vaikuttaa riippuvaiseen muuttujaan tai lopputulokseen regressiomallin sisällä.. Tilastollisesti moninkertaisella regressiomallilla, jossa on korkea monikollineaarisuus, tulee vaikeammaksi arvioimaan kunkin riippumattoman muuttujan ja riippuvan muuttujan välistä suhdetta. Pienet muutokset käytetyssä tiedossa tai malliyhtälön rakenteessa voivat tuottaa suuria ja virheellisiä muutoksia riippumattomien muuttujien arvioiduissa kertoimissa.
Mallien oikean määrittelyn ja asianmukaisen toiminnan varmistamiseksi on olemassa testit, jotka voidaan suorittaa monikoloaarisuudelle. Varianssi-inflaatiokerroin on yksi tällainen mittausväline. Varianssi-inflaatiokertoimien käyttäminen auttaa tunnistamaan monikollineaarisuusongelmien vakavuuden, jotta mallia voidaan säätää. Varianssi-inflaatiokerroin mittaa, kuinka paljon riippumattoman muuttujan käyttäytymiseen (varianssiin) vaikuttaa tai kohoaa sen vuorovaikutus / korrelaatio muiden riippumattomien muuttujien kanssa. Varianssi-inflaatiokertoimet mahdollistavat nopean mittauksen siitä, kuinka paljon muuttuja vaikuttaa tavanomaiseen virheeseen regressiossa. Kun esiintyy merkittäviä monikollineaarisuusongelmia, varianssi-inflaatiokerroin on erittäin suuri mukana oleville muuttujille. Kun nämä muuttujat on tunnistettu, voidaan käyttää useita lähestymistapoja kolineaarimuuttujien eliminoimiseksi tai yhdistämiseksi ratkaisemaan monikollineaarisuusongelma.
Vaikka monikollineaarisuus ei vähennä mallin yleistä ennustevoimaa, se voi tuottaa arvioita regressiokertoimista, jotka eivät ole tilastollisesti merkitseviä. Tietyssä mielessä sitä voidaan ajatella eräänlaisena kaksinkertaisena laskennana mallissa. Kun kaksi tai useampi riippumaton muuttuja on läheisessä yhteydessä toisiinsa tai mittaa melkein samaa, silloin niiden mittauksen taustalla oleva vaikutus otetaan huomioon kahdesti (tai enemmän) muuttujien välillä, ja on vaikeaa tai mahdotonta sanoa, mikä muuttuja todella vaikuttaa itsenäinen muuttuja. Tämä on ongelma, koska monien ekonometristen mallien tavoitteena on testata täsmälleen tällainen tilastollinen suhde riippumattomien muuttujien ja riippuvaisten muuttujien välillä.
Esimerkiksi, jos taloustieteilijä haluaa testata, onko työttömyysasteen (itsenäisenä muuttujana) ja inflaatioasteen (riippuvaisena muuttujana) välillä tilastollisesti merkitsevä suhde. Sisällyttämällä työttömyysasteeseen liittyvät muut riippumattomat muuttujat, kuten uudet alkuperäiset työttömyysväitteet, toisi todennäköisesti monikollineaarisuuden malliin. Kokonaismallilla saattaa olla vahva, tilastollisesti riittävä selityskyky, mutta se ei pysty tunnistamaan, johtuuko vaikutus lähinnä työttömyysasteesta tai uusista alkuperäisistä työttömyysvaatimuksista. Tätä VIF havaitsisi, ja se ehdottaa mahdollisesti pudottamalla yksi muuttujista pois mallista tai etsimällä jotakin tapaa yhdistää ne yhteisen vaikutuksen kaappaamiseksi riippuen siitä, mitä erityistä hypoteesia tutkija kiinnostaa testaamaan.
