Mikä on Homoskedastic?
Homoskedastinen (myös kirjoitettu "homoscedastic") viittaa tilaan, jossa jäännös- tai virhetermin varianssi regressiomallissa on vakio. Toisin sanoen virhetermi ei vaihtele suuresti ennustajan muuttujan arvon muuttuessa. Homoskedastisuuden puute voi kuitenkin viitata siihen, että regressiomalliin on ehkä sisällytettävä muita ennustajamuuttujia selittämään riippuvaisen muuttujan suorituskyky.
Avainsanat
- Homoskedastisuus tapahtuu, kun virhetermin varianssi regressiomallissa on vakio. Jos virhetermin varianssi on homoskedaattinen, malli määritettiin hyvin. Jos varianssia on liian paljon, mallia ei ehkä määritetä hyvin. Ylimääräisten ennustajamuuttujien lisääminen voi auttaa selittämään riippuvaisen muuttujan suorituskykyä. Vastakohtana heteroskedatisisuus tapahtuu, kun virhetermin varianssi ei ole vakio.
Kuinka homoskedastinen toimii
Homoskedasticity on yksi oletus lineaarisen regression mallinnuksesta. Jos virheiden varianssi regressioviivan ympärillä vaihtelee suuresti, regressiomalli voi olla huonosti määritelty. Homoskedastisuuden vastakohta on heteroskedastisuus, samoin kuin vastakohta "homogeeniselle" on "heterogeeninen". Heteroskedatilisuus (myös speltti ”heteroskedatilisuus”) viittaa tilaan, jossa virhetermin varianssi regressioyhtälössä ei ole vakio.
Kun otetaan huomioon, että varianssi on mitattu ero ennustetun lopputuloksen ja tietyn tilanteen todellisen lopputuloksen välillä, homoskedastisuuden määrittäminen voi auttaa määrittämään, mitkä tekijät täytyy säätää tarkkuuden suhteen.
Erityiset näkökohdat
Yksinkertainen regressiomalli tai yhtälö koostuu neljästä termistä. Vasemmalla puolella on riippuvainen muuttuja. Se edustaa ilmiötä, jota malli pyrkii "selittämään". Oikealla puolella on vakio, ennustemuuttuja ja jäännös- tai virhetermi. Virhetermi osoittaa riippuvuuden muuttujan muuttuvuuden määrän, jota ennustajamuuttuja ei selitä.
Esimerkki homoskedasticista
Oletetaan esimerkiksi, että halusit selittää opiskelijoiden testitulokset käyttämällä aikaa, jonka jokainen opiskelija vietti opiskeluun. Testitulokset olisivat tässä tapauksessa riippuvainen muuttuja ja opiskeluaika olisi ennustajamuuttuja.
Virhetermi osoittaisi testipisteiden varianssin määrän, jota ei selitetty tutkimuksen kestolla. Jos tämä variaatio on tasainen tai homoskedaattinen, niin se viittaa siihen, että malli saattaa olla riittävä selitys testin suoritukselle - selittää se opiskeluun kuluvalla ajanjaksolla.
Mutta varianssi voi olla heteroskedaattinen. Virhetermitietojen kaavio voi näyttää suuren määrän tutkimusaikaa vastaavan hyvin läheisesti korkeita testituloksia, mutta alhaiset tutkimusajan testitulokset vaihtelivat suuresti ja sisälsivät jopa erittäin korkeita tuloksia. Joten pistemäärävarianssia ei selitettäisi hyvin yhdellä ennustemuuttujalla - opiskeluajalla. Tässä tapauksessa jokin muu tekijä on todennäköisesti toiminnassa, ja mallia on ehkä parannettava sen tai niiden tunnistamiseksi. Jatkotutkimukset voivat paljastaa, että jotkut opiskelijat olivat nähneet vastaukset testiin etukäteen tai että he olivat aiemmin suorittaneet samanlaisen testin, joten heidän ei tarvinnut opiskella tätä testiä varten.
Regressiomallin parantamiseksi tutkija lisäisi sen vuoksi toisen selittävän muuttujan, joka osoittaa, oliko opiskelija nähnyt vastaukset ennen testiä. Regressiomallilla olisi tällöin kaksi selittävää muuttujaa - aikatutkimus ja onko opiskelijalla aiemmat tiedot vastauksista. Näillä kahdella muuttujalla selitettäisiin enemmän testipisteiden varianssista ja virhetermin varianssi voisi sitten olla homoskedaattinen, mikä viittaa siihen, että malli oli hyvin määritelty.
