Mikä on määrityskerroin?
Määrityskerroin on tilastollisessa analyysissä käytetty mitta, joka arvioi, kuinka hyvin malli selittää ja ennustaa tulevia tuloksia. Se osoittaa tietojoukon selitetyn vaihtelevuuden tason. Määrityskerrointa, joka tunnetaan myös nimellä "R-neliö", käytetään ohjeena mallin tarkkuuden mittaamiseen.
Yksi tapa tulkita tätä lukua on sanoa, että tiettyyn malliin sisältyvät muuttujat selittävät noin x% havaitusta variaatiosta. Joten jos R2 = 0, 50, niin noin puolet havaitusta variaatiosta voidaan selittää mallilla.
R-Squared
Avainsanat
- Määrityskerroin on monimutkainen idea, joka keskittyy tulevan tietomallin tilastolliseen analyysiin. Määrityskerrointa käytetään selittämään, kuinka suuri yhden tekijän variaatio voi johtua sen suhteesta toiseen tekijään.
Määrityskertoimen ymmärtäminen
Määrityskerrointa käytetään selittämään, kuinka suuri yhden tekijän variaatio voi johtua sen suhteesta toiseen tekijään. Siihen luotetaan voimakkaasti trendi-analyysissä, ja se esitetään arvona välillä 0 - 1.
Mitä lähempänä arvoa on 1, sitä parempi sopivuus tai suhde näiden kahden tekijän välillä on. Määrityskerroin on korrelaatiokertoimen neliö, joka tunnetaan myös nimellä "R", jonka avulla se voi näyttää lineaarisen korrelaatioasteen kahden muuttujan välillä.
Tämä korrelaatio tunnetaan nimellä "sopivuuden hyvyys". Arvo 1, 0 ilmaisee täydellisen sopivuuden, joten se on erittäin luotettava malli tulevia ennusteita varten, mikä osoittaa, että malli selittää kaikki havaitut variaatiot. Toisaalta arvo 0 osoittaisi, että malli ei pysty mallintamaan tietoja oikein. Mallissa, jossa on useita muuttujia, kuten moniregressiomalli, säädelty R2 on parempi määrityskerroin. Taloudessa R20-arvon, joka on yli 0, 60, pidetään kannattavana.
Määrityskertoimen analysoinnin edut
Määrityskerroin on tietojoukon ennustettujen pisteiden välisen korrelaation neliö todellisen pistemääräjoukon välillä. Se voidaan ilmaista myös X- ja Y-pisteiden välisen korrelaation neliönä, X: n ollessa riippumaton muuttuja ja Y: n riippuvainen muuttuja.
Esityksestä riippumatta R-neliö, joka on yhtä suuri kuin 0, tarkoittaa sitä, että riippuvaista muuttujaa ei voida ennustaa riippumattoman muuttujan avulla. Käänteisesti, jos se on 1, se tarkoittaa, että riippumaton muuttuja ennustaa aina muuttujan riippuvuuden.
Määrityskerroin, joka kuuluu tälle alueelle, mittaa sitä, missä määrin riippumaton muuttuja ennustaa riippuvaisen muuttujan. Esimerkiksi R-neliö 0, 20 tarkoittaa, että riippumaton muuttuja ennustaa 20% riippuvasta muuttujasta.
Sovituksen hyvyys tai lineaarinen korrelaatioaste mittaa kuvaajalle sovitetun viivan ja kaikkien kuvaajan ympäri hajallaan olevien pisteiden välistä etäisyyttä. Tiukalla datajoukolla on regressioviiva, joka on hyvin lähellä pisteitä ja jolla on korkea sovitustaso, mikä tarkoittaa, että viivan ja datan välinen etäisyys on hyvin pieni. Hyvällä sovituksella on R-neliö, joka on lähellä yhtä.
R-neliö ei kuitenkaan kykene määrittämään, ovatko datapisteet vai ennusteet puolueellisia. Se ei myöskään kerro analyytikolle tai käyttäjälle, onko määrityskerroin hyvä vai ei. Esimerkiksi pieni R-neliö ei ole huono, ja henkilön on tehtävä päätös R-neliön perusteella.
Määrityskerrointa ei tule tulkita naiivasti. Esimerkiksi, jos mallin R-neliöksi ilmoitetaan 75%, sen virheiden varianssi on 75% pienempi kuin riippuvan muuttujan varianssi, ja sen virheiden keskihajonta on 50% pienempi kuin riippuvaisen muuttujan keskihajonta. muuttuja. Mallin virheiden keskihajonta on noin kolmannes niiden virheiden keskihajonnan suuruudesta, jotka saisit vain vakiovarusteisessa mallissa.
Lopuksi, vaikka R-neliön arvo olisi suuri, mallissa selittävillä muuttujilla ei ehkä ole tilastollista merkitystä, tai näiden muuttujien efektiivinen koko voi olla käytännössä hyvin pieni.
