Mitkä ovat vapausasteita?
Vapausasteilla tarkoitetaan loogisesti riippumattomien arvojen, jotka voivat vapaasti vaihdella, enimmäismäärää tietonäytteessä.
Avainsanat
- Vapauden asteilla tarkoitetaan loogisesti riippumattomien arvojen, jotka ovat arvoja, joilla on vapaus vaihdella, enimmäismäärää tietonäytteessä. Vapausasteista keskustellaan yleisesti tilastossa esiintyvien erilaisten hypoteesitestausmuotojen, kuten chi Neliö. Vapausasteiden laskeminen on avainta yritettäessä ymmärtää Chi-Square-tilastojen merkitystä ja nollahypoteesin paikkansapitävyyttä.
Vapausasteiden ymmärtäminen
Helpoin tapa ymmärtää vapausasteita käsitteellisesti on esimerkki:
- Tarkastellaan tietonäytettä, joka koostuu yksinkertaisuuden vuoksi viidestä positiivisesta kokonaisluvusta. Arvot voivat olla mikä tahansa luku, joiden välillä ei ole tunnettua yhteyttä. Tällä tietonäytteellä olisi teoreettisesti viisi vapausastetta. Neljä näytteessä olevaa lukua on {3, 8, 5 ja 4} ja koko data-näytteen keskiarvon paljastuu olevan 6.Tämä tarkoittaa, että viidennen numeron on oltava 10. Se ei voi olla mitään muuta. Sillä ei ole vapautta vaihdella. Joten tämän näytteen vapausaste on 4.
Vapausasteiden kaava on yhtä suuri kuin näytteen koko vähennettynä:
Df = N − 1 missä: Df = vapausaste N = näytteen koko
Vapausasteista keskustellaan yleisesti erilaisissa hypoteesitestauksen muodoissa tilastoissa, kuten Chi-Square. On olennaisen tärkeää laskea vapausaste, kun yritetään ymmärtää Chi-Square-tilastojen merkitystä ja nollahypoteesin paikkansapitävyyttä.
Ki-neliötestit
Chi-Square-testejä on kahta eri tyyppiä: itsenäisyystesti, jossa esitetään suhdekysymys, kuten "Onko sukupuolen ja SAT-pistemäärien välillä suhdetta?"; ja sopivuuden testi, jossa kysytään jotain "Jos kolikko heitetään 100 kertaa, tuleeko se 50 kertaa päähän ja hännään 50 kertaa?"
Näissä kokeissa vapausasteita käytetään määrittämään, voidaanko tietty nollahypoteesi hylätä kokeessa olevien muuttujien ja näytteiden kokonaismäärän perusteella. Esimerkiksi, kun harkitaan opiskelijoita ja kurssin valintaa, 30 tai 40 opiskelijan otoskoko ei todennäköisesti ole riittävän suuri tuottamaan merkittävää tietoa. Saman tai samankaltaisten tulosten saaminen tutkimuksesta käyttämällä otoskokoa 400 tai 500 opiskelijaa on kelvollisempaa.
Vapausasteiden historia
Varhaisin ja perusteellisin käsitys vapausasteista todettiin 1800-luvun alkupuolella, kietoutuneena matemaatikon ja tähtitieteilijä Carl Friedrich Gaussin teoksiin. Termin nykyaikaista käyttöä ja ymmärtämistä selosti ensin englantilainen tilastoitsija William Sealy Gosset artikkelissaan "Keskiarvon todennäköinen virhe", joka julkaistiin Biometrikassa vuonna 1908 kynän nimellä hänen nimettömyytensä säilyttämiseksi.
Gosset ei käyttänyt kirjoituksissaan erityisesti termiä "vapauden asteet". Hän kuitenkin selitti konseptin koko kehittelyn ajan, jota lopulta kutsutaan opiskelijan T-jakaumaksi. Varsinaisesta nimityksestä tehtiin suosittu vasta vuonna 1922. Englantilainen biologi ja tilastotieteilijä Ronald Fisher alkoi käyttää termiä "Degrees of Freedom", kun hän aloitti raporttien ja tietojen julkaisemisen työstään chi-neliöiden kehittämisessä.
