Sisällysluettelo
- Mikä on T-testi?
- T-testin selittäminen
- Moniselitteiset testitulokset
- T-testin oletukset
- T-testien laskeminen
- Korreloiva (tai parillinen) T-testi
- Y-variaatio (yhdistetty) T-testi
- Epätasaisen variaation T-testi
- Käytettävän T-testin määrittäminen
- Epätasaisen variaation T-testiesimerkki
Mikä on T-testi?
T-testi on eräs tyyppinen päättelytilasto, jota käytetään määrittämään, onko kahden ryhmän keskiarvojen välillä merkittävää eroa, joka voi liittyä tietyissä piirteissä. Sitä käytetään enimmäkseen silloin, kun tietojoukot, kuten kolikon 100 kiertämisen tuloksena tallennetut tietojoukot, noudattaisivat normaalia jakaumaa ja niillä voi olla tuntemattomia variansseja. T-testiä käytetään hypoteesin testaustyökaluna, joka mahdollistaa väestöön sovellettavan oletuksen testaamisen.
T-testi tarkastelee t-tilastotietoja, t-jakauman arvoja ja vapausasteita kahden tietojoukon välisen eron todennäköisyyden määrittämiseksi. Jos haluat suorittaa testin kolmella tai useammalla muuttujalla, on käytettävä varianssianalyysiä.
T-testi
T-testin selittäminen
Pohjimmiltaan t-testi antaa meille mahdollisuuden verrata kahden tietojoukon keskiarvoja ja määrittää, ovatko ne peräisin samasta populaatiosta. Edellä olevissa esimerkeissä, jos otettaisiin otos luokan A opiskelijoista ja toinen otos luokan B opiskelijoista, emme odota heidän olevan täsmälleen samaa keskiarvoa ja keskihajontaa. Samalla tavoin lumelääkellä syötetystä kontrolliryhmästä otettujen näytteiden ja lääkkeiden määräämästä ryhmästä otettujen näytteiden keskiarvon ja keskihajonnan tulisi olla hiukan erilainen.
Matemaattisesti t-testi ottaa näytteen kummastakin ryhmästä ja määrittää ongelmalausekkeen olettamalla nollahypoteesin, että kaksi keskiarvoa ovat yhtä suuret. Sovellettavien kaavojen perusteella tietyt arvot lasketaan ja verrataan standardiarvoihin, ja oletettu nollahypoteesi hyväksytään tai hylätään vastaavasti.
Jos nollahypoteesi voidaan hylätä, se osoittaa, että datalukemat ovat vahvoja eivätkä ole sattumaa. T-testi on vain yksi monista tähän tarkoitukseen käytetyistä testeistä. Tilastotieteilijöiden on lisäksi käytettävä muita testejä kuin t-testiä tutkiaksesi enemmän muuttujia ja testejä, joiden näytteen koko on suurempi. Suuren otoksen koon vuoksi tilastotieteilijät käyttävät z-testiä. Muita testausvaihtoehtoja ovat chi-neliötesti ja f-testi.
T-testejä on kolme tyyppiä, ja ne luokitellaan riippuvaisiksi ja riippumattomiksi t-testeiksi.
Avainsanat
- T-testi on eräs päättelytilasto, jota käytetään määrittämään, onko kahden ryhmän keskiarvoissa merkittäviä eroja, jotka saattavat liittyä tietyissä piirteissä. T-testi on yksi monista testeistä, joita käytetään hypoteesitestauksessa t-testin laskeminen vaatii kolme avaintietoarvoa. Niihin sisältyy ero kunkin tietojoukon keskiarvojen välillä (kutsutaan keskiarvoeroksi), kunkin ryhmän keskihajonta ja kunkin ryhmän tietoarvojen lukumäärä. On olemassa useita erityyppisiä t-testejä, jotka voidaan suorittaa riippuen tarvittavista tiedoista ja analyysityypistä.
Moniselitteiset testitulokset
Ajatelkaa, että lääkkeiden valmistaja haluaa testata vasta keksittyä lääkettä. Se noudattaa standardimenetelmää, jolla lääke koettelee yhtä potilasryhmää ja antaa lumelääke toiselle ryhmälle, nimeltään kontrolliryhmä. Kontrolliryhmälle annettu lumelääke on ainetta, jolla ei ole aiottua terapeuttista arvoa, ja se toimii vertailukohtana mitata, miten toinen ryhmä, jolle annetaan todellinen lääke, reagoi.
Lääkekokeen jälkeen lumelääkettä saaneiden kontrolliryhmän jäsenet ilmoittivat keskimääräisen elinajanodotteen nousevan kolme vuotta, kun taas uuden lääkkeen määrääneen ryhmän jäsenten keskimääräinen elinajanodote kasvoi neljä vuotta. Välitön havainto voi osoittaa, että lääke todellakin toimii, koska tulokset ovat parempia lääkettä käyttävälle ryhmälle. On kuitenkin myös mahdollista, että havainto voi johtua sattumasta, etenkin yllättävästä osasta onnea. T-testi on hyödyllinen päätettäessä, ovatko tulokset oikeita ja sovellettavissa koko väestöön.
Koulussa 100 luokan A oppilasta sai keskimäärin 85% keskimääräisen poikkeaman ollessa 3%. Toiset 100 luokkaan B kuuluvaa opiskelijaa antoivat keskimäärin 87% keskimääräisen poikkeaman ollessa 4%. Vaikka B-luokan keskiarvo on parempi kuin A-luokan, ei välttämättä ole oikein hypätä siihen johtopäätökseen, että B-luokan oppilaiden kokonaissuorituskyky on parempi kuin A-luokan oppilaiden. Tämä johtuu siitä, että tarkoittaa, että luokan B keskihajonta on myös suurempi kuin luokan A. Se osoittaa, että niiden äärimmäiset prosenttimäärät, alempana ja ylemmänä, olivat huomattavasti hajaantuneempia kuin luokassa A. t-testi voi auttaa määrittämään mikä luokka menestyi paremmin.
T-testin oletukset
- Ensimmäinen t-testejä koskeva oletus koskee mittausastetta. T-testin oletuksena on, että kerättyihin tietoihin sovellettu mitta-asteikko noudattaa jatkuvaa tai säännöllistä asteikkoa, kuten esimerkiksi IQ-testin pistemäärät. Toinen oletus on yksinkertainen satunnainen näyte, että tiedot ovat kerätään edustavalta, satunnaisesti valitulta osalta koko väestöstä.Kolmas oletus on, että data, kun piirretään, johtaa normaalijakaumaan, kellonmuotoiseen jakautumiskäyrään.Neljäs oletus on kohtuullisen suuri otoskoko. Suurempi näytteen koko tarkoittaa, että tulosten jakautumisen tulisi lähestyä normaalia kellon muotoista käyrää. Viimeinen oletus on varianssin homogeenisuus. Homogeeninen tai yhtä suuri varianssi esiintyy, kun näytteiden keskihajonnat ovat suunnilleen yhtä suuret.
T-testien laskeminen
T-testin laskeminen vaatii kolme avaintietoarvoa. Ne sisältävät eron kunkin tietojoukon keskiarvojen välillä (kutsutaan keskiarvona), kunkin ryhmän keskihajonnan ja kunkin ryhmän data-arvojen määrän välillä.
T-testin tulos tuottaa t-arvon. Tätä laskettua t-arvoa verrataan sitten arvoon, joka on saatu kriittisestä arvotaulusta (jota kutsutaan T-jakaumatauluksi). Tämä vertailu auttaa määrittämään, kuinka todennäköisesti ero varojen välillä tapahtui sattumalta tai onko tietojoukkoilla todella sisäisiä eroja. T-testi kysyy, edustaako ryhmien välinen ero todellista eroa tutkimuksessa vai onko todennäköinen merkityksetön tilastollinen ero.
T-jakelupöydät
T-jakaantotaulukko on saatavana yksisuuntaisena ja kaksisäikeisenä. Ensimmäistä käytetään arvioimaan tapauksia, joilla on kiinteä arvo tai alue selkeällä suunnalla (positiivinen tai negatiivinen). Mikä on esimerkiksi todennäköisyys, että lähtöarvo pysyy alle -3: n tai saavuttaa enemmän kuin seitsemän, kun noppaparia vieritetään? Jälkimmäistä käytetään etäisyysrajoitettuun analyysiin, kuten esimerkiksi kysyttäessä, ovatko koordinaatit välillä -2 ja +2.
Laskelmat voidaan suorittaa vakio-ohjelmistoilla, jotka tukevat tarvittavia tilastotoimintoja, kuten MS Excel -sovelluksessa.
T-arvot ja vapausasteet
T-testi tuottaa tulosteena kaksi arvoa: t-arvo ja vapausasteet. T-arvo on kahden näytesarjan keskiarvon ja otosjoukkojen välisen eron välinen suhde. Vaikka osoittaja-arvo (ero kahden näytejoukon keskiarvon välillä) on suoraviivainen laskeakseen, nimittäjästä (ero, joka esiintyy otosjoukkojen sisällä) voi tulla hiukan monimutkainen riippuen osallistuvien data-arvojen tyypistä. Suhteen nimittäjä on dispersion tai vaihtelun mittaus. T-arvon korkeammat arvot, joita kutsutaan myös t-pisteiksi, osoittavat, että kahden näytesarjan välillä on suuri ero. Mitä pienempi t-arvo, sitä enemmän samankaltaisuutta on kahden näytesarjan välillä.
- Suuri t-piste osoittaa, että ryhmät ovat erilaisia. Pieni t-piste osoittaa, että ryhmät ovat samanlaisia.
Vapausasteilla viitataan sellaisten tutkimusten arvoihin, joilla on vapaus vaihdella ja jotka ovat välttämättömiä nollahypoteesin merkityksen ja pätevyyden arvioimiseksi. Näiden arvojen laskeminen riippuu yleensä näytteen joukossa käytettävissä olevien tietueiden lukumäärästä.
Korreloiva (tai parillinen) T-testi
Korreloiva t-testi suoritetaan, kun näytteet koostuvat tyypillisesti vastaavista pareista samanlaisista yksiköistä, tai kun on tapauksia toistuvista mittauksista. Esimerkiksi voi esiintyä tapauksia, joissa samat potilaat testataan toistuvasti - ennen tietyn hoidon saamista ja sen jälkeen. Tällaisissa tapauksissa kutakin potilasta käytetään kontrollinäytteenä itseään vastaan.
Tätä menetelmää sovelletaan myös tapauksiin, joissa näytteet liittyvät jollain tavalla tai niillä on vastaavat ominaisuudet, kuten vertaileva analyysi, johon osallistuvat lapset, vanhemmat tai sisarukset. Korreloivat tai parilliset t-testit ovat riippuvaista tyyppiä, koska nämä koskevat tapauksia, joissa kaksi näytesarjaa liittyvät toisiinsa.
Kaava t-arvon ja vapausasteiden laskemiseksi pariksi muodostetulle t-testille on:
- Keskiarvo1 ja keskiarvo2 ovat kunkin näytesarjan keskiarvot, kun taas var1 ja var2 edustavat kunkin näytesarjan varianssia.
Kaksi muuta tyyppiä kuuluvat riippumattomiin t-testeihin. Näiden tyyppiset näytteet valitaan toisistaan riippumattomasti - toisin sanoen kahden ryhmän tietojoukot eivät viittaa samoihin arvoihin. Niihin sisältyy tapauksia, kuten 100 potilaan ryhmä, joka jaetaan kahteen 50 potilaan ryhmään. Yksi ryhmistä tulee kontrolliryhmäksi ja sille annetaan lumelääke, kun taas toinen ryhmä saa määrätyn hoidon. Tämä muodostaa kaksi riippumatonta otosryhmää, jotka ovat parittomia toistensa kanssa.
Y-variaatio (tai yhdistelmä) T-testi
Yhtävarianssista t-testiä käytetään, kun näytteiden lukumäärä kussakin ryhmässä on sama tai kahden tietojoukon varianssi on samanlainen. Seuraavaa kaavaa käytetään t-arvon ja vapausasteen laskemiseen yhtä suurelle varianssille t-testi:
T-arvo = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 keskiarvo1 – keskiarvo2 missä: keskiarvo1 ja keskiarvo2 = kunkin näytteen joukon keskiarvot1 ja var2 = kunkin näytejoukon varianssi n1 ja n2 = tietueiden lukumäärä kussakin otosjoukossa
ja, Vapausasteet = n1 + n2−2 missä: n1 ja n2 = tietueiden lukumäärä kussakin otosjoukossa
Epätasaisen variaation T-testi
Epätasaista varianssia t-testiä käytetään, kun näytteiden lukumäärä kussakin ryhmässä on erilainen, ja myös kahden tietojoukon varianssi on erilainen. Tätä testiä kutsutaan myös Welchin t-testiksi. Seuraavaa kaavaa käytetään t-arvon ja vapausasteen laskemiseen epätasaisen varianssin t-testissä:
T-arvo = n1var12 + n2var22 keskiarvo1 - keskiarvo2, jossa: keskiarvo1 ja keskiarvo2 = kunkin näytteen joukon keskiarvotvar1 ja var2 = kunkin näytesarjan varianssin1 ja n2 = tietueiden lukumäärä kussakin otosjoukossa
ja, Vapausasteet = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 missä: var1 ja var2 = kunkin näytteen sarjan varianssi n1 ja n2 = lukumäärä tietueiden lukumäärät kussakin otosjoukossa
Oikean käytettävän T-testin määrittäminen
Seuraavaa vuokaaviota voidaan käyttää määritettäessä, mitä t-testiä tulisi käyttää näytesarjojen ominaisuuksien perusteella. Tärkeimpiä huomioitavia tekijöitä ovat ovatko näytteistietueet samanlaiset, jokaisessa näytejoukossa olevien tietueiden lukumäärä ja kunkin näytejoukon varianssi.

Kuva Julie Bang © Investopedia 2019
Epätasaisen variaation T-testiesimerkki
Oletetaan, että olemme tekemässä diagonaalisesti taidegalleriassa vastaanotettuja maalauksia. Yksi näyteryhmä sisältää 10 maalausta, kun taas toinen sisältää 20 maalausta. Tietosarjat ja vastaavat keskiarvot ja varianssiarvot ovat seuraavat:
| Sarja 1 | Sarja 2 | |
| 19, 7 | 28, 3 | |
| 20.4 | 26, 7 | |
| 19, 6 | 20.1 | |
| 17.8 | 23, 3 | |
| 18, 5 | 25, 2 | |
| 18.9 | 22.1 | |
| 18.3 | 17.7 | |
| 18.9 | 27, 6 | |
| 19.5 | 20.6 | |
| 21, 95 | 13.7 | |
| 23.2 | ||
| 17.5 | ||
| 20.6 | ||
| 18 | ||
| 23.9 | ||
| 21.6 | ||
| 24.3 | ||
| 20.4 | ||
| 23.9 | ||
| 13, 3 | ||
| Tarkoittaa | 19, 4 | 21.6 |
| vaihtelu | 1, 4 | 17.1 |
Vaikka sarjan 2 keskiarvo on korkeampi kuin sarjan 1, emme voi päätellä, että kaikkien maalausten keskimääräinen pituus on noin 21, 6 yksikköä, koska sarjan 2 varianssi on huomattavasti suurempi kuin sarjan 1. Onko tämä sattumalta vai onko eroja todella olemassa? kaikkien taidegalleriassa saatujen maalausten väestöstä? Vahvistamme ongelman olettamalla nollahypoteesin, että keskiarvo on sama kahden näytesarjan välillä, ja suoritamme t-testin varmistaaksemme hypoteesin paikkansapitävyyden.
Koska datatietueiden lukumäärä on erilainen (n1 = 10 ja n2 = 20) ja varianssi on myös erilainen, t-arvo ja vapausasteet lasketaan yllä olevalle tietojoukolle käyttämällä kaavaa, joka mainitaan epätasaisen varianssin T-testissä osiossa.
T-arvo on -2, 24787. Koska miinusmerkki voidaan jättää huomioimatta vertaamalla kahta t-arvoa, laskettu arvo on 2.24787.
Vapausasteen arvo on 24, 38 ja se pienennetään 24: een, koska kaavan määritelmä vaatii arvon pyöristämisen pienimmäksi mahdolliseksi kokonaislukuarvoksi.
Aina kun normaalijakauma oletetaan, voidaan määritellä todennäköisyystaso (alfataso, merkitsevyystaso, p ) hyväksymiskriteeriksi. Useimmissa tapauksissa voidaan olettaa olevan 5%: n arvo.
Käyttämällä vapausasteen arvoa 24 ja 5%: n merkitsevyystasoa tarkastelemalla t-arvon jakaantotaulua saadaan arvo 2, 064. Vertaamalla tätä arvoa laskettuun arvoon 2.247 osoittaa, että laskettu t-arvo on suurempi kuin taulukon arvo merkitsevyystasolla 5%. Siksi on turvallista hylätä nollahypoteesi, jonka mukaan keinojen välillä ei ole eroa. Väestöjoukolla on luontaisia eroja, eivätkä ne ole sattumaa.
Vertaile sijoitustilejä × Tässä taulukossa olevat tarjoukset ovat peräisin kumppanuuksista, joista Investopedia saa korvauksen. Palveluntarjoajan nimi KuvausAiheeseen liittyvät ehdot
Kuinka varianssianalyysi (ANOVA) toimii Varianssianalyysi (ANOVA) on tilastollinen analyysityökalu, joka erottaa tietojoukossa löydetyn kokonaisvaihtelevuuden kahteen osaan: satunnaisiin ja systemaattisiin tekijöihin. lisää Z-testin määritelmä Z-testi on tilastollinen testi, jota käytetään määrittämään, ovatko kaksi populaatiokeskiarvoa erilaiset, kun varianssit ovat tiedossa ja otoksen koko on suuri. lisää Vapausasteiden määritelmä Vapausasteilla tarkoitetaan loogisesti riippumattomien arvojen, jotka ovat arvoja, joilla on vapaus vaihdella, enimmäismäärää tietonäytteessä. enemmän T-jakauman ymmärtäminen AT-jakauma on tyyppinen todennäköisyysfunktio, joka soveltuu arvioimaan populaatioparametrejä pienille otoskokoille tai tuntemattomille variansseille. lisää Mitä puolipoikkeamalla mitataan Puolipoikkeamalla voidaan arvioida sijoitetun pääoman tuoton keskimääräistä pienemmät vaihtelut. Sitä käytetään vaihtoehtona keskihajonnalle. lisää Bonferroni-testi Bonferroni-testi on eräänlainen moninkertainen vertailukoe, jota käytetään tilastollisessa analyysissä. lisää kumppanilinkkejäAiheeseen liittyvät artikkelit

taloustiede
Mitä oletuksia tehdään t-testin suorittamisessa?

Riskienhallinta
Historiallisen volatiliteetin käyttäminen tulevaisuusriskin mittaamiseksi

Pörssistrategia ja koulutus
Kuinka käyttää Exceliä osakekurssien simulointiin

Taloudelliset tunnusluvut
Kuinka laskea IRR Excelissä?

Matematiikka ja tilastot
Mikä on suhteellinen standardivirhe

Taloudelliset tunnusluvut
Mikä on kaava nettonykyarvon (NPV) laskemiseksi Excelissä?
