Mikä on varianssianalyysi (ANOVA)?
Varianssianalyysi (ANOVA) on tilastoissa käytetty analysointityökalu, joka jakaa tietojoukon sisällä havaitun kokonaismuuttuvuuden kahteen osaan: systemaattiset tekijät ja satunnaiskertoimet. Järjestelmällisillä tekijöillä on tilastollinen vaikutus annettuun tietojoukkoon, kun taas satunnaiskertoimilla ei ole. Analyytikot käyttävät ANOVA-testiä määrittääkseen riippumattomien muuttujien vaikutuksen riippuvaiseen muuttujaan regressiotutkimuksessa.
1900-luvulla kehitettyjä t- ja z-testimenetelmiä käytettiin tilastollisiin analyyseihin vuoteen 1918 saakka, jolloin Ronald Fisher loi varianssimenetelmän. ANOVA: ta kutsutaan myös Fisherin varianssianalyysiksi, ja se on t- ja z-testien jatke. Termi tuli tunnetuksi vuonna 1925, esiintymisen jälkeen Fisherin kirjassa "Tilastolliset menetelmät tutkijoille". Sitä käytettiin kokeellisessa psykologiassa ja laajennettiin myöhemmin aiheisiin, jotka olivat monimutkaisempia.
ANOVA-kaava on:
F = MSEMST jossa: F = ANOVA-kerroinMST = käsittelystä johtuva neliöiden keskimääräinen summaMSE = virheestä johtuva neliöiden keskimääräinen summa
Mitä varianssianalyysi paljastaa?
ANOVA-testi on ensimmäinen vaihe analysoida tekijöitä, jotka vaikuttavat tiettyyn tietojoukkoon. Kun testi on valmis, analyytikko suorittaa lisätestauksen metodisille tekijöille, jotka mittaavasti lisäävät tietojoukon epäjohdonmukaisuutta. Analyytikko hyödyntää ANOVA-testituloksia f-testissä tuottaakseen lisätietoja, jotka ovat yhdenmukaisia ehdotettujen regressiomallien kanssa.
ANOVA-testi mahdollistaa useamman kuin kahden ryhmän vertailun samanaikaisesti sen määrittämiseksi, onko niiden välillä yhteys. ANOVA-kaavan tulos, F-tilasto (jota kutsutaan myös F-suhteeksi), mahdollistaa useiden tietoryhmien analysoinnin näytteiden välisen ja näytteiden sisäisen variaatioiden määrittämiseksi.
Jos testattujen ryhmien välillä ei ole todellista eroa, jota kutsutaan nollahypoteesiksi, ANOVA: n F-suhteen tilastotulos on lähellä arvoa 1. Sen näytteenoton vaihtelut seuraavat todennäköisesti Fisher F -jakaumaa. Tämä on oikeastaan ryhmä jakelufunktioita, joilla on kaksi ominaislukua, joita kutsutaan vapauden asteen numeroijaksi ja nimittäjäksi vapausasteiksi.
Avainsanat
- Varianssianalyysi, tai ANOVA, on tilastollinen menetelmä, joka erottaa havaitut varianssitiedot eri komponenteiksi käytettäväksi lisätesteissä. Yhdensuuntaista ANOVAa käytetään kolmessa tai useammassa tietoryhmässä, jotta saadaan tietoa riippuvaisen ja riippumattomia muuttujia.Jos ryhmien välillä ei ole todellista varianssia, ANOVA: n F-suhteen tulisi olla lähellä yhtä.
Esimerkki kuinka ANOVA: ta käytetään
Tutkija voi esimerkiksi testata useiden korkeakoulujen opiskelijoita nähdäkseen, ylittävätkö yhden korkeakoulun opiskelijat jatkuvasti muiden korkeakoulujen opiskelijat. Yrityssovelluksessa T & K-tutkija voi testata kahta erilaista prosessia tuotteen luomiseksi nähdäksesi onko yksi prosessi parempi kuin toinen kustannustehokkuuden kannalta.
Käytetty ANOVA-testin tyyppi riippuu monista tekijöistä. Sitä käytetään, kun datan on oltava kokeellista. Varianssianalyysiä käytetään, jos tilastollisiin ohjelmistoihin ei ole pääsyä, mikä johtaa ANOVA: n laskentaan käsin. Se on helppo käyttää ja soveltuu parhaiten pieniin näytteisiin. Monien kokeellisten mallien kanssa otoskokojen on oltava samat eri tekijätason yhdistelmille.
ANOVA on hyödyllinen kolmen tai useamman muuttujan testaamisessa. Se on samanlainen kuin monen kahden näytteen t-testit. Se johtaa kuitenkin vähemmän tyypin I virheitä ja on sopiva moniin ongelmiin. ANOVA ryhmittelee erot vertaamalla kunkin ryhmän keskiarvoja ja sisältää varianssin jakamisen eri lähteisiin. Sitä käytetään koehenkilöiden, testiryhmien, ryhmien välillä ja ryhmien sisällä.
Yksisuuntainen ANOVA tai kaksisuuntainen ANOVA
ANOVA-tyyppejä on kahta tyyppiä: yksisuuntainen (tai yksisuuntainen) ja kaksisuuntainen. Yksisuuntainen tai kaksisuuntainen tarkoittaa riippumattomien muuttujien lukumäärää varianssitestin analyysissä. Yhdensuuntainen ANOVA arvioi ainoan tekijän vaikutuksen ainoaan vastemuuttujaan. Se määrittää ovatko kaikki näytteet samat. Yhdensuuntaista ANOVA: ta käytetään määrittämään, onko kolmen tai useamman riippumattoman (toisiinsa liittymättömän) ryhmän keskiarvojen välillä tilastollisesti merkitseviä eroja.
Kaksisuuntainen ANOVA on yksisuuntaisen ANOVA jatko. Yhdensuuntaisesti sinulla on yksi riippumaton muuttuja, joka vaikuttaa riippuvaiseen muuttujaan. Kaksisuuntaisella ANOVAlla on kaksi riippumatonta. Esimerkiksi kaksisuuntainen ANOVA antaa yritykselle mahdollisuuden vertailla työntekijöiden tuottavuutta kahden riippumattoman muuttujan, kuten palkan ja taitojoukon, perusteella. Sitä käytetään tarkkailemaan kahden tekijän vuorovaikutusta ja testaamaan kahden tekijän vaikutus samanaikaisesti.
