Mikä on Chi-Square-tilasto?
Chi-neliö ( χ 2) tilasto on testi, joka mitaa kuinka odotuksia verrataan todettuihin tietoihin (tai mallituloksiin). Chi-neliötilastojen laskemisessa käytettyjen tietojen on oltava satunnaisia, raakoja, toisiaan poissulkevia, peräisin riippumattomista muuttujista ja riittävän suuresta otoksesta. Esimerkiksi kolikon 100-kertaisen heittämisen tulokset täyttävät nämä kriteerit.
Chi-neliötestejä käytetään usein hypoteesitestauksessa.
Kaava Chi-Square on
χc2 = ∑ (Oi − Ei) 2Ei missä: c = vapausasteetO = havaittu arvo (t) E = odotettu arvo (t) alkavat {kohdistettu} & \ chi ^ 2_c = \ summa \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {missä:} \ & c = \ teksti {vapausasteet} \ & O = \ teksti {havaittu arvo (t)} \ & E = \ teksti {odotettu arvo (t) } \ \ loppu {linjassa} χc2 = ∑Ei (Oi −Ei) 2, missä: c = vapausasteetO = havaittu arvo (t) E = odotettu arvo (t)
Mitä Chi-Square-tilasto kertoo sinulle?
Chi-neliötestejä on kahta päätyyppiä: itsenäisyystesti, jossa esitetään suhdekysymys, kuten "Onko sukupuolen ja SAT-pistemäärien välillä suhdetta?"; ja sopivuuden testi, jossa kysytään jotain "Jos kolikko heitetään 100 kertaa, tuleeko se 50 kertaa päähän ja hännään 50 kertaa?"
Näissä kokeissa vapausasteita käytetään määrittämään, voidaanko tietty nollahypoteesi hylätä kokeessa olevien muuttujien ja näytteiden kokonaismäärän perusteella.
Esimerkiksi, kun harkitaan opiskelijoita ja kurssin valintaa, 30 tai 40 opiskelijan otoskoko ei todennäköisesti ole riittävän suuri tuottamaan merkittävää tietoa. Saman tai samankaltaisten tulosten saaminen tutkimuksesta käyttämällä otoskokoa 400 tai 500 opiskelijaa on kelvollisempaa.
Toisessa esimerkissä harkitse kolikon heittämistä 100 kertaa. Odotettavissa oleva tulos kolikon heittämisestä 100 kertaa on, että päät nousevat 50 kertaa ja hännät nousevat 50 kertaa. Todellinen tulos voi olla, että päät nousevat 45 kertaa ja hännät nousevat 55 kertaa. Chi-neliötilastot osoittavat mahdolliset erot odotettujen tulosten ja todellisten tulosten välillä.
Esimerkki chi-neliön testistä
Kuvittele, että satunnainen kysely tehtiin 2 000 eri äänestäjälle, sekä miehille että naisille. Vastaajat luokiteltiin sukupuolen mukaan ja olivatko he republikaanisia, demokraattisia vai riippumattomia. Kuvittele ruudukko, jossa sarakkeet on merkitty tasavaltalaisiksi, demokraattisiksi ja itsenäisiksi, ja kaksi riviä, joissa on uros ja nainen. Oletetaan, että 2000 vastaajan tiedot ovat seuraavat:
Ensimmäinen vaihe chi-neliötilastojen laskemiseksi on löytää odotetut taajuudet. Ne lasketaan jokaiselle ruudukon "solulle". Koska sukupuolikategorioita on kaksi ja poliittisen näkemyksen kolme luokkaa, odotettavissa olevia taajuuksia on yhteensä kuusi. Odotetun taajuuden kaava on:
E (r, c) = n (r) × c (r) n missä: r = rivi kysymyksessäc = kyselyn sarake = vastaava kokonaisuus \ aloita {kohdistettu} & E (r, c) = \ frac {n (r) kertaa c (r)} {n} \ & \ textbf {missä:} \ & r = \ teksti {kyseinen rivi} \ & c = \ teksti {kyseessä oleva sarake} \ & n = \ teksti {vastaava kokonaisuus} \ \ loppu {linjassa} E (r, c) = nn (r) × c (r) missä: r = rivi kyselyssä = kysymyssarake = vastaava kokonaisuus
Tässä esimerkissä odotetut taajuudet ovat:
- E (1, 1) = (900 x 800) / 2 000 = 360E (1, 2) = (900 x 800) / 2 000 = 360E (1, 3) = (200 x 800) / 2 000 = 80E (2, 1) = (900 x 1 200) / 2 000 = 540 E (2, 2) = (900 x 1 200) / 2 000 = 540 E (2, 3) = (200 x 1 200) / 2 000 = 120
Seuraavaksi näitä käytetään arvoina laskettaessa chi-neliötilastot seuraavan kaavan avulla:
Chi-neliö = ∑2E (r, c) missä: O (r, c) = annetulle riville ja sarakkeelle havaitut tiedot \ alkavat {kohdistettu} & \ teksti {Chi-neliö} = \ summa \ frac {^ 2} {E (r, c)} \ & \ textbf {missä:} \ & O (r, c) = \ teksti {annetun rivin ja sarakkeen havaitut tiedot} \ \ loppu {kohdistettu} Chi-squared = ∑E (r, c) 2, jossa: O (r, c) = annetun rivin ja sarakkeen havaitut tiedot
Tässä esimerkissä lauseke jokaiselle havaitulle arvolle on:
- O (1, 1) = (400 - 360) 2/360 = 4, 44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 50 (2, 1) = (500 - 540) 2/540 = 2, 96 O (2, 2) = (600 - 540) 2/540 = 6, 67 O (2, 3) = (100 - 120) 2/120 = 3, 33
Chi-neliön tilastotiedot ovat sitten yhtä suuret näiden arvojen summan kanssa eli 32, 41. Sitten voimme katsoa chi-neliöistä tilastotaulukkoa nähdäksemme, ottaen huomioon kokoonpanomme vapausasteet, onko tulos tilastollisesti merkitsevä vai ei.
