Mikä on vääriä korrelaatio
Tilastoissa väärää korrelaatiota tai vääryyttä viitataan kahden muuttujan väliseen yhteyteen, joka näyttää syylliseltä, mutta ei ole. Vilpillisissä suhteissa näyttää usein olevan yksi muuttuja, joka vaikuttaa toiseen. Tämä harhaanjohtava korrelaatio johtuu usein kolmannesta tekijästä, jota ei ole havaittavissa tutkimushetkellä, jota joskus kutsutaan hämmentäväksi tekijäksi.
Avainsanat
- Väärä korrelaatio tai vääryys on silloin, kun kaksi tekijää näyttävät olevan satunnaisesti liittyviä, mutta eivät ole toisiinsa. Syy-suhteen ilmeneminen johtuu usein samanlaisesta liikkeestä kaaviossa, joka osoittautuu sattumanvaraiseksi tai johtuu kolmannesta "sekoittavasta" tekijästä.Väärää korrelaatiota. voi usein johtua pienistä otoskokoista tai mielivaltaisista päätepisteistä.
Kuinka väärä korrelaatio toimii
Kun kaksi satunnaismuuttujaa seuraa toisiaan tarkasti kuvaajassa, on helppo epäillä korrelaatiota tai näiden kahden tekijän välistä suhdetta, kun muutos vaikuttaa toiseen. Kun toinen syy "syy-yhteyteen" jätetään syrjään, tämä havainto voi johtaa kaavion lukijaan uskomaan, että muuttujan A liike liittyy muuttujan B liikkeeseen tai päinvastoin. mutta joskus tarkemmassa tilastollisessa tutkimuksessa kohdistetut liikkeet ovat sattumaa tai johtuvat kolmannesta tekijästä, joka vaikuttaa kahteen ensimmäiseen. Tämä on väärä korrelaatio. Tutkimus, joka tehdään pienillä näytteen suuruuksilla tai mielivaltaisilla päätepisteillä, on erityisyys, joka on alttiita harhaan.
Esimerkki vääristä korrelaatioista
Mielenkiintoisten korrelaatioiden löytäminen ei ole liian haastavaa. Monet kuitenkin osoittautuvat harhaan. Wall Streetin uroslajeissa kaksi suosittua vääriä korrelaatioita koskevat naisia ja urheilua. 1920-luvulta peräisin on hamepituuden teoria, jonka mukaan hamepituudet ja osakemarkkinoiden suunta korreloivat. Jos hame on pitkä, se tarkoittaa osakemarkkinoiden laskua; jos ne ovat lyhyitä, markkinat nousevat. Tammikuun lopulla puhutaan ns. Super Bowl -indikaattorista, joka viittaa siihen, että AFC-joukkueen voitto tarkoittaa todennäköisesti osakemarkkinoiden laskua tulevana vuonna, kun taas NFC-joukkueen voitto merkitsee kurssin nousua. markkinoida. Vuodesta 1966 lähtien indikaattorin tarkkuus on ollut 80%. Se on hauska keskustelupala, mutta luultavasti ei jotain, jota vakava taloudellinen neuvonantaja suosittelisi sijoitusstrategiana asiakkaille.
Tässä on muutama esimerkki yleisistä vääristä korrelaatioista:
- Hukkumat lisääntyvät jäätelön myynnin kasvaessa. Voi vaikuttaa siltä, että lisääntynyt jäätelömyymä aiheuttaa enemmän hukkumista, mutta todellisuudessa nouseva lämpö voi saada enemmän ihmisiä uimaan ja ostamaan enemmän jäätelöä. Yhdysvaltojen murhaaste vuosina 2006-2011 laski samalla tahdilla kuin Microsoft Internet Explorer käyttö.Läättäjät, jotka sanovat kiitos ja kiitos, nauttivat paremmin jakamisesta paremmin. Oakland Raiders -joukkuevarusteita käyttävät ihmiset tekevät todennäköisemmin rikoksia.
Kuinka havaita vääriä korrelaatioita
Tilastotieteilijöiden ja muiden tietoja analysoivien tutkijoiden on aina etsittävä vääriä suhteita. He käyttävät useita menetelmiä, mukaan lukien:
- Oikean edustavan näytteen varmistaminen.Ole riittävä otoskoko.Ole varovainen mielivaltaisista päätepisteistä.Valitse mahdollisimman monta ulkopuolista muuttujaa.Käytä nollahypoteesia ja tarkista vahvan p-arvon varalta.
