Mikä on neliöiden summa?
Ruutujen summa on tilastollinen tekniikka, jota käytetään regressioanalyysissä tietopisteiden leviämisen määrittämiseksi. Regressioanalyysissä tavoitteena on selvittää, kuinka hyvin tietosarjat voidaan sovittaa funktioon, joka voi auttaa selittämään, kuinka datasarja muodostettiin. Neliösummaa käytetään matemaattisena tapana löytää funktio, joka sopii parhaiten (vaihtelee vähiten) tiedoista.
Kaava neliöiden summalle on
N: n esineestä koostuvalle X: n neliöiden summa = i = 0∑n (Xi −X) 2 missä: Xi = joukon i: nnen alkioX = kaikkien sarjan alkioiden keskiarvo (Xi −X)) = Kunkin kohteen poikkeama keskiarvosta
Ruutujen summa tunnetaan myös variaationa.
Mitä ruutujen summa kertoo sinulle?
Ruutujen summa on keskimäärästä poikkeamisen mitta. Tilastossa keskiarvo on numerojoukon keskiarvo ja se on yleisimmin käytetty keskitason taipumus. Aritmeettinen keskiarvo lasketaan yksinkertaisesti laskemalla yhteen tietojoukon arvot ja jakamalla arvojen lukumäärä.
Oletetaan, että Microsoftin (MSFT) päätöskurssit olivat viimeisen viiden päivän aikana 74, 01, 74, 77, 73, 94, 73, 61 ja 73, 40 Yhdysvaltain dollareissa. Kokonaishintojen summa on 369, 73 dollaria, ja oppikirjan keskimääräinen tai keskimääräinen hinta olisi siten 369, 73 dollaria / 5 = 73, 95 dollaria.
Mutta mittausjoukon keskiarvon tunteminen ei aina riitä. Joskus on hyödyllistä tietää, kuinka paljon variaatiota mittajoukossa on. Se, kuinka kaukana yksittäiset arvot ovat keskiarvosta, voi antaa jonkinlaisen kuvan siitä, kuinka havainnot tai arvot sopivat luotavaan regressiomalliin.
Esimerkiksi, jos analyytikko halusi tietää, liikkuuko MSFT: n osakekurssi yhdessä Applen kurssin (AAPL) kanssa, hän voi luetella havaintojoukot molempien osakkeiden prosessista tietyn ajanjakson ajan, ts. 1, 2 tai 10 vuotta ja luo lineaarinen malli jokaisella havainnolla tai mittauksella. Jos suhde molempien muuttujien (ts. AAPL: n ja MSFT: n hinnan) välillä ei ole suoraviivainen, niin tietojoukossa on eroja, jotka on tutkittava.
Tilastoissa puhutaan, että jos luodussa lineaarisessa mallissa oleva rivi ei läpäise kaikkia arvojen mittauksia, niin osa osakekurssien havainnoidusta variaatiosta on selittämätön. Ruutujen summaa käytetään laskemaan, onko kahden muuttujan välillä lineaarinen suhde, ja mahdolliseen selittämättömään muuttuvuuteen viitataan neliöiden jäännössummana.
Ruutujen summa on variaatiokentän summa, jossa variaatio määritellään jakautumisena kunkin yksittäisen arvon ja keskiarvon välillä. Neliöiden summan määrittämiseksi kunkin datapisteen ja parhaiten sopivan viivan välinen etäisyys neliöidään ja summataan sitten yhteen. Parhaiten sopiva rivi minimoi tämän arvon.
Kuinka laskea neliöiden summa
Nyt voit nähdä, miksi mittausta kutsutaan neliöpoikkeamien summaksi tai lyhyiden neliöiden summaksi. Yllä olevan MSFT-esimerkin avulla neliöiden summa voidaan laskea seuraavasti:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Pelkästään poikkeamien summan lisääminen ilman neliöimistä tuottaa luvun, joka on yhtä suuri tai lähellä nollaa, koska negatiiviset poikkeamat tasoittavat melkein täydellisesti positiiviset poikkeamat. Realistisemman luvun saamiseksi poikkeamien summa on ruudutettava. Neliöiden summa on aina positiivinen luku, koska minkä tahansa lukujen positiivinen tai negatiivinen luku on aina positiivinen.
Esimerkki kuinka neliösummaa käytetään
MSFT-laskelman tulosten perusteella korkea neliösumma osoittaa, että suurin osa arvoista on kauempana keskiarvosta, ja siten tiedoissa on suurta vaihtelua. Alhainen neliösumma viittaa havaintojen joukon pieneen variaatioon.
Yllä olevassa esimerkissä luku 1.0942 osoittaa, että MSFT: n osakekurssien vaihtelut viimeisen viiden päivän aikana ovat hyvin alhaiset ja sijoittajat, jotka haluavat sijoittaa osakkeisiin, joille on ominaista hintavakaus ja heikko volatiliteetti, voivat valita MSFT: n.
Avainsanat
- Ruutujen summa mittaa datapisteiden poikkeaman keskiarvosta. Korkeampi neliösumman tulos osoittaa tietojoukon suuren vaihtelevuuden, kun taas alempi tulos osoittaa, että tiedot eroavat huomattavasti keskiarvosta..
Ruutumien summan käytön rajoitukset
Sijoituspäätöksen tekeminen ostettavasta osakekannasta vaatii paljon enemmän havaintoja kuin tässä luetellut. Analyytikon on ehkä jouduttava työskentelemään vuosien tietojen kanssa saadakseen paremmin varmuuden siitä, kuinka suuri tai matala omaisuuserän variaatio on. Kun joukkoon lisätään enemmän datapisteitä, neliöiden summa kasvaa, koska arvot jakautuvat enemmän.
Laajimmin käytetyt variaation mittaukset ovat keskihajonta ja varianssi. Kummankin mittarin laskemiseksi on kuitenkin ensin laskettava neliöiden summa. Varianssi on neliöiden summan keskiarvo (ts. Neliöiden summa jaettuna havaintojen lukumäärällä). Vakiopoikkeama on varianssin neliöjuuri.
On olemassa kaksi regressioanalyysimenetelmää, joissa käytetään neliösummaa: lineaaristen pienimpien neliöiden menetelmä ja epälineaarisen pienimpien neliöiden menetelmä. Pienimmän neliösumman menetelmä viittaa siihen, että regressiofunktio minimoi varianssin neliöiden summan todellisista datapisteistä. Tällä tavoin on mahdollista piirtää toiminto, joka tilastollisesti tarjoaa parhaan mahdollisen datan. Huomaa, että regressiofunktio voi olla joko lineaarinen (suora viiva) tai epälineaarinen (kaareva viiva).
