Varianssi on tietojoukon numeroiden välisen eron mittaus. Varianssi mittaa kuinka kaukana sarjan jokainen luku on keskiarvosta.
Tietojoukkokaaviota käyttämällä voimme tarkkailla, mikä on eri datapisteiden tai numeroiden lineaarinen suhde. Teemme tämän piirtämällä regressioviivan, jolla yritetään minimoida minkä tahansa yksittäisen datapisteen etäisyys itse linjasta. Alla olevassa taulukossa datapisteet ovat sinisiä pisteitä, oranssi viiva on regressioviiva ja punaiset nuolet ovat etäisyys havaitusta tiedosta ja regressioviiva.

Kuva Julie Bang © Investopedia 2020
Laskeessamme varianssia kysymme, ottaen huomioon kaikkien näiden datapisteiden suhteet, kuinka paljon etäisyyttä odotamme seuraavalle datapisteelle? Tätä "etäisyyttä" kutsutaan virhetermiksi, ja sitä varianssi mittaa.
Sinänsä varianssista ei ole usein hyötyä, koska siinä ei ole yksikköä, mikä vaikeuttaa mittaamista ja vertailua. Varianssin neliöjuuri on kuitenkin standardipoikkeama, ja se on molemmat käytännöllinen mittauksena.
Varianssin laskeminen Excelissä
Varianssin laskeminen Excelissä on helppoa, jos tietojoukko on jo syötetty ohjelmistoon. Oheisessa esimerkissä lasketaan 20 päivän päivittäisen tuoton variaatio S&P 500: een sijoittavassa erittäin suositussa SPY-nimisessä pörssikaupparahastossa (ETF).
- Kaava on = VAR.S (valitse data)
Syy, että haluat käyttää VAR.S: ää eikä VAR.P: tä (joka on toinen tarjottu kaava), on se, että usein sinulla ei ole koko tietokantaa mitattaviksi. Esimerkiksi, jos meillä olisi taulukossa kaikki SPY ETF -historian tuotot, voisimme käyttää populaatiomittausta VAR.P, mutta koska mittaamme vain viimeiset 20 päivää käsitteen havainnollistamiseksi, käytämme VAR.S.

Kuten näette, laskettu varianssiarvo.000018674 kertoo meille vähän itsestään tietojoukosta. Jos jatkamme neliöjuuren kyseisen arvon saamiseksi tuottojen keskihajontaa, se olisi hyödyllisempää.
