Korelacija proti kovarianci
Korelacija in kovarianca sta tesno povezana pojma v teoretični statistiki. Pomembni so pri določanju odnosa med dvema naključnima spremenljivkama.
Kaj je korelacija?
Korelacija je merilo moči odnosa med dvema spremenljivkama. Korelacijski koeficient kvantificira stopnjo spremembe ene spremenljivke glede na spremembo druge spremenljivke. V statistiki je korelacija povezana s konceptom odvisnosti, ki je statistični odnos med dvema spremenljivkama
Pearsonov korelacijski koeficient ali samo korelacijski koeficient r je vrednost med -1 in 1 (-1≤r≤+1). Je najpogosteje uporabljen korelacijski koeficient in velja le za linearno razmerje med spremenljivkami. Če je r=0, razmerje ne obstaja in če je r≥0, je razmerje premo sorazmerno; vrednost ene spremenljivke narašča z naraščanjem druge. Če je r≤0, je razmerje obratno sorazmerno; ena spremenljivka se zmanjša, medtem ko se druga poveča.
Zaradi pogoja linearnosti lahko korelacijski koeficient r uporabimo tudi za ugotavljanje prisotnosti linearne povezave med spremenljivkama.
Kaj je kovarianca?
V statistični teoriji je kovarianca merilo, koliko se dve naključni spremenljivki spremenita skupaj. Z drugimi besedami, kovarianca je merilo moči korelacije med dvema naključnima spremenljivkama.
Iz druge perspektive je mogoče videti, da je korelacija samo normalizirana različica kovariance, kjer je kovarianca deljena s produktom standardnih odklonov dveh naključnih spremenljivk. Razpon kovariance je lahko velik; zato ni enostavno primerjati. To težavo je mogoče premagati tako, da se vrednosti kovariance prenesejo v obseg, kjer jih je mogoče primerjati z normalizacijo (podobno kot to počne z-rezultat). Čeprav sta kovarianca in varianca med seboj povezani na zgornji način, njuni verjetnostni porazdelitvi nista povezani na preprost način in ju je treba obravnavati ločeno.
Kakšna je razlika med korelacijo in kovarianco?
• Tako korelacija kot kovarianca sta meri razmerja med dvema naključnima spremenljivkama. Korelacija je merilo moči linearnosti obeh spremenljivk, kovarianca pa je merilo moči korelacije.
• Vrednosti korelacijskega koeficienta so vrednosti med -1 in +1, medtem ko razpon kovariance ni konstanten, ampak je lahko pozitiven ali negativen. Toda če so naključne spremenljivke standardizirane pred izračunom kovariance, potem je kovarianca enaka korelaciji in ima vrednost med -1 in +1.