Populacija v primerjavi s standardnim odklonom vzorca
V statistiki se za opis nabora podatkov uporablja več indeksov, ki ustrezajo njegovi osrednji tendenci, disperziji in asimetriji. Standardni odklon je ena najpogostejših mer razpršitve podatkov od središča nabora podatkov.
Zaradi praktičnih težav pri testiranju hipoteze ne bo mogoče uporabiti podatkov celotne populacije. Zato za sklepanje o populaciji uporabljamo vrednosti podatkov iz vzorcev. V takšni situaciji se ti imenujejo ocenjevalci, saj ocenjujejo vrednosti parametrov populacije.
Izredno pomembno je, da pri sklepanju uporabljamo nepristranske ocenjevalce. Ocenjevalnik je nepristranski, če je pričakovana vrednost tega ocenjevalca enaka parametru populacije. Vzorčno povprečje na primer uporabljamo kot nepristranski ocenjevalec za populacijsko povprečje. (Matematično je mogoče dokazati, da je pričakovana vrednost vzorčnega povprečja enaka povprečju populacije). V primeru ocenjevanja standardnega odklona populacije je tudi vzorčni standardni odklon nepristranski ocenjevalec.
Kaj je standardni odklon populacije?
Ko je mogoče upoštevati podatke celotne populacije (na primer v primeru popisa), je mogoče izračunati standardno odstopanje populacije. Za izračun standardnega odklona populacije se najprej izračunajo odstopanja vrednosti podatkov od povprečja populacije. Koren povprečja kvadrata (kvadratno povprečje) odstopanj se imenuje standardno odstopanje populacije.
V razredu 10 učencev je mogoče preprosto zbrati podatke o učencih. Če se hipoteza testira na tej populaciji študentov, potem ni potrebe po uporabi vzorčnih vrednosti. Na primer, izmerjena teža 10 študentov (v kilogramih) je 70, 62, 65, 72, 80, 70, 63, 72, 77 in 79. Potem je povprečna teža desetih ljudi (v kilogramih) (70+62+65+72+80+70+63+72+77+79)/10, kar je 71 (v kilogramih). To je povprečje populacije.
Za izračun standardnega odstopanja populacije izračunamo odstopanja od povprečja. Vsaka odstopanja od povprečja so (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 in (79 – 71)=8. Vsota kvadratov odstopanja je (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Standardni odklon populacije je √(366/10)=6,05 (v kilogramih). 71 je natančna povprečna teža učencev razreda in 6.05 je točno standardno odstopanje teže od 71.
Kaj je standardni odklon vzorca?
Ko se podatki iz vzorca (velikosti n) uporabijo za oceno parametrov populacije, se izračuna standardna deviacija vzorca. Najprej se izračunajo odstopanja vrednosti podatkov od vzorčne sredine. Ker se vzorčno povprečje uporablja namesto populacijskega povprečja (ki ni znano), uporaba kvadratnega povprečja ni primerna. Da bi nadomestili uporabo vzorčne sredine, se vsota kvadratov odstopanj deli z (n-1) namesto z n. Standardni odklon vzorca je kvadratni koren tega. V matematičnih simbolih je S=√{∑(xi-ẍ)2 / (n-1)}, kjer je S standardna deviacija vzorca, ẍ je vzorčna sredina in xi so podatkovne točke.
Zdaj predpostavimo, da so v prejšnjem primeru populacija učenci celotne šole. Potem bo razred samo vzorec. Če se ta vzorec uporabi pri oceni, bo standardni odklon vzorca √(366/9)=6.38 (v kilogramih), saj je bilo 366 deljeno z 9 namesto z 10 (velikost vzorca). Dejstvo, ki ga je treba upoštevati, je, da ni zajamčeno, da je to natančna vrednost standardnega odstopanja populacije. To je zgolj ocena.
Kakšna je razlika med standardnim odklonom populacije in standardnim odklonom vzorca?
• Standardni odklon populacije je natančna vrednost parametra, ki se uporablja za merjenje disperzije od središča, medtem ko je vzorčni standardni odklon zanj nepristranski ocenjevalec.
• Standardni odklon populacije je izračunan, ko so znani vsi podatki za vsakega posameznika v populaciji. V nasprotnem primeru se izračuna standardno odstopanje vzorca.
• Standardni odklon populacije je podan s σ=√{ ∑(xi-µ)2/ n}, kjer je µ povprečje populacije in n velikost populacije, vendar standardno odstopanje vzorca je podano s S=√{ ∑(xi-ẍ)2 / (n-1)}, kjer je ẍ povprečje vzorca in n velikost vzorca.