Kategorični podatki v primerjavi s številskimi podatki
Podatki so dejstva ali informacije, zbrane za namene reference ali analize. Pogosto se ti podatki zbirajo kot atribut zadevnega subjekta. Ta atribut se lahko razlikuje od enega do drugega, zato ga lahko obravnavamo kot spremenljivko. Spremenljivke lahko prevzamejo različne oblike vrednosti in te so del zbranih podatkov.
Spremenljivke so lahko kvalitativne ali kvantitativne; če je spremenljivka kvantitativna, so odgovori številke in velikost izmerjenega atributa je mogoče navesti z določeno stopnjo natančnosti. Druga vrsta, kvalitativne spremenljivke, merijo kvalitativne lastnosti in vrednosti, ki jih predpostavljajo spremenljivke, ne morejo biti podane v smislu velikosti ali velikosti. Spremenljivke same so znane kot kategorične spremenljivke in podatki, zbrani s pomočjo kategorične spremenljivke, so kategorični podatki.
Več o številskih podatkih
Numerični podatki so v bistvu kvantitativni podatki, pridobljeni iz spremenljivke, vrednost pa ima pomen velikosti/magnitude. Pridobljeni numerični podatki so nadalje razdeljeni v tri kategorije, ki temeljijo na teoriji, ki jo je razvil Stanley Smith Stevens. Številski podatki so lahko ordinalni, intervalni ali razmerni. Vrsta podatkov je določena z metodo merjenja vrednosti, vrste pa so znane kot nivoji meritev.
Teža osebe, razdalja med dvema točkama, temperatura in cena delnice so primeri numeričnih podatkov.
V statistiki je večina metod izpeljana za analizo numeričnih podatkov. Osnovna deskriptivna statistika in regresija ter druge metode sklepanja se večinoma uporabljajo za analizo numeričnih podatkov.
Več o kategoričnih podatkih
Kategorični podatki so vrednosti za kvalitativno spremenljivko, pogosto številko, besedo ali simbol. Izpostavljajo dejstvo, da spremenljivka v obravnavanem primeru pripada eni izmed več razpoložljivih izbir. Zato spadajo v eno od kategorij; od tod tudi ime kategorično.
Politična pripadnost osebe, narodnost osebe, najljubša barva osebe in krvna skupina bolnika so kvalitativni atributi. Včasih je mogoče dobiti število kot kategorično vrednost, vendar število samo po sebi ne predstavlja velikosti izmerjenega atributa. Primer je poštna številka.
Poleg tega vse kategorične vrednosti pripadajo nominalnemu podatkovnemu tipu, ki je še en tip, ki temelji na nivojih meritev. Metode, ki se uporabljajo za analizo kategoričnih podatkov, se razlikujejo od tistih za numerične podatke, vendar je lahko osnovno načelo enako.
Kakšna je razlika med kategoričnimi in številskimi podatki?
• Numerični podatki so vrednosti, dobljene za kvantitativno spremenljivko, in nosijo občutek velikosti, povezan s kontekstom spremenljivke (zato so vedno številke ali simboli, ki nosijo številsko vrednost). Kategorični podatki so vrednosti, dobljene za kvalitativno spremenljivko; številke kategoričnih podatkov nimajo občutka velikosti.
• Numerični podatki vedno pripadajo ordinalnemu, razmerniškemu ali intervalnemu tipu, medtem ko kategorični podatki pripadajo nominalnemu tipu.
• Metode, uporabljene za analizo kvantitativnih podatkov, se razlikujejo od metod, uporabljenih za kategorične podatke, tudi če so načela enaka, ima vsaj aplikacija pomembne razlike.
• Numerični podatki so analizirani s statističnimi metodami v opisni statistiki, regresiji, časovnih vrstah in mnogih drugih.
• Za kategorične podatke se običajno uporabljajo deskriptivne metode in grafične metode. Uporabljajo se tudi nekateri neparametrični testi.