Kakšna je razlika med diskretnimi in zveznimi podatki?

Kakšna je razlika med diskretnimi in zveznimi podatki?

Rešitev

Diskretni podatki lahko zavzamejo le določene vrednosti. Teh vrednosti je lahko neskončno veliko, vendar je vsaka od njih posebna in med njimi ni sivega območja. Diskretni podatki so lahko številčni - na primer število jabolk -, lahko pa so tudi kategorični - na primer rdeči ali modri, moški ali ženska, dober ali slab.

Neprekinjeni podatki niso omejeni na določene ločene vrednosti, ampak lahko zavzemajo katero koli vrednost v neprekinjenem območju. Med katerima koli dvema vrednostma zveznih podatkov je lahko neskončno število drugih. Neprekinjeni podatki so v osnovi vedno številčni.

Včasih je smiselno številske podatke, ki so pravilno ene vrste, obravnavati kot podatke druge vrste. Na primer, podatek, kot je višina, je zvezen, vendar se pogosto ne oziramo preveč na majhne razlike in namesto tega višino razvrstimo v več diskretnih bins. Nasprotno pa, če štejemo velike količine neke diskretne entitete - riževih zrnc, termitov ali denarcev v gospodarstvu - se lahko odločimo, da 2.000.006 in 2.000.008 ne bomo obravnavali kot bistveno različni vrednosti, temveč kot bližnji točki na približnem kontinuumu.

Včasih je tudi koristno obravnavati številčne podatke kot kategorične, npr.: premajhna teža, normalna teža, debelost. To je običajno le še ena vrsta razvrščanja.

Kategorične podatke je redko smiselno obravnavati kot zvezne.

Komentarji (5)

Podatki so vedno diskretni. Če je vzorec spremenljivke sestavljen iz n vrednosti, je največje število različnih vrednosti, ki jih spremenljivka lahko zavzame, enako n. Glej ta citat

Vsi dejanski vzorčni prostori so diskretni in vsi opazovani naključni vzorci so diskretni. imajo diskretne porazdelitve. Neprekinjena porazdelitev je matematična konstrukcija, primerna za matematično obravnavo, vendar je ni mogoče praktično opazovati. E.J.G. Pitman (1979, str. 1).

Za podatke o spremenljivki se običajno predpostavlja, da so pridobljeni iz naključne spremenljivke. Naključna spremenljivka je zvezna v območju, če obstaja neskončno število možnih vrednosti, ki jih spremenljivka lahko zavzame med katerima koli dvema različnima točkama v območju. Na primer, višina, teža in čas se običajno štejejo za zvezne. Seveda bo vsaka meritev teh spremenljivk končno natančna in v nekaterih smislu diskretna.

Koristno je razlikovati med urejenimi (tj. ordinalnimi) in neurejenimi (tj. nominalnimi), in binarne diskretne spremenljivke.

Nekateri uvodni učbeniki zamenjujejo zvezno spremenljivko s številčno spremenljivko. Na primer, rezultat v računalniški igri je diskreten, čeprav je številčen.

Nekateri uvodni učbeniki zamenjujejo spremenljivko razmerja z zveznimi spremenljivkami. Spremenljivka števila je spremenljivka razmerja, vendar ni zvezna.

V praksi se spremenljivka pogosto obravnava kot zvezna, kadar lahko zavzame dovolj veliko število različnih vrednosti.

Reference

  • Pitman, E. J. G. 1979. Nekaj osnovne teorije statističnega sklepanja. London: Chapman and Hall. Opomba: Citat sem našel v uvodu 2. poglavja knjige Murrayja Aitkina Statistično sklepanje: Integrirani Bayesov/verjetnostni pristop.
Komentarji (3)

Temperature so stalne. Lahko je 23 stopinj, 23,1 stopinje, 23,100004 stopinj.

Spol je diskreten. Lahko si samo moški ali ženska (v klasičnem razmišljanju). Nekaj, kar lahko predstavite s celim številom, kot so 1, 2 itd.

Razlika je pomembna, saj lahko številni statistični algoritmi in algoritmi za podatkovno rudarjenje obdelujejo eno vrsto, druge pa ne. Na primer pri običajni regresiji mora biti Y zvezen. Pri logistični regresiji je Y diskreten.

Komentarji (1)