Razlika između varijance uzorka i varijance populacije

Obrazloženje

U statistici se pojam uzorkovanja odnosi na odabir dijela zbirnih statističkih podataka radi dobivanja relevantnih informacija o cjelini. Skup ili čitava statistička informacija o određenom karakteru svih članova obuhvaćenih istraživanjem naziva se "stanovništvo" ili "svemir". (Das, N.G., 2010). Odabrani dio populacije koji se koristi za dobivanje karakteristika stanovništva ili svemira naziva se "uzorkom". Populacija se sastoji od pojedinih jedinica ili članova, a neke su jedinice uključene u uzorak. Ukupni broj jedinica populacije naziva se veličinom populacije, a količina uzorka naziva se veličinom uzorka. Populacija i uzorak mogu biti konačni ili beskonačni, a slični mogu biti postojeći ili hipotetski.

Odstupanje: Varijanca je brojčana vrijednost koja pokazuje kako se široko pojedinačne figure u nizu podataka raspodjeljuju oko srednje vrijednosti. To je koliko je svaki broj udaljen od srednje vrijednosti, a time i jedan od drugog. Varijanta nulte vrijednosti znači da su svi podaci identični. Što je više varijanca, to su više vrijednosti koje se šire oko prosjeka, dakle jedna od druge. Manje je varijance, manje su vrijednosti raširene oko srednje vrijednosti, dakle jedna od druge, a varijanca ne može biti negativna.

Razlika između varijance populacije i varijance uzorka

Glavna razlika između varijance populacije i varijance uzorka odnosi se na izračun varijance. Varijacija se izračunava u pet koraka. Prvo se izračunava srednja vrijednost, zatim se izračunavaju odstupanja od srednje vrijednosti, a treće odstupanja su kvadratna, četvrto se odstupanja od kvadrata zbrajaju i na kraju se taj zbroj dijeli s brojem predmeta za koje se računa varijanca. Tako je varijanca = Σ (xi-x -) / n. Gdje je xi = i. Broj, x- = prosjek i n = broj predmeta ...

Sada, kada se varijanca treba izračunati iz podataka o populaciji, n je jednak broju predmeta. Dakle, ako se odstupanje krvnog tlaka od svih 1000 ljudi izračuna iz podataka o krvnom tlaku svih 1000 ljudi, tada je n = 1000. Međutim, kada se varijanca izračunava iz uzorka podataka 1 treba oduzeti od n prije dijeljenja vrijednosti zbroj kvadratnih odstupanja. Prema tome, u gornjem primjeru ako uzorak podataka sadrži 100 predmeta, nazivnik bi bio 100 - 1 = 99.

Zbog toga je vrijednost varijance izračunata na uzorku podataka veća od vrijednosti koja se mogla utvrditi korištenjem podataka o populaciji. Logika toga jest nadoknaditi nedostatak podataka o populacijskim podacima. Nemoguće je pronaći varijantu visina u ljudskim bićima, za naš apsolutni nedostatak podataka o visinama svih živih ljudskih bića, a da ne govorimo o budućnosti. Čak i ako uzmemo jedan umjereni primjer, poput podataka o naseljenosti o visinama svih živih muškaraca u SAD-u, to je fizički moguće, ali trošak i vrijeme koji su uključeni u to umanjili bi svrhu izračuna. To je razlog zbog kojeg se uzorci uzimaju u većini statističkih svrha, a to je praćeno nedostatkom podataka o većini podataka. Da bi se ovo nadoknadilo, vrijednosti varijance i standardno odstupanje, što je kvadrat korijena varijance, su veće u slučaju podataka uzoraka od varijance iz podataka o populaciji..

Ovo djeluje kao automatski štit za analitičare i donositelje odluka. Logika se odnosi na odluke o proračunu kapitala, osobnim i poslovnim financijama, građevinarstvu, upravljanju prometom i mnogim primjenjivim područjima. Ovo pomaže vlasniku udjela da bude na sigurnoj strani tijekom donošenja odluke ili drugih zaključaka.

Sažetak: Varijacija populacije odnosi se na vrijednost varijance koja se izračunava iz podataka o populaciji, a varijanca uzorka je varijanca izračunata iz podataka o uzorku. Zbog ove vrijednosti nazivnika u formuli za varijancu u slučaju podataka o uzorku je 'n-1', a za podatke populacije to je 'n'. Kao rezultat toga, varijanca i standardno odstupanje dobiveno iz podataka o uzorcima su više nego one utvrđene iz podataka o populaciji.