Varijanta vs kovarijanca
Varijanca i kovarijancija dvije su mjere koje se koriste u statistici. Varijanca je mjera rasipanja podataka, a kovarijancija označava stupanj promjene dvije slučajne varijable zajedno. Varijanca je poprilično intuitivan pojam, ali kovarijancija se matematički definira u početku ne tako intuitivnom.
Više o varijanci
Varijanca je mjera disperzije podataka od srednje vrijednosti distribucije. To govori koliko udaljene podatkovne točke od srednje vrijednosti distribucije. To je jedan od primarnih deskriptora distribucije vjerojatnosti i jedan od trenutaka distribucije. Takođe, varijanca je parametar populacije, a varijanca uzorka iz populacije djeluje kao procjenitelj varijancije populacije. Iz jedne perspektive definira se kao kvadrat standardnog odstupanja.
Jednostavnim jezikom može se opisati kao prosjek kvadrata udaljenosti između svake podatkovne točke i srednje vrijednosti raspodjele. Za izračunavanje varijance koristi se sljedeća formula.
Var (X) = E [(X-μ)2 ] za stanovništvo i
Var (X) = E [(X-~x)2 ] za uzorak
Nadalje se može pojednostaviti dajući Var (X) = E [X2 ] - (E [X])2.
Varijanca ima neka svojstva potpisa, a često se koristi u statistici da bi pojednostavili upotrebu. Varijanca je negativna jer je to kvadrat udaljenosti. Međutim, raspon varijance nije ograničen i ovisi o pojedinoj distribuciji. Varijanca konstantne slučajne varijable je nula, a varijanca se ne mijenja s obzirom na parametar lokacije.
Više o Covariance
U statističkoj teoriji kovarijanta je mjera koliko se dvije slučajne varijable zajedno mijenjaju. Drugim riječima, kovarijancija je mjera snage korelacije između dvije slučajne varijable. Također, može se smatrati generalizacijom koncepta varijance dvije slučajne varijable.
Kovarijacija dvije slučajne varijable X i Y, koje su zajednički raspodijeljene s konačnim sekundarnim zamahom, poznata je kao σXY= E [(X-E [X]) (Y-E [Y])]. Iz toga se varijanca može promatrati kao poseban slučaj kovarijance, pri čemu su dvije varijable iste. COV (X, X) = Var (X)
Normalizacijom kovarijancije može se dobiti koeficijent linearne korelacije ili Pearsonov koeficijent korelacije, koji je definiran kao ρ = E [(X-E [X]) (Y-E [Y])] / (σx σY ) = (Cov (X, Y)) / (σx σY)
Grafički gledano, kovarijancija između para podataka može se promatrati kao područje pravokutnika s podatkovnim točkama na suprotnim vrhovima. Može se protumačiti kao mjera veličine razdvajanja između dviju podataka. Uzimajući u obzir pravokutnike za čitavu populaciju, jačina odvajanja može se smatrati preklapanjem pravokutnika koji odgovara svim točkama podataka; varijanca dviju varijabli. Kovarijacija je u dvije dimenzije, zbog dvije varijable, ali pojednostavljivanje jedne varijable daje varijancu jednog kao razdvajanje u jednoj dimenziji.
Koja je razlika između varijance i kovariance?
• Varijanca je mjera širenja / disperzije u populaciji dok se kovarijancija smatra mjerom varijacije dvije slučajne varijable ili jačine korelacije.
• Varijacija se može smatrati posebnim slučajem kovarijance.
• Varijansa i kovarijancija ovise o veličini vrijednosti podataka i ne mogu se uspoređivati; dakle, oni se normaliziraju. Kovarijacija se normalizira u koeficijent korelacije (dijeljenje na proizvod standardnih odstupanja dviju slučajnih varijabli) i varijanca se normalizira u standardnu devijaciju (uzimanjem kvadratnog korijena)