I Korelacija i Regresija su statistički alati koji se bave dvije ili više varijabli. Iako se obje odnose na istu temu, postoje razlike između to dvoje. Niže su objašnjene razlike između dvaju.
Pojam korelacija s obzirom na dvije ili više varijabli označava da su varijable na neki način povezane. Korelacijska analiza određuje postoji li odnos između dvije varijable i jačina veze. Ako su dvije varijable x (neovisne) i y (ovisne) toliko povezane da prati varijacija u veličini neovisne varijable, varijacija u veličini ovisne varijable, tada se kaže da su dvije varijable u korelaciji.
Korelacija može biti linearna ili nelinearna. Linearna korelacija je ona u kojoj su varijable toliko povezane da bi promjena vrijednosti jedne varijable uzrokovala promjenu vrijednosti druge varijable. U linearnoj korelaciji raštrkane točke povezane s odgovarajućim vrijednostima ovisnih i neovisnih varijabli skupit će se oko nehorizontalne ravne linije, iako bi vodoravna ravna linija također ukazivala na linearni odnos između varijabli ako bi ravna linija mogla povezati točke koje predstavljaju varijable.
Regresijska analiza, s druge strane, koristi postojeće podatke za određivanje matematičkog odnosa između varijabli koje se mogu koristiti za određivanje vrijednosti ovisne varijable u odnosu na bilo koju vrijednost nezavisne varijable.
Korelacija se odnosi na mjerenje snage povezanosti ili intenziteta odnosa, gdje se regresija odnosi na predviđanje vrijednosti ovisne varijable u odnosu na poznatu vrijednost nezavisne varijable. To se može objasniti slijedećim formulama.
Koeficijent korelacije ili korelacija koeficijenta (r) između x i y utvrđuje se sljedećom formulom;
r = kovarijans (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy su standardna odstupanja od x i y, i, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Koeficijent korelacije r čisti je broj i ne ovisi o mjernoj jedinici. Dakle, ako je x visina (inča), a y je težina (funti) ljudi određene regije, tada r nije ni u inčima niti u funtama, već je jednostavno broj.
Jednadžba regresije pronalazi se sljedećom formulom;
Jednadžba regresije y na x (kako bi se utvrdila procjena y) je y - y '= byx (x-x‾), byx se naziva koeficijent regresije y na x. Jednadžba regresije x na y (da saznamo procjenu x) je x - x '= bxy (y-y‾), bxy se naziva koeficijent regresije x na y.
Korelacijska analiza ne pretpostavlja ovisnost bilo koje varijable o drugoj varijabli, niti pokušava otkriti odnos između njih. Jednostavno procjenjuje stupanj povezanosti između varijabli. Drugim riječima, korelacijska analiza testira međuovisnost varijabli. S druge strane, regresijska analiza opisuje ovisnost zavisne varijable ili varijable odziva na neovisnoj ili objašnjenoj varijabli. Regresijska analiza pretpostavlja da postoji jednosmjerna uzročno-posljedična veza između objašnjivih i varijabli odgovora, a ne uzima u obzir je li ta uzročno-posljedična veza pozitivna ili negativna. Za korelaciju su vrijednosti ovisnih i neovisnih varijabli slučajne, ali za regresijske vrijednosti neovisnih varijabli ne moraju biti slučajne.
1. Korelacijska analiza je test međusobne ovisnosti dviju varijabli. Regresijska analiza daje matematičku formulu za određivanje vrijednosti ovisne varijable u odnosu na vrijednost nezavisne varijable / s.
2. Koeficijent korelacije nije ovisan o odabiru podrijetla i razmjera, ali regresijski koeficijent nije tako.
Za korelaciju vrijednosti obje varijable moraju biti slučajne, ali to nije slučaj za regresijski koeficijent.
1. Das, N. G., (1998), Statističke metode, Kalkuta
2. Korelacija i regresija, dostupno na www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regresija i korelacija, dostupni na www.abyss.uoregon.edu