Regresija vs korelacija
U statistici je važno utvrđivanje odnosa između dvije slučajne varijable. To daje mogućnost predviđanja jedne varijable u odnosu na druge. Regresijska analiza i povezanost primjenjuju se u vremenskim prognozama, ponašanju na financijskom tržištu, uspostavljanju fizičkih odnosa eksperimentima i u mnogo realnijim scenarijima.
Što je regresija?
Regresija je statistička metoda koja se koristi za crtanje odnosa između dvije varijable. Često se prikupljaju podaci mogu postojati varijable koje ovise o drugima. Točan odnos tih varijabli može se uspostaviti samo regresijskim metodama. Utvrđivanje ovog odnosa pomaže razumjeti i predvidjeti ponašanje jedne varijable u drugu.
Najčešće primjena regresijske analize je za procjenu vrijednosti ovisne varijable za određenu vrijednost ili raspon vrijednosti neovisnih varijabli. Na primjer, pomoću regresije možemo utvrditi odnos između cijene robe i potrošnje, na temelju podataka prikupljenih iz slučajnog uzorka. Regresijska analiza proizvodi regresijsku funkciju skupa podataka, što je matematički model koji najbolje odgovara dostupnim podacima. To se lako može predstaviti planom raspršenja. Grafički gledano, regresija je ekvivalentna pronalaženju najbolje odgovarajuće krivulje za skup podataka davanja. Funkcija krivulje je regresijska funkcija. Pomoću matematičkog modela potražnja robe može se predvidjeti za određenu cijenu.
Stoga se regresijska analiza široko koristi u predviđanju i prognoziranju. Također se koristi za uspostavljanje odnosa u eksperimentalnim podacima, iz područja fizike, kemije i mnogih prirodnih znanosti i inženjerskih disciplina. Ako je odnos ili regresijska funkcija linearna funkcija, tada je postupak poznat kao linearna regresija. U planu raspršenja može se predstaviti kao ravna linija. Ako funkcija nije linearna kombinacija parametara, tada je regresija nelinearna.
Što je korelacija?
Korelacija je mjera snage odnosa dvije varijable. Koeficijent korelacije kvantificira stupanj promjene jedne varijable na temelju promjene u drugoj varijabli. U statistici je korelacija povezana s pojmom ovisnosti, što je statistički odnos između dvije varijable.
Pearsonov koeficijent korelacije ili samo koeficijent korelacije r je vrijednost između -1 i 1 (-1≤r≤ + 1). To je najčešće korišteni koeficijent korelacije i vrijedi samo za linearni odnos između varijabli. Ako je r = 0, ne postoji odnos, a ako je r≥0, odnos je izravno proporcionalan; tj. vrijednost jedne varijable povećava se s porastom druge. Ako je r≤0, odnos je obrnuto proporcionalan; tj. jedna se varijabla smanjuje kako se druga povećava.
Zbog stanja linearnosti, koeficijent korelacije r može se koristiti i za utvrđivanje prisutnosti linearnog odnosa između varijabli.
Koja je razlika između regresije i korelacije?
Regresija daje oblik odnosa između dvije slučajne varijable, a korelacija daje stupanj snage odnosa.
Regresijska analiza stvara regresijsku funkciju, što pomaže ekstrapoliranju i predviđanju rezultata, dok korelacija može pružiti samo informacije u kojem smjeru se može promijeniti.
Točniji modeli linearne regresije daju se analizom ako je koeficijent korelacije veći. (| R | ≥0.8)