Linearna vs logistička regresija
U statističkoj analizi važno je utvrditi odnos između varijabli koje se tiču studije. Ponekad je to možda jedina svrha same analize. Jedno snažno sredstvo kojim se utvrđuje postojanje veze i identificiranje veze je regresijska analiza.
Najjednostavniji oblik regresijske analize je linearna regresija, gdje je odnos između varijabli linearni odnos. U statističkom pogledu on otkriva odnos između varijable objašnjavanja i varijable odgovora. Na primjer, pomoću regresije možemo utvrditi odnos između cijene robe i potrošnje na temelju podataka prikupljenih iz slučajnog uzorka. Regresijska analiza proizvest će regresijsku funkciju skupa podataka, što je matematički model koji najbolje odgovara dostupnim podacima. To se lako može predstaviti planom raspršenja. Grafička regresija jednaka je pronalaženju najbolje odgovarajuće krivulje za dati skup podataka. Funkcija krivulje je regresijska funkcija. Pomoću matematičkog modela može se predvidjeti upotreba robe za određenu cijenu.
Stoga se regresijska analiza široko koristi u predviđanju i prognoziranju. Također se koristi za utvrđivanje odnosa u eksperimentalnim podacima, u područjima fizike, kemije, te u mnogim prirodnim i tehničkim disciplinama. Ako je odnos ili regresijska funkcija linearna funkcija, tada je postupak poznat kao linearna regresija. U planu raspršenja može se predstaviti kao ravna linija. Ako funkcija nije linearna kombinacija parametara, tada je regresija nelinearna.
Logistička regresija usporediva je s multivarijantnom regresijom i stvara model koji objašnjava utjecaj više prediktora na varijablu odgovora. Međutim, u logističkoj regresiji varijabla krajnjeg rezultata treba biti kategorična (obično se dijeli; tj., Par dostižnih ishoda, poput smrti ili preživljavanja, premda posebne tehnike omogućuju modeliranje više kategoriziranih podataka). Kontinuirana varijabla ishoda može se transformirati u kategorijsku varijablu koja se koristi za logističku regresiju; međutim, urušavanje kontinuiranih varijabli na ovaj način uglavnom je obeshrabreno jer smanjuje točnost.
Za razliku od linearne regresije, prema prosjeku, varijable predviđanja u logističkoj regresiji ne moraju biti prisiljene da budu linearno povezane, uobičajeno distribuirane ili da imaju jednaku varijancu unutar svakog klastera. Kao rezultat, odnos između prediktora i varijabli ishoda vjerojatno nije linearna funkcija.
Koja je razlika između logističke i linearne regresije?
• U linearnoj regresiji pretpostavlja se linearni odnos između objašnjavajuće varijable i varijable odgovora, a parametri koji zadovoljavaju model nalaze se analizom, kako bi se dobio tačan odnos.
• Linearna regresija provodi se za kvantitativne varijable, a rezultirajuća funkcija je kvantitativna.
• U logističkoj regresiji upotrijebljeni podaci mogu biti kategorični ili kvantitativni, ali rezultat je uvijek kategoričan.