Razlika između klasifikacije i regresije

ključna razlika između klasifikacije i regresijskog stabla je to u klasifikaciji su ovisne varijable kategorične i neuređene, dok su u regresiji ovisne varijable neprekidne ili poredane cijele vrijednosti.

Razvrstavanje i regresija su tehnike učenja za kreiranje modela predviđanja iz prikupljenih podataka. Obje su tehnike grafički predstavljene kao stabla klasifikacije i regresije, točnije dijagrami tijeka s podjelom podataka nakon svakog koraka, ili bolje rečeno, "grana" u stablu. Taj se postupak naziva rekurzivna particija. Polja poput Rudarstva koristi ove tehnike klasifikacije i regresije. Ovaj se članak usredotočuje na stablo klasifikacije i regresijsko stablo.

SADRŽAJ

1. Pregled i ključne razlike
2. Što je klasifikacija
3. Što je regresija
4. Usporedna usporedba - klasifikacija prema regresiji u tabelarnom obliku
5. Sažetak

Što je klasifikacija?

Klasifikacija je tehnika koja se koristi za postizanje sheme koja prikazuje organizaciju podataka počevši od varijable prethodnika. Ovisne varijable su ono što klasificira podatke.

Slika 01: Istraživanje podataka

Stablo klasifikacije započinje s neovisnom varijablom, koja se dijeli na dvije skupine što je određeno postojećim ovisnim varijablama. Zamišljeno je da se razjasne odgovori u obliku kategorizacije dovedenih od ovisnih varijabli.

Što je regresija

Regresija je metoda predviđanja koja se temelji na pretpostavljenoj ili poznatoj brojčanoj izlaznoj vrijednosti. Ova izlazna vrijednost rezultat je niza rekurzivnih particija, pri čemu svaki korak ima jednu numeričku vrijednost i drugu skupinu ovisnih varijabli koje se grane na drugi par poput ovog.

Stablo regresije započinje s jednom ili više varijabli prethodnika i završava jednom konačnom izlaznom varijablom. Ovisne varijable su ili kontinuirane ili diskretne numeričke varijable.

Koja je razlika između klasifikacije i regresije?

 Klasifikacija vs regresija

Model stabla gdje ciljna varijabla može uzeti diskretni skup vrijednosti. Model stabla gdje ciljna varijabla može uzimati kontinuirane vrijednosti, obično stvarne brojeve.
Zavisna varijabla
Za stablo klasifikacije, ovisne varijable su kategorične. Za stablo regresije, zavisne varijable su numeričke.
vrijednosti
Ima postavljenu količinu neuređenih vrijednosti. Sadrži ili diskretne još uređene vrijednosti ili zasebne vrijednosti.
Svrha gradnje
Svrha konstrukcije regresijskog stabla je da se regresijski sustav uklopi u svaku odredujuću granu na način da dođe do očekivane izlazne vrijednosti. Stablo klasifikacije se odvaja kako je određeno zavisnom varijablom izvedenom iz prethodnog čvora.

Sažetak - Klasifikacija prema regresiji

Regresijska i klasifikacijska stabla korisne su tehnike za mapiranje procesa koji upućuje na proučeni ishod, bilo u klasifikaciji, bilo u jednoj numeričkoj vrijednosti. Razlika između klasifikacijskog stabla i regresijskog stabla je njihova ovisna varijabla. Stabla klasifikacije imaju ovisne varijable koje su kategorične i neuređene. Regresijska stabla imaju ovisne varijable koje su kontinuirane vrijednosti ili poredane cijele vrijednosti.

Referenca:

1. "Učenje stabla odlučivanja." Wikipedija, Zaklada Wikimedia, 13. svibnja 2018. Dostupno ovdje 

Ljubaznošću slike:

1.'Data Rudarstvo'By Arbeck - Vlastiti rad, (CC BY 3.0) putem Commons Wikimedia