ključna razlika između klasifikacije i regresijskog stabla je to u klasifikaciji su ovisne varijable kategorične i neuređene, dok su u regresiji ovisne varijable neprekidne ili poredane cijele vrijednosti.
Razvrstavanje i regresija su tehnike učenja za kreiranje modela predviđanja iz prikupljenih podataka. Obje su tehnike grafički predstavljene kao stabla klasifikacije i regresije, točnije dijagrami tijeka s podjelom podataka nakon svakog koraka, ili bolje rečeno, "grana" u stablu. Taj se postupak naziva rekurzivna particija. Polja poput Rudarstva koristi ove tehnike klasifikacije i regresije. Ovaj se članak usredotočuje na stablo klasifikacije i regresijsko stablo.
1. Pregled i ključne razlike
2. Što je klasifikacija
3. Što je regresija
4. Usporedna usporedba - klasifikacija prema regresiji u tabelarnom obliku
5. Sažetak
Klasifikacija je tehnika koja se koristi za postizanje sheme koja prikazuje organizaciju podataka počevši od varijable prethodnika. Ovisne varijable su ono što klasificira podatke.
Slika 01: Istraživanje podataka
Stablo klasifikacije započinje s neovisnom varijablom, koja se dijeli na dvije skupine što je određeno postojećim ovisnim varijablama. Zamišljeno je da se razjasne odgovori u obliku kategorizacije dovedenih od ovisnih varijabli.
Regresija je metoda predviđanja koja se temelji na pretpostavljenoj ili poznatoj brojčanoj izlaznoj vrijednosti. Ova izlazna vrijednost rezultat je niza rekurzivnih particija, pri čemu svaki korak ima jednu numeričku vrijednost i drugu skupinu ovisnih varijabli koje se grane na drugi par poput ovog.
Stablo regresije započinje s jednom ili više varijabli prethodnika i završava jednom konačnom izlaznom varijablom. Ovisne varijable su ili kontinuirane ili diskretne numeričke varijable.
Klasifikacija vs regresija | |
Model stabla gdje ciljna varijabla može uzeti diskretni skup vrijednosti. | Model stabla gdje ciljna varijabla može uzimati kontinuirane vrijednosti, obično stvarne brojeve. |
Zavisna varijabla | |
Za stablo klasifikacije, ovisne varijable su kategorične. | Za stablo regresije, zavisne varijable su numeričke. |
vrijednosti | |
Ima postavljenu količinu neuređenih vrijednosti. | Sadrži ili diskretne još uređene vrijednosti ili zasebne vrijednosti. |
Svrha gradnje | |
Svrha konstrukcije regresijskog stabla je da se regresijski sustav uklopi u svaku odredujuću granu na način da dođe do očekivane izlazne vrijednosti. | Stablo klasifikacije se odvaja kako je određeno zavisnom varijablom izvedenom iz prethodnog čvora. |
Regresijska i klasifikacijska stabla korisne su tehnike za mapiranje procesa koji upućuje na proučeni ishod, bilo u klasifikaciji, bilo u jednoj numeričkoj vrijednosti. Razlika između klasifikacijskog stabla i regresijskog stabla je njihova ovisna varijabla. Stabla klasifikacije imaju ovisne varijable koje su kategorične i neuređene. Regresijska stabla imaju ovisne varijable koje su kontinuirane vrijednosti ili poredane cijele vrijednosti.
1. "Učenje stabla odlučivanja." Wikipedija, Zaklada Wikimedia, 13. svibnja 2018. Dostupno ovdje
1.'Data Rudarstvo'By Arbeck - Vlastiti rad, (CC BY 3.0) putem Commons Wikimedia