Nadzirano učenje i nenadzirano učenje dva su temeljna koncepta strojnog učenja. Nadzirano učenje je zadatak strojnog učenja učenja funkcije koja preslikava ulaz na izlaz na temelju primjera parova ulaz-izlaz. Nenadzirano učenje je zadatak strojnog učenja izvesti funkciju za opisivanje skrivene strukture iz neoznačenih podataka. ključna razlika Između strojnog učenja pod nadzorom i bez nadzora je to supervizirano učenje koristi označene podatke dok nenadzirano učenje koristi neobilježene podatke.
Strojno učenje je polje u računalnim znanostima koje računalnom sustavu pruža mogućnost učenja iz podataka bez izričitog programiranja. Omogućuje analizu podataka i predviđanje obrazaca u njima. Postoji mnogo primjena strojnog učenja. Neki od njih su prepoznavanje lica, prepoznavanje geste i prepoznavanje govora. Postoje različiti algoritmi vezani uz strojno učenje. Neki od njih su regresija, klasifikacija i grupiranje. Najčešći programski jezici za razvoj aplikacija utemeljenih na strojnom učenju su R i Python. Također se mogu koristiti i drugi jezici kao što su Java, C ++ i Matlab.
1. Pregled i ključne razlike
2. Što je nadzirano učenje
3. Što je nenadzirano učenje
4. Sličnosti između nadziranog i nenadziranog strojnog učenja
5. Usporedna usporedba - Nadzirano u odnosu na nenadzirano strojno učenje u tabelarnom obliku
6. Sažetak
U sustavima utemeljenim na strojnom učenju model funkcionira u skladu s algoritmom. U superviziranom učenju nadzire se model. Prvo je potrebno obučiti model. Uz stečeno znanje može predvidjeti odgovore za buduće instance. Model se trenira pomoću obilježenog skupa podataka. Kad se izvan uzorka podataka da sustavu, može predvidjeti rezultat. Slijedi mali izvadak iz popularnog skupa podataka IRIS.
Prema gornjoj tablici atributi se nazivaju Sepal dužina, Sepalina širina, Patel dužina, Patel širina i Vrste. Stupci su poznati kao značajke. Jedan red sadrži podatke za sve atribute. Stoga se jedan red naziva promatranje. Podaci mogu biti numerički ili kategorični. U modelu su data opažanja s odgovarajućim nazivom vrste kao ulazom. Kad se daje novo promatranje, model treba predvidjeti vrsti kojoj pripada.
U superviziranom učenju postoje algoritmi za klasifikaciju i regresiju. Klasifikacija je postupak klasifikacije označenih podataka. Model je stvorio granice koje su razdvajale kategorije podataka. Kada se modelu pruže novi podaci, on se može kategorizirati na temelju mjesta gdje postoji tačka. K-najbliži susjedi (KNN) je klasifikacijski model. Ovisno o k vrijednosti, određuje se kategorija. Na primjer, kada je k 5, ako je određena podatkovna točka blizu osam podatkovnih točaka u kategoriji A i šest podatkovnih točaka u kategoriji B, tada će se podatkovna točka klasificirati kao A.
Regresija je proces predviđanja trenda prethodnih podataka da bi se predvidio ishod novih podataka. U regresiji se izlaz može sastojati od jedne ili više kontinuiranih varijabli. Predviđanje se vrši pomoću crte koja pokriva većinu podataka. Najjednostavniji regresijski model je linearna regresija. To je brzo i ne zahtijeva podešavanje parametara, kao što je u KNN. Ako podaci pokazuju parabolični trend, tada model linearne regresije nije prikladan.
To su neki primjeri nadziranih algoritama učenja. Općenito, rezultati dobiveni iz nadziranih metoda učenja točniji su i pouzdani jer su ulazni podaci dobro poznati i označeni. Stoga stroj mora analizirati samo skrivene obrasce.
Kod učenja bez nadzora, model se ne nadgleda. Model radi samostalno, kako bi predvidio ishode. Koristi algoritme strojnog učenja za donošenje zaključaka o neobilježenim podacima. Općenito, algoritmi učenja bez nadzora teže su od algoritama za nadzirano učenje jer ima malo informacija. Klasteriranje je vrsta učenja bez nadzora. Pomoću algoritama mogu se grupirati nepoznati podaci. K-srednja vrijednost i klasteriranje na temelju gustoće dva su algoritma grupiranja.
k-srednji algoritam, nasumično postavlja k centroid za svaki klaster. Tada se svaka podatkovna točka dodjeljuje najbližem centroidu. Euklidska udaljenost koristi se za izračunavanje udaljenosti od podatkovne točke do centroida. Točke podataka razvrstane su u skupine. Ponovno se izračunavaju položaji za k centroida. Novi centarroidni položaj određen je sredinom svih točaka u grupi. Opet je svaka točka podataka dodijeljena najbližem centroidu. Taj se postupak ponavlja sve dok se centroidi više ne promijene. k-mean je algoritam brzog klasteriranja, ali nije navedena inicijalizacija clusterskih točaka. Također, velika je varijacija modela klastera utemeljenih na inicijalizaciji točaka klastera.
Drugi algoritam klasteriranja je Klasteriranje na temelju gustoće. Također je poznata i kao Prostorna klasteriranje zasnovana na gustoći sa bukom. Djeluje definiranjem klastera kao maksimalnim skupom povezanih točaka gustoće. Dva su parametra koja se koriste za grupiranje na temelju gustoće. Oni su Ɛ (epsilon) i minimalni bodovi. Ɛ je najveći polumjer susjedstva. Minimalni bodovi minimalni su broj bodova u susjedstvu to za definiranje clustera. Ovo su neki od primjera grupiranja koji spadaju u nenadzirano učenje.
Općenito, rezultati generirani iz algoritama nenadziranog učenja nisu mnogo točni i pouzdani jer stroj mora definirati i označiti ulazne podatke prije nego što utvrdi skrivene obrasce i funkcije.
Nadzirano u odnosu na nenadzirano strojno učenje | |
Nadzirano učenje je zadatak strojnog učenja učenja funkcije koja preslikava ulaz na izlaz na temelju primjera parova ulaz-izlaz. | Nenadzirano učenje je zadatak strojnog učenja izvesti funkciju za opisivanje skrivene strukture iz neobilježenih podataka. |
Glavna funkcionalnost | |
U nadzornom učenju model predviđa ishod na temelju označenih ulaznih podataka. | U učenju bez nadzora, model predviđa ishod bez obilježenih podataka identificirajući obrasce. |
Točnost rezultata | |
Rezultati dobiveni iz nadziranih metoda učenja precizniji su i pouzdaniji. | Rezultati dobiveni neodržavanim metodama učenja nisu mnogo točni i pouzdani. |
Glavni algoritmi | |
Postoje algoritmi za regresiju i klasifikaciju u superviziranom učenju. | Postoje algoritmi za grupiranje u nekontroliranom učenju. |
Nadzirano učenje i nekontrolirano učenje dvije su vrste strojnog učenja. Nadzirano učenje je zadatak strojnog učenja učenja funkcije koja preslikava ulaz na izlaz na temelju primjera parova ulaz-izlaz. Nenadzirano učenje je zadatak strojnog učenja izvesti funkciju za opisivanje skrivene strukture iz neobilježenih podataka. Razlika između nadziranog i nenadziranog strojnog učenja je u tome što nadzirano učenje koristi označene podatke, dok neko nadzirano naginjanje koristi neobilježene podatke.
1.TheBigDataUniversity. Strojno učenje - Nadzirano VS Nenadzirano učenje, Kognitivna klasa, 13. ožujka 2017. Dostupno ovdje
2. "Nenadzirano učenje." Wikipedia, Zaklada Wikimedia, 20. ožujka 2018. Dostupno ovdje
3. "Nadzirano učenje." Wikipedia, Zaklada Wikimedia, 15. ožujka 2018. Dostupno ovdje
1.'2729781 'autor GDJ (Public Domain) putem pixabay-a