Strojno učenje skup je metoda koje se koriste za stvaranje računalnih programa koji se mogu učiti iz promatranja i predvidjeti. Strojno učenje koristi algoritme, regresije i srodne znanosti za razumijevanje podataka. Ovi se algoritmi općenito mogu smatrati statističkim modelima i mrežama.
Duboko učenje podskup je metoda strojnog učenja. Podaci se raščlanjuju na više slojeva mreže dubokog učenja kako bi mreža mogla donositi zaključke i donositi odluke o podacima. Metode dubokog učenja omogućuju veliku preciznost na velikim skupovima podataka, ali ove značajke čine duboko učenje mnogo intenzivnijim resursima od klasičnog strojnog učenja.
Već nekoliko desetljeća strojno se učenje koristi kao metoda postizanja umjetne inteligencije u strojevima. U osnovi je polje strojnog učenja usmjereno na stvaranje računala koja mogu učiti i donositi odluke, zbog čega je strojno učenje dobro prilagođeno istraživanju umjetne inteligencije. Međutim, nisu svi modeli strojnog učenja namijenjeni razvoju "prave" umjetne inteligencije koja savršeno odgovara ili nadilazi ljudsku inteligenciju. Umjesto toga, modeli su često osmišljeni za istraživanje specifičnih, ograničenih problema.
Dubinsko učenje predloženo je u ranim fazama rasprava o strojnom učenju, ali malo je istraživača slijedilo metode dubokog učenja jer su računski zahtjevi dubokog učenja mnogo veći nego u klasičnom strojnom učenju. Međutim, računska moć računala povećala se eksponencijalno od 2000. godine, omogućujući istraživačima ogromna poboljšanja u strojnom učenju i konstrukciji umjetne inteligencije. Budući da se modeli dubokog učenja dobro razmještaju s povećanim podacima, duboko učenje ima potencijal da savlada značajne prepreke u stvaranju istinske umjetne inteligencije.
Strojno učenje i duboko učenje su algoritamski. U klasičnom strojnom učenju istraživači koriste relativno malu količinu podataka i odlučuju koja su najvažnija svojstva unutar podataka koji su algoritam potrebni kako bi mogli predvidjeti. Ova metoda se naziva inženjering značajki. Na primjer, ako bi se program strojnog učenja podučavao prepoznavati sliku aviona, njegovi programeri izradili bi algoritme koji programu omogućuju prepoznavanje tipičnih oblika, boja i veličina komercijalnih zrakoplova. S tim informacijama program strojnog učenja predvidio je hoće li slike biti predstavljene uključenim zrakoplovima.
Duboko učenje uglavnom se razlikuje od klasičnog strojnog učenja po mnogim slojevima odlučivanja. Mreže dubokog učenja često se smatraju „crnim okvirima“, jer se podaci raščlanjuju kroz više mrežnih slojeva na kojima se svaki primjećuje. To može otežati razumijevanje rezultata od rezultata klasičnog strojnog učenja. Točan broj slojeva ili koraka u odlučivanju ovisi o vrsti i složenosti odabranog modela.
Strojno učenje tradicionalno koristi male skupove podataka iz kojih se može učiti i predvidjeti. S malim količinama podataka, istraživači mogu odrediti precizne značajke koje će pomoći programu strojnog učenja razumjeti i naučiti iz podataka. Međutim, ako program naiđe na informacije koje ne može klasificirati na temelju svojih već postojećih algoritama, istraživači će obično morati ručno analizirati problematične podatke i stvoriti novu značajku. Zbog toga klasično strojno učenje obično ne mjeri dobro velikim količinama podataka, ali može umanjiti pogreške na manjim skupovima podataka.
Duboko učenje je posebno pogodno za velike skupove podataka, a modeli često zahtijevaju velike skupove podataka da bi bili korisni. Zbog složenosti mreže dubokog učenja, mreži je potrebna znatna količina podataka o obuci i dodatnih podataka da bi se testirala mreža nakon treninga. Trenutno istraživači usavršavaju mreže dubokog učenja koje mogu biti učinkovitije i koriste manje skupove podataka.
Strojno učenje ima različite zahtjeve performansi računala. Postoji puno modela koji se mogu pokrenuti na prosječnom osobnom računalu. Što naprednije dobivaju statističke i matematičke metode, to je računalu teže da obrađuje podatke.
Duboko učenje obično zahtijeva mnogo resursa. Razdvajanje velikih količina informacija kroz više slojeva za odlučivanje zahtijeva mnogo računske snage. Kako računala brže postaju, dublje učenje postaje sve dostupnije.
Strojno učenje ima nekoliko uobičajenih i značajnih ograničenja. Overfitting je statistički problem koji može utjecati na algoritam strojnog učenja. Algoritam strojnog učenja sadrži određenu količinu „pogreške“ pri analizi i predviđanju podataka. Algoritam bi trebao pokazati odnos između relevantnih varijabli, ali pri prekomjernom uklapanju počinje uzimati i grešku, što dovodi do "bučnijih" ili netočnih modela. Modeli strojnog učenja mogu također postati pristrani prema idiosinkraziji podataka s kojima su obučavani, problem koji je posebno očit kada istraživači treniraju algoritme na cijelom dostupnom skupu podataka umjesto da spreme dio podataka kako bi testirali algoritam na.
Duboko učenje ima iste statističke zamke kao i klasično strojno učenje, kao i nekoliko jedinstvenih problema. Za mnoge probleme, nema dovoljno dostupnih podataka da bi se uvježbala razumna mreža dubokog učenja. Često je skupo ili nemoguće prikupiti više podataka o stvarnom svijetu ili simulirati problem koji ograničava trenutni raspon tema za koje se duboko učenje može koristiti.
Strojno učenje i duboko učenje opisuju metode podučavanja računala za učenje i donošenje odluka. Duboko učenje podskup je klasičnog strojnog učenja, a neke važne razlike pomažu u dubokom i strojnom učenju pogodnim za različite aplikacije.