I duboko i učvršćeno učenje visoko su povezani s računalnom snagom umjetne inteligencije (AI). Oni su autonomne funkcije strojnog učenja koje utiču put računalima do stvaranja vlastitih principa u izradi rješenja. Te dvije vrste učenja mogu postojati i u nekoliko programa. Općenito, dubinsko učenje koristi trenutne podatke, dok pojačano učenje koristi metodu pokušaja i pogreške u smišljanju predviđanja. Sljedeće rasprave nadalje zaranjaju u takve razlike.
Duboko učenje naziva se i dubokim strukturiranim učenjem ili hijerarhijskim učenjem. To je prvi put uvela 1986. godine Rina Dechter, profesorica informatike. Koristi trenutne informacije u nastavi algoritama za traženje odgovarajućih obrazaca koji su bitni u prognoziranju podataka. Takav sustav koristi različite razine umjetnih neuronskih mreža sličnih neuronskim sastavima ljudskog mozga. Pomoću složenih veza algoritam će možda moći obrađivati milijune informacija i zonama pod specifičnijim predviđanjem.
Ova vrsta učenja može se primijeniti kada programeri žele softver da na raznim slikama uoči ljubičastu boju. Program bi se tada hranio s više slika (dakle, „duboko“ učenje) sa i bez ljubičastih boja. Programom će se kroz klasteriranje moći prepoznati obrasci i naučiti kada označiti boju kao ljubičastu. Duboko učenje koristi se u raznim programima prepoznavanja, poput analiza slike i zadataka predviđanja, kao što su predviđanja vremenskih serija.
Ojačavanje učenja obično obuhvaća predviđanja putem pokušaja i pogreške. S obzirom na njegovu povijest iz AI perspektive, ona je razvijena krajem 1980-ih; temeljila se na rezultatima pokusa na životinjama, koncepcijama optimalne kontrole i vremenskim razlikama. Pored učenja pod nadzorom i bez nadzora, pojačanje je jedna od osnovnih paradigmi strojnog učenja. Kao što mu ime govori, algoritam se trenira kroz nagrade.
Na primjer, AI je razvijen za igranje s ljudima u određenoj mobilnoj igri. Svaki put kada AI izgubi, algoritam se revidira kako bi se maksimizirao njegov rezultat. Tako se ova vrsta tehnike uči iz njegovih grešaka. Nakon brojnih ciklusa, AI se razvio i postajao je bolji u prebijanju ljudskih igrača. Učenje ojačanja primjenjuje se u najsuvremenijim tehnologijama kao što su poboljšanje robotike, vađenje teksta i zdravstvena zaštita.
Duboko učenje može izvršiti ciljno ponašanje analizom postojećih podataka i primjenom onoga što je naučeno na novi skup informacija. S druge strane, učenje s pojačanjem može promijeniti svoj odgovor prilagodbom kontinuirane povratne informacije.
Duboko učenje djeluje s već postojećim podacima jer je neophodno u obuci algoritma. Što se tiče učenja o pojačanju, ono je istraživačke prirode i može se razviti bez trenutnog skupa podataka kako se uči putem pokušaja i pogreške.
Duboko učenje koristi se u prepoznavanju slike i govora, dubokom pretraživanju mreže i smanjenju dimenzija. Za usporedbu, učenje ojačanja koristi se u interakciji s vanjskim podražajima s optimalnom kontrolom kao što su robotika, zakazivanje dizala, telekomunikacije, računalne igre i zdravstvena zaštita.
Duboko učenje je također poznato kao hijerarhijsko učenje ili duboko strukturirano učenje, dok pojačano učenje nema druge široko poznate pojmove.
Duboko učenje jedna je od brojnih metoda strojnog učenja. S druge strane, učenje pojačanja područje je strojnog učenja; to je jedna od tri temeljne paradigme.
U usporedbi s dubokim učenjem, učvršćenje učenja bliže je mogućnostima ljudskog mozga jer se takva vrsta inteligencije može poboljšati povratnim informacijama. Duboko učenje uglavnom je za prepoznavanje i manje je povezano s interakcijom.
Duboko učenje prvi put je uvela Rina Dechter 1986. godine dok je učenje ojačanja razvijeno krajem 1980-ih na temelju koncepata pokusa na životinjama, optimalne kontrole i vremenskih razlika.