Razlika između podataka i OLAP-a

Data Mining vs OLAP

Izdvajanje podataka i OLAP dvije su zajedničke tehnologije Business Intelligence (BI). Poslovna inteligencija odnosi se na računalno utemeljene metode prepoznavanja i izdvajanja korisnih informacija iz poslovnih podataka. Iskopavanje podataka je polje računalnih znanosti koje se bavi izvlačenjem zanimljivih obrazaca iz velikih skupova podataka. Kombinira mnoge metode od umjetne inteligencije, statistike i upravljanja bazama podataka. OLAP (mrežna analitička obrada) kao što ime sugerira, je skup načina za ispitivanje višedimenzionalnih baza podataka.

Iskopavanje podataka poznato je i kao Otkrivanje znanja u podacima (KDD). Kao što je već spomenuto, radi se o području računalnih znanosti koje se bavi izvlačenjem do tada nepoznatih i zanimljivih podataka iz sirovih podataka. Zbog eksponencijalnog rasta podataka, posebno na područjima kao što je poslovanje, vađenje podataka postalo je vrlo važan alat za pretvorbu ovog velikog bogatstva podataka u poslovnu inteligenciju, jer je ručno vađenje uzoraka postalo naizgled nemoguće u posljednjih nekoliko desetljeća. Na primjer, trenutno se koristi za razne aplikacije kao što su analiza društvenih mreža, otkrivanje prijevara i marketing. Iskopavanje podataka obično se bavi sljedeća četiri zadatka: grupiranje, klasifikacija, regresija i udruživanje. Klasteriranje identificira slične skupine iz nestrukturiranih podataka. Klasifikacija je pravila učenja koja se mogu primijeniti na nove podatke i obično uključuju sljedeće korake: prethodna obrada podataka, dizajniranje modeliranja, odabir učenja / obilježja i procjena / validacija. Regresija je pronalaženje funkcija s minimalnom pogreškom za modeliranje podataka. A povezanost traži odnose između varijabli. Iskopavanje podataka obično se koristi za odgovor na pitanja kao što su glavni proizvodi koji bi mogli pomoći ostvarenju velike dobiti sljedeće godine u Wal-Martu.

OLAP je klasa sustava koji pružaju odgovore na višedimenzionalne upite. OLAP se obično koristi za marketing, izradu proračuna, predviđanje i slične aplikacije. Nepotrebno je da su baze podataka korištene za OLAP konfigurirane za složene i ad-hoc upite s brzom izvedbom. Matrica se obično koristi za prikaz izlaza OLAP-a. Redovi i stupci formirani su dimenzijama upita. Često koriste metode združivanja na više tablica kako bi dobili sažetke. Na primjer, može li se saznati o prodaji ove godine u Wal-Martu u odnosu na prošlu godinu? Kakva je predviđanja o prodaji u sljedećem tromjesečju? Što se može reći o trendu gledajući promjenu postotka?

Iako je očito da su Data mining i OLAP slični jer djeluju na podacima kako bi se dobila inteligencija, glavna razlika dolazi od načina na koji rade s podacima. OLAP alati pružaju višedimenzionalnu analizu podataka i daju sažetke podataka, ali kontrastno, izvlačenje podataka fokusira se na omjere, obrasce i utjecaje u skupu podataka. To je OLAP posao sakupljanja, koji se svodi na rad podataka pomoću "dodavanja", ali data mining odgovara "podjeli". Druga značajna razlika je da dok alati za vađenje podataka modeliraju podatke i vraćaju primjenjiva pravila, OLAP će provoditi tehnike usporedbe i kontrasta duž poslovne dimenzije u stvarnom vremenu.