Data Mining vs Skladištenje podataka
Proces iskopavanja podataka odnosi se na granu informatike koja se bavi izvlačenjem uzoraka iz velikih skupova podataka. Ti se skupovi potom kombiniraju statističkim metodama i umjetnom inteligencijom. Iskopavanje podataka u modernom poslovanju odgovorno je za pretvaranje neobrađenih podataka u izvore umjetne inteligencije. Podaci se manipuliraju i na taj način mogu dati pouzdane odluke koje se mogu koristiti u odlučivanju. To tvrtkama daje prednost nad konkurencijom jer imaju skupove podataka na koje se mogu pouzdati u pružanju inteligencije. Rudarstvo podataka koriste i organizacije u postupcima profiliranja, uključujući marketing, znanstveno otkrivanje nadzora i otkrivanje prijevara.
Postoje i drugi uobičajeni izrazi koji se mogu povezati s vađenjem podataka, poput ribolova podataka, jaružanja podataka ili čak prisluškivanja podataka. Sve ovo upućuje na različite varijacije vađenja podataka koje se koriste u uzorkovanju malih skupova podataka koji mogu biti premali za proizvodnju statističkih zaključaka. Oni su, međutim, ključni za ocjenu valjanosti podataka koji se koriste i mogu se koristiti u stvaranju hipoteze kada se raduje davanju raspoložive populacije podataka.
S druge strane, skladište podataka je izraz koji opisuje sustav u organizaciji koji se koristi u prikupljanju podataka. Ti podaci prikupljeni u skladištu podataka nude se transakcijskim sustavima kao što su fakture, evidencije o kupnji ili čak evidencije o zajmu. Zapisi podataka uzimaju se s pojedinačnih mjesta stvaranja i spajaju se pod jednim krovom koji je skladište podataka. Ti se podaci zatim prijavljuju, a izvješćivanje se vrši na agregirani način kako bi se korisnicima poslovnih informacija pomoglo u donošenju valjanih odluka. Za učinkovito funkcioniranje skladišta podataka potrebni su izvor podataka, baza podataka i alat za izvješćivanje.
Stoga se može reći da je skladište podataka baza podataka koja se koristi za posebne svrhe izvještavanja o analiziranim podacima. Ti podaci dolaze iz različitih sustava koji su pripremljeni za izvještavanje.
Da bi obavio svoju funkciju, skladište podataka održava funkcije u tri različita sloja. Oni uključuju postavljanje, integraciju i pristup. U postupnom postavljanju, sirovi podaci programeri pohranjuju s jedinom svrhom analize i podrške. Integrirajući sloj koristi se za integraciju podataka i za stupanj apstrakcije od korisnika podataka. I na kraju, pristupni sloj važan je za uklanjanje podataka od različitih korisnika podataka.
I rudarstvo podataka i skladištenje podataka mogu se nazvati alatima koji se koriste za prikupljanje poslovne informacije. Glavna razlika između njih je kako se prikupljaju poslovne informacije. Stoga se može reći da je podatke koji su dobro pohranjeni u rudnicima vrlo lako rudariti i na taj način iskoristiti. Skladište podataka stoga je odgovorno za olakšavanje rada u iskopu podataka u smještaju svih relevantnih podataka koje je potrebno minirati na središnjem mjestu, a ne kad ih kopanje podataka mora tražiti na različitim lokacijama. To pomaže uštedjeti vrijeme provedeno na vađenju podataka i resurse koji se koriste u rudarstvu.
Sažetak
Iskopavanje podataka je proces vađenja podataka iz velikih skupova podataka.
Skladištenje podataka postupak je okupljanja svih relevantnih podataka.
I rudarstvo i skladištenje podataka su alati za prikupljanje poslovne inteligencije.
Iskopavanje podataka specifično je u prikupljanju podataka.
Skladištenje podataka je alat za uštedu vremena i poboljšanje učinkovitosti spajanjem podataka s različitih lokacija iz različitih područja organizacije.
Skladište podataka ima tri sloja, a to su postavljanje, integracija i pristup.