Skladištenje podataka je sustav dizajniran za spremanje i organiziranje podataka u središnjim spremištima, uključujući podatke iz drugih izvora. To je temeljni koncept poslovne inteligencije u modelima relacijskih baza podataka koji koristi analitičke tehnike za integriranje poslovnih podataka u središnju bazu podataka.
Postoje dva uobičajena arhitektonska modela koja se koriste za skladištenje podataka:
Oba su uobičajeni modeli višedimenzionalnih baza podataka koji se koriste u svrhu potrebe velikih baza podataka u analitičke svrhe u stvarnim skladištima podataka.
Predstavljamo nepristranu usporedbu između njih kako bismo bolje razumjeli koji je od njih bolji od drugog.
To je najčešći i široko prihvaćeni arhitektonski model koji se koristi za razvoj skladišta podataka i podatkovnih mjesta u kojima se podaci organiziraju u činjenice i dimenzije. To je najjednostavniji arhitektonski model u kojem se jedna tablica činjenica koristi za izradu tablica s više dimenzija, oponašajući uzorak zvijezde.
Kao što ime sugerira, dijagram nalikuje zvijezdi s tablicom činjenica u središtu i višestrukim tablicama dimenzija koje zrače iz nje, stvarajući uzorak poput zvijezde.
Poznata je i kao shema pridruživanja zvijezda te pohranjuje sve atribute dimenzije u jednu denormaliziranu tablicu činjenica kako bi se brzo kretala kroz velike višedimenzionalne skupove podataka što čini brza vremena odgovora na upit.
To je proširenje zvjezdanog shema s dodatnim funkcionalnostima. Za razliku od sheme zvijezda, tablice dimenzija u shemi snježne pahulje se normaliziraju u više povezanih tablica.
Arhitektonski model predstavlja logički raspored tablica u hijerarhiji odnosa više prema jednom gdje se više dimenzijskih tablica normalizira u poddimenzionalne tablice, nalik na uzorak snježne pahulje, otuda i naziv.
To je složenija inačica sheme zvijezda s više spajanja između dimenzijskih tablica koja uzima sporo vrijeme obrade za dohvaćanje podataka, što znači sporo vrijeme odgovora na upit. Umanjuje suvišnost podataka što zauzvrat poboljšava izvedbu upita.
U relacijskim bazama podataka zvjezdasta shema je najjednostavniji arhitektonski model koji se koristi za razvoj skladišta podataka i višedimenzionalne podatkovne karte. Kao što ime sugerira, model nalikuje zvijezdi s točkama koje zrače iz centra što znači da je tablica činjenica središte, a točke su tablice dimenzija. Kao i drugi dimenzionalni modeli, sastoji se od podataka u obliku činjenica i dimenzija. S druge strane, shema snježne pahulje je složeniji arhitektonski model koji se odnosi na višedimenzionalnu bazu podataka s logičkim rasporedom tablica u obliku snježne pahulje..
Shema snježne pahulje prilično je slična shemi zvjezdica, osim što može imati više tablica dimenzija koje se dalje normaliziraju u više povezanih tablica koje se nazivaju poddimenzionalnim tablicama. Predstavlja više nivoa odnosa koji se granaju u obrazac snježne pahulje. No, shema zvijezda pohranjuje sve povezane atribute dimenzije u jednu denormaliziranu tablicu dimenzija što olakšava razumijevanje i rukovanje jednostavnijim upitima.
Tablica dimenzija ne može sadržavati duplicirane retke u modelima relacijskih baza podataka zbog jednostavne činjenice da bi mogla stvoriti nejasnoće u pretraživanju. Svaka tablica treba imati stupac ili kombinaciju stupaca nazvanih primarnim ključem koji jedinstveno identificira sve zapise tablice. Strani ključ je stupac ili skupina stupaca koji pruža vezu između dvije tablice. U shemi zvijezda svaka tablica dimenzija ima primarni ključ koji je povezan sa stranim ključem u tablici činjenica. Poslovna hijerarhija u shemi snježne pahulje predstavljena je odnosom primarnog ključa / stranog ključa između dimenzijskih tablica.
Ključna razlika između dva modela relacijskih baza podataka je normalizacija. Tablice dimenzija u shemi zvijezda nisu normalizirane, što znači da će poslovni model koristiti relativno više prostora za pohranjivanje dimenzijskih tablica, a više prostora znači više suvišnih zapisa što bi u konačnici uzrokovalo nedosljednost. S druge strane, shema Snowflake minimizira reduciranje podataka jer se tablice dimenzija normaliziraju, što čini daleko manje suvišnih zapisa. Poslovna hijerarhija i njene dimenzije sačuvane su kroz referentni integritet, što znači da se odnosi mogu neovisno ažurirati u skladištima podataka.
Zvjezdana shema ima manje spajanja između tablice dimenzija i tablice činjenica u odnosu na shemu snježne pahulje koja ima više pridruživanja što predstavlja manju složenost upita. Budući da su dimenzije u zvjezdanoj shemi povezane kroz središnju tablicu činjenica, ona ima jasne staze pridruživanja što znači brzo vrijeme odgovora na upit i brzo vrijeme odziva znači bolje performanse. Shema Snowflake ima veći broj pridruživanja, pa duže vrijeme odgovora na upit što rezultira složenijim upitima što u konačnici kompromitira izvedbu.
Oba su najčešći i široko usvojeni arhitektonski modeli koji se koriste za razvoj skladišta baza podataka i podatkovnih mjesta. Međutim, svaki poslovni model ima svoj udio prednosti i nedostataka. Iako je shema zvijezda najjednostavniji multidimenzionalni model koji se koristi za organiziranje podataka u činjenice i dimenzije, idealan je za izradu podatkovnih marki koje uključuju manje složene odnose. Snježna pahulja je logički prikaz tablica u višedimenzionalnoj bazi podataka u kojima su dimenzije pohranjene u poddimenzionalne tablice. Glavna razlika između njih dvoje je normalizacija. Tablice dimenzija u shemi snježne pahulje potpuno su normalizirane u više preglednih tablica, dok su u zvjezdanoj shemi dimenzionalne tablice denormalizirane u jednu središnju tablicu činjenica.