Razlika između sheme zvijezda i pahuljica

Skladištenje podataka je sustav dizajniran za spremanje i organiziranje podataka u središnjim spremištima, uključujući podatke iz drugih izvora. To je temeljni koncept poslovne inteligencije u modelima relacijskih baza podataka koji koristi analitičke tehnike za integriranje poslovnih podataka u središnju bazu podataka.

Postoje dva uobičajena arhitektonska modela koja se koriste za skladištenje podataka:

  • Zvjezdana shema
  • Shema snježnih pahuljica

Oba su uobičajeni modeli višedimenzionalnih baza podataka koji se koriste u svrhu potrebe velikih baza podataka u analitičke svrhe u stvarnim skladištima podataka.

Predstavljamo nepristranu usporedbu između njih kako bismo bolje razumjeli koji je od njih bolji od drugog.

Što je shema zvijezda?

To je najčešći i široko prihvaćeni arhitektonski model koji se koristi za razvoj skladišta podataka i podatkovnih mjesta u kojima se podaci organiziraju u činjenice i dimenzije. To je najjednostavniji arhitektonski model u kojem se jedna tablica činjenica koristi za izradu tablica s više dimenzija, oponašajući uzorak zvijezde.

Kao što ime sugerira, dijagram nalikuje zvijezdi s tablicom činjenica u središtu i višestrukim tablicama dimenzija koje zrače iz nje, stvarajući uzorak poput zvijezde.

Poznata je i kao shema pridruživanja zvijezda te pohranjuje sve atribute dimenzije u jednu denormaliziranu tablicu činjenica kako bi se brzo kretala kroz velike višedimenzionalne skupove podataka što čini brza vremena odgovora na upit.

Što je shema snježnih pahuljica?

To je proširenje zvjezdanog shema s dodatnim funkcionalnostima. Za razliku od sheme zvijezda, tablice dimenzija u shemi snježne pahulje se normaliziraju u više povezanih tablica.

Arhitektonski model predstavlja logički raspored tablica u hijerarhiji odnosa više prema jednom gdje se više dimenzijskih tablica normalizira u poddimenzionalne tablice, nalik na uzorak snježne pahulje, otuda i naziv.

To je složenija inačica sheme zvijezda s više spajanja između dimenzijskih tablica koja uzima sporo vrijeme obrade za dohvaćanje podataka, što znači sporo vrijeme odgovora na upit. Umanjuje suvišnost podataka što zauzvrat poboljšava izvedbu upita.

Razlika između sheme Star i Snowflake

Arhitektura sheme zvijezda i pahuljica

U relacijskim bazama podataka zvjezdasta shema je najjednostavniji arhitektonski model koji se koristi za razvoj skladišta podataka i višedimenzionalne podatkovne karte. Kao što ime sugerira, model nalikuje zvijezdi s točkama koje zrače iz centra što znači da je tablica činjenica središte, a točke su tablice dimenzija. Kao i drugi dimenzionalni modeli, sastoji se od podataka u obliku činjenica i dimenzija. S druge strane, shema snježne pahulje je složeniji arhitektonski model koji se odnosi na višedimenzionalnu bazu podataka s logičkim rasporedom tablica u obliku snježne pahulje..

Tablica dimenzija

Shema snježne pahulje prilično je slična shemi zvjezdica, osim što može imati više tablica dimenzija koje se dalje normaliziraju u više povezanih tablica koje se nazivaju poddimenzionalnim tablicama. Predstavlja više nivoa odnosa koji se granaju u obrazac snježne pahulje. No, shema zvijezda pohranjuje sve povezane atribute dimenzije u jednu denormaliziranu tablicu dimenzija što olakšava razumijevanje i rukovanje jednostavnijim upitima.

Poslovni model sheme zvijezda i pahuljica

Tablica dimenzija ne može sadržavati duplicirane retke u modelima relacijskih baza podataka zbog jednostavne činjenice da bi mogla stvoriti nejasnoće u pretraživanju. Svaka tablica treba imati stupac ili kombinaciju stupaca nazvanih primarnim ključem koji jedinstveno identificira sve zapise tablice. Strani ključ je stupac ili skupina stupaca koji pruža vezu između dvije tablice. U shemi zvijezda svaka tablica dimenzija ima primarni ključ koji je povezan sa stranim ključem u tablici činjenica. Poslovna hijerarhija u shemi snježne pahulje predstavljena je odnosom primarnog ključa / stranog ključa između dimenzijskih tablica.

Integritet podataka u shemi zvijezda i pahuljica

Ključna razlika između dva modela relacijskih baza podataka je normalizacija. Tablice dimenzija u shemi zvijezda nisu normalizirane, što znači da će poslovni model koristiti relativno više prostora za pohranjivanje dimenzijskih tablica, a više prostora znači više suvišnih zapisa što bi u konačnici uzrokovalo nedosljednost. S druge strane, shema Snowflake minimizira reduciranje podataka jer se tablice dimenzija normaliziraju, što čini daleko manje suvišnih zapisa. Poslovna hijerarhija i njene dimenzije sačuvane su kroz referentni integritet, što znači da se odnosi mogu neovisno ažurirati u skladištima podataka.

Izvedba upita

Zvjezdana shema ima manje spajanja između tablice dimenzija i tablice činjenica u odnosu na shemu snježne pahulje koja ima više pridruživanja što predstavlja manju složenost upita. Budući da su dimenzije u zvjezdanoj shemi povezane kroz središnju tablicu činjenica, ona ima jasne staze pridruživanja što znači brzo vrijeme odgovora na upit i brzo vrijeme odziva znači bolje performanse. Shema Snowflake ima veći broj pridruživanja, pa duže vrijeme odgovora na upit što rezultira složenijim upitima što u konačnici kompromitira izvedbu.

Zvjezdana shema naspram Snježne pahulje: Usporedni grafikon


Sažetak sheme Zvjezdani stihovi Snježne pahulje

Oba su najčešći i široko usvojeni arhitektonski modeli koji se koriste za razvoj skladišta baza podataka i podatkovnih mjesta. Međutim, svaki poslovni model ima svoj udio prednosti i nedostataka. Iako je shema zvijezda najjednostavniji multidimenzionalni model koji se koristi za organiziranje podataka u činjenice i dimenzije, idealan je za izradu podatkovnih marki koje uključuju manje složene odnose. Snježna pahulja je logički prikaz tablica u višedimenzionalnoj bazi podataka u kojima su dimenzije pohranjene u poddimenzionalne tablice. Glavna razlika između njih dvoje je normalizacija. Tablice dimenzija u shemi snježne pahulje potpuno su normalizirane u više preglednih tablica, dok su u zvjezdanoj shemi dimenzionalne tablice denormalizirane u jednu središnju tablicu činjenica.