Razlika između Semi Join i Bloom Join

Semi Join vs Bloom Join

Polu pridruživanje i Bloom pridruživanje su dvije metode pridruživanja koje se koriste u obradi upita za distribuirane baze podataka. Pri obradi upita u distribuiranim bazama podataka potrebno je prijenos podataka između baza podataka smještenih na različitim web lokacijama. Ovo bi mogla biti skupa operacija, ovisno o količini podataka koju je potrebno prenijeti. Stoga je prilikom obrade upita u okruženju distribuirane baze podataka važno optimizirati upite kako bi se smanjila količina podataka koja se prenosi između web mjesta. Polu pridruživanje i pridruživanje procvatu dvije su metode koje se mogu koristiti za smanjenje količine prijenosa podataka i obavljanje učinkovite obrade upita.

Što je Semi Join?

Polu pridruživanje je metoda koja se koristi za učinkovitu obradu upita u okruženjima distribuirane baze podataka. Razmislite o situaciji u kojoj se baza podataka zaposlenika (koja sadrži podatke kao što su ime zaposlenika, broj odjela za koje radi itd.) Koja se nalazi na mjestu 1 i baze podataka Odjela (sadrži podatke poput broja odjela, naziv odjela, lokaciju itd.) Smještene na web mjestu 2. Na primjer, ako želimo dobiti ime zaposlenika i naziv odjela za koji ona radi (samo od odjela smještenih u "New Yorku") izvršavanjem upita u procesoru upita koji se nalazi na web mjestu 3, postoji nekoliko načina kako podaci bi se mogli prenijeti između tri stranice za postizanje ovog zadatka. No, prilikom prijenosa podataka važno je napomenuti da nije potrebno prenositi cijelu bazu podataka između web mjesta. Samo su neki atributi (ili tupleli) potrebni za spajanje potrebni za premještanje upita između web mjesta. Polu pridruživanje je metoda kojom se može smanjiti količina podataka poslanih između stranica. Kod polu-pridruživanja, samo stupac za pridruživanje prenosi se s jedne stranice na drugu, a zatim se taj preneseni stupac koristi za smanjenje veličine isporučenih odnosa između ostalih mjesta. Za gornji primjer, možete jednostavno prenijeti broj odjela i naziv odjela tuples s location = "New York" s stranice 2 na web lokaciju 1 i obaviti spajanje na mjestu 1 i prenijeti konačni odnos natrag na web mjesto 3.

Što je Bloom Join?

Kao što je spomenuto ranije, bloom pridruživanje je druga metoda koja se koristi za izbjegavanje prijenosa nepotrebnih podataka između web mjesta prilikom izvršavanja upita u okruženjima distribuirane baze podataka. U procvatu spajanja, umjesto prenošenja samog stupca spajanja, kompaktni prikaz stupca spajanja prenosi se između web mjesta. Bloom pridruživanje koristi filter za procvat koji koristi malo vektora za izvršavanje upita o članstvu. Prvo se ugrađuje filtar za cvjetanje pomoću stupca za spajanje i prenosi se između sita, a zatim se obavljaju operacije spajanja.

Koja je razlika između Semi Join i Bloom Join?

Iako se metode pridruživanja polu-pridruživanja i bloom-bloom koriste kako bi se smanjila količina podataka prenesenih između web mjesta prilikom izvršavanja upita u okruženju distribuirane baze podataka, bloom pridruživanje smanjuje količinu podataka (broj parova) prenesenih u usporedbi s polu-pridruživanjem korištenjem koncept bloom filtera, koji upotrebljavaju malo vektora da bi odredili postavljeno članstvo. Stoga će upotreba bloom pridruživanja biti učinkovitija od upotrebe polu pridruživanja.