Razlika med Semi Join in Bloom Join

Razlika med Semi Join in Bloom Join
Razlika med Semi Join in Bloom Join

Video: Razlika med Semi Join in Bloom Join

Video: Razlika med Semi Join in Bloom Join
Video: Что выбрать? Тренировки или соревнования? #tabletennis #tournament 2024, November
Anonim

Semi Join vs Bloom Join

Semi join in Bloom joint sta dve metodi združevanja, ki se uporabljata pri obdelavi poizvedb za porazdeljene baze podatkov. Pri obdelavi poizvedb v porazdeljenih bazah podatkov je treba podatke prenašati med bazami podatkov, ki se nahajajo na različnih mestih. To bi lahko bila draga operacija, odvisno od količine podatkov, ki jih je treba prenesti. Zato je pri obdelavi poizvedb v okolju porazdeljene baze podatkov pomembno optimizirati poizvedbe, da zmanjšate količino podatkov, ki se prenašajo med mesti. Semi join in bloom joint sta dve metodi, ki ju je mogoče uporabiti za zmanjšanje količine prenosa podatkov in učinkovito obdelavo poizvedb.

Kaj je Semi Join?

Semi join je metoda, ki se uporablja za učinkovito obdelavo poizvedb v okoljih porazdeljene baze podatkov. Razmislite o situaciji, ko se zbirka podatkov o zaposlenih (s podatki, kot so ime zaposlenega, številka oddelka, za katerega dela itd.) nahaja na mestu 1, in baza podatkov o oddelku (s podatki, kot so številka oddelka, ime oddelka, lokacija itd.), ki se nahaja na mestu 2. Na primer, če želimo pridobiti ime zaposlene in ime oddelka, za katerega dela (samo za oddelke, ki se nahajajo v »New Yorku«), tako da izvedemo poizvedbo v procesorju poizvedb, ki se nahaja na mestu 3, obstaja več načinov, da podatke bi lahko prenašali med tremi mesti, da bi dosegli to nalogo. Toda pri prenosu podatkov je pomembno upoštevati, da ni treba prenašati celotne baze podatkov med spletnimi mesti. Za učinkovito izvedbo poizvedbe je treba med mesti prenesti samo nekatere atribute (ali tuple), ki so potrebni za združevanje. Semi join je metoda, ki jo je mogoče uporabiti za zmanjšanje količine podatkov, poslanih med spletnimi mesti. Pri delnem združevanju se z enega mesta na drugo prenese le združevalni stolpec, nato pa se ta preneseni stolpec uporabi za zmanjšanje velikosti poslanih odnosov med drugimi mesti. Za zgornji primer lahko samo prenesete številko oddelka in ime oddelka tuples z lokacijo=”New York” z mesta 2 na mesto 1 in izvedete združevanje na mestu 1 ter prenesete končno relacijo nazaj na mesto 3.

Kaj je Bloom Join?

Kot smo že omenili, je bloom join še ena metoda, ki se uporablja za izogibanje prenosu nepotrebnih podatkov med mesti pri izvajanju poizvedb v okoljih porazdeljene baze podatkov. Pri združevanju bloom se namesto prenosa samega združevalnega stolpca med mesti prenaša strnjena predstavitev združevalnega stolpca. Bloom pridružitev uporablja bloom filter, ki uporablja bitni vektor za izvajanje poizvedb o članstvu. Najprej se z uporabo stolpca za združevanje zgradi bloom filter, ki se prenaša med mesti, nato pa se izvedejo operacije združevanja.

Kakšna je razlika med Semi Join in Bloom Join?

Čeprav se za zmanjšanje količine podatkov, ki se prenašajo med spletnimi mesti pri izvajanju poizvedb v okolju porazdeljene baze podatkov, uporabljata metodi semi-join in bloom-join, bloom-join zmanjša količino prenesenih podatkov (število tuplov) v primerjavi z semi združi z uporabo koncepta bloom filtrov, ki uporabljajo bitni vektor za določanje članstva v nizu. Zato bo uporaba združevanja bloom bolj učinkovita kot uporaba pol združevanja.

Priporočena: