Razlika med RDBMS in Hadoop

Kazalo:

Razlika med RDBMS in Hadoop
Razlika med RDBMS in Hadoop

Video: Razlika med RDBMS in Hadoop

Video: Razlika med RDBMS in Hadoop
Video: Hadoop против РСУБД 2024, Julij
Anonim

Ključna razlika med RDBMS in Hadoopom je, da RDBMS shranjuje strukturirane podatke, medtem ko Hadoop shranjuje strukturirane, polstrukturirane in nestrukturirane podatke.

RDBMS je sistem za upravljanje baze podatkov, ki temelji na relacijskem modelu. Hadoop je programska oprema za shranjevanje podatkov in izvajanje aplikacij v grozdih osnovne strojne opreme.

Slika
Slika

Kaj je RDBMS?

RDBMS pomeni sistem za upravljanje relacijskih baz podatkov, ki temelji na relacijskem modelu. V RDBMS se tabele uporabljajo za shranjevanje podatkov, ključi in indeksi pa pomagajo povezovati tabele. Tabela je zbirka podatkovnih elementov, ti pa so entitete. Vsebuje vrstice in stolpce. Vrstice predstavljajo en vnos v tabeli. Stolpci predstavljajo atribute.

Prodajna baza podatkov lahko na primer vsebuje entitete strank in izdelkov. Stranka ima lahko atribute, kot so customer_id, name, address, phone_no. Element ima lahko atribute, kot so product_id, name itd. Primarni ključ tabele strank je customer_id, primarni ključ tabele izdelkov pa product_id. Postavitev product_id v tabelo strank kot tuji ključ povezuje ti dve entiteti. Prav tako so tudi tabele med seboj povezane. Zagotavljajo celovitost podatkov, normalizacijo in še veliko več. Nekaj običajnih RDBMS je MySQL, MSSQL in Oracle. Za poizvedovanje uporabljajo SQL.

Kaj je Hadoop?

Hadoop je odprtokodno ogrodje Apache, napisano v Javi. Pomaga pri shranjevanju in obdelavi velike količine podatkov v gručah računalnikov z uporabo preprostih modelov programiranja. Glavni cilj Hadoopa je shranjevanje in obdelava velikih podatkov, ki se nanašajo na veliko količino kompleksnih podatkov. Prepustnost Hadoopa, ki je zmožnost obdelave količine podatkov v določenem časovnem obdobju, je visoka.

Razlika med RDBMS in Hadoop
Razlika med RDBMS in Hadoop

V arhitekturi Hadoop so štirje moduli. To so Hadoop common, YARN, Hadoop Distributed File System (HDFS) in Hadoop MapReduce. Skupni modul vsebuje javanske knjižnice in pripomočke. Ima tudi datoteke za zagon Hadoopa. Hadoop YARN izvaja razporejanje opravil in upravljanje virov gruče.

Poleg tega je Hadoop Distributed File System (HDFS) sistem za shranjevanje Hadoop. Uporablja arhitekturo master-slave. Glavno vozlišče je NameNode in upravlja metapodatke datotečnega sistema. Drugi računalniki so podrejena vozlišča ali DataNodes. Shranjujejo dejanske podatke. Po drugi strani pa Hadoop MapReduce izvaja porazdeljeno računanje. Ima algoritme za obdelavo podatkov. V HDFS ima glavno vozlišče sledilnik opravil. Na podrejenih vozliščih izvaja opravila za zmanjšanje preslikave. Za vsako podrejeno vozlišče obstaja sledilnik opravil za dokončanje obdelave podatkov in pošiljanje rezultatov nazaj glavnemu vozlišču. Na splošno Hadoop zagotavlja ogromno shranjevanje podatkov z visoko procesorsko močjo.

Kakšna je razlika med RDBMS in Hadoop?

RDBMS proti Hadoop

RDBMS je sistemska programska oprema za ustvarjanje in upravljanje baz podatkov, ki temeljijo na relacijskem modelu. Hadoop je zbirka odprtokodne programske opreme, ki povezuje veliko računalnikov za reševanje težav, ki vključujejo veliko količino podatkov in računanja.
Podatkovna raznolikost
RDBMS shranjuje strukturirane podatke. Hadoop shranjuje strukturirane, polstrukturirane in nestrukturirane podatke.
Shranjevanje podatkov
RDBMS shrani povprečno količino podatkov. Hadoop shrani veliko količino podatkov kot RDBMS.
Hitrost
V RDBMS so branja hitra. V Hadoopu sta branje in pisanje hitra.
Skalabilnost
RDBMS ima navpično razširljivost. Hadoop ima vodoravno razširljivost.
Strojna oprema
RDBMS uporablja vrhunske strežnike. Hadoop uporablja standardno strojno opremo.
Prepustnost
Prepustnost RDBMS je večja. Prepustnost Hadoop je manjša.

Povzetek – RDBMS proti Hadoop

Ta članek je obravnaval razliko med RDBMS in Hadoop. Ključna razlika med RDBMS in Hadoopom je v tem, da RDBMS shranjuje strukturirane podatke, medtem ko Hadoop shranjuje strukturirane, polstrukturirane in nestrukturirane podatke.

Priporočena: