NameNode Augsta pieejamība, izmantojot Quorum Journal Manager



NameNode Augsta pieejamība ir viena no svarīgākajām Hadoop 2.0 funkcijām. NameNode Augsta pieejamība ar Quorum Journal Manager tiek izmantota, lai koplietotu rediģēšanas žurnālus starp aktīvajiem un gaidstāves nosaukuma mezgliem.

Šī ir viena no vissvarīgākajām Hadoop 2.0 funkcijām. Pirms apspriest Namenode augstas pieejamības funkciju, ir svarīgi zināt, kas ir kvorums. Kvorums ir vispārīgs termins, ko lieto kopās, kur mēs sakām, ka konkrēta kopa ir stabila. Kvorums sniedz mašīnu sarakstu un palīdz noteikt klastera veselību. Ir divi kvoruma veidi: paredzamais kvorums un aprēķinātais kvorums.





NameNode Augsta pieejamība, izmantojot Quorum Journal Manager (QJM)

Pirms Hadoop 2.0 NameNode bija viens kļūmes punkts (SPOF) HDFS klasterī. Katram klasterim bija viens NameNode, un, ja šī mašīna nebija pieejama, kopa kopumā nebūs pieejama, līdz NameNode vai nu tiks restartēts, vai arī palaidīts atsevišķā mašīnā. Klasiskā HA klasterī divas atsevišķas mašīnas ir konfigurētas kā NameNodes. Jebkurā brīdī viens no NameNodes būs aktīvā stāvoklī, bet otrs būs gaidstāves stāvoklī. Aktīvais NameNode ir atbildīgs par visām klienta operācijām klasterī, savukārt gaidstāves režīms vienkārši darbojas kā vergs, uzturot pietiekami daudz stāvokļa, lai nodrošinātu ātru kļūmjpārleci.

Lai gaidīšanas režīma mezgls saglabātu savu stāvokli koordinētu ar aktīvo mezglu, abi mezgli sazinās ar atsevišķu dēmonu grupu, ko sauc par “JournalNodes” (JN). Kad aktīvais mezgls veic jebkādu nosaukumvietas modifikāciju, tas žurnālā JournalNodes reģistrē veikto izmaiņu ierakstu. Gaidīšanas mezgls spēj nolasīt grozīto informāciju no JN un regulāri uzrauga, vai tajā nav izmaiņu. Gaidīšanas mezglam redzot izmaiņas, tas tos piemēro savai nosaukumvietai. Kļūmjpārlēces gadījumā gaidstāves režīms pirms stāvokļa maiņas uz aktīvo stāvokli pārliecinās, vai ir izlasījis visas izmaiņas no JounalNodes. Tas garantē, ka nosaukumvietas stāvoklis tiek pilnībā sinhronizēts, pirms notiek kļūmjpārlēce.



Lai nodrošinātu ātru kļūmjpārlēcienu, ir svarīgi, lai gaidīšanas režīmā būtu atjaunināta un aktuāla informācija par bloku atrašanās vietu kopā. Lai tas notiktu, DataNodes tiek konfigurēti ar abu NameNodes atrašanās vietu un abiem nosūta bloku atrašanās vietas informāciju un sirdsdarbību.

Ir svarīgi, lai vienlaikus būtu aktīvs tikai viens no NameNodes. Pretējā gadījumā nosaukumvietas stāvoklis varētu atšķirties no abiem un izraisīt datu zudumu vai kļūdainus rezultātus. Lai no tā izvairītos, JournalNodes rakstniekam vienlaikus atļauj tikai vienu NameNode. Kļūmjpārlēces laikā NameNode, kuram jākļūst aktīvam, uzņemsies atbildību par JournalNodes rakstīšanu.

Vai mums ir jautājums? Lūdzu, pieminējiet tos komentāru sadaļā, un mēs ar jums sazināsimies.



kas ir skeneris java

Saistītās ziņas:

Hadoop 2.0 kopu arhitektūras federācijas pārskats