Stropu datu modeļi



Hive datu modeļos ir šādi komponenti, piemēram, datu bāzes, tabulas, starpsienas un kausi vai kopas. Strops atbalsta primitīvos veidus, piemēram, veselos skaitļus, pludiņus, dubultspēles un virknes.

Hive ir Hadoop datu noliktavas sistēma, kas atvieglo datu apkopošanu, ad-hoc vaicājumus un lielu datu kopu, kas glabājas Hadoop saderīgās failu sistēmās, analīzi. Strops strukturē datus labi saprotamās datu bāzes koncepcijās, piemēram, tabulās, rindās, kolonnās un nodalījumos. Tas atbalsta primitīvos veidus, piemēram, veselos skaitļus, pludiņus, dubultspēles un virknes. Hive atbalsta arī asociatīvos masīvus, sarakstus, struktūras, kā arī Serialize un Deserialized API tiek izmantota datu pārvietošanai tabulās un ārpus tām.





kā brīdināt javascript

Apskatīsim stropu datu modeļus detalizēti

Stropu datu modeļi:

Stropa datu modeļi satur šādus komponentus:



  • Datu bāzes
  • Galdi
  • Starpsienas
  • Kausi vai kopas

Starpsienas:

Sadalīšana nozīmē tabulas sadalīšanu rupjās daļās, pamatojoties uz nodalījuma kolonnas vērtību, piemēram, “dati”. Tas ļauj ātrāk veikt vaicājumus par datu daļām

vizuālās studijas apmācība iesācējiem

Stropu datu modeļi

Tātad, kāda ir Partition funkcija? Sadalīšanas taustiņi nosaka datu glabāšanas veidu. Katra nodalījuma atslēgas unikālā vērtība definē tabulas nodalījumu. Ērtības labad nodalījumi tiek nosaukti pēc datumiem. Tas ir līdzīgs HDFS ‘Block Splitting’.



Kausi:

Grupas nodrošina papildu struktūru datiem, kurus var izmantot efektīviem vaicājumiem. Divu tabulu savienojumu, kas ir ievietotas vienā un tajā pašā kolonnā, ieskaitot savienojuma kolonnu, var realizēt kā savienojumu kartes pusē. Grupēšana pēc izmantotā ID nozīmē, ka mēs varam ātri novērtēt uz lietotāju balstītu vaicājumu, izpildot to nejaušinātā paraugā no kopējā lietotāju kopas.

Vai mums ir jautājums? Lūdzu, pieminējiet tos komentāru sadaļā, un mēs ar jums sazināsimies.

Saistītās ziņas:

c ++ kārtojiet numurus augošā secībā

Noderīgas stropa komandas