Hive ir Hadoop datu noliktavas sistēma, kas atvieglo datu apkopošanu, ad-hoc vaicājumus un lielu datu kopu, kas glabājas Hadoop saderīgās failu sistēmās, analīzi. Strops strukturē datus labi saprotamās datu bāzes koncepcijās, piemēram, tabulās, rindās, kolonnās un nodalījumos. Tas atbalsta primitīvos veidus, piemēram, veselos skaitļus, pludiņus, dubultspēles un virknes. Hive atbalsta arī asociatīvos masīvus, sarakstus, struktūras, kā arī Serialize un Deserialized API tiek izmantota datu pārvietošanai tabulās un ārpus tām.
kā brīdināt javascript
Apskatīsim stropu datu modeļus detalizēti
Stropu datu modeļi:
Stropa datu modeļi satur šādus komponentus:
- Datu bāzes
- Galdi
- Starpsienas
- Kausi vai kopas
Starpsienas:
Sadalīšana nozīmē tabulas sadalīšanu rupjās daļās, pamatojoties uz nodalījuma kolonnas vērtību, piemēram, “dati”. Tas ļauj ātrāk veikt vaicājumus par datu daļām
vizuālās studijas apmācība iesācējiem
Tātad, kāda ir Partition funkcija? Sadalīšanas taustiņi nosaka datu glabāšanas veidu. Katra nodalījuma atslēgas unikālā vērtība definē tabulas nodalījumu. Ērtības labad nodalījumi tiek nosaukti pēc datumiem. Tas ir līdzīgs HDFS ‘Block Splitting’.
Kausi:
Grupas nodrošina papildu struktūru datiem, kurus var izmantot efektīviem vaicājumiem. Divu tabulu savienojumu, kas ir ievietotas vienā un tajā pašā kolonnā, ieskaitot savienojuma kolonnu, var realizēt kā savienojumu kartes pusē. Grupēšana pēc izmantotā ID nozīmē, ka mēs varam ātri novērtēt uz lietotāju balstītu vaicājumu, izpildot to nejaušinātā paraugā no kopējā lietotāju kopas.
Vai mums ir jautājums? Lūdzu, pieminējiet tos komentāru sadaļā, un mēs ar jums sazināsimies.
Saistītās ziņas:
c ++ kārtojiet numurus augošā secībā