Apache Hive instalēšana Ubuntu



Šajā emuārā mēs uzzināsim par Apache Hive instalēšanu Ubuntu un Hadoop Hive, Hive sql, Hive datu bāzes, Hive servera un Hive instalēšanas koncepcijām.

Apache Hive ir viens no vissvarīgākajiem Hadoop ekosistēmas ietvariem, kas savukārt padara to par ļoti svarīgu . Šajā emuārā mēs uzzināsim par Apache Hive un Hive instalēšanu Ubuntu.

Kas ir Apache Hive?

Apache strops ir datu noliktavas infrastruktūra, kas atvieglo lielu datu kopu meklēšanu un pārvaldīšanu, kas atrodas sadalītās glabāšanas sistēmā. Tas ir veidots virs Hadoop un to ir izstrādājis Facebook. Stropu nodrošina veidu, kā vaicāt datus, izmantojot SQL līdzīgu vaicājumu valodu, ko sauc HiveQL (stropu vaicājuma valoda).





Iekšēji tulkotājs tulko HiveQL paziņojumus MapReduce darba vietas, kuras pēc tam tiek iesniegtas Hadoop ietvars izpildei.

Starpība starp stropu un SQL:

Stropu izskatās ļoti līdzīgi kā tradicionālā datu bāze ar SQL piekļuvi. Tomēr tāpēc, ka Stropu balstīts uz Hadoops un MapReduce operācijām, ir vairākas galvenās atšķirības:



Tā kā Hadoop ir paredzēts ilgstošiem secīgiem skenējumiem un Stropu balstīts uz Hadoops , jūs varētu sagaidīt, ka vaicājumiem ir ļoti augsts latentums. Tas nozīmē, ka Stropu nebūtu piemērots tām lietojumprogrammām, kurām nepieciešams ļoti ātrs atbildes laiks, kā jūs varat sagaidīt, izmantojot tradicionālo RDBMS datu bāzi.

Visbeidzot, Stropu ir balstīta uz lasīšanu un tāpēc nav piemērota darījumu apstrādei, kas parasti ietver lielu procentuālo daļu rakstīšanas operāciju.

selēna tīmekļa draivera testng ietvara piemērs

Stropu instalēšana Ubuntu:

Lūdzu, veiciet tālāk norādītās darbības, lai instalētu Apache strops Ubuntu:



1. darbība: Lejupielādēt Stropu darva.

Komanda: wget http://archive.apache.org/dist/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz

2. darbība: Izraksts darva failu.

Komanda: darva -xzf apache-strops-2.1.0-bin.tar.gz

Komanda: ls

Spread Hive File - Hive Installation - Edureka

3. solis: Rediģēt “.Bashrc” failu, lai atjauninātu vides mainīgos.

Komanda: sudo gedit .bashrc

Faila beigās pievienojiet šo:

# Iestatiet HIVE_HOME

eksportēt HIVE_HOME = / home / edureka / apache-hive-2.1.0-bin
eksportēt PATH = $ PATH: /home/edureka/apache-hive-2.1.0-bin/bin

Pārliecinieties arī, vai ir iestatīts arī hadoop ceļš.

Palaist zem komandas, lai izmaiņas darbotos tajā pašā terminālā.

Komanda: avots .bashrc

4. solis: Pārbaudiet stropa versiju.

goto c ++ piemērs

5. darbība: Izveidot Stropu direktoriju ietvaros HDFS . Katalogs ‘Noliktava’ ir vieta, kur glabāt tabulu vai datus, kas saistīti ar stropu.

Komanda:

  • hdfs dfs -mkdir -p / lietotājs / strops / noliktava
  • hdfs dfs -mkdir / tmp

6. solis: Iestatiet tabulas lasīšanas / rakstīšanas atļaujas.

Komanda:

Šajā komandā mēs piešķiram grupai rakstīšanas atļauju:

  • hdfs dfs -chmod g + w / lietotājs / strops / noliktava
  • hdfs dfs -chmod g + w / tmp

7. solis: Iestatiet Hadoops ceļš iekšā h ive-env.sh

Komanda: cd apache-strops-2.1.0-bin /

Komanda: gedit conf / hive-env.sh

Iestatiet parametrus, kā parādīts zemāk esošajā momentuzņēmumā.

8. solis: Rediģēt stropu vietne.xml

Komanda: gedit conf / hive-site.xml

javax.jdo.option.ConnectionURL jdbc: derby: databaseName = / home / edureka / apache-hive-2.1.0-bin / metastore_dbcreate = true JDBC savienojuma virkne JDBC metastorei. Lai savienojuma šifrēšanai / autentifikācijai izmantotu SSL, savienojuma vietrādī URL norādiet datu bāzei specifisku SSL karodziņu. Piemēram, jdbc: postgresql: // myhost / db? Ssl = true postgres datu bāzei. hive.metastore.warehouse.dir / user / hive / noliktavas noklusējuma datu bāzes atrašanās vieta noliktavai hive.metastore.uris Taupības URI attālajai metastorei. Metastore klients izmanto, lai izveidotu savienojumu ar attālo metastore. javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver draivera klases nosaukums JDBC metastorei javax.jdo.PersistenceManagerFactoryClass org.datanucleus.api.jdo.JDOPersistenceManagerFactory klases ieviešana

9. solis: Pēc noklusējuma Hive izmanto Derbijs datu bāzē. Inicializējiet Derby datu bāzi.

Komanda: bin / schematool -initSchema -dbType derbijs

10. solis :Uzsākt Stropu.

Komanda: strops

11. solis :Palaidiet dažus vaicājumus stropu čaulā.

Komanda: parādīt datu bāzes

Komanda: izveidot tabulas darbinieka (id virkne, nosaukuma virkne, dept virkne) rindas formāta norobežotus laukus, kas izbeigti ar ‘’ saglabāti kā tekstfails

Komanda: parādīt tabulas

12. darbība: Lai izietu no Strops:

Komanda: Izeja

Tagad, kad esat pabeidzis Hive instalēšanu, nākamais solis uz priekšu ir izmēģināt Hive komandas uz Hive apvalka. Tāpēc mūsu nākamais emuārs “ Populārākās stropa komandas ar HQL piemēriem ”Palīdzēs jums apgūt stropu komandas.

Saistītās ziņas:

leļļu šefpavāra sāls salīdzinājums

Kā palaist stropu skriptus?

Stropu komandas

Ievads Apache Hive