Apache Pig instalēšana Linux



Šis emuārs ir soli pa solim ceļvedis Apache Pig instalēšanai Linux vidē. Mēs instalēsim Apache Pig 0.16.0 un palaidīsim to dažādos režīmos.

Šajā amatā es runāšu par Apache Pig instalēšana Linux . Sāksim ar Apache Pig un Pig Latin pamata definīciju.

Apache Pig ir rīks / platforma, lai izveidotu un izpildītu ar Hadoop izmantoto programmu Map Reduce. Tas ir rīks / platforma lielu datu kopu analīzei. Jūs varat teikt, ka Apache Pig ir abstrakcija virs MapReduce. Programmētāji, kas nav tik labi lietojami Java, mēdza cīnīties ar Hadoop, galvenokārt rakstot MapReduce darbus.Tātad, tā ir svarīga tēma, kas jāapgūst un jāapgūst .Apache Pig ir sava valoda Cūka latīņu kas ir noderīga sliktiem programmētājiem.





Pamata ievads cūku latīņu valodā palīdzēs labāk saprast:

Tiek saukta augsta līmeņa procesuālā valoda, ko izmanto Apache Pig platformā Cūka latīņu . Apache Pig iezīme ir “Pig Latin”, kas ir salīdzinoši vienkāršāka valoda, kas var darboties ar izplatītām datu kopām Hadoop failu sistēmā (HDFS). Apache Pig jums ir jāraksta Pig skripti, izmantojot Pig latīņu valodu, kas tiek pārveidota par MapReduce darbu, kad palaižat Pig skriptu. Apache Pig ir dažādi operatori, kas tiek izmantoti tādu uzdevumu veikšanai kā datu lasīšana, rakstīšana, apstrāde. Lai uzzinātu vairāk par Apache Pig operatoriem, apmeklējiet mūsu emuāru “ Apache Pig operatori: 1. daļa - Relāciju operatori ”.

Tagad, kad jums ir pamatzināšanas par Apache Pig, sāksim ar Apache Pig instalēšanu Linux.



Apache Pig instalēšana Linux:

Tālāk ir norādītas darbības Apache Pig instalēšanai Linux (Ubuntu / centos / Windows, izmantojot Linux VM). Zemāk esošajā iestatījumā es izmantoju Ubuntu 16.04.

1. darbība: Lejupielādēt Cūka darva failu.

Komanda: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Lejupielādēt Cūka - Cūka instalēšana - Edureka

2. darbība: Izraksts darva failu, izmantojot tar komandu. Zem darvas komandas x nozīmē izvilkt arhīva failu, ar nozīmē filtrēt arhīvu caur gzip, f nozīmē arhīva faila faila nosaukumu.

Komanda: darva -xzf pig-0.16.0.tar.gz

Komanda: ls

kas ir dekss jaudā bi

3. solis: Rediģēt “ .bashrc ”Failu, lai atjauninātu Apache Pig vides mainīgos. Mēs to iestatām tā, lai mēs varētu piekļūt cūkai no jebkura direktorija, mums nav jādodas uz cūku direktoriju, lai izpildītu cūku komandas. Turklāt, ja kāda cita lietojumprogramma meklē Pig, tā no šī faila iepazīs Apache Pig ceļu.

Komanda: sudo gedit .bashrc

Faila beigās pievienojiet šo:

# Iestatiet PIG_HOME

eksportēt PIG_HOME = / home / edureka / pig-0.16.0
eksportēt PATH = $ PATH: /home/edureka/pig-0.16.0/bin
eksportēt PIG_CLASSPATH = $ HADOOP_CONF_DIR

Pārliecinieties arī, vai ir iestatīts arī hadoop ceļš.

Palaidiet komandu zemāk, lai izmaiņas tiktu atjauninātas tajā pašā terminālā.

Komanda: avots .bashrc

4. solis: Pārbaudiet cūku versiju. Tas ir paredzēts, lai pārbaudītu, vai Apache Pig ir pareizi instalēts. Gadījumā, ja jūs nesaņemat Apache Pig versiju, jums jāpārbauda, ​​vai esat pareizi veicis iepriekš minētās darbības.

Komanda: cūka -versija

5. solis :Pārbaudiet cūku palīdzību, lai redzētu visas cūku komandas iespējas.

Komanda: cūka -palīdzība

6. solis :Palaidiet Cūku, lai sāktu rūciena apvalku. Grunt apvalks tiek izmantots, lai palaistu Pig Latin skriptus.

Komanda: cūka

no komata līdz bināram pitonā

Ja pareizi aplūkojat iepriekšējo attēlu, Apache Pig ir divi režīmi, kuros to var palaist, pēc noklusējuma tā izvēlas MapReduce režīmu. Otrs režīms, kurā jūs varat palaist Pig, ir Vietējais režīms. Ļaujiet man pastāstīt jums vairāk par šo.

Izpildes režīmi Apache Pig:

  • MapReduce režīms - Šis ir noklusējuma režīms, kuram nepieciešama piekļuve Hadoop kopai un HDFS instalācijai. Tā kā tas ir noklusējuma režīms, nav nepieciešams norādīt karodziņu -x (jūs varat izpildīt cūka VAI cūka -x mapreduce ). Šajā režīmā ieeja un izeja ir HDFS.
  • Vietējais režīms - Ar piekļuvi vienai mašīnai visi faili tiek instalēti un palaisti, izmantojot vietējo resursdatoru un failu sistēmu. Šeit vietējais režīms tiek norādīts, izmantojot ‘-x flag’ ( cūka -x vietējā ). Šajā režīmā ievade un izvade ir lokālajā failu sistēmā.

Komanda: cūka -x vietējā

Lai skatītos Apache Pig instalēšanu Linux, varat apskatīt zemāk esošo videoklipu:

Apache Pig uzstādīšana | Cūku instalēšana Linux Edureka

Tagad, kad esat pabeidzis Apache Pig instalēšanu Linux, nākamais solis uz priekšu ir izmēģināt dažus relāciju Pig operatorus Pig Grunt čaulā. Tādējādi nākamais emuārs “ Apache Pig operatori: 1. daļa - Relāciju operatori ”Palīdzēs jums apgūt cūku operatorus.

Tagad, kad esat Linux instalējis Apache Pig, pārbaudiet Autors: Edureka, uzticams tiešsaistes mācību uzņēmums ar vairāk nekā 250 000 apmierinātu izglītojamo tīklu visā pasaulē. Edureka Big Data Hadoop sertifikācijas apmācības kurss palīdz izglītojamajiem kļūt par HDFS, dzijas, MapReduce, Pig, Hive, HBase, Oozie, Flume un Sqoop ekspertiem, izmantojot reāllaika lietošanas gadījumus mazumtirdzniecības, sociālo mediju, aviācijas, tūrisma, finanšu jomā.

Vai mums ir jautājums? Lūdzu, pieminējiet to komentāru sadaļā, un mēs ar jums sazināsimies.