R programmēšana - iesācēju rokasgrāmata R programmēšanas valodai



Šis emuārs par R programmēšanu iepazīstina jūs ar R un palīdz ar piemēriem detalizēti izprast dažādus R programmēšanas pamatjēdzienus.

R ir viens no populārākajiem analīzes rīkiem. Bet papildus izmantošanai analīzei, R ir arī programmēšanas valoda.Ar IT nozares izaugsmi ir augošs pieprasījums pēc kvalificētiem vai saprotot R kā datu analīzes rīku un programmēšanas valodu.Šajā emuārā es jums palīdzēšu saprast dažādus R programmēšanas pamatus. Mūsu lpp apburošs Emuārs ,mēs esam apsprieduši, kāpēc mums ir nepieciešama analīze, kas ir biznesa analīze, kāpēc un kurš lieto R.

Šajā emuārā mēs sapratīsim zemāk minētos R programmēšanas pamatjēdzienus šādā secībā:





  1. Mainīgie
  2. Datu tipi
  3. Datu operatori
  4. Nosacījuma paziņojums
  5. Cilpas
  6. Funkcijas

Jūs varat iziet R programmēšanas valodas tīmekļa semināra ierakstu, kur mūsu instruktors ir detalizēti izskaidrojis tēmas ar piemēriem, kas palīdzēs jums labāk izprast R programmēšanu.

R programmēšana iesācējiem R Programmēšanas valodas apmācība Edureka



Tāpēc ejam uz priekšu un apskatīsim pirmo R programmēšanas koncepciju - mainīgos.

R programmēšana: mainīgie

Mainīgie nav nekas cits kā nosaukums atmiņas vietai, kurā ir vērtība. Mainīgais lielums R var saglabāt skaitliskas vērtības, sarežģītas vērtības, vārdus, matricas un pat tabulu. Pārsteidzoši, vai ne?

Mainīgais - R programmēšana - Edureka

Attēls: Radīšanamainīgo lielumu



Iepriekš redzamais attēls parāda, kā mainīgie tiek izveidoti un kā tie tiek glabāti dažādos atmiņas blokos. R, mums nav jādeklarē mainīgais pirms tā izmantošanas, atšķirībā no citām programmēšanas valodām, piemēram, Java, C, C ++ utt.

Virzīsimies uz priekšu un mēģināsim saprast, kas ir datu tips un dažādi R atbalstītie datu tipi.

R programmēšana: datu tipi

R gadījumā mainīgais pats par sevi nav deklarēts nevienam datu tipam, drīzāk tas iegūst tam piešķirtā R objekta datu tipu. Tātad R tiek saukta par dinamiski drukātu valodu, kas nozīmē, ka, lietojot to programmā, mēs varam atkal un atkal mainīt viena un tā paša mainīgā datu tipu.

Datu tipi norāda, kāda veida vērtība ir mainīgajam un kāda veida matemātiskas, relācijas vai loģiskas darbības tam var piemērot, neradot kļūdu. R ir daudz datu veidu, tomēr zemāk ir visbiežāk izmantotie:

Tagad apspriedīsim katru no šiem datu tipiem atsevišķi, sākot ar vektoriem.

Vektori

Vektori ir visvienkāršākie R datu objekti, un ir seši atomu vektoru veidi. Zemāk ir seši atomu vektori:

Loģiski : To izmanto, lai saglabātu loģisko vērtību, piemēram, PATIESA vai FALSE .

Ciparu skaitlis : To izmanto, lai saglabātu gan pozitīvos, gan negatīvos skaitļus, ieskaitot reālo skaitli.

Piem .: 25, 7.1145, 96547

Vesels skaitlis : Tas satur visas skaitļa vērtības, t.i., visus pozitīvos un negatīvos veselos skaitļus.

Piemēram: 45.479, -856.479, 0

Komplekss : Tie ir formas x + yi, kur x un y ir skaitliski, un i apzīmē -1 kvadrātsakni.

Piemēram: 4 + 3i

Raksturs : To lieto, lai kopā glabātu vienu rakstzīmi, rakstzīmju (vārdu) grupu vai vārdu grupu. Rakstzīmes var definēt vai nu atsevišķās pēdiņās, vai divkāršās pēdiņās.

Piemēram: 'Edureka', 'R ir jautri mācīties'.

Parasti vektoru definē un inicializē šādi:

Vtr = c (2, 5, 11, 24) Or Vtr<- c(2, 5, 11 , 24)

Pāriesim uz priekšu un sapratīsim citus datu tipus R

Saraksts

Saraksti ir diezgan līdzīgi vektoriem, taču saraksti ir R objekti, kas var saturēt dažāda veida elementus, piemēram, & mīnus skaitļus, virknes, vektorus un citu sarakstu tajā.

Piemēram:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Izeja:

[[1]] [1] Sveiki, sveiki, kā vai tu dari '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] PATIESA

Matrica

Matrica ir R objekts, kurā elementi ir izvietoti divdimensiju taisnstūrveida izkārtojumā.

Pamata sintakse matricas izveidošanai R ir & mīnus

 matrica (dati, nrow, ncol, byrow, dimnames) 

Kur:

  • dati ir ievades vektors, kas kļūst par matricas datu elementiem.
  • tagad ir izveidojamo rindu skaits.
  • ncol ir izveidojamo kolonnu skaits.
  • byrow ir loģisks pavediens. Ja TRUE, tad ievades vektora elementi ir sakārtoti pa rindām.
  • vājvārds ir rindām un kolonnām piešķirtie nosaukumi.

Piemērs:

Mimatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Izeja:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Masīvi R ir datu objekti, kurus var izmantot datu glabāšanai vairāk nekā divās dimensijās. Tas izmanto vektorus kā ievadi un izmanto vērtības parametrs, lai izveidotu masīvu.

Pamata sintakse masīva izveidošanai R ir & mīnus

 masīvs (data, dim, dimnames) 

Kur:

  • dati ir ievades vektors, kas kļūst par masīva datu elementiem.
  • ir masīva dimensija, kur jūs nododat rindu skaitu, kolonnu un matricu skaitu, kas jāizveido ar minētajām dimensijām.
  • vājvārds ir rindām un kolonnām piešķirtie nosaukumi.

Piemērs:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Izeja:

,, viens [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Datu rāmis

Datu rāmis ir tabula vai divdimensiju masīvam līdzīga struktūra, kurā katrā kolonnā ir viena mainīgā vērtības un katrā rindā ir viena vērtību kopa.priekškatrā kolonnā. Tālāk ir norādītas dažas datu ietvara īpašības, kas jāņem vērā katru reizi, kad mēs ar tām strādājam:

  • Kolonnu nosaukumiem jābūt tukšiem.
  • Katrā kolonnā jābūt vienādam datu vienumu skaitam.
  • Datu rāmī saglabātie dati var būt skaitliski, faktori vai rakstzīmes.
  • Rindu nosaukumiem jābūt unikāliem.

Piemērs:

emp_id = c (100: 104) emp_name = c ('Jānis', 'Henrijs', 'Ādams', 'Rons', 'Gerijs') dept = c ('Pārdošana', 'Finanses', 'Mārketings', 'HR “,“ P&A ”) dati<- data.frame(emp_id, emp_name, dept) emp.data 

Izeja:

emp_id emp_name nod 1 100 John Sales 2 101 Henrijs Finanses 3 102 Adam Marketing 4 103 Rons HR 5 104 Gerijs pētniecība un attīstība

Tāpēc tagad, kad mēs esam sapratuši R pamatdatu veidus, ir pienācis laiks dziļi ienirt R, izprotot datu operatoru jēdzienus.

R programmēšana: datu operatori

R galvenokārt ir 4 datu operatori, un tie ir redzami zemāk:

Aritmētiskie operatori : Šie operatori palīdz mums veikt aritmētiskās pamatdarbības, piemēram, saskaitīšanu, atņemšanu, reizināšanu utt.

Apsveriet šādu piemēru:

num1 = 15 num2 = 20 num3 = 0 # papildinājums num3 = num1 + num2 num3 #substrakcija num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #grīdas nodalījums num3 = num1% /% num2 num3

Izeja:

[1] 35 [piecpadsmit [1] 300 [1] 0,75 [1] 15 [1] 125 [vienpadsmit

Relāciju operatori : Šie operatori palīdz mums veikt relācijas darbības, piemēram, pārbaudīt, vai mainīgais ir lielāks, mazāks vai vienāds ar citu mainīgo. Relāciju operācijas rezultāts vienmēr ir loģiska vērtība.

Apsveriet šādus piemērus:

num1 = 15 num2 = 20 # ir vienāds ar num3 = (num1 == num2) num3 #nav vienāds ar num3 = (num1! = num2) num3 #mazāk par num3 = (num1 num2) num3 # bez vienādu ar num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Izeja:

[1] FALSE [1] PATIESA [1] PATIESA [1] FALSE [1] PATIESA [1] FALSE

Uzdevumu operatori: Šie operatori tiek izmantoti, lai piešķirtu vērtības mainīgajiem R. Piešķiršanu var veikt, izmantojot jebkuru no piešķiršanas operatoriem(<-) vai ir vienāds ar operatoru (=). Mainīgā lielumu var piešķirt divos veidos: kreisajā un labajā.

LoģiskiOperatori: Šie operatori salīdzina abas entītijas un parasti tiek izmantoti ar Būla (loģiskām) vērtībām, piemēram, ‘un’, ‘vai’un‘Nē’.


R programmēšana: nosacījumu paziņojumi

  1. Ja paziņojums: Ja paziņojums palīdz jums novērtēt vienu izteiksmi kā daļu no plūsmas. Lai veiktu šo novērtējumu, jums vienkārši jāuzraksta atslēgvārds If, kam seko vērtējamā izteiksme. Zemāk redzamā plūsmas diagramma sniegs priekšstatu par to, kā If paziņojums kontrolē koda plūsmu: Apsveriet šādu piemēru:
num1 = 10 num2 = 20 ja (num1<=num2){ print('Num1 is less or equal to Num2') 

Izeja:

[1] 'Num1 ir mazāks vai vienāds ar Num2'
  • Cits paziņojums: Else if paziņojums palīdz jums paplašināt filiāles uz If paziņojuma izveidoto plūsmu un dod jums iespēju novērtēt vairākus nosacījumus, izveidojot jaunas plūsmas filiāles. Tālāk sniegtā plūsma sniegs jums priekšstatu par to, kā cits, ja priekšraksts sazaro koda plūsmu:

    Apsveriet šādu piemēru:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 ir mazāks par Num1')} cits, ja ('Num1 == Num2) {print (' Num1 un Num2 ir vienādi ')}

    Izeja:

    [1] 'Num1 ir mazāks par Num2'

  • Cits paziņojums: Cits paziņojums tiek izmantots, kad visas citas izteiksmes ir pārbaudītas un atzītas par nederīgām. Šis būs pēdējais paziņojums, kas tiek izpildīts kā filiāles If - Else if daļa. Zemāk plūsma sniegs jums labāku priekšstatu par to, kā Else maina koda plūsmu:

Apsveriet šādu piemēru:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 ir mazāks par Num1')} cits print ('Num1 un Num2 ir vienādi')}

Izeja:

[1] 'Num1 un Num2 ir vienādi'

R programmēšana: cilpas

Cilpas paziņojums ļauj mums vairākas reizes izpildīt paziņojumu vai pārskatu grupu. R galvenokārt ir 3 veidu cilpas:

  1. atkārtojiet cilpu : Tas atkārto paziņojumu vai apgalvojumu grupu, kamēr dotais nosacījums ir PATIESA. Atkārtošanas cilpa ir labākais izejas kontrolētās cilpas piemērs, kur kods vispirms tiek izpildīts un pēc tam tiek pārbaudīts nosacījums, lai noteiktu, vai vadībai vajadzētu būt cilpas iekšpusē, vai iziet no tās. Zemāk ir vadības plūsma atkārtotā ciklā:
    Apskatīsim tālāk sniegto piemēru, lai saprastu, kā mēs varam izmantot atkārtotu cilpu, lai pievienotu n skaitļus, līdz summa sasniegs 100:

    x = 2 atkārtojiet {x = x ^ 2 drukāt (x), ja (x> 100) {pārtraukums}

    Izeja:

    [1] 4 [1] 16 [1] 256. lpp
  2. kamēr Loop : Est palīdz atkārtot apgalvojumu vai apgalvojumu grupu, kamēr dotais nosacījums ir PATIESA. Lai gan cilpa, salīdzinot ar atkārtoto cilpu, ir nedaudz atšķirīga, tas ir ieejas kontrolētas cilpas piemērs, kur nosacījums vispirms tiek pārbaudīts, un tikai tad, ja tiek konstatēts, ka nosacījums ir patiess, vadība tiek piegādāta cilpas iekšpusē, lai izpildītu kodu . Zemāk redzama vadības plūsma brīža ciklā:
    Apskatīsim tālāk sniegto piemēru, lai pievienotu pirmo 10 skaitļu kvadrātu summu un saprastu, kā cilpa while darbojas labāk:

    num = 1 sumn = 0, kamēr (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Izeja:

    [vienpadsmit [piecpadsmit [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. par cilpu : Tas tiek izmantots, lai noteiktu laiku atkārtotu paziņojumu vai grupu. Atšķirībā no atkārtojuma un kamēr cikls, for cikls tiek izmantots situācijās, kad mums ir zināms, cik reižu kods ir jāizpilda iepriekš. Tas ir līdzīgs while ciklam, kurā vispirms tiek pārbaudīts nosacījums, un pēc tam tiek izpildīts tikai iekšpusē ierakstītais kods. Ļauj redzēt cilpas vadības plūsmu tagad:

Tagad aplūkosim piemēru, kur mēs izmantosim for ciklu, lai izdrukātu pirmos 10 ciparus:

par (x pēc 1:10) {izdrukāt (x)}

Izeja:

[vienpadsmit [1] 2 [1] 3 [1] 4 [piecpadsmit [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R programmēšana: funkcijas

Funkcija ir sakārtota, atkārtoti izmantojama koda bloks, kas tiek izmantots, lai veiktu vienu saistītu darbību. R galvenokārt ir divu veidu funkcijas:

Iepriekš definētas funkcijas : Tās ir iebūvētas funkcijas, kuras lietotājs var izmantot, lai veiktu savu darbu vieglākr. Piemēram: mean( x) , sum( x) , kvrt ( x ), augšējā daļa( x ) utt.

Lietotājs definēts Funkcijas: Šīs funkcijas izveido lietotājs, lai izpildītu konkrētas lietotāja prasības. Zemāk ir sintakse, lai izveidotu funkcijuR:

 func  nosaukums_nosaukums  <– funkciju (arg_1, arg_2 un hellip){ // Funkcijas pamatteksts }

Apsveriet šo vienkāršās funkcijas piemēru kvadrātu summas ģenerēšanaigada2 numuri:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Rezultāts: [1] 25

Es ceru, ka jums patika lasīt šo R programmēšanas emuāru. Šajā apmācībā mēs esam apskatījuši visus R pamatus, tāpēc jūs varat sākt praktizēt tūlīt. Pēc šī R programmēšanas emuāra es nākšu klajā ar vairākiem emuāriem vietnē R for Analytics, tāpēc sekojiet jaunumiem.

Tagad, kad esat sapratis R pamatus, pārbaudiet Autors: Edureka, uzticams tiešsaistes mācību uzņēmums ar vairāk nekā 250 000 apmierinātu izglītojamo tīklu visā pasaulē. Edureka’s Data Analytics with R apmācība palīdzēs jums iegūt zināšanas R programmēšanā, datu apstrādē, izpētes datu analīzē, datu vizualizācijā, datu iegūšanā, regresijā, sentimentu analīzē un RStudio izmantošanā reālās dzīves gadījumu izpētei mazumtirdzniecībā, sociālajos medijos.

Vai mums ir jautājums? Lūdzu, pieminējiet to šī “R Programming” emuāra komentāru sadaļā, un mēs pēc iespējas ātrāk sazināsimies ar jums.

noklusējuma vērtība virknei Java