Lielo datu apstrāde ar Apache Spark & ​​Scala



Apache Spark ir parādījies kā lieliska attīstība lielu datu apstrādē.

kārtojot masīvu c ++ programmā

IST: plkst. 7:00 - 08:00, 17. oktobrī, 14. oktobrī





PDT: 14.30–14.30, 14. oktobris ’14

Ierobežotas vietas !! Aizpildiet veidlapu labajā pusē un rezervējiet savu vietu jau šodien.



Sveiki visiem, mēs rīkojam bezmaksas tīmekļa semināru par Apache Spark un Scala 18. oktobrī ’14. Vebināra nosaukums ir Lielo datu apstrāde ar Apache Spark un Scala . Šajā vebinārā tiks apspriestas būtiskākās tēmas attiecībā uz Apache Spark un Scala. Jebkurus jautājumus vai šaubas var noskaidrot sesijas laikā.

Apskatāmās tēmas:

  • Kas ir Big Data?
  • Kas ir Spark?
  • Kāpēc Spark?
  • Dzirksteļu ekosistēma
  • Piezīme par Scala
  • Kāpēc Scala?
  • Sveika dzirkstele - rokas

Kāpēc Spark?

Apache Spark ir atvērtā koda kopu skaitļošanas sistēma Hadoop kopu kopām. Tas ir kvalificējams kā viens no labākajiem datu analīzes un apstrādes dzinējiem liela mēroga datiem ar nepārspējamu ātrumu, ērtu lietošanu un izsmalcinātu analīzi. Šīs priekšrocības un funkcijas padara Apache Spark par krosovertu darbības, kā arī izpētes analīzē:

  • Programmā Spark izstrādātās programmas darbojas 100 reizes ātrāk nekā tās, kas izstrādātas Hadoop MapReduce.
  • Spark apkopo 80 augsta līmeņa operatorus.
  • Spark Streaming ļauj reāllaikā apstrādāt datus.
  • GraphX ​​ir bibliotēka grafiskiem aprēķiniem.
  • MLib ir mašīnmācīšanās bibliotēka Spark.
  • Galvenokārt Scala rakstīts, Spark var iegult jebkurā JVM balstītā operētājsistēmā, tajā pašā laikā to var izmantot arī REPL (lasīt, novērtēt, apstrādāt un ielādēt) veidā.
  • Tam ir spēcīgas kešatmiņas un diska noturības iespējas.
  • Spark SQL ļauj prasmīgi apstrādāt SQL vaicājumus
  • Apache Spark var izvietot, izmantojot Apache Mesos, HDFS dziju, HBase, Cassandra vai Spark Cluster Manager (paša Spark klastera pārvaldnieku).
  • Spark simulē Scala funkcionālo stilu un kolekciju API, kas ir liela priekšrocība Scala un Java izstrādātājiem.

Nepieciešamība pēc Apache Spark:

Spark sniedz milzīgus ieguvumus nozarei, ņemot vērā ātrumu, dažādos uzdevumus, ko tā var veikt, elastību, kvalitatīvu datu analīzi, rentabilitāti utt. Tas piegādā augstas klases reāllaika lielo datu analīzes risinājumus IT nozarei, apmierinot augošo klientu pieprasījumu. Reāllaika analīze palielina biznesa iespējas. Tā savietojamība ar Hadoop ļauj uzņēmumiem to ātri pieņemt. Ir ļoti vajadzīgi pēc Spark apguvušiem ekspertiem un izstrādātājiem, jo ​​tā ir salīdzinoši jauna tehnoloģija, kas arvien vairāk tiek izmantota.