Google Data Science intervijas jautājumi: viss, kas jums jāzina, lai to uzlauztu

Šajā rakstā ir sniegta virkne Google Data Science Interview Questiosn, intervijas process un priekšnoteikumi, lai pieteiktos darbā Google.

Pieņemšana darbā tādā pasaules mēroga uzņēmumā kā Google ir sapņu darbs daudziem cilvēkiem. Viņiem ir daži no talantīgākajiem AI pētnieku zinātniekiem, un pasaulē. Google avotu nav daudz Intervijas jautājumi tiešsaistē, un tur nav viegli nokļūt darbā. Tāpēc šajā rakstā es apskatīšu šādas tēmas:

Darba apraksts un prasības

Ar vidējo algu - 169 067 ASV dolāri , ieskaitot bonusu. Google datu zinātnieka alga svārstās no 120 000 - 280 000 USD . Ar šo lielo algu jums jāzina pareizās prasības attiecībā uz amatu, kuru jūs piesakāties. Lai gan prasības dažādās pozīcijās atšķiras, zemāk ir daži no izplatītākajiem:

Minimālā prasība:



<> operators kvl

google

  • Maģistra grāds kvantitatīvajā disciplīnā (statistika, operāciju izpēte, datorzinātne)
  • 2 gadu darba pieredze datu analīzes jomā
  • Pieredze ar statistikas programmatūru (piem., R , , MATLAB, Pandas) un
  • Pieredze ar datu bāzes valodām (piem., SQL )

Pienākumi:

leļļu vs ansible vs šefpavārs
  • Darbs ar lielām, sarežģītām datu kopām. Atrisiniet sarežģītas, ikdienišķas analīzes problēmas, pēc vajadzības pielietojot uzlabotas analītiskās metodes
  • Veikt analīzi, kas ietver datu vākšanu un prasību noteikšanu, apstrādi, analīzi, notiekošos rezultātus un prezentācijas
  • Veidojiet un analizējiet cauruļvadus iteratīvi, lai sniegtu plašu ieskatu
  • Attīstīt visaptverošas zināšanas par Google datu struktūrām un metriku, iestājoties par izmaiņām, ja tas nepieciešams produktu izstrādei
  • Mijiedarbojieties daudzfunkcionāli, sniedzot biznesa ieteikumus (piemēram, izmaksu un ieguvumu, prognozēšanas, eksperimentu analīzes)
  • Izpētiet un izstrādājiet analīzes, prognozēšanas un optimizācijas metodes, lai uzlabotu Google lietotājiem paredzēto produktu kvalitāti

Google Data Science intervijas process

Izlases saraksta dzēšana pati par sevi ir grūts uzdevums, kas pilnībā atkarīgs no jūsu CV, motivācijas vēstule un Pieredze . Google Datu zinātne Intervijas jautājumi ir smadzeņu teaser un tehnisko vaicājumu sajaukums. Parasti pirmais process ir telefoniskā intervija.

Telefoniskā intervija:

Tas sastāv no jautājumiem, kuru pamatā galvenokārt ir (konkrēti un teorētiski) un lielā mērā balstīti uz . Jautājumi atšķiras arī atkarībā no projektiem, pie kuriem esat strādājis.
  • 1. gadījums: Intervijās tika jautāts par iezīmju iegūšanas paņēmieniem, PCA (izmantots projektos), korelācijas analīzi, dažām izmantotajām klasifikācijas metodēm (SVM, GBM, neironu tīkls). Kāpēc ne loģistiska regresija, kāpēc GBM? - būtībā jautājumi, kas griežas ap klases atdalāmību.
  • 2. gadījums: Kāpēc izmantot funkciju izvēli? Ja divi prediktori ir ļoti korelēti, kāda ir ietekme uz koeficientiem loģistiskajā regresijā? Kādi ir koeficientu ticamības intervāli?
  • 3. gadījums: Disks griežas uz vārpstas, un jūs nezināt, kādā virzienā disks griežas. Jums tiek piegādāts tapu komplekts. Kā jūs izmantosiet tapas, lai aprakstītu, kā disks griežas?
Pēc telefoniskajām intervijām tas notiek klātienē un kodēšanas kārtās. Apspriedīsim dažus no visbiežāk sastopamajiem Google Data Science intervijas jautājumiem. Lai gan šie jautājumi var netikt uzdoti tieši tā, kā norādīts zemāk, esmu mēģinājis aptvert daudzus no tiem.

Google Data Science intervijas jautājumi

Šie jautājumi nav sarežģīti, jo Google tā vietā pārtrauca šo jautājumu uzdošanu, viņiem ir līdzīgi jautājumi, kurus viņi sauc Problēmu risināšanas jautājumi . Tiek uzdoti daudzi mašīnmācīšanās jautājumi, sākot no vispārīgiem līdz praktiskiem. Google būtībā aptver tēmu plašumu, nevis dziļumu. Q1. Jūs atrodaties kazino un jums ir divi kauliņi, ar kuriem spēlēt. Jūs laimējat 10 USD katru reizi, kad iemetat 5. Ja spēlējat līdz uzvarai un pēc tam apstājaties, kāda ir paredzamā izmaksa? Q2. Jūs gatavojaties iekāpt lidmašīnā uz Londonu, vēlaties uzzināt, vai jums jāņem līdzi lietussargs. Jūs saucat trīs savus nejaušos draugus un kā katru no viņiem, ja līst lietus. Varbūtība, ka jūsu draugs runā patiesību, ir 2/3, un varbūtība, ka viņi melojot jums izrāda palaidnību, ir 1/3. Ja visi 3 no viņiem saka, ka līst, tad kāda ir varbūtība, ka Londonā tiešām līst. Q3. Kā pievienotu jaunu Facebook locekļi dalībnieku datu bāzē un kodē viņu attiecības ar citiem datu bāzē? Q4. Kā jūs pārbaudīsit, vai ir lielāka iespējamība, ka lietotājs paliks aktīvs pēc 6 mēnešiem, ņemot vērā, ka lietotājam tagad ir vairāk draugu? Q5. Jums tiek piešķirtas 40 kārtis ar četrām dažādām krāsām - 10 zaļās, 10 sarkanās, 10 zilās un 10 dzeltenās. Katras krāsas kartes ir numurētas no viena līdz desmit. Divas kārtis tiek izvēlētas nejauši. Uzziniet varbūtību, ka izvēlētajām kartēm nav tāda paša numura un krāsas. Q6. Izveidojiet programmu izvēlētajā valodā, lai lasītu teksta failu ar dažādiem tvītiem. Izejai jābūt 2 teksta failiem - vienam, kurā ir visu unikālo vārdu saraksts starp visiem tvītiem, kā arī atkārtoto vārdu skaits, un otrajā failā jābūt vidējam unikālo vārdu skaitam visiem tvītiem. Q7. Ko jūs darīsit, ja trūkstošo vērtību noņemšana no datu kopas izraisa neobjektivitāti? Q8. Disks griežas uz vārpstas, un jūs nezināt, kādā virzienā disks griežas. Jums tiek piegādāts tapu komplekts. Kā jūs izmantosiet tapas, lai aprakstītu, kā disks griežas? Q9. Kā jūs izveidosiet ieteikumu programmu darbam? Q10. Kādu produktu vēlaties izveidot Google? Q11. Automašīnām tiek implantēti ātruma izsekotāji, lai apdrošināšanas sabiedrības varētu izsekot mūsu braukšanas stāvoklim. Pamatojoties uz šo jauno shēmu, uz kādiem biznesa jautājumiem var atbildēt? Q12. Kā jūs varat izlemt, vai viens algoritms ir labāks par otru? Q13. Kastītē ir 12 sarkanās un 12 melnās kartes. Citā kastē ir 24 sarkanās un 24 melnās kartes. Jūs vēlaties nejauši izvilkt divas kārtis no vienas no divām lodziņām, kurā kastē ir lielāka varbūtība iegūt vienas krāsas kartes un kāpēc? Q14. Kāda ir atšķirība starp modeli ar maisiņu un modeli ar pastiprinātu modeli? Q15. Jūs katru mēnesi izveidojat pārskatu par lietotāju satura augšupielādēm un novērojat, ka janvārī mēnesī strauji palielinās augšupielāžu skaits. Augšupielāžu skaits ir palielinājies, īpaši attēlu augšupielādes. Kā jūs domājat, kas to izraisīs, un kā jūs pārbaudīsit šo pēkšņo smaili? Q16. Jums pieder apģērbu uzņēmums un vēlaties uzlabot savu vietu tirgū. Kā jūs to izdarīsit no zemes līmeņa? Q17. Kā jūs izlemsit, kuras divu pārsprieguma cenu algoritmu versijas darbojas labāk jebkurā aviācijas uzņēmumā? Q18. Kāda ir laso brīvības pakāpe? Q19. Kāda ir atšķirība starp iteratoru, ģeneratoru un izpratni par sarakstu Python? Q20. Ņemot vērā vietņu un vietņu izmaiņu kopumu, kā jūs pārbaudīsit jauno vietnes funkciju, lai noteiktu, vai izmaiņas darbojas pozitīvi? Q21. Ņemot vērā MxN dimensijas matricu, kurā katra šūna satur alfabētu, atrodiet, vai tajā ir iekļauta virkne. Q22. Kā jūs izveidosiet kešatmiņas sistēmu, izmantojot uzlabotu datu struktūru, piemēram, hashmap? Q23. Ja jūs varētu iegūt datu kopu par jebkuru interesējošu tēmu neatkarīgi no vākšanas metodēm vai resursiem, kā šī datu kopa izskatītos un kā jūs ar to rīkotos? Q24. Kādas ir anomāliju noteikšanas metodes? Q25. Kā kešatmiņa darbojas un kā jūs to izmantojat datu zinātnē? Tātad, puiši, ar šo mēs esam nonākuši pie šī raksta beigām. Google Data Science Interview jautājumi galvenokārt ir scenārija pamatā un pieprasīt, lai jums būtu Problēmu risināšanas spējas un turklāt jums jāzina, kā šajās situācijās izmantot Data Science. Es ceru, ka tas jums dos iespēju sagatavoties jebkurai datu zinātnes intervijai nākotnē. Vai tas būtu Google, Microsoft, Apple vai Uber. Visi tehnoloģiju giganti uzdod līdzīga veida jautājumus, kad runa ir par datu zinātni, jo tā ir plaša un vienlaikus jauna joma. ļauj jums pārzināt rīkus un sistēmas, kuras izmanto datu zinātnes profesionāļi. Tas ietver apmācību par statistiku, datu zinātni, Python, Apache Spark & ​​Scala, Tensorflow un Tableau. Mācību programma ir noteikta, veicot plašu pētījumu par vairāk nekā 5000 amata aprakstiem visā pasaulē. Ja jums ir kādi jautājumi, nekautrējieties minēt komentāru sadaļā zemāk.