Kāpēc jums vajadzētu saplūst, kad jūs jau varat pievienoties Tableau?



Datu sajaukšana tabulā - metode, ko izmanto, ja vairākos datu avotos ir saistīti dati, kurus vēlaties analizēt kopā vienā skatā.

Pasaulē, kas dienā ģenerē un patērē 2,5 kvintiljonus baitus datu, organizācijām ir jāmeklē jaunas metodes datu pārveidošanai un apvienošanai, lai sasniegtu optimālu efektivitāti. Viena no šādām datu apvienošanas metodēm ir Datu apvienošana tablo .

Tā kā tam ir tik svarīgs mērķis jebkuras organizācijas datu ciklā, tas lielākajā daļā padara ļoti būtisku moduli . Šajā emuārā mēs apspriedīsim šādus jēdzienus:





Kāpēc jums ir nepieciešama datu sajaukšana tablo?

Pieņemsim, ka jūs esat a Izstrādātāja tabula kam ir darījumu dati, kas saglabāti Salesforce, un kvotu dati, kas saglabāti programmā Access. Dati, kurus vēlaties apvienot, tiek glabāti dažādās datubāzēs, un katrā tabulā uzņemto datu precizitāte abos datu avotos ir atšķirīga, tāpēc datu sajaukšana ir labākais veids, kā apvienot šos datus.

Datu sajaukšana ir noderīga šādos apstākļos:



  1. Jūs vēlaties apvienot datus no dažādām datu bāzēm, kuras neatbalsta starpdatu bāzes savienojumi.

    Savienojumi starp datu bāzēm neatbalsta savienojumus ar kubiem (piemēram, Oracle Essbase) vai dažiem tikai ekstraktu savienojumiem (piemēram, Google Analytics). Šajā gadījumā iestatiet atsevišķus datu avotus datiem, kurus vēlaties analizēt, un pēc tam izmantojiet datu sajaukšanu, lai apvienotu datu avotus vienā lapā.

  2. Dati ir dažādos detalizācijas līmeņos.

    Dažreiz viena datu kopa uztver datus, izmantojot dažādus detalizācijas līmeņi i., lielāka vai mazāka precizitāte nekā pārējā datu kopa.

    Piemēram, pieņemsim, ka analizējat darījumu datus un kvotu datus. Darījumu dati var aptvert visus darījumus. Tomēr kvotu dati var apkopot darījumus ceturkšņa līmenī. Tā kā darījumu vērtības katrā datu kopā tiek uztvertas dažādos detalizācijas līmeņos, datu apvienošanai jāizmanto datu sajaukšana.



Kas ir datu sajaukšana tablo?

Datu sajaukšana ir ļoti efektīva iezīme Valde . To izmanto, ja vairākos datu avotos ir saistīti dati, kurus vēlaties analizēt kopā vienā skatā. Tā ir metode datu apvienošanai, kas papildina viena datu avota datu tabulu ar cita datu avota datu kolonnām.

Parasti šāda veida datu apvienošanai izmantojat savienojumus, taču ir gadījumi, kad labāk ir izmantot datu sajaukšanu atkarībā no faktoriem, piemēram, datu veida un detalizācijas.

kas ir sesija java

Kā tas atšķiras no pievienošanās datiem?

Datu sajaukšana simulē tradicionālo kreiso savienojumu. Galvenā atšķirība starp abiem ir kad savienojums tiek veikts attiecībā uz agregāciju.

Kreisais savienojums

Kad datu apvienošanai izmantojat kreiso savienojumu, vaicājums tiek nosūtīts uz datu bāzi, kurā tiek veikta savienošana. Izmantojot kreiso savienojumu, tiek atgrieztas visas rindas no kreisās tabulas un visas labās tabulas rindas, kurām kreisajā tabulā ir atbilstoša rindu atbilstība. Pēc tam pievienošanās rezultātus nosūta atpakaļ un apkopo Tableau.

Piemēram, pieņemsim, ka jums ir šādas tabulas. Ja kopējās kolonnas ir Lietotāja ID , kreisajā savienojumā tiek ņemti visi dati no kreisās tabulas, kā arī visi dati no labās tabulas, jo katrā rindā kreisajā tabulā ir atbilstoša rindu atbilstība.

Datu apvienošana - datu sajaukšana Tableau - EdurekaDatu sajaukšana

Ja datu apvienošanai izmantojat datu sajaukšanu, datu bāzē tiek nosūtīts vaicājums katram datu avotam, kas tiek izmantots lapā. Vaicājumu rezultātus, ieskaitot apkopotos datus, Tableau nosūta atpakaļ un apvieno. Skats izmanto visas rindas no primārā datu avota, kreisās tabulas un apkopotās rindas no sekundārā datu avota, labās tabulas, pamatojoties uz saistošo lauku izmēriem.

Varat mainīt saistīšanas lauku vai pievienot vairāk saistīšanas lauku, lai maisījumā iekļautu dažādas vai papildu datu rindas no sekundārā datu avota, mainot apkopotās vērtības.

Piemēram, pieņemsim, ka jums ir šādas tabulas. Ja saistošie lauki ir Lietotāja ID abās tabulās, sajaucot datus, tiek ņemti visi dati no kreisās tabulas, un kreisā tabula tiek papildināta ar labās tabulas datiem. Šajā gadījumā ne visas vērtības var būt daļa no iegūtās tabulas šādu iemeslu dēļ:

  • Kreisās tabulas rindai labajā tabulā nav atbilstošas ​​rindas atbilstības, kā norāda nulles vērtība.
  • Labās tabulas rindās ir vairākas atbilstošas ​​vērtības, kā norāda zvaigznīte (*).

Pieņemsim, ka jums ir tādas pašas tabulas kā iepriekš, bet sekundārajā datu avotā ir jauns lauks ar nosaukumu Mērķi . Atkal, ja saistīšanas lauks ir Lietotāja ID , sajaucot datus, visi dati tiek ņemti no kreisās tabulas un tiek papildināti ar labās tabulas datiem. Šajā gadījumā jūs redzat to pašu nulles vērtību un zvaigznītes iepriekšējā piemērā papildus šim:

  • Tāpēc ka Mērķi lauks ir mērs, redzat rindas vērtībasMērķilauks apkopots, pirms labajā tabulā esošie dati tiek apvienoti ar kreisās tabulas datiem.
  • Tāpat kā iepriekšējā piemērā, kreisās tabulas rindā nav attiecīgās rindas Mērķi lauks, kā norādīts otrajā nulles vērtībā.

Kad jāaizstāj pievienošanās Sajaukšana

1. Dati ir jātīra.

Ja pēc pievienošanās jūsu tabulas pareizi nesakrīt, izveidojiet katras tabulas datu avotus, veiciet visus nepieciešamos pielāgojumus (tas ir, pārdēvējiet kolonnas, mainiet kolonnu datu tipus, izveidojiet grupas, izmantojiet aprēķinus utt.) Un pēc tam izmantojiet datu sajaukšanu, lai datus apvienotu.

2. Pievienošanās rada datu dublikātus.

Datu dublikāti pēc pievienošanās ir dažādu detalizācijas pakāpju datu simptoms. Ja pamanāt datu dublikātus, tā vietā, lai izveidotu savienojumu, izmantojiet datu sajaukšanu, lai tā vietā apvienotos kopējā dimensijā.

3. Jums ir daudz datu.

Parasti apvienojumus ieteicams izmantot, lai apvienotu datus no vienas datu bāzes. Pievienošanos apstrādā datu bāze, kas ļauj pievienošanās darbam izmantot dažas no datu bāzes vietējām iespējām. Tomēr, ja strādājat ar lieliem datu kopumiem, pievienošanās var apgrūtināt datu bāzi un būtiski ietekmēt veiktspēju. Šajā gadījumā datu sajaukšana varētu palīdzēt. Tā kā Tableau apstrādā datu apvienošanu pēc datu apkopošanas, ir mazāk datu, kas jāapvieno. Ja ir mazāk apvienojamo datu, parasti veiktspēja uzlabojas.

Datu sajaukšana tablo

Datu sajaukšanu varat izmantot, ja jums ir dati atsevišķos datu avotos, kurus vēlaties analizēt kopā vienā lapā. Tableau ir divi nosaukti iebūvēti datu avoti Paraugs-lielveikals un Kafijas ķēdes paraugs.mdb ko izmantos, lai ilustrētu datu sajaukšanu.

1. darbība: izveidojiet savienojumu ar saviem datiem un iestatiet datu avotus

  • Izveidojiet savienojumu ar datu kopu un datu avota lapā iestatiet datu avotu. An inbuilt datu avots Kafijas ķēdes paraugs.mdb ,kas ir MS Access datu bāzes fails, tiks izmantots, lai ilustrētu datu sajaukšanu.
  • Iet uz Dati > Jauns datu avots, izveidojiet savienojumu ar otro datu kopu.Šajā piemērā tiek izmantots Paraugs - lielveikals datu avots. Tvista iestatīja datu avotu.
  • Lai sāktu veidot skatu, noklikšķiniet uz cilnes lapa.

2. darbība: norādiet primāro datu avotu

  • Velciet vismaz vienu lauku no sava primārā datu avota skatā, lai to apzīmētu kā primāro datu avotu. Iekš Dati rūtī noklikšķiniet uz datu avota, kuru vēlaties apzīmēt kā galveno datu avotu. Šajā piemērā Kafijas ķēdes paraugs ir atlasīts.
  • Šis ekrānuzņēmums parāda dažādās failā pieejamās tabulas un savienojumus.

3. darbība. Norādiet sekundāro datu avotu

  • Lauki, kas tiek izmantoti skatā no datu avotiem, kas nav primārais datu avots vai aktīvās saites, automātiski norāda sekundāros datu avotus kā turpmākos datu avotus. Šajā gadījumā Superstore paraugs.

4. solis: Sajauciet datus

  • Tagad jūs varat integrēt datus no abiem avotiem, pamatojoties uz kopīgu dimensiju ( Valsts , šajā gadījumā). Ņemiet vērā, ka blakus kategorijai - stāvoklis - parādās neliels saites attēls. Tas norāda abu datu avotu kopīgo dimensiju.
  • Pieņemsim, ka jūs izveidojat joslu diagrammu ar Peļņas koeficients Kolonnu plauktā un Valsts Rindu plauktā diagrammā parādīts, kā peļņas koeficients mainās katrā valstī gan lielveikalu, gan kafijas ķēdes veikalos.

Datu sajaukšanas ierobežojumi tablo

  1. Ir daži datu sajaukšanas ierobežojumi ap nesaturošiem agregātiem, piemēram, Vidusmēra , un RAWSQLAGG .
  2. Datu sajaukšana apdraud vaicājuma ātrumu ļoti detalizēti.
  3. Mēģinot kārtot pēc aprēķināta lauka, kurā izmantoti jaukti dati, aprēķinātais lauks netiek parādīts dialoglodziņa Kārtot nolaižamajā sarakstā Laukums.
  4. Cube datu avotus var izmantot tikai kā primāro datu avotu datu apvienošanai Tableau. Tos nevar izmantot kā sekundāros datu avotus.

Es ceru, ka tagad jums visiem ir taisnīga ideja Datu apvienošana tablo no šī emuāra. Izsalcis pēc vairāk zināšanām? Neuztraucieties, šis video ļaus labāk izprast šo koncepciju.