Python Seaborn apmācība: kas ir Seaborn un kā to izmantot?



Python Seaborn apmācība gar atšķirību starp seaborn un matplotlib. Uzziniet arī par dažādām funkcijām un pielāgojumiem, kas pieejami seaborn.

Python ir neskaitāmi ļoti spēcīgu bibliotēku un ietvaru krātuve. Starp tiem ir Seaborn, kas ir dominējošais datu vizualizācija bibliotēka, piešķirot vēl vienu iemeslu programmētājiem pabeigt darbu . Šajā Python Seaborn apmācībā jūs izmantosiet visus datu vizualizācijas trūkumus, izmantojot Seaborn.

Pirms turpināt, apskatīsim visas šī raksta diskusiju tēmas:





Tātad vispirms sāksim pamatot Python Seaborn nozīmi.

Kāpēc izmantot Python Seaborn?

Kā minēts iepriekš, Python Seaborn bibliotēka tiek izmantota, lai atvieglotu izaicinošo datu vizualizācijas uzdevumu, un tā ir balstīta . Seaborn ļauj izveidot statistikas grafiku, izmantojot šādas funkcijas:



  • API, kuras pamatā ir datu kopas, kas ļauj salīdzināt vairākus mainīgie

  • Atbalsta vairāku sižetu režģus, kas savukārt atvieglo sarežģītu vizualizāciju veidošanu

  • Pieejamas viena un divu mainīgo vizualizācijas, lai salīdzinātu datu apakškopas



    print_r uz virkni
  • Dažādu krāsu palešu pieejamība, lai atklātu dažāda veida modeļus

  • Aplēses un grafiki automātiski

Tātad, ja jūs domājat, kāpēc lietot Seaborn, kad jums jau ir Matplotlib, šeit ir atbilde uz to.

Python Seaborn vs Matplotlib:

'Ja Matplotlibs' cenšas padarīt vieglas lietas vieglas un grūti izdarāmas lietas ', arī Seaborn mēģina padarīt viegli definētu smagu lietu kopumu' - Maikls Vaskoms (Seaborn radītājs).
Patiesībā Matplotlib ir labs, bet Seaborn ir labāks. Būtībā Matbornot novēro divus trūkumus, kurus Seaborn novērš:

  1. Matplotlib var personalizēt, taču ir grūti saprast, kādi iestatījumi ir nepieciešami, lai zemes gabalus padarītu pievilcīgākus. No otras puses, Seaborn nāk ar daudzām pielāgotām tēmām un augsta līmeņa saskarnēm, lai atrisinātu šo problēmu.

  2. Strādājot ar Pandas , Matplotlib nedarbojas labi, kad jārisina DataFrames, savukārt Seaborn funkcijas faktiski darbojas DataFrames.

Kā uzstādīt Seaborn?

Lai instalētu Python Seaborn bibliotēku, varat izmantot šādas komandas, pamatojoties uz izmantoto platformu:

pip instalēt jūras dzimušo

vai

conda instalēt jūras dzimušo

Kad tas ir instalēts, pārliecinieties, vai esat instalējis paketes un bibliotēkas, no kurām atkarīgs jūrasdzimtais.

Python Seaborn Dependencies instalēšana:

Obligātās atkarības no jūras dzimušajiem ir:

Ir arī viena ieteicamā atkarība, kas ir:

  • valsts modeļi

Lai instalētu šīs bibliotēkas, varat izmantot tās pašas komandas, kas iepriekš parādītas Seaborn ar to attiecīgajiem nosaukumiem. Pēc uzstādīšanas tos var viegli importēt. Seaborn ļauj ielādēt jebkuru datu kopu no izmantojot load_dataset () funkciju. Varat arī apskatīt visas pieejamās datu kopas, izmantojot funkciju get_dataset_names () šādi:

PIEMĒRS:

importēt jūrdzimušo kā sns sns.get_dataset_names ()

Tādējādi tiks parādīts visu pieejamo datu kopu saraksts.
Tagad, kad esat izveidojis savu vidi darbam ar jūras dzimušajiem, turpināsim tālāk, lai redzētu, kā izmantot tā iezīmēšanas funkcijas .

Jūras dzimušo zīmēšanas funkcijas

Statistisko attiecību vizualizēšana:

Saistību izpratnes process starp datu kopas mainīgajiem un to, kā šīs attiecības savukārt ir atkarīgas no citiem mainīgajiem, ir pazīstams kā statistikas analīze. Apskatīsim tam nepieciešamās funkcijas:

relplot ():

Šī ir skaitļa līmeņa funkcija, kas statistisko attiecību vizualizēšanai izmanto divas citas asu funkcijas:

  • izkaisītais ()
  • līnijas plāns ()

Šīs funkcijas var norādīt, izmantojot relplot () parametru ‘kind’. Gadījumā, ja šis parametrs ir norādīts, tam ir noklusējuma parametrs scatterplot (). Pirms sākat rakstīt kodu, noteikti importējiet nepieciešamās bibliotēkas šādi:

importēt numpy kā np importa pandas kā pd importēt matplotlib.pyplot kā plt importēt jūrasdzimtu kā sns sns.set (style = 'darkgrid')

Lūdzu, ņemiet vērā, ka stila atribūts ir arī pielāgojams, un tam var būt jebkura vērtība, piemēram, darkgrid, ērces utt., Par ko es vēlāk runāšu sižeta estētikas sadaļā. Apskatīsim nelielu piemēru:

PIEMĒRS:

f = sns.load_dataset ('lidojumi') sns.relplot (x = 'pasažieri', y = 'mēnesis', dati = f)

REZULTĀTS:

Lidojumi1-Python Seaborn apmācība-Edureka

Kā redzat, punkti ir uzzīmēti 2 dimensijās. Tomēr jūs varat pievienot citu kategoriju, izmantojot semantiku “nokrāsa”. Apskatīsim tā paša piemēru:

PIEMĒRS:

f = sns.load_dataset ('lidojumi') sns.relplot (x = 'pasažieri', y = 'mēnesis', nokrāsa = 'gads', dati = f)

Jūs redzēsiet šādu izvadi:

REZULTĀTS:

Tomēr ir daudz vairāk pielāgojumu, kurus varat izmēģināt, piemēram, krāsas, stili, izmērs utt. Ļaujiet man tikai parādīt, kā jūs varat mainīt krāsu šajā piemērā:

PIEMĒRS:

sns.set (style = 'darkgrid') f = sns.load_dataset ('lidojumi') sns.relplot (x = 'pasažieri', y = 'mēnesis', nokrāsa = 'gads', palete = 'ch: r = - .5, l = .75 ', dati = f)

REZULTĀTS:

līnijzīmols ():

Šī funkcija ļaus jums uzzīmēt nepārtrauktu līniju saviem datiem. Šo funkciju varat izmantot, mainot parametru ‘kind’ šādi:

PIEMĒRS:

a = pd.DataFrame ({'Diena': [1,2,3,4,5,6,7], 'Pārtika': [30,80,45,23,51,46,76], 'Apģērbs' : [13,40,34,23,54,67,98], 'Trauki': [12,32,27,56,87,54,34]}, indekss = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'diena', y = 'apģērbs', kind = 'līnija', dati = a) g.fig.autofmt_xdate ()

REZULTĀTS:

Līnijlaukuma noklusējums ir y kā x funkcija. Tomēr, ja vēlaties, to var mainīt. Ir vēl daudz iespēju, kuras varat izmēģināt tālāk.

Tagad apskatīsim, kā noformēt kategoriskos datus.

Plānošana ar kategoriskiem datiem:

Šī pieeja nonāk attēlā, kad mūsu galvenais mainīgais tiek tālāk sadalīts diskrētās grupās (kategoriskās). To var panākt, izmantojot catplot () funkciju.

catplot ():

Šī ir figūras līmeņa funkcija, piemēram, relplot (). To var raksturot ar trim asu līmeņa funkciju ģimenēm, proti:

  1. Izkliedes plāni - tie ietver sloksnes (), spietu ()

    metodes pārslodze pret metodes ignorēšanu
  2. Izplatīšanas grafiki - boxplot (), vijolplot (), boxenplot ()

  3. Paredzētie plāni - proti, pointplot (), barplot (), countplot ()

Tagad parādīsim dažus piemērus, lai to parādītu:

PIEMĒRS:

importēt jūrdzimušo kā sns importēt matplotlib.pyplot kā plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', dati = a)

REZULTĀTS:

Kā redzat, iepriekš minētajā piemērā es neesmu iestatījis parametru ‘kind’. Tāpēc tā ir atgriezusi grafiku kā noklusējuma izkliedes diagrammu. Varat norādīt jebkuru no asu līmeņa funkcijām, lai pēc vajadzības mainītu diagrammu. Ņemsim arī šī piemēru:

PIEMĒRS:

importēt jūrdzimušo kā sns importēt matplotlib.pyplot kā plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'vijole', dati = a)

REZULTĀTS:

Iepriekš redzamajā izvadā ir redzams vijoles plāns padomu datu kopai. Tagad mēģināsim atrast, kā vizualizēt datu kopas izplatību.

Datu kopas izplatīšanas vizualizēšana:

Tas galvenokārt attiecas uz datu kopu izpratni, ņemot vērā to, vai tās ir vienvirziena vai divvērtīgas. Pirms sākat ar to, vienkārši importējiet:

importēt numpy kā np importa pandas kā pd importēt jūrmātes kā sns importēt matplotlib.pyplot kā plt no scipy import stats sns.set (color_codes = True)

Kad tas ir izdarīts, jūs varat turpināt plānot vienvirziena un divvariantu sadalījumus.

Vienveidīgo sadalījumu uzzīmēšana:

Lai tos uzzīmētu, varat izmantot funkciju distplot () šādi:

PIEMĒRS:

a = np.neparasts. normāls (loc = 5, izmērs = 100, mērogs = 2) sns.distplot (a)

REZULTĀTS:

Kā redzat iepriekšējā piemērā, mēs esam uzzīmējuši mainīgā a diagrammu, kuras vērtības ģenerē normālā () funkcija, izmantojot distplot.

Divvirzienu sadalījumu uzzīmēšana:

Tas nonāk attēlā, kad jums ir divi nejauši neatkarīgi mainīgie, kā rezultātā rodas kāds iespējamais notikums. Labākā funkcija šāda veida grafiku uzzīmēšanai ir jointplot (). Uzzīmēsim tagad divvirzienu grafiku, izmantojot jointplot ().

PIEMĒRS:

x = pd.DataFrame ({'Diena': [1,2,3,4,5,6,7], 'Pārtika': [30,80,45,23,51,46,76], 'Apģērbs' : [13,40,34,23,54,67,98], 'Trauki': [12,32,27,56,87,54,34]}, indekss = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Diena': [8,9,10,11,12,13,14], 'Pārtika': [30,80,45,23,51,46, 76], “Apģērbs”: [13,40,34,23,54,67,98], “Trauki”: [12,32,27,56,87,54,34]}, indekss = [8,9 , 10,11,12,13,14]) vidējais, cov = [0, 1], [(1, .5), (.5, 1)] dati = np.random.multivariate_normal (mean, cov, 200 ) ar sns.axes_style ('balts'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

REZULTĀTS:

Tagad, kad esat sapratis dažādas Python Seaborn funkcijas, turpināsim veidot strukturētus vairāku zemes gabalu režģus.

Vairāku zemes gabalu režģi:

Python Seaborn ļauj plānot vairākus režģus blakus. Tie būtībā ir diagrammas vai diagrammas, kas ir uzzīmētas, izmantojot to pašu mērogu un asis, lai veicinātu to salīdzināšanu. Tas savukārt palīdz programmētājam ātri atšķirt parauglaukumus un iegūt lielu informācijas daudzumu.

Apsveriet šo facetgrid () funkcijas piemēru, lai uzzīmētu šos grafikus.

PIEMĒRS:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'suga') b.map (plt.hist, 'sepal_length')

REZULTĀTS:

Iepriekš minētā izeja skaidri parāda pusdienu un vakariņu laikā sniegto padomu salīdzinājumu. Varat arī uzzīmēt, izmantojot PairGrid funkciju, ja jums ir salīdzināmu mainīgo pāri. Apsveriet šādu piemēru.

PIEMĒRS:

sns.set (style = 'ērces') a = sns.load_dataset ('lidojumi') b = sns.PairGrid (a) b.map (plt.scatter)

REZULTĀTS:

Kā redzat, iepriekšminētā produkcija dažādos veidos skaidri salīdzina gadu un pasažieru skaitu.

Seaborn arī ļauj pielāgot estētiku, kas tiek apspriests tālāk.

Sižeta estētika:

Šis Python Seaborn apmācības segments nodarbojas ar mūsu sižetu padarīšanu pievilcīgākiem un apburošākiem.

Python Seaborn attēls-estētika:

Pirmā funkcija, kuru es apspriedīšu, ir iestatīta (). Es jau iepriekš izmantoju šīs funkcijas parametru ‘style’. Šis parametrs galvenokārt attiecas uz jūras dzimušajiem tematiem. Pašlaik ir pieejami pieci no tiem, proti, tumšā režģis, ērces, baltais režģis, baltais un tumšais.

Apsveriet šo piemēru, kas demonstrē balto tēmu.

PIEMĒRS:

iestatiet java klases ceļu Linux
importēt jūras zīdaini kā sns importēt matplotlib.pyplot kā plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', dati = a)

REZULTĀTS:

Iepriekš minētajā izvadē varat pamanīt, ka tēma ir mainīta uz baltu. Jūs varat tos izpētīt tālāk, izmantojot arī citas tēmas. Ja pamanāt iepriekšējā izvadē, visapkārt diagrammai ir asis. Tomēr tas ir arī pielāgojams, izmantojot funkciju despine (). Apskatiet piemēru zemāk.

PIEMĒRS:

importēt jūras zīdaini kā sns importēt matplotlib.pyplot kā plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', dati = a) sns.despine (nobīde = 10, apdare = taisnība)

REZULTĀTS:



Ievērojiet atšķirību starp diviem iepriekšējiem rezultātiem. Tomēr ir daudz vairāk iespēju, kuras varat izpētīt pats.

Python Seaborn krāsu paletes:

Krāsa būtībā ir tā iezīme, kas tuvojas cilvēka acīm ārpus jebkuras citas pazīmes. Seaborn ļauj jums spēlēties ar krāsām, izmantojot dažādas funkcijas, piemēram, color_palette (), hls_palette (), husl_palette () utt. Apskatiet krāsas, kuras pašlaik atrodas seaborn.

PIEMĒRS:

importēt numpy kā np importēt jūrdzimušu kā sns importēt matplotlib.pyplot kā plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

REZULTĀTS:

Iepriekš redzamajā attēlā redzamas krāsas, kas atrodas jūras dzimušajos. Es to esmu izdarījis, izmantojot funkciju palplot (). Lai iegūtu dziļākas variācijas, varat izmantot hls_palette (), husl_palette () utt.

Tas mūs noved pie Python Seaborn apmācības beigām. Es ceru, ka jūs visu esat skaidri sapratis. Pārliecinieties, ka praktizējat pēc iespējas vairāk .

Vai mums ir jautājums? Lūdzu, pieminējiet to šī emuāra “Python Seaborn Tutorial” komentāru sadaļā, un mēs pēc iespējas ātrāk sazināsimies ar jums.

Lai iegūtu padziļinātas zināšanas par Python kopā ar dažādām lietojumprogrammām, varat reģistrēties tiešraidē ar diennakts atbalstu un piekļuvi mūža garumā.