Modelēšanas paņēmieni biznesa analīzē ar R.



Emuārs sniedz īsu iepazīšanos ar modelēšanas paņēmieniem biznesa analīzē kopā ar R.

Dažādas modelēšanas metodes:

Jebkuru problēmu mēs varam sadalīt mazākos procesos:





Klasifikācija - ir vieta, kur mēs klasificējam datus. Piem., slimības visām slimībām piemīt noteikta uzvedība, un mēs varam tās tālāk klasificēt.

Piemēram: slimības, kas samazina imunitāti, slimības, kas izraisa galvassāpes utt.



Regresija - ietver attiecību noteikšanu starp vairākiem mainīgajiem.

Piemēram: kā cilvēka svars ir saistīts ar viņa augumu.

AnomolijsAtklāšana - būtībā ir svārstības.



Piemēram: Augstsprieguma vai zema sprieguma gadījumā.

Cits piemērs varētu būt regulēta uzvedība, kas ietver braukšanu labajā vai kreisajā pusē atkarībā no valsts. Anomolijs šeit ir kāds, kurš brauc no pretējās puses.

Cits piemērs varētu būt tīkla ielaušanās. Šeit autentificēts lietotājs piesakās jūsu uzņēmuma vietnē, un tad, ja kāds neautentificēts piesakās, tas irAn0moly.

Atribūtu nozīme - Tas būtībā dod vairākus atribūtus, piemēram, augumu, svaru, temperatūru, sirdsdarbību. Jāatzīmē, ka visi šie atribūti ir svarīgi uzdevumam.

Piemēram: Kāds mēģina paredzēt, kurā laikā cilvēks nonāks birojā. Katram atribūtam ir svarīga loma, taču ne visi atribūti ir svarīgi.

Asociācijas noteikumi - Vienkāršāk sakot, tas ir analizēt vai paredzēt nākamo uzvedību, kur tā griežas ap ieteikumu motoru.

Piemēram: Persona, kas pērk maizi, var nopirkt arī pienu. Ja mēs analizējam iepriekšējo iepirkšanās paradumu, visām groza precēm ir saistība. Šajā gadījumā varētu būt varbūtība, ka cilvēks, kurš pērk maizi, iegādāsies arī pienu.

Kopu veidošana - Tas ir viens no vecākajiem paņēmieniem statistikā. Faktiski vienmēr var modelēt jebkuru problēmu, vai tā būtu klasifikācija vai kopu veidošana, kas nozīmē līdzīgu entītiju grupēšanu.

Piemēram:

1) Paņemiet grozu ar āboliem un apelsīniem, kurā mēs varam atdalīt ābolus no apelsīniem.

2) Svarīgs kopu izmantošanas gadījums ir veselības aprūpe. Gandrīz visa statistika un analīze sākās ar veselības aprūpes lietošanu. Lai iedziļinātos, ir klasteru apzīmējums, ko sauc par kohortām (cilvēkiem ar līdzīgām slimībām), lai tos varētu pētīt atsevišķi no esošajiem klientiem. Piemēram, ja 10 cilvēki cieš no drudža un vēl 10 cilvēki no galvassāpēm, mēs atradīsim to, kas starp viņiem ir kopīgs, un radīsim zāles.

Funkcijas izvilkšana - Funkciju iegūšanas precizitāte, derīgums un kļūme ir diezgan būtiska. Citiem vārdiem sakot, funkciju izdalīšanu var saukt par modeļa atpazīšanu.

Piemēram:

Google meklēšanā, kad lietotājs ievada vārdu, tas nāk ar rezultātiem. Tagad ir jāuzdod svarīgs jautājums - kā tā zināja, kura lapa ir atbilstoša un neatbilstoša šim terminam? Uz to var atbildēt, izmantojot funkciju izdalīšanu un rakstu atpazīšanu, kur tas papildina ievērojamas funkcijas. Pieņemsim, ka tiek dots fotoattēls, noteiktas kameras nosaka sejas, izceļ seju, lai iegūtu skaistus attēlus, kas arī izmanto funkciju atpazīšanu.

Uzraudzīta mācīšanās pret bez uzraudzības

uz) Prognozēšanas kategorija - Metodes ietver regresiju, loģistiku, neironu tīklus un lēmumu kokus. Daži piemēri ietver krāpšanas atklāšanu (kur dators mācās un paredz nākamo krāpšanu no iepriekšējās krāpšanas vēstures). Mācībās bez uzraudzības nevar paredzēt ar piemēriem, jo ​​nav vēsturisku datu.

b) Klasifikācijas kategorija - Ņemot piemēru, neatkarīgi no tā, vai darījums ir krāpniecisks vai nē, tas nonāk klasifikācijas kategorijā. Šeit mēs ņemam vēsturiskos datus un klasificējam tos ar lēmumu kokiem vai, ja mēs vispār neņemam vēsturiskos datus, tad mēs tieši sākam ar datiem un mēģinām patstāvīgi izmantot funkcijas. Piemēram, ja mums ir jāzina darbinieki, kuri, iespējams, pametīs organizāciju vai arī paliks. Gadījumā, ja tā ir jauna organizācija, kur mēs nevaram izmantot vēsturiskos datus, mēs vienmēr varam izmantot kopu datu iegūšanai.

c) Izpētes kategorija - Šī ir tieša metode, kas nāk klajā ar to, ko nozīmē lielie dati. Mācībās bez uzraudzības to sauc par principa komponentiem un kopu veidošanu.

d) Interešu kategorija - šeit ir iesaistīti vairāki elementi, piemēram, savstarpēja pārdošana / pārdošana, tirgus grozu analīze. Grozu analīzē nav uzraudzītas mācīšanās, jo nav vēsturisku datu. Tāpēc mēs tieši ņemam datus un atrodam asociācijas, secību un faktoru analīzi.

Vai mums ir jautājums? Pieminiet tos komentāru sadaļā, un mēs ar jums sazināsimies.

Saistītās ziņas:

java kā izmantot