Kādi ir mašīnmācīšanās priekšnoteikumi?



Šis emuārs par mašīnmācīšanās priekšnoteikumiem palīdzēs izprast pamatjēdzienus, kas jums jāzina, pirms sākat strādāt ar mašīnmācīšanos.

Mašīnmācība neapšaubāmi ir vispieprasītākā laikmeta tehnoloģija! Ja esat iesācējs un sākat izmantot mašīnmācīšanos, ir svarīgi zināt mašīnmācīšanās priekšnoteikumus. Šis emuārs palīdzēs jums saprast dažādos jēdzienus, kas jums jāzina, pirms sākat strādāt ar mašīnmācīšanos.

Lai iegūtu padziļinātas zināšanas par mākslīgo intelektu un mašīnmācīšanos, varat reģistrēties tiešraidē autors Edureka ar diennakts atbalstu un piekļuvi mūža garumā.





Šeit ir tēmu saraksts apskatīts šajā emuārā:

  1. Mašīnmācīšanās priekšnoteikumi
  2. Mašīnmācīšanās izpratne ar lietošanas gadījumu

Mašīnmācīšanās priekšnoteikumi

Lai sāktu arMašīnmācīšanās jums jāpārzina šādi jēdzieni:



  1. Statistika
  2. Lineārā algebra
  3. Rēķins
  4. Varbūtība
  5. Programmēšanas valodas

Statistika

Statistika satur rīkus, kurus var izmantot, lai iegūtu kādu rezultātu no datiem. Ir aprakstoša statistika, ko izmanto, lai pārveidotu neapstrādātus datus svarīgā informācijā. Arī secinošu statistiku var izmantot, lai iegūtu svarīgu informāciju no datu izlases, nevis izmantotu pilnīgu datu kopu.

Lai uzzinātu vairāk par Statistiku varat apskatīt šādos emuāros:

Lineārā algebra

Lineārie algebras darījumiar vektoriem, matricām un lineārām transformācijām. Tas ir ļoti svarīgi mašīnmācībā, jo to var izmantot, lai pārveidotu un veiktu datu kopas darbības.



Rēķins

Rēķins ir svarīgs matemātikas lauks, un tam ir neatņemama loma daudzos mašīnmācīšanās algoritmos. Datu kopa, kurai ir vairākas funkcijas, irizmanto, lai izveidotu mašīnmācīšanās modeļus, jo iezīmes ir vairākas daudzveidīgas mainīgajām, ir svarīga loma mašīnmācīšanās modeļa izveidē. Integrācija un diferenciācija ir obligāta.

Varbūtība

Varbūtība palīdz prognozēt notikumu iespējamību, tā palīdz mums pamatot situāciju, vai tā var atkārtoties. Mašīnmācībai varbūtība ir a pamats.

Mathematics

Lai uzzinātu vairāk par varbūtību, varat to iziet Emuārs.

Programmēšanas valoda

Lai ieviestu visu mašīnmācīšanās procesu, ir svarīgi zināt tādas programmēšanas valodas kā R un Python. Abi Python un R nodrošina iebūvētas bibliotēkas, kas ļoti atvieglo Machine Learning algoritmu ieviešanu.

Papildus programmēšanas pamatzināšanām ir svarīgi arī zināt, kā iegūt, apstrādāt un analizēt datus. Šī ir viena no vissvarīgākajām prasmēm, kas nepieciešama mašīnmācībai.

Lai uzzinātu vairāk par programmēšanu mašīnmācīšanās valodās varat apskatīt šādus emuārus:

  1. Labākās Python bibliotēkas datu zinātnei un mašīnmācībai

Mašīnmācīšanās lietošanas gadījums

Mašīnmācība ir saistīta ar algoritma izveidi, kas var mācīties no datiem, lai veiktu prognozi, piemēram, kāda veida priekšmeti ir attēlā, vai ieteikumu dzinēju, labāko zāļu kombināciju, lai izārstētu noteiktu slimību vai surogātpasta filtrēšanu.

Mašīnmācība ir balstīta uz matemātiskiem priekšnoteikumiem, un, ja jūs zināt, kāpēc matemātika tiek izmantota mašīnmācībās, tas padarīs to jautru. Jums jāzina matemātika aiz funkcijām, kuras izmantosiet, un kurš modelis ir piemērots datiem un kāpēc.

Tāpēc sāksim ar interesantu māju cenu prognozēšanas problēmu, ņemot vērā datu kopu ar dažādu pazīmju un cenu vēsturi, un tagad mēs apsvērsim dzīvojamās platības kvadrātpēdās un cenas.

Tagad mums ir datu kopa, kurā ir divas kolonnas, kā parādīts zemāk:

Starp šiem diviem mainīgajiem jābūt zināmai korelācijai, lai uzzinātu, ka mums būs jāizveido modelis, kas var prognozēt māju cenu. Kā mēs to varam izdarīt?

Grafiksim šos datus un redzēsim, kā tie izskatās:

Šeit X ass ir cena par kvadrātmetru dzīvojamās platības, un Y ass ir mājas cena. Ja mēs uzzīmēsim visus datu punktus, mēs iegūsim izkliedes diagrammu, ko var attēlot ar līniju, kā parādīts iepriekš redzamajā attēlā, un, ja mēs ievadīsim dažus datus, tas paredzēs kādu rezultātu. Ideālā gadījumā mums jāatrod līnija, kas krustosies ar maksimālajiem datu punktiem.

Šeit mēs cenšamies izveidot līniju, ko sauc par:

Y = mX + c

Šī metode, kā prognozēt lineāro saistību starp mērķi (atkarīgo mainīgo) un prognozējošo mainīgo (neatkarīgo mainīgo), tiek saukta par lineāru regresiju. Tas ļauj mums izpētīt un apkopot divu mainīgo saistību.

  • X = neatkarīgais mainīgais
  • Y = atkarīgais mainīgais
  • c = y-pārtveršana
  • m = līnijas slīpums

Ja ņemam vērā vienādojumu, mums ir vērtības X, kas ir neatkarīgs mainīgais, tāpēc mums tikai jāaprēķina m un c vērtības, lai prognozētu Y vērtību.

Tātad, kā mēs varam atrast šos mainīgos?

Lai atrastu šos mainīgos, mēs varam izmēģināt virkni vērtību un mēģināt uzzināt līniju, kas šķērso maksimālo datu punktu skaitu. Bet kā mēs varam atrast vislabāk piemēroto līniju?

Tātad, lai atrastu vispiemērotāko līniju, mēs varam izmantot vismazāko kvadrātu kļūdas funkciju, kas atradīs kļūdu starp y reālo vērtību un paredzamo vērtību y`.

kāda ir atšķirība starp abstrakto klasi un saskarni?

Mazāko kvadrātu kļūdas funkciju var attēlot, izmantojot šādu vienādojumu:

Izmantojot šo funkciju, mēs varam uzzināt kļūdu katram prognozētajam datu punktam, salīdzinot to ar faktisko datu punkta vērtību. Pēc tam jūs ņemat visu šo kļūdu apkopojumu un kvadrātveida tos, lai uzzinātu novirzi prognozē.

Ja savam grafikam pievienosim trešo asi, kurā ir visas iespējamās kļūdas, un uzzīmēsim to trīsdimensiju telpā, tas izskatīsies šādi:

Iepriekš redzamajā attēlā ideālās vērtības būtu apakšējā melnajā daļā, kas paredzēs cenas tuvu faktiskajam datu punktam. Nākamais solis ir atrast labākās iespējamās m un c vērtības. To var izdarīt, izmantojot optimizācijas tehniku, ko sauc par gradienta nolaišanos.

Gradienta nolaišanās ir iteratīva metode, kur mēs sākam ar dažu vērtību kopas inicializēšanu mūsu mainīgajiem un lēnām tos uzlabojam, līdz minimumam samazinot kļūdu starp faktisko vērtību un paredzamo vērtību.

Ja mēs domājam, ka praktiski dzīvokļa cenas patiesībā nav atkarīgas tikai no cenas par kvadrātpēdām, ir daudz faktoru, piemēram, guļamistabu, vannas istabu skaits utt. Ja ņemam vērā arī šīs funkcijas, vienādojums izskatīsies kaut kas kā šis

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Šī ir daudzlīniju regresija, tā pieder lineārajai algebrai, šeit mēs varam izmantot matricas ar izmēru mxn, kur m ir pazīmes un n ir datu punkti.

Apsvērsim vēl vienu situāciju, kurā mēs varam izmantot varbūtību, lai atrastu mājas stāvokli, lai klasificētu māju pēc tā, vai tā ir labā vai sliktā stāvoklī. Lai to paveiktu, mums būs jāizmanto tehnika, ko sauc par loģistisko regresiju, kas darbojas ar sigmoīdās funkcijas parādīšanās varbūtību.

Šajā rakstā mēs aplūkojām mašīnmācīšanās priekšnoteikumus un to piemērošanu mašīnmācībās. Tātad būtībā tas sastāv no statistikas, aprēķina, lineārās algebras un varbūtības teorijas. Rēķinam ir optimizēšanai izmantotas metodes, lineārajai algebrai ir algoritmi, kas var darboties ar milzīgām datu kopām, ar varbūtību mēs varam paredzēt notikumu iespējamību, un statistika palīdz mums secināt noderīgas atziņas no datu kopu izlases.

Tagad, kad jūs zināt mašīnmācīšanās priekšnoteikumus, esmu pārliecināts, ka vēlaties uzzināt vairāk. Šeit ir daži emuāri, kas palīdzēs jums sākt darbu ar Data Science:

Ja vēlaties iestāties pilnīgā mākslīgā intelekta un mašīnmācīšanās kursā, Edureka piedāvā īpaši kuratoru kas ļaus jums pārzināt tādas metodes kā uzraudzīta mācīšanās, bez uzraudzības un dabiskās valodas apstrāde. Tas ietver apmācību par jaunākajiem sasniegumiem un tehniskajām pieejām mākslīgā intelekta un mašīnmācīšanās jomā, piemēram, padziļināta mācīšanās, grafiskie modeļi un mācīšanās pastiprināšana.