Izplūdušais K nozīmē klasteru izveidi Mahoutā



Šis emuārs sniedz ievadu Fuzzy K-Means grupēšanai Apache Mahout.

Fuzzy K-Means ir tieši tāds pats algoritms kā K-mean, kas ir populāra vienkārša kopu veidošanas tehnika. Vienīgā atšķirība ir tā, ka tā vietā, lai piešķirtu punktu tikai vienai kopai, tam var būt kaut kāda neskaidrība vai divu vai vairāku kopu pārklāšanās. Tālāk ir sniegti galvenie punkti, aprakstot izplūdušos K-līdzekļus:





kā izmantot kārtot c ++
  • Atšķirībā no K-Means, kas meklē cietu kopu, kur katrs punkts pieder vienai kopai, Fuzzy K-Means meklē mīkstākas kopas, lai tās pārklājas.
  • Viens punkts mīkstajā klasterī var piederēt vairāk nekā vienai kopai ar noteiktu afinitātes vērtību pret katru no punktiem.
  • Afinitāte ir proporcionāla šī punkta attālumam no centrālās kopas.
  • Līdzīgi kā K-Means, Fuzzy K-Means darbojas ar objektiem, kuriem ir noteikts attāluma mērs un kurus var attēlot n- dimensiju vektoru telpa.

Fuzzy K-Means Map Samaziniet plūsmu

Nav daudz atšķirību starp MapReduce K-Means plūsmu un Fuzzy K-Means. Abu īstenošana Mahoutā ir līdzīga.

Tālāk ir būtiskie parametri Fuzzy K-Means ieviešanai:



  • Ievadei nepieciešama vektora datu kopa.
  • Lai iesētu sākotnējās k kopas, jābūt RandomSeedGenerator.
  • Attāluma mērīšanai ir nepieciešams SquaredEuclideanDistanceMeasure.
  • Liela konverģences sliekšņa vērtība, piemēram, –cd 1.0, ja ir izmantota attāluma mēra vērtība kvadrātā
  • MaxIterations vērtība noklusējuma vērtība ir -x 10.
  • Normalizācijas koeficients vai izplūduma koeficients, kura vērtība pārsniedz -m 1,0

Vai mums ir jautājums? Pieminiet tos komentāru sadaļā, un mēs ar jums sazināsimies.

Saistītās ziņas

kā sastādīt java programmas



Uzraudzīta mācīšanās Apache Mahout