Fuzzy-C-Means-Algorithmus – Wikipedia

before-content-x4

コンピューターサイエンスではそれがあります Fuzzy-C-Means-Algorithmus 、 また Cぼやけの平均値のアルゴリズム 、K-meansクラスタリングアルゴリズムの拡張である克服できないクラスタリングアルゴリズム。 Bezdek(1981)によって一般化された形式で提示されました。 [初め]

after-content-x4

C-Meansクラスタリングでは、クラスターの数

c {displaystyle c}

最初に決定されました(クラスターの数をクラスタリングするK-meansでは含まれています

k {displaystyle k}

ではなく

c {displaystyle c}

専用)。最初のステップでは、クラスターセンターはランダムになります

{displaystyle v_ {i}}

(グラフィックの下の円)。 2番目のステップでは、各オブジェクト(グラフィックの下の長方形)が次のクラスターセンターに割り当てられます。その後、各オブジェクトとその割り当てられたクラスター中心の間の(四角)距離が計算され、すべての観測(

j k m そうです a n s {displaystyle j_ {kmeans}}

)。目標は次のとおりです

j k m そうです a n s {displaystyle j_ {kmeans}}

できるだけ小さくするために、i。 H.クラスターセンターの位置を見つけて、すべてのオブジェクトとそれに関連するクラスターセンターの間の距離が小さいようになります。 3番目のステップでは、クラスターに属するオブジェクトからのクラスターセンターが再計算されます。 4番目のステップでは、各オブジェクトに次のクラスターセンターが再び割り当てられます。この手順は、安定した溶液が見つかるまで繰り返されます。次のグラフィックが示すように、オブジェクトは反復プロセスの過程で異なるクラスターに割り当てることができます。グラフィックをステップ2とステップ4と比較します。

after-content-x4

k-meansクラスタリングの欠点は、すべてのステップの各オブジェクトが 明らかに クラスターセンターに割り当てられます。その結果、最終的なソリューションは、最初のクラスターセンターの位置の選択に大きく依存できます。もちろん、最初のクラスターセンターの位置とは無関係に、可能な限り明確なソリューションに興味があります。

したがって、Fuzzy-C-Meansアルゴリズムでは、各オブジェクトはクラスターセンターに明確に割り当てられていませんが、各オブジェクトは文の重みです。

初め c )) {displaystyle(u_ {1i}、ldots、u_ {ci})}

特定のクラスターへの属性がどれほど強いかを示す割り当て。たとえば、ウェイトはステップ2の赤いオブジェクトのものである可能性があります

これらのウェイトは、加重距離も取得するためにも使用されます アレン クラスターセンターを計算します。最終的に、特定のクラスターセンターに近いオブジェクトは、このクラスターに大きな重みを持ちます。ステップ4の青色クラスター中心近くの青いオブジェクトは、例えばB.重み

= 0 90 {displaystyle u_ {text {blau}} = 0 {、} 90}

= 0 05 {displaystyle u_ {text {green} = 0 {、} 05}

腐敗 = 0 05 {displaystyle u_ {text {rot}} = 0 {、} 05}

もつ。緑のクラスターの境界近くの2つの青いオブジェクトは、zをzすることができます。 B.重み

= 0 5 {displaystyle u_ {text {blau}} = 0 {、} 5}

= 0 45 {displaystyle u_ {text {green} = 0 {、} 45}

腐敗 = 0 05 {displaystyle u_ {text {rot}} = 0 {、} 05}

もつ。

ウェイト

初め c )) {displaystyle(u_ {1i}、ldots、u_ {ci})}

いわゆるファジー番号は各オブジェクトを表します。重みは、各オブジェクトに1つに追加する必要はありません(このセクションでよりよく理解するために作られたように)。名前はまた、K-Meansクラスタリングの派生からのものです ファジー-c-means。

用語 ファジー オブジェクトを1つ以上のクラスターに割り当てることを可能にするクラスター分析の方法について説明します。これは、ある程度の帰属( メンバーシップの学位 ))

k {displaystyle u_ {i}}

オブジェクト

バツ k k = 初め n )) {displaystyle x_ {k}(k = 1、dots、n)}

すべてのクラスターに対して

= 初め c )) {displaystyle i(i = 1、dots、c)}

使用されている。毎日

k {displaystyle u_ {i}}

間隔[0、1]にあります。大きな方

k {displaystyle u_ {i}}

、より強いほど

バツ k {displaystyle x_ {k}}

{displaystyle i}

Fuzzy-C-Meansアルゴリズムのターゲット関数は次のとおりです。

与えます

d k 2 = バツ k )) t バツ k )) {displaystyle d_ {ik}^{2} =(x_ {k} -v_ {i})^{t}(x_ {k} -v_ {i})}

正方形(真正性)ポイント間の距離

バツ k {displaystyle x_ {k}}

クラスターセンター(プロトタイプ)

{displaystyle v_ {i}}

マトリックスVから。パーティションマトリックスuには、メンバーシップの学位が与えられます

k {displaystyle u_ {i}}

また。 Cはクラスターの数であり、nデータレコードのサイズです。 「Fuzzi」m(> 1)は、オブジェクトがクラスターにどの程度鋭く割り当てられるかを決定します。 mを無限に走らせると、彼らは近づきます

k {displaystyle u_ {i}}

1C{displaystyle {tfrac {1} {c}}}

と。 H.ポイントの所属は、すべてのクラスターで同じです。 1に近い場合、クラスタリングはシャープです。 H.所属は0または1でより近いです。実際には、1〜2.5の値が適切であることが判明しました(Stutz(1999)を参照)。その価値

k {displaystyle u_ {i}}

{displaystyle v_ {i}}

ターゲット関数を最小化することで決定されます。したがって、オブジェクトは、四角距離の合計と同じようにクラスターに割り当てられます

d k 2 {displaystyle d_ {i}^{2}}

最小限になります。最適化は、追加の条件下で行われます。

  1. 各ポイントについて、すべてのクラスターの所属の合計は1、iです。 H.すべてのために
  2. クラスターは空ではありません。 H.すべてのために
after-content-x4