Relief Algorithm-Wikipedia

before-content-x4

救済アルゴリズム 、属性重み付けのためのアルゴリズムのファミリーは、機械学習の監視されている学習方法の1つです。
まず第一に、リリーフアルゴリズムは将来の意思決定プロセスを指すのではなく、どの属性が決定に最も大きいまたはわずかな影響を与えたかという問題をその後に調べるためのツールです。これは、意思決定が任意に落ちない場合に特に役立ちますが、技術的なコンテキストでは、物理的、化学的、またはその他のサイズが特定のテスト結果につながります。属性の重み付けからリリーフアルゴリズムの1つを使用すると、既に実行されている意思決定プロセス(たとえば、試してみる)から同様のプロセス(他の属性値)に結論を導き出すことができます。
彼らのアプリケーションのために、2つの間の距離の定義は最初です 実例 必要な、それは間の違いからです 属性 インスタンスごとに。
すべての可能なインスタンス全体もあります インスタンスルーム 専用。これは私です。 A.数学的な意味でのベクトルルームはありません。通常、ベクトルADD -ONは有意義に定義できないため、数の乗算もありません。ただし、距離(上記参照)が2つのインスタンスで定義されているため、メトリック空間が非常によくあります。
2つのインスタンスの属性値の違いは 名目 値、すなわち(元々)この属性の一致のインスタンスの場合、つまり(元々)は、インスタンス間の距離として1番目として定義する場合、通常、いわゆるマンハッタン距離、つまりすべての微分量の合計を使用する必要があります。

after-content-x4

最初から理論的な「スケルトン」に「肉」を追加するために、次の用語を説明するために(名目上)属性を持つ簡単な例が追加されます。

| 属性: | Outlook |温度 |空気湿度 |風が強い | クラス: 支払い|プレイ
| 可能値: |サニー |クール |通常 |いいえ | kl.wert: |そして
| |変更可能 |軽度 |高 |そして | |いいえ
| |雨 |ホット

ここには4つの属性があり、2つの属性と他の2つの値が取得できます。この例では、インスタンスは特定の気象状況であり、3*3*2*2 = 36の異なる気象条件が理論的に可能です。

決定 – 製造プロセスは2つのオプションを提供します。ターゲットサイズは、天候で外でプレイできるかどうかの決定です。これにより、2つのクラスの例(インスタンス)が発生します。各インスタンスは、クラスで「再生」または「プレイしない」です。
この場合、2つのインスタンス間の可能な限り最大の距離は、極端な場合の4です。外で遊ぶ私のように天気を選択する場合、Hは同じような天気でなければなりません。ここでは、私からもそう遠くないが、もはや遊んでいない天気もあります。

リリーフアルゴリズムは、各属性の重みを変更しますaは、近隣当局の違いがどれだけ大きくなるかに応じて、aで同じクラスと異なるクラスの両方です。最後に、サイズの緩和が授与した重みのインスタンスのSO -CALLEDクラスの値、意思決定プロセスの結果の影響を見ることができます。
最も単純なアルゴリズムであるリリーフの場合、これは2つのクラスでのみ機能します。つまり、ターゲットサイズは2つの値を取ることができ、データは完了する必要があります。まず、救済は私が私自身のインスタンスであり、次の隣人を決定します。 最も近いヒット 、「次のヒット」と呼ばれ、h)と他のクラスの1つと呼ばれます( 最も近いミス 、したがって、m)と呼ばれる「次の間違い」。 IがHまたはMと一致するすべての属性の重み いいえ 構成されているのは、私がHまたは一致するMとは異なるものの重みが減少することです。属性が数値である場合、それは依存します 卒業生 この変更は、属性値の差から変化します。

救済の適用性の前提条件は、正確に2つのクラスが定義され、データがないことです。さらに、ノイズの多いデータは、アルゴリズムの意味にも影響を与える可能性があります。この場合、救済を拡大する必要があります。このような拡張機能は、一般にAからFへの大文字によって識別されます。

安心 救済と同じ前提条件ですが、選択したインスタンスの次の隣人と他のクラスのそれぞれを検索するだけでなく、それぞれを検索します。 Kはカスタムパラメーターです。

Reliefb Reliefc 2つの属性値間の(標準化された)差の定義を変更します。したがって、個々の属性の価値がないインスタンスを含めることもできます。ここで、2つのインスタンスの違いは、属性Aとして1-1/(Aの値の数)で定義されます。

after-content-x4

関連する 差異関数がもう少し複雑であるが「よりインテリジェント」である別の変更です。条件付き確率は、これにおいて主要な役割を果たします。これは、個々のクラス内の属性値の相対頻度に応じて評価されます。

結局のところ、クラスの値は、2つ以上のu。u.数値値を引き受けることができます。私たちの天気の例では、たとえば、外でプレイしたいかどうかについての決定に加えて、プレイ期間の可能性も可能にする可能性があります。この場合、アルゴリズムは、ランダムな原則に従って他のクラスのいずれかから次の隣人を選択できます(したがって、 安心して )そしていつものように、または彼は他の各クラスから選ばれた権威のために彼自身のK近くの隣人を探しています(それはそれがやり方です 安心 )。

  • M. Robnik-Sikonja、I。Kononenko:RelieffとRrelieffの理論的および経験的分析。機械学習、53(1-2):23.69、2003
  • イアン・H・ウィッテン、E。フランク:データマイニング、機械学習のための実用的なツールとテクニック、カール・ハンサー・ヴェルラグ・ミュンヘン・ウィーン、2001年
  • Qi Zhong:リリーフを使用してマウス遺伝子データ、機械学習、2004年冬の機能を選択します
after-content-x4