ドミナル戦略 – ウィキペディア、無料百科事典
ゲーム理論では、 戦略 これらは、各プレイヤーが選択できるさまざまな代替案または決定です。
プレイヤーのために、 戦略が厳密に支配的です 別のはい、他のプレイヤーがすることをしてください。問題のプレイヤーは、2番目の決定よりも1つ目のプレイヤーでより大きなユーティリティを受け取ります。合理的なプレーヤーは、最適ではないため、厳密に支配された戦略をプレイすることはありません。
多くの単純なゲームは、支配的な戦略を通じて解決できます。他のプレイヤーのプレイに応じて、プレーヤーの戦略が他の人よりも優れている、または悪いゲームであるゲームでは、逆のことが起こります。
用語 [ 編集します ]
プレーヤーが複数のオプションの間で最適な戦略を選択しようとすると、2つの戦略AとBを比較して、どれが優れているかを確認できます。考慮されるゲームに応じて、次の結果が発生する可能性があります。
- AはBを支配します。ここでは、2つの可能性を区別できます。
- Aの選択が、他のプレーヤー(n)が何をするかに関係なく、Bを選択するよりも常により良い結果をもたらす場合、AはBを厳密に支配します。
- AがBよりも厳密に優れている相手のアクションのセットが少なくとも一連のアクションがあり、残りのAとBが同じユーティリティを与える場合、BはBを弱く支配します(つまり、プレーヤーはAとBの間に無関心です)。要するに、選択肢Aは、相手をプレイする方法を正確に選択する方法に応じて、場合によってはBよりも優れており、他の場合はBよりも優れています。
- AはBによって支配されており、2つの可能性があります。
- Aの選択が他のプレーヤー(n)に関係なく、Aの選択が常にBの選択よりも悪い結果をもたらす場合、AはBによって厳密に支配されます。
- Aは、より悪い結果をもたらす相手の選択セットが少なくとも1つある場合、Bによって弱く支配されますが、残りは無関心です
次の支払いマトリックスの例では、F1戦略はF2によって厳密に支配されています。これは18歳未満で、0は3未満であるためです。
c 初め | c 2 | |
---|---|---|
f 初め | 15.15 | 0.18 |
f 2 | 18.0 | 3.3 |
支配的または支配的な戦略がないゲームがあることに注意してください、この例は性別の戦いです
男女の戦い | プラヤ | 山 |
---|---|---|
プラヤ | 10.20 | 0.0 |
山 | 0.0 | 20.10 |
数学的定義 [ 編集します ]
どんなプレイヤーでも
、戦略
弱く支配します 別の戦略に
と
- (少なくとも1つを仮定します 厳格な不平等
厳密に支配します a
と
- プレイヤー戦略のセットを示します と 他のプレイヤーのすべての戦略を表します
厳密に支配された戦略の繰り返し除去 [ 編集します ]
厳密に支配された戦略の反復排除は、すべてのプレーヤーが合理的であり、プレイヤーの合理性は一般的な知識であるという仮定の下で有効なプロセスです。つまり、各プレイヤーは(a)残りのプレイヤーが合理的であること、(b)他のプレイヤーが自分が合理的であることを知っていることなどを知っていることを知っています。
厳密に支配された戦略の繰り返し排除は、ゲームを解決するための一般的なテクニックです。支配的なすべての戦略を排除することで構成されています。支払いマトリックスから始めて、最初のステップでは、合理的なプレーヤーがその戦略をプレイしないため、支配的な戦略が排除されます。これは、新しい小さなゲームに変換されます。最初のステップで支配されていなかったいくつかの戦略は、この新しい小さなゲームで支配することができます。この最初のステップは、プロセスが停止するまで、より小さなゲームを連続的に作成します。これは、厳密に支配的な戦略または支配的な戦略を見つけることができない場合に発生します。
厳密に支配された戦略を排除すると、各プレーヤーに単一の戦略が生じる場合があります。その戦略のセットは、ナッシュバランスと呼ばれるものと一致します
例 [ 編集します ]
イニシャル c 初め c 2 c 3 f 初め 7.0 7.14 0.7 f 2 0.21 0.7 14.0 最初の支払いマトリックスでは、戦略Cが削除されます 3 、それはcによって支配されているためです 2
( 説明 :プレーヤーの行がfを再生する場合、列プレーヤーは7と比較して14の支払いを好みます 初め プレーヤーの行がfを再生する場合、0の前に7 2 ))2番目のステップ c 初め c 2 f 初め 7.0 7.14 f 2 0.21 0.7 除去されるとc 3 、fを排除する場合 2 それはfによって支配されているので 初め
( 説明 :プレーヤーの列、そのcを知っています 3 プレイされず、7人の支払いは、プレーヤー列がcを再生する場合に0の支払いを好むでしょう 初め o c 2 ))最後に、この削減された支払いマトリックスの前で、列プレーヤーはcを再生することを選択します 2 )支払いは大きいため(0と比較して14)。この一連の戦略は、ナッシュバランスと一致します(f 初め 、c 2 ))
参照してください [ 編集します ]
参照 [ 編集します ]
書誌 [ 編集します ]
外部リンク [ 編集します ]
- ↑ クレップ、デビッドM.(1995)。 マイクロ経済理論のコース 。
Recent Comments