Testheorie(統計) – ウィキペディア

before-content-x4

テスト理論 推定理論に加えて、数学統計の中心的なサブエリアであり、統計テストの構築と検査を扱います。このようなテストは、データなどの質問をしようとしています

  • 新しい薬は、古くてよく整えた準備よりも本当に良いように思えますか?
  • 気候変動は人類ゲンを引き起こしていますか?
  • 新しい場所にある工場の建設は、10年以内に期待されますか?
after-content-x4

答える。一方では、テストのモデリングと構築も役割を果たします。一方、テストが満たすべき品質要件と、そのようなテストがまったく存在するかどうかの問題があります。

以下の説明については、テストの状況では、仮説に対して、または仮説に反して行われる決定の間に非対称性があることに注意してください。前述の薬物検査が発生した場合、新薬の決定は、既存よりも悪いものの、劇的な結果をもたらすでしょう(患者への深刻な損害、補償請求の可能性の高いコスト、新しい導入のコストの失敗、画像の喪失など)。この非対称性はモデリングに反映されています。最初の種類の間違いは可能な限り回避する必要があります。つまり、その確率を制限する必要があります。これにより、次の用語が動機付けられます。

帰無仮説と代替 [ 編集 | ソーステキストを編集します ]

(必ずしもパラメトリックではない)統計モデルがあります

バツ a p t )) t th )) }

。正式化

バツ {displaystyle x}

データを受け入れることができる値、

a {displaystyle {mathcal {a}}}

のサブ量性を説明するσ代数です

after-content-x4
バツ {displaystyle x}

確率が割り当てられます。

p t )) t th {displaystyle(p_ {vartheta})_ {vartheta in theta}}

確率の家族です。インデックス

th {displaystyletheta}

その後、2つの量になります

th 0 {displaystyle theta _ {0}}

th 初め {displaystyle theta _ {1}}

分解。その意味は

テスト理論の中心的な問題は今です:それが嘘をついていると仮定します どれでも 不明な確率分布

p t {displaystyle p_ {vartheta}}

t th {displaystyle vartheta in theta}

以前とデータ

バツ バツ {displaystyleをお願いしますx}

与えられます。どうすれば可能な限り最高の声明を出すことができますか

t th 0 {displaystyle vartheta in theta _ {0}}

または

t th 初め {displaystyle vartheta in theta _ {1}}

は?

帰無仮説の役割と代替の役割は、質問が変化した場合にも逆転できることに注意する必要があります。

統計テスト [ 編集 | ソーステキストを編集します ]

統計テストは、決定される決定をフォーマットします。そうなる 0 =「帰無仮説の受け入れ」 1 =「代替を受け入れる」 設定。 0〜1の値は、代替案を選択する可能性に対応します。数学的には、テストは測定可能な関数です

データが利用可能な場合

バツ {displaystyle x}

決定

ファイ バツ )) {displaystyle phi(x)}

配達します。次に、テストについて話します

th 0 {displaystyle theta _ {0}}

に対して

th 初め {displaystyle theta _ {1}}

。総額

テストのテスト領域の名前であり、代替で使用できるすべてのデータが含まれています。

テストは、非属性テストの場合と呼ばれます

ファイ バツ )) { 0 初め } f u¨r a l l そうです バツ バツ {displaystyle phi(x)in {0,1} quad mathrm {f {ddot {u}} r ;; alle ;;} xin x}

。それ以外の場合、テストはランダム化テストです。非ランダム化テストは常に明確な決定を下します。

エラー1.および2番目のタイプ [ 編集 | ソーステキストを編集します ]

aです

t th {displaystyle vartheta in theta}

与えられると、2つの異なる方法でエラーを作成できます。最初のタイプは決定と呼ばれます

th 初め {displaystyle theta _ {1}}

、 それでも

t th 0 {displaystyle vartheta in theta _ {0}}

は。条件付き確率の表記に頼ります

エラーの可能性1. art。アナログはエラーについて話している2.

th 0 {displaystyle theta _ {0}}

決定するが、

t th 初め {displaystyle vartheta in theta _ {1}}

は。したがって、エラー2型の可能性はあります

証明書機能、レベル、切断 [ 編集 | ソーステキストを編集します ]

現在のテストでは、関数が呼び出されます

テストのテスト関数。説明された

t {displaystyle operatorname {e} _ {vartheta}}

確率測定に関する期待値

p t {displaystyle p_ {vartheta}}

aです

a [ 0 初め ] {displaystyle alpha in [0,1]}

それが与えられた

だから男に電話してください

a {displaystyle alpha}

テストのレベル。も適用されます

呼ばれています

a {displaystyle alpha}

テストの有効レベル。したがって、テストの有効レベルは、エラー1の上位障壁です。

のために

t th 初め {displaystyle vartheta in theta _ {1}}

呼ばれています

g ファイ t )) {displaystyle g_ {phi}(varta)}

ポイントでのテストの分離

t {displaystyle vartheta}

。エラーの2番目のタイプの可能性に対応します いいえ パラメーターを作成します

t {displaystyle vartheta}

存在します。

テストでは、さまざまな最適性を策定できます。これは強度が異なります。最適性の概念が強いほど、最適なテストが存在する前提条件が高くなります。最適性に加えて、多くの場合、少量のテスト内で最適なテストを検索する必要があるために、削減原理(以下を参照)も定式化します。

最高のテストでさえ [ 編集 | ソーステキストを編集します ]

さらに最高のテストはテストであり、その切断は、特定のレベルでの他のすべてのテストの切断よりも常に大きいです。したがって、エラーの可能性は、それ以上のテストよりも最高のテストでも常に小さくなります。

均等に最高のテストの中心的な存在ステートメントは、ネイマンピアソンレマです。 Neyman Pearsonテストはさらに最良のテストであると述べています。この結果は、適切な条件(たとえば単調な密度の商で)でより一般的なテストの問題に拡張できます。

マキシミンテスト [ 編集 | ソーステキストを編集します ]

Maximinテストは、エラーの最悪の場合の確率が、特定のレベルでの他のすべてのテストよりも2番目のタイプが小さいテストです。 Maximinテストの大きな利点は、最良のテストよりもはるかに一般的な要件の下で存在することです。

厳密なテスト [ 編集 | ソーステキストを編集します ]

厳密なテストは、局所的に最適なテスト(またはエンベロープパワー機能)の分離からの切断の最大偏差が、他のすべてのテストよりも特定のレベルまで小さいテストです。 Maximinテストと同様に、厳密なテストはすでに弱い条件下で存在します。

削減原則とは、テストの小さなクラスで最適な要素を検索できる手順を指します。重要な削減の原則は、本物のテストに対する制限です。これらは、テストの分離が常にレベルを上回る特定のレベルでのテストです。したがって、純粋なテストは、純粋にランダムな決定である「ナイーブ」テストよりも常に優れています。同様のテストは、最高の本物のテストさえも見つけるための重要なツールです。これらを使用すると、帰無仮説から代替レベルへの遷移への遷移時の品質関数がレベルの価値を示します。

テスト理論の多くの最適性と還元原則を分類し、決定理論の一部として統計的意思決定問題で比較できます。

テスト理論と同様に、統計決定の問題の基礎は統計モデルです

= バツ a p t )) t th )) {displaystyle {mathcal {e {e}} =(x、{mathcal {a}}、(p_ {vartheta})_ {vartheta in theta})}}}

常にテスト理論において常に決定空間

[ 0 初め ] b [ 0 初め ] )) )) {displaystyle([0,1]、{mathcal {b}}([0,1])}}

は。決定関数は、正確に統計テストであり、ランダム化されたテストは、無作為化決定関数、非ランドストランドーム化された決定 – 作成機能に従って非ランドストランドーム化されたテストに対応します。

損失関数の典型的な選択は、ネイマンピアソン損失関数です。

統計テスト用

ファイ {displaystylephi}

配達します。ここで説明してください

a {displaystyle alpha}

また。

b {displaystyleベータ}

エラー1の確率1.または2型の場合

t {displaystyle vartheta}

存在します。

テストの量をテストの量に制限した場合

a {displaystyle alpha}

上記のリスク関数はそうです

  • ハンス・オットー・ジョージ: 安stic 。確率理論と統計の紹介。第4版。 Walter de Gruyter、ベルリン2009、ISBN 978-3-11-021526-7、doi: 10.1515/9783110215274
  • LudgerRüschendorf: 数学統計 。 Springer Verlag、Berlin Heidelberg 2014、ISBN 978-3-642-41996-6、doi: 10,1007/978-3-642-41997-3
  • Claudia Czado、Thorsten Schmidt: 数学統計 。 Springer-Verlag、Berlin Heidelberg 2011、ISBN 978-3-642-17260-1、doi: 10,1007/978-3-642-17261-8-8
after-content-x4