二項分布のプロパティ。 二項分布法則


もちろん、累積分布関数を計算するときは、二項分布とベータ分布の間の前述の関係を使用する必要があります。 n > 10 の場合、この方法は直接合計よりも確実に優れています。

統計に関する古典的な教科書では、二項分布の値を取得するために、極限定理に基づいた公式 (Moivre-Laplace の公式など) を使用することが推奨されることがよくあります。 注意すべきこと 純粋に計算上の観点から特に現在、ほぼすべてのテーブルに強力なコンピューターがある場合、これらの定理の値はゼロに近くなります。 上記の近似の主な欠点は、ほとんどのアプリケーションで一般的な n の値に対して精度が完全に不十分であることです。 同様に不利な点は、何らかの近似の適用可能性に関する明確な推奨事項が存在しないことです (標準テキストには漸近的な定式化のみが示されており、精度の推定値が伴っていないため、ほとんど役に立ちません)。 どちらの式も n に対してのみ有効だと思います。< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

ここでは、分位点を見つける問題については考慮しません。離散分布の場合、それは自明であり、そのような分布が発生する問題では、原則として、関係ありません。 それでも分位数が必要な場合は、p 値 (観測された有意性) を使用して問題を再定式化することをお勧めします。 以下に例を示します。いくつかの列挙アルゴリズムを実装する場合、各ステップで二項確率変数に関する統計的仮説をチェックする必要があります。 古典的なアプローチによれば、各ステップで基準の統計を計算し、その値を臨界セットの境界と比較する必要があります。 ただし、アルゴリズムは列挙型であるため、毎回クリティカル セットの境界を新たに決定する必要があり (結局のところ、サンプル サイズはステップごとに変化します)、非生産的に時間コストが増加します。 最新のアプローチでは、観測された有意性を計算し、それを信頼確率と比較して、分位数の検索を節約することを推奨しています。

したがって、次のコードでは逆関数は計算されません。代わりに関数 rev_binomialDF が与えられ、試行回数 n、成功回数 m、および値 y を考慮して 1 回の試行での成功確率 p が計算されます。これらの m 回の成功が得られる確率。 これは、二項分布とベータ分布の間の前述の関係を使用します。

実際、この関数を使用すると、信頼区間の境界を取得できます。 実際、n 回の二項試行で m 回の成功が得られたとします。 知られているように、m = 0 の場合、信頼水準を持つパラメーター p の両側信頼区間の左限界は 0 であり、 は次の方程式の解になります。 。 同様に、m = n の場合、右境界は 1 であり、for は次の方程式の解になります。 。 これは、左の境界を見つけるには、次の方程式を解く必要があることを意味します。 、そして正しいものを検索するには、方程式 。 これらは関数 binom_leftCI および binom_rightCI で解決され、それぞれ両側信頼区間の上限と下限を返します。

絶対的に信じられないほどの精度が必要ない場合は、十分に大きな n に対して次の近似を使用できることに注意してください [B.L. ファン・デル・ワールデン、数学統計学。 M: イリノイ州、1960 年、Ch. 2秒。 7]: ここで、 g は正規分布の分位数です。 この近似の価値は、正規分布の分位数を計算できる非常に単純な近似があることです (正規分布の計算に関するテキストと、このリファレンスの対応するセクションを参照してください)。 私の実践では (主に n > 100 の場合)、この近似では約 3 ~ 4 桁が得られ、一般にこれで十分です。

次のコードを使用した計算には、ファイル betaDF.h 、 betaDF.cpp (ベータ配布に関するセクションを参照)、および logGamma.h 、 logGamma.cpp (付録 A を参照) が必要です。 関数の使用例もご覧いただけます。

binomialDF.h ファイル

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(2 回の試行、2 回の成功、2 回の p); /* * 独立した観測の「試行」があり、 * それぞれの成功確率が「p」であるとします。 * 成功の数が 0 から「成功」まで (両端を含む) である確率 B(successes|trials,p) を計算します。 */ double rev_binomialDF(2 回の試行、2 回の成功、2 回の y); /* * 少なくとも m 回成功する確率 y が * ベルヌーイ スキームの試行で既知であるとします。 この関数は、1 回の試行で成功する確率 p * を求めます。 * * 計算には次の関係が使用されます * * 1 - p = rev_Beta(trials-successes| successes+1, y)。 */ double binom_leftCI(二重試行、二重成功、二重レベル); /* 独立した観測の "試行" があり、 * 各成功の確率 "p" があり、 * 成功の数は "success" であるとします。 * 両側信頼区間の左限界は * 有意水準レベルを使用して計算されます。 */ double binom_rightCI(double n、double 成功、double level); /* 独立した観測の "試行" があり、 * 各成功の確率 "p" があり、 * 成功の数は "success" であるとします。 * 両側信頼区間の右限界は * 有意水準レベルを使用して計算されます。 */ #endif /* 終了 #ifndef __BINOMIAL_H__ */

binomialDF.cpp ファイル

/************************************************ **** **********/ /* 二項分布 */ /**************************** **** ***************************/ #include #含む #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * 「n」個の独立した観測があり、 * それぞれの成功確率が「p」であるとします。 * 成功回数が 0 と "m" (両端を含む) の間である確率 B(m|n,p) を計算します。 * 0 から m までの二項確率の合計: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * 計算は単純な合計を意味しません - * は中心ベータ分布との次の関係を使用します: * * B(m|n,p) = Beta(1-p|n-m,m+1)。 * * 引数は 0 を含む正の値でなければなりません<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) 1 を返します。 それ以外の場合は、BetaDF(n-m, m+1).value(1-p) を返します。 )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * 少なくとも m 回成功する確率 y が * ベルヌーイ スキームの n 回の試行で既知であるとします。 この関数は、1 回の試行で成功する確率 p * を求めます。 * * 計算には次の関係が使用されます * * 1 - p = rev_Beta(y|n-m,m+1)。 */ (assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

- (二項分布) 多数の独立したイベントを観察した結果として得られるランダムなイベントの発生確率を、その構成要素の発生確率が一定であれば計算できる分布です。 経済辞典

- (ベルヌーイ分布) 各試行におけるこのイベントの発生確率が p(0 p 1) に等しい場合の、反復された独立試行におけるあるイベントの発生数の確率分布。 まさに、その数字は? このイベントの発生があります…… 大百科事典

二項分布- - 電気通信のトピック、基本概念 EN 二項分布 ...

- (ベルヌーイ分布)、各試行におけるこのイベントの発生確率が p (0≤p≤1) の場合、反復された独立試行におけるあるイベントの発生数の確率分布。 つまり、この事象の発生回数μは…… 百科事典

二項分布-1.49。 二項分布 離散確率変数 X の確率分布。0 から n までの任意の整数値をとり、x = 0、1、2、...、n、パラメータ n = 1、2、... になります。そして0< p < 1, где Источник … 規範および技術文書の用語を収録した辞書リファレンスブック

ベルヌーイ分布、確率変数 X の確率分布。それぞれ確率を持つ整数値を取ります (二項係数; p パラメーター B.R.、値を取る、肯定的な結果の確率と呼ばれます... 数学百科事典

反復された独立した試行における、ある事象の発生数の確率分布。 各試行でイベントの発生確率が p に等しく、0 ≤ p ≤ 1 の場合、n が独立した場合のこのイベントの発生数 μ は ... ... ソビエト大百科事典

- (ベルヌーイ分布)、各試行におけるこのイベントの発生確率が p (0 の場合)、反復された独立試行における特定のイベントの発生数の確率分布。<или = p < или = 1). Именно, число м появлений … 自然科学。 百科事典

二項確率分布- (二項分布) それぞれの独立した実験 (統計的観察) の結果が、勝利または敗北、包含または除外、プラスまたは... の 2 つの可能な値のいずれかを取る場合に観察される分布。 経済数学辞典

二項確率分布- それぞれの独立した実験 (統計的観察) の結果が、勝利または敗北、包含または除外、プラスまたはマイナス、0 または 1 の 2 つの値のいずれかを取る場合に観察される分布。つまり…… 技術翻訳者向けハンドブック

  • 問題における確率理論と数学的統計。 360 を超えるタスクと演習、D. A. ボルジク。 提案されたマニュアルには、さまざまなレベルの複雑さのタスクが含まれています。 ただし、主に中程度の複雑さのタスクに重点が置かれます。 これは、学生に次のことを奨励するために意図的に行われています。
  • 問題における確率理論と数学的統計 360 を超える問題と演習、Borzykh D. 提案されたマニュアルには、さまざまなレベルの複雑さの問題が含まれています。 ただし、主に中程度の複雑さのタスクに重点が置かれます。 これは、学生に次のことを奨励するために意図的に行われています。

実装を検討する ベルヌーイ スキーム、つまり 一連の反復された独立した試行が実行され、その各試行では、試行回数に関係なく、指定されたイベント A が同じ確率を持ちます。 そして、各トライアルについて、結果は 2 つだけです。

1) イベント A - 成功。

2) イベント - 失敗、

一定の確率で

離散確率変数 X - 「ある時点でのイベント A の発生数」を考慮に入れてみましょう。 Pテスト」を実行し、この確率変数の分布の法則を見つけます。 X 値は次の値を取ることができます。

確率 確率変数 X が次の値をとること Xのkはベルヌーイの公式で求められます

ベルヌーイの式 (1) で定義される離散確率変数の分布則を次のように呼びます。 二項分布法則. 永続 P R (q=1-p)式(1)に含まれる、 は以下と呼ばれます。 二項分布のパラメータ。

「二項分布」という名前は、式 (1) の右辺が展開の一般項であることに由来しています。 ニュートンの二項式、それらの。

(2)

それ以来 p+q=1の場合、等式 (2) の右辺は 1 に等しくなります。

だということだ

(4)

等式 (3) では、最初の項は qn右辺は、次の確率を意味します。 PテストイベントAは一度も出現しない、第二期 イベント A が 1 回発生する確率、第 3 項はイベント A が 2 回発生する確率、そして最後の項 r pイベント A が正確に発生する確率です P一度。

離散確率変数の二項分布法則は、表の形式で示されます。

バツ 0 1 k n
R qn r p

二項分布の主な数値的特徴は次のとおりです。

1) 数学的期待 (5)

2) 分散 (6)

3) 標準偏差 (7)

4) 最も可能性の高いイベントの発生回数 k0は、与えられた条件が与えられた場合に得られる数です。 P最大二項確率に相当します

与えられたものとして PRこの数値は不等式によって決まります

(8)

数値の場合 pr+rが整数ではない場合、 k0この数値の整数部分に等しい場合、 pr+rが整数の場合、 k0 2つの意味があります

確率分布の二項法則は、射撃の理論、製品品質の統計的管理の理論と実践、待ち行列の理論、信頼性の理論などで使用されます。 この法律は、一連の独立した裁判が行われるすべての場合に適用されます。

例 1:品質管理により、デバイス 100 個中、平均 90 個に欠陥がないことが確認されています。 ランダムに購入された高品質デバイスの数の二項確率分布をコンパイルします。 4.


解決:発生がテストされているイベント A は、「ランダムに取得されたデバイスは品質が良い」です。 問題の状況に応じて、二項分布の主なパラメーターは次のとおりです。

確率変数 X は、取得された 4 台のうちの高品質デバイスの数です。これは、X の値を意味します。式 (1) を使用して、X の値の確率を求めます。


したがって、値 X の分布の法則は、取得された 4 台のうちの高品質デバイスの数になります。

バツ 0 1 2 3 4
R 0,0001 0,0036 0,0486 0,2916 0,6561

分布の構造が正しいかどうかを確認するには、確率の合計が何に等しいかを確認してみましょう。

答え:分配法

バツ 0 1 2 3 4
R 0,0001 0,0036 0,0486 0,2916 0,6561

例 2:適用された治療法により、95%の症例で回復が見られます。 5人の患者がこの方法を使用しました。 最も可能性の高い回復者数と、確率変数 X の数値特性 (この方法を使用した 5 人の患者のうち回復した人の数) を見つけます。

こんにちは! 確率分布が何であるかはすでに知っています。 それは離散的または連続的であり、それが確率密度分布と呼ばれることを学びました。 次に、さらに一般的なディストリビューションをいくつか見てみましょう。 コインがあり、正しいコインがあったとして、それを 5 回投げるとします。 また、確率変数 X を定義し、大文字の X で表します。これは、5 回投げる「ワシ」の数と等しくなります。 おそらくコインが 5 枚あるので、それらを一度に投げて、表が何枚出たか数えてみます。 あるいは、コインが 1 枚あれば、それを 5 回投げて、何回表が出たかを数えることもできます。 それはあまり関係ありません。 しかし、コインが 1 枚あり、それを 5 回投げたとします。 そうすれば、私たちには不確実性はなくなります。 これが私の確率変数の定義です。 ご存知のとおり、ランダム変数は通常の変数とは少し異なり、関数に似ています。 実験に何らかの値を割り当てます。 そして、この確率変数は非常に単純です。 5回投げた後に「ワシ」が何回落ちたかを数えるだけです。これが確率変数Xです。この場合、さまざまな値の確率がどのくらいになるかを考えてみましょう。 では、X (大文字の X) が 0 である確率はどれくらいでしょうか? それらの。 5回投げても表が出ない確率はどれくらいですか? これは実際、「裏」が出る確率と同じです (そうです、確率論の簡単な概要です)。 いくつかの「尾」が得られるはずです。 これらのそれぞれの「尾」の確率はどれくらいでしょうか? これは1/2です。 それらの。 1/2 に 1/2、1/2、1/2、そして再び 1/2 を掛けます。 それらの。 (1/2)⁵。 1⁵=1、2⁵で割る、つまり 32歳。非常に論理的です。 そこで...確率論について説明したことを少し繰り返します。 これは、私たちが現在どこに向かっているのか、そして実際に離散確率分布がどのように形成されるのかを理解するために重要です。 では、表が 1 回だけ出る確率はどれくらいでしょうか? まあ、最初のトスで表が出たかもしれない。 それらの。 「ワシ」、「尾」、「尾」、「尾」、「尾」のようになります。 あるいは、2度目のトスで表が出る可能性もある。 それらの。 「尾」、「頭」、「尾」、「尾」、「尾」などの組み合わせが考えられます。 5回投げた後、1つの「ワシ」が落ちる可能性があります。 これらのそれぞれの状況の確率はどれくらいでしょうか? 表が出る確率は1/2です。 次に、「裏」が出る確率 (1/2 に等しい) は、1/2、1/2、1/2 で乗算されます。 それらの。 これらの状況がそれぞれ起こる確率は 1/32 です。 X=0 の状況の確率も同様です。 実際、表と裏の特別な順序の確率は 1/32 になります。 したがって、その確率は 1/32 です。 そしてその確率は1/32です。 そして、そのような状況が起こるのは、「ワシ」が5回のトスのいずれかに落ちる可能性があるためです。 したがって、ちょうど 1 つの「ワシ」が抜ける確率は 5 * 1/32 に等しくなります。 5/32。 非常に論理的です。 ここから興味深いことが始まります。 確率は何ですか... (それぞれの例を色を変えて書きます)... 確率変数が 2 である確率はどれくらいですか? それらの。 コインを 5 回投げますが、2 回ちょうど表が出る確率はどれくらいですか? こっちのほうが面白いですよね? どのような組み合わせが可能ですか? それは表、表、裏、裏、裏かもしれません。 表、裏、表、裏、裏の場合もあります。 そして、これら2つの「ワシ」が組み合わせの異なる場所に立つことができると考えると、少し混乱する可能性があります。 上記のように配置について考えることはもうできません。 ...できますが、混乱する危険があるだけです。 あなたは一つのことを理解しなければなりません。 これらの各組み合わせの確率は 1/32 です。 1/2*1/2*1/2*1/2。 それらの。 これらの各組み合わせの確率は 1/32 です。 そして、私たちの条件 (2 つの「ワシ」) を満たすそのような組み合わせがいくつ存在するかを考える必要があります。 それらの。 実際、コイントスが 5 つあり、そのうち「ワシ」が抜ける 2 つを選択する必要があると想像する必要があります。 5 つのトスが円になっていると仮定して、椅子が 2 つしかないことも想像してみましょう。 そして私たちはこう言います。「さあ、イーグルスの椅子に座るのは誰ですか?」 それらの。 あなたの中の誰が「ワシ」になるでしょうか? そして、私たちは彼らが座る順番には興味がありません。 より明確になることを願って、そのような例を挙げます。 また、ニュートンの二項式について説明するときは、このトピックに関する確率論のチュートリアルをご覧になるとよいでしょう。 なぜなら、そこで私はこれらすべてをより詳細に掘り下げるからです。 しかし、このように推論すると、二項係数が何であるかが理解できるでしょう。 なぜなら、次のように考えた場合: OK、トスが 5 つあります。どのトスが最初の表になるでしょうか? さて、どのフリップが最初の表になるかについて 5 つの可能性があります。 そして、2番目の「イーグル」のチャンスは何回ありますか? さて、私たちがすでに使用した最初のトスで、表のチャンスが一度奪われました。 それらの。 コンボの頭の位置の 1 つは、トスの 1 つによってすでに占有されています。 残り 4 つのトスが残っています。これは、2 番目の「ワシ」が 4 つのトスのいずれかに落ちる可能性があることを意味します。 そして、あなたはそれをここで見ました。 私は最初のトスで表になることを選択し、残りの 4 回のトスのうち 1 回でも表が出るはずだと想定しました。 したがって、ここでの可能性は 4 つだけです。 私が言いたいのは、最初の頭については着地できる位置が 5 つあるということです。 そして、2番目のポジションでは、残りのポジションは4つだけです。 考えてみてください。 このように計算するとき、順序が考慮されます。 しかし、今の私たちにとって、「表」と「裏」がどのような順序で出るかは問題ではありません。 「ワシ 1」とも「ワシ 2」とも言いません。 どちらの場合も、それは単なる「ワシ」です。 これがヘッド 1、これがヘッド 2 であると想定できます。 あるいは、その逆も考えられます。これは 2 番目の「ワシ」で、これが「最初」である可能性があります。 私がこれを言ったのは、どこで配置を使用し、どこで組み合わせを使用するかを理解することが重要だからです。 私たちは順序には興味がありません。 したがって、実際には、私たちのイベントの起源は 2 つしかありません。 それを 2 で割ってみましょう。後でわかるように、2 になります。 私たちのイベントの起源。 頭が 3 つあるなら、3 つあるはずです。その理由を説明します。 つまり... 5*4=20 割る 2 は 10 です。したがって、確実に 2 つの頭が得られる 32 通りの組み合わせのうち、10 通りの組み合わせがあります。 では、10*(1/32) は 10/32 に等しいのですが、これは何に等しいでしょうか? 5/16。 二項係数を通して書いていきます。 これがここの一番上にある値です。 よく考えてみると、これは 5! を割ったものと同じです... この 5 * 4 は何を意味しますか? 5! は5*4*3*2*1です。 それらの。 ここで 5 * 4 だけが必要な場合は、5 を割ることができます。 3人分! これは、5*4*3*2*1 を 3*2*1 で割ったものに等しくなります。 そして残るは5*4だけです。 したがって、この分子と同じになります。 そして、なぜなら、 シーケンスには興味がありません。ここでは 2 が必要です。実際には 2!。 1/32を掛けます。 これは、ちょうど 2 つの表を当てる確率になります。 ちょうど 3 回表が出る確率はどれくらいですか? それらの。 x=3である確率。 したがって、同じ論理により、最初の表の出現は 5 回のフリップに 1 回発生する可能性があります。 2 回目の表の出現は、残り 4 回のトスのうちの 1 回で発生する可能性があります。 そして、残り 3 回のトスのうち 1 回で 3 回目の表が発生する可能性があります。 3 つのトスを配置するさまざまな方法は何通りありますか? 一般に、3 つのオブジェクトを所定の位置に配置する方法は何通りありますか? 3です! それを理解することもできますし、私が詳しく説明したチュートリアルをもう一度参照することもできます。 しかし、たとえば文字 A、B、C を考えると、それらを配置する方法は 6 通りあります。 これらは見出しと考えることができます。 ここには ACB、CAB が考えられます。 BAC、BCA、そして...私が名前を付けなかった最後のオプションは何ですか? CBA。 3つの異なるアイテムを6通りに配置できます。 6 で割るのは、これら 6 つの異なる方法を同等として扱うため、それらの 6 つの異なる方法を再度数えたくないからです。 ここでは、何回トスを上げて表になるかには興味がありません。 5*4*3… これは 5!/2! と書き換えることができます。 そしてそれをさらに 3 で割ります。 これが彼なのです。 3! 3*2*1 に相当します。 スリーは縮小しています。 これは 2 になります。これは 1 になります。もう一度、5*2、つまり は 10 です。各状況の確率は 1/32 なので、これも 5/16 です。 そしてそれは興味深いです。 表が 3 つ得られる確率は、表が 2 つ得られる確率と同じです。 その理由は…そうですね、それが起こった理由はたくさんあります。 しかし、よく考えてみると、表が 3 つ得られる確率は、裏が 2 つ得られる確率と同じです。 そして、3 つの裏が得られる確率は、2 つの表が得られる確率と同じでなければなりません。 そして、価値観がこのように機能するのは良いことです。 大丈夫。 X=4である確率はいくらですか? 以前に使用したのと同じ式を使用できます。 5*4*3*2 になる可能性があります。 したがって、ここでは 5 * 4 * 3 * 2 と書きます... 4 つのオブジェクトを配置する方法は何通りありますか? 4です! 4! - これは実際、ここのこの部分です。 これは4*3*2*1です。 したがって、これは相殺され、5 が残ります。すると、各組み合わせの確率は 1/32 になります。 それらの。 これは 5/32 に相当します。 繰り返しになりますが、表が 4 回出る確率は、表が 1 回出る確率と等しいことに注意してください。 そして、これは理にかなっています。 表4は尾1と同じです。 あなたはこう言うでしょう:それで、どのような投げ方で、これは「尾」が落ちるでしょうか? はい、5 通りの組み合わせがあります。 そしてそれぞれの確率は 1/32 です。 そして最後に、X=5 である確率はいくらでしょうか? それらの。 5回連続ヘッズアップ。 「ワシ」、「ワシ」、「ワシ」、「ワシ」、「ワシ」のようになります。 各表の確率は 1/2 です。 それらを掛けると 1/32 になります。 別の道に行くこともできます。 これらの実験で表と裏が得られる方法が 32 通りあるとすれば、これはそのうちの 1 つにすぎません。 ここでは 32 通りの方法のうち 5 つがありましたが、ここでは 32 通りのうち 10 つでした。それでも、計算を実行したので、確率分布を描画する準備が整いました。 でももう時間切れだ。 次のレッスンで続けましょう。 気が向いたら、次のレッスンを見る前に絵を描いてみてはいかがでしょうか? また近いうちにお会いしましょう!