技術共有

[数学的統計] 2-確率変数とその確率分布

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. 確率変数の定義と分類

定義: 確率変数は、ランダム実験で異なる値を取る変数です。

  1. カテゴリ確率変数 (公称)

    • 例:性別(男性、女性)、職業(公務員、会社員、学生、退職者、無職)、検査結果(陰性、陽性)
  2. 順序付きカテゴリカル確率変数 (順序付き)

    • 例: 態度 (強く同意、同意、中立、反対、強く反対)、使用頻度 (週に 1 回、2 週間に 1 回、半年に 1 回、ほとんど使用しない、まったく使用しない)
  3. 数値確率変数

    • 例:年齢(13、14、15、16...)、収入(任意の値を入力できます)

2. 離散確率分布

2.1 二項分布

  • 意味: で説明されています んん 独立した試験で成功 えーっ 各試行が成功する確率は次のとおりです。 1ページp
  • X ∼ Bin ( n 、 p ) X sim text{Bin}(n、 p)バツ置き場(,p)
  • 確率質量関数 (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}(バツ=)=()p(1p)
  • 累積分布関数 (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = sum_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}(バツ=)==0()p(1p)

2.2 ベルヌーイ分布

  • 意味: 実験の成功(または失敗)の確率を表します。 1ページp
  • X ∼ ベルン ( p ) X シムテキスト{ベルン}(p)バツベルン(p)
  • 確率質量関数 (PMF) P ( X = x ) = { x = 1 の場合 p 1 − x = 0 の場合 p(X = x) ={pもしバツ=11pもしバツ=0 (バツ=バツ)={p1pもしバツ=1もしバツ=0
  • 累積分布関数 (CDF) F ( X = x ) = { x &lt; 0 なら 0 0 ≤ x &lt; 1 なら 1 − p x ≥ 1 なら 1 F(X = x) ={0もしバツ<01pもし0バツ<11もしバツ1 (バツ=バツ)= 01p1もしバツ<0もし0バツ<1もしバツ1

2.3 幾何学的分布

  • 意味: 最初の成功までの失敗回数の確率を表します。各試行の成功確率は次のとおりです。 1ページp
  • X ∼ Geom ( p ) X sim text{Geom}(p)バツジオム(p)
  • 確率質量関数 (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kp(バツ=)=(1p)p
  • 累積分布関数 (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}(バツ=)=1(1p)+1

2.4 負の二項分布

  • 意味: 各試行の成功確率は、r 回目の成功に達するまでの失敗の回数を表します。 1ページp
  • X ∼ NegBin ( r , p ) X はテキスト{NegBin}(r, p) と等しいバツネグビン(r,p)
  • 確率質量関数 (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^k(バツ=)=(+r1)pr(1p)
  • 累積分布関数 (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = sum_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^i(バツ=)==0(+r1)pr(1p)

2.5 超幾何分布

  • 意味: 非復元なしの有限母集団からのサンプリングを説明します。 んん 回、成功 えーっ 倍の確率。
  • X ∼ 超幾何 ( N , K , n ) X sim text{超幾何}(N, K, n)バツハイパージオム(いいえ,,)
  • 確率質量関数 (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}(バツ=)=(いいえ)()(いいえ)
  • 累積分布関数 (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = sum_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}(バツ=)==0(いいえ)()(いいえ)

2.6 ポアソン分布

  • 意味:単位時間内に記述が発生する えーっ イベントの確率、つまりイベントの平均発生率は λ です。
  • X ∼ ポアソン ( λ ) X sim text{ポアソン}(lambda)バツポアソン(λ)
  • 確率質量関数 (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}(バツ=)=!λeλ
  • 累積分布関数 (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} sum_{i=0}^{k} frac{lambda^i}{i!}(バツ=)=eλ=0!λ

2.7 それらの間の関係

  • ベルヌーイ分布特別です二項分布、いつ 1 = 1 1 = 1=1 時間。
  • 幾何分布は、最初の成功までに必要な試行回数の分布であり、次のように見ることができます。二項分布拡大。
  • 負の二項分布として見ることができます幾何分布の一般化。r 回の成功までに必要な失敗の回数を記述するために使用されます。
  • 超幾何分布に似ている二項分布ただし、有限の母集団や非復元のないサンプリングには適しています。
  • ポアソン分布はい二項分布の極限ケース んん とても大きくて 1ページp とても若いし、 λ = np ラムダ = npλ=p 一定に保ちます。

3. 連続確率分布

3.1 指数分布

  • 意味: 指数分布は、独立したイベント間の時間間隔を記述するためによく使用される連続確率分布です。

  • X ∼ 指数関数 ( λ ) X sim text{指数関数}(lambda)バツ指数関数(λ)、で λ &gt; 0 ラムダ&gt;0λ>0 レートパラメータです

  • 確率密度関数 (PDF) f ( x ; λ ) = λ e − λ x (x ≥ 0の場合) f(x; lambda) = lambda e^{-lambda x} quad text{for } x geq 0(バツ;λ)=λeλバツのためにバツ0

  • 累積分布関数 (CDF) F ( x ; λ ) = 1 − e − λ x (x ≥ 0の場合) F(x; lambda) = 1 - e^{-lambda x} quad text{for } x geq 0(バツ;λ)=1eλバツのためにバツ0

3.2 ガンマ分布

  • 意味: 待ち時間の累積を記述し、指数分布とχ²分布を一般化したものです。

  • X ∼ ガンマ ( k , θ ) X sim text{ガンマ}(k, θ)バツガンマ(,θ)、で 0 ...>0 は形状パラメータ、 θ &gt; 0 シータ&gt;0θ>0 はスケールパラメータです

  • 確率密度関数 (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) x ≥ 0 の場合 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{for } x geq 0(バツ;,θ)=θΓ()バツ1eバツ/θのためにバツ0、で Γ ( k ) ガンマ(k)Γ() はガンマ関数です

  • 累積分布関数 (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}(バツ;,θ)=Γ()γ(,バツ/θ)、で γ ( k , x / θ ) ガンマ(k, x/θ)γ(,バツ/θ) は不完全なガンマ関数です。

3.3 正規分布

  • 意味: 多数の独立した確率変数の合計の分布を記述し、自然科学や社会科学で広く使用されています。

  • X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)バツいいえ(μ,σ2)、で、 ミューμ は平均値、 σ 2 シグマ^2σ2 分散です

  • 確率密度関数 (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}(バツ;μ,σ2)=2πσ2 1e2σ2(バツμ)2

  • 累積分布関数 (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}left[1 + operatorname{erf}left(frac{x-mu}{sqrt{2sigma^2}}right)right](バツ;μ,σ2)=21[1+エルフ(2σ2 バツμ)]ここで、erf は誤差関数です。

3.4 t分布

  • 意味: サンプルが小さい状況での仮説検定と信頼区間推定に使用されます。

  • X ∼ t ( ν ) X sim t(nu)バツt(ν)、で、 ν nuν 自由度です

  • 確率密度関数 (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}right)}{sqrt{nupi} Gammaleft(frac{nu}{2}right)} left(1 + frac{t^2}{nu}right)^{-frac{nu+1}{2}}(t;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νt2)2ν+1

  • 累積分布関数 (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} du(t;ν)=21+tπν Γ(2ν)Γ(2ν+1)0t(1+νあなた2)2ν+1dあなた

3.5 カイ二乗分布

  • 意味: 仮説検定と分散分析によく使用されます。

  • X ∼ χ 2 ( k ) X sim chi^2(k)バツχ2()、で えーっ 自由度です

  • 確率密度関数 (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 x ≥ 0 の場合 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{for } x geq 0(バツ;)=2/2Γ(/2)1バツ/21eバツ/2のためにバツ0

  • 累積分布関数 (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}right)}{Gammaleft(frac{k}{2}right)}(バツ;)=Γ(2)γ(2,2バツ)

3.6 F 分布

  • 意味: 2 つのサンプルの分散を比較するために使用されます。

  • X ∼ F ( d 1 , d 2 ) X は F(d_1, d_2) と等しいバツ(d1,d2)、で d 1 d_1d1 そして d 2 d_2d2 自由度です

  • 確率密度関数 (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) x ≥ 0 の場合 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{for } x geq 0(バツ;d1,d2)=バツB(2d1,2d2)(d1バツ+d2)d1+d2(d1バツ)d1d2d2 のためにバツ0、で BBB ベータ機能です

  • 累積分布関数 (CDF) F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}左(frac{d_1}{2}, frac{d_2}{2}右)(バツ;d1,d2)=d1バツ+d2d1バツ(2d1,2d2)、で は不完全なベータ関数です

3.7 両者の関係

  • カイ二乗分布は次のようになります。正規分布の二乗和 。例えば、 えーっ 独立した標準正規変数の二乗和は、次のように自由度に従います。 えーっ カイ二乗分布。
  • t 分布は次のとおりです。標準正規分布とカイ二乗分布に基づいて構築の。具体的には、t 分布は、標準正規変数をその独立したカイ二乗分布変数の平方根で割ることによって取得できます。
  • F 分布は2 つの独立したカイ二乗分布変数の比率の拡張 。 F 分布は 2 つの分散を比較するために使用され、2 つのカイ二乗分布変数の比を取得することによって構築されます。