기술나눔

[수리통계] 2-랜덤변수와 확률분포

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. 확률변수의 정의 및 분류

정의: 무작위 변수는 무작위 실험에서 다른 값을 취하는 변수입니다.

  1. 범주형 확률변수(명목형)

    • 예시 : 성별(남성, 여성), 직업(공무원, 직장인, 학생, 퇴직, 무직), 검사결과(음성, 양성)
  2. 순서형 범주형 확률변수(순서형)

    • 예: 태도(매우 동의함, 동의함, 중립적, 동의하지 않음, 크게 동의하지 않음), 사용 빈도(일주일에 한 번, 2주에 한 번, 6개월에 한 번, 거의 전혀, 전혀)
  3. 수치확률변수

    • 예: 연령(13, 14, 15, 16...), 소득(어떤 값이든 입력 가능)

2. 이산 확률 분포

2.1 이항 분포

  • 정의: 설명 N 독립적인 시험에서 성공 kk케이 각 시행이 성공할 확률은 다음과 같습니다. 페이지
  • 공식 X ∼ Bin ( n , p ) X sim text{Bin}(n, p)엑스큰 상자(N,)
  • 확률질량함수(PMF) P(X=k)=(nk)pk(1−p)n−k P(X=k)=이항nk(1−p)^nk(엑스=케이)=(케이N)케이(1)N케이
  • 누적 분포 함수(CDF) F(X=k) = ∑i=0k(ni)pi(1−p)n−i F(X=k) = sum_{i=0}^{k} 이항{n}{i} p^i (1-p)^{ni}에프(엑스=케이)==0케이(N)(1)N

2.2 베르누이 분포

  • 정의: 실험의 성공(또는 실패) 확률을 설명합니다. 성공 확률은 다음과 같습니다. 페이지
  • 공식 X ∼ 베른(p) X sim text{베른}(p)엑스베른()
  • 확률질량함수(PMF) P(X=x) = { x=1이면 p 1 − x=0이면 p P(X=x) ={만약에엑스=11만약에엑스=0 (엑스=엑스)={1만약에엑스=1만약에엑스=0
  • 누적 분포 함수(CDF) F(X=x) = { x &lt; 0이면 0, 0 ≤ x &lt; 1이면 1 − p, x ≥ 1이면 1 F(X=x) ={0만약에엑스<01만약에0엑스<11만약에엑스1 에프(엑스=엑스)= 011만약에엑스<0만약에0엑스<1만약에엑스1

2.3 기하학적 분포

  • 정의: 첫 번째 성공 전 실패 횟수의 확률을 설명합니다. 각 시도의 성공 확률은 다음과 같습니다. 페이지
  • 공식 X ∼ 기하(p) X sim text{기하}(p)엑스지오엠()
  • 확률질량함수(PMF) P(X=k) = (1-p)kp P(X=k) = (1-p)^kp(엑스=케이)=(1)케이
  • 누적 분포 함수(CDF) F(X=k)=1−(1−p)k+1 F(X=k)=1−(1-p)^{k+1}에프(엑스=케이)=1(1)케이+1

2.4 음이항 분포

  • 정의: r번째 성공에 도달하기 전의 실패 횟수를 설명합니다. 각 시행의 성공 확률은 다음과 같습니다. 페이지
  • 공식 X ∼ NegBin ( r , p ) X sim text{NegBin}(r, p)엑스네그빈(아르 자형,)
  • 확률질량함수(PMF) P(X=k)=(k+r-1k)pr(1-p)k P(X=k)=이항{k+r-1}{k}p^r(1-p)^k(엑스=케이)=(케이케이+아르 자형1)아르 자형(1)케이
  • 누적 분포 함수(CDF) F(X=k) = ∑i=0k(i+r−1i)pr(1−p)i F(X=k) = sum_{i=0}^{k} 이항{i+r−1}{i} p^r(1-p)^i에프(엑스=케이)==0케이(+아르 자형1)아르 자형(1)

2.5 초기하 분포

  • 정의: 유한 모집단에서 대체 없이 샘플링하는 방법을 설명합니다. N 번, 성공 kk케이 배 확률.
  • 공식 X ∼ 초기하(N, K, n) X sim text{초기하}(N, K, n)엑스하이퍼지오므(N,케이,N)
  • 확률질량함수(PMF) P(X=k) = (Kk)(N−Kn−k)(Nn) P(X=k) = 이항분포{K}{k} 이항분포{NK}{nk}}{이항분포{N}{n}}(엑스=케이)=(NN)(케이케이)(N케이N케이)
  • 누적 분포 함수(CDF) F(X=k) = ∑i=0k(Ki)(N−Kn−i)(Nn) F(X=k) = 합_{i=0}^{k} 이항분포 이항K}{i} 이항NK}{ni}}{이항N}{n}에프(엑스=케이)==0케이(NN)(케이)(NN케이)

2.6 포아송 분포

  • 정의: 설명은 단위 시간 내에 발생합니다. kk케이 사건의 확률, 사건의 평균 발생률은 λ입니다.
  • 공식 X ∼ 푸아송 ( λ ) X sim text{푸아송}(람다)엑스푸아송(λ)
  • 확률질량함수(PMF) P(X=k) = λke−λk! P(X = k) = 람다^ke^{-람다}}{k!}(엑스=케이)=케이!λ케이이자형λ
  • 누적 분포 함수(CDF) F(X=k) = e−λ∑i=0kλ∑!F(X=k) = e^{-람다} 합_{i=0}^{k} 프랙{람다^i}{i!}에프(엑스=케이)=이자형λ=0케이!λ

2.7 그들 사이의 관계

  • 베르누이 분포특별하다이항 분포,언제 숫자 = 1 숫자 = 1N=1 시간.
  • 기하학적 분포첫 번째 성공까지 필요한 시행 횟수의 분포로, 다음과 같이 볼 수 있습니다.이항 분포확대.
  • 음이항 분포로 볼 수 있다기하학적 분포r번 성공하기 전에 필요한 실패 횟수를 설명하는 데 사용되는 의 일반화입니다.
  • 초기하 분포비슷하다이항 분포, 그러나 유한한 모집단과 대체 없는 샘플링에 적합합니다.
  • 포아송 분포이항 분포한계 사례 N 매우 크고 페이지 아주 어리고, λ = np 람다 = npλ=N 일정하게 유지하십시오.

3. 연속확률분포

3.1 지수분포

  • 정의: 지수 분포는 독립적인 사건 사이의 시간 간격을 설명하는 데 자주 사용되는 연속 확률 분포입니다.

  • 공식 X ∼ 지수 ( λ ) X sim text{지수}(람다)엑스지수(λ),안에 λ &gt; 0 람다 &gt; 0λ>0 속도 매개 변수입니다

  • 확률밀도함수 (PDF) f(x;λ) = λe−λx (x ≥ 0에 대해) f(x;λ) = λe^{-λx} 사각형 text{for} x geq 0에프(엑스;λ)=λ이자형λ엑스~을 위한엑스0

  • 누적 분포 함수(CDF) F(x;λ) = 1 − e − λx (x ≥ 0에 대해) F(x;λ) = 1 - e^{-λx} 4중 텍스트{x에 대해} geq 0에프(엑스;λ)=1이자형λ엑스~을 위한엑스0

3.2 감마 분포

  • 정의: 대기 시간의 누적을 설명하며 지수 분포와 χ² 분포를 일반화한 것입니다.

  • 공식 X ∼ 감마(k, θ) X 시뮬레이션 텍스트{감마}(k, 세타)엑스감마(케이,θ),안에 케이 &gt; 0 케이 &gt; 0케이>0 모양 매개변수입니다. θ &gt; 0 세타 &gt; 0θ>0 스케일 매개변수입니다

  • 확률밀도함수 (PDF) f(x; k, θ) = xk − 1 e − x / θ θ k Γ(k) (x ≥ 0에 대해) f(x; k, 세타) = frac{x^{k-1}e^{-x/세타}}{세타^k Gamma(k)} 사각형 텍스트{x에 대해} geq 0에프(엑스;케이,θ)=θ케이Γ(케이)엑스케이1이자형엑스/θ~을 위한엑스0,안에 Γ ( k ) 감마(k)Γ(케이) 감마 함수입니다

  • 누적 분포 함수(CDF) F(x; k, θ) = γ(k, x/θ)Γ(k) F(x; k, 세타) = frac{gamma(k, x/세타)}{Gamma(k)}에프(엑스;케이,θ)=Γ(케이)γ(케이,엑스/θ),안에 γ ( k , x / θ ) 감마 ( k , x / 세타)γ(케이,엑스/θ) 불완전한 감마 함수입니다.

3.3 정규분포

  • 정의: 다수의 독립확률변수의 합의 분포를 기술하며 자연과학과 사회과학에서 널리 사용된다.

  • 공식 X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)엑스N(μ,σ2),안에, μ 무μ 는 평균값이고, 시그마^2σ2 차이는

  • 확률밀도함수 (PDF) f(x; μ, σ2) = 1 2 π σ2 e − ( x − μ ) 2 2 σ2 f(x; 뮤, 시그마^2) = 프랙{1}{sqrt{2피시그마^2}} e^{-프랙{(x-뮤)^2}{2시그마^2}}에프(엑스;μ,σ2)=2πσ2 1이자형2σ2(엑스μ)2

  • 누적 분포 함수(CDF) F(x; μ, σ2) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ2) ] F(x; mu, sigma^2) = frac{1}{2}left[1 + 연산자 이름{erf}left(frac{x-mu}{sqrt{2sigma^2}}right)right]에프(엑스;μ,σ2)=21[1+에르프(2σ2 엑스μ)], 여기서 erf는 오류 함수입니다.

3.4 t-분포

  • 정의: 소규모 표본 상황에서 가설 검정 및 신뢰 구간 추정에 사용됩니다.

  • 공식 X ∼ t ( ν ) X 와 t(nu)의 관계는 다음과 같다.엑스(ν),안에, ν 누ν 자유도이다

  • 확률밀도함수 (PDF) f(t; ν) = Γ(ν+12) ν π Γ(ν2)(1+t2ν) − ν+12 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}right)}{sqrt{nupi} Gammaleft(frac{nu}{2}right)} left(1+ frac{t^2}{nu}right)^{-frac{nu+1}{2}}에프(;ν)=νπ Γ(2ν)Γ(2ν+1)(1+ν2)2ν+1

  • 누적 분포 함수(CDF) F(t; ν) = 1 2 + t Γ(ν + 1 2) π ν Γ(ν 2) ∫ 0 t(1 + u 2 ν) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} du에프(;ν)=21+πν Γ(2ν)Γ(2ν+1)0(1+ν2)2ν+1

3.5 카이제곱 분포

  • 정의: 가설 검정 및 분산 분석에 일반적으로 사용됩니다.

  • 공식 X ∼ χ 2 ( k ) X sim chi^2(k)엑스χ2(케이),안에 kk케이 자유도이다

  • 확률밀도함수 (PDF) f(x;k) = 1 2 k / 2 Γ(k/2) xk/2 − 1 e − x / 2 (x ≥ 0인 경우) f(x;k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} 사각형 text{for} x geq 0에프(엑스;케이)=2케이/2Γ(케이/2)1엑스케이/21이자형엑스/2~을 위한엑스0

  • 누적 분포 함수(CDF) F(x; k) = γ(k2, x2) Γ(k2) F(x; k) = 감마좌측(프랙{k}{2}, 프랙{x}{2}우측)}{감마좌측(프랙{k}{2}우측)}에프(엑스;케이)=Γ(2케이)γ(2케이,2엑스)

3.6 F-분포

  • 정의: 두 표본의 분산을 비교하는 데 사용됩니다.

  • 공식 X ∼ F ( d 1 , d 2 ) X와 F(d_1, d_2)의 관계는 다음과 같습니다.엑스에프(1,2),안에 디 1 디_11 그리고 디2디22 자유도이다

  • 확률밀도함수 (PDF) f(x;d1,d2) = (d1x)d1d2d2(d1x+d2)d1+d2xB(d12,d22) x ≥ 0에 대하여 f(x;d_1, d_2) = frac{sqrt{frac{(d_1x)^{d_1} d_2^{d_2}}{(d_1x + d_2)^{d_1 + d_2}}}}{x 왼쪽(frac{d_1}{2}, frac{d_2}{2}오른쪽)} 사각형 텍스트{for } x geq 0에프(엑스;1,2)=엑스(21,22)(1엑스+2)1+2(1엑스)122 ~을 위한엑스0,안에 비비 베타 기능이다

  • 누적 분포 함수(CDF) F(x; d1, d2) = Id1xd1x + d2(d12, d22) F(x; d_1, d_2) = I_{frac{d_1x}{d_1x + d_2}}왼쪽(frac{d_1}{2}, frac{d_2}{2}오른쪽)에프(엑스;1,2)=1엑스+21엑스(21,22),안에 2세 불완전한 베타 기능입니다

3.7 그들 사이의 관계

  • 카이제곱 분포는 다음과 같습니다.정규분포의 제곱합 . 예를 들어, kk케이 독립 표준 정규 변수의 제곱합은 다음과 같은 자유도를 따릅니다. kk케이 카이제곱 분포.
  • t 분포는 다음과 같습니다.표준정규분포와 카이제곱분포를 기반으로 구성 의. 구체적으로, t-분포는 표준 정규 변수를 독립 카이제곱 분포 변수의 제곱근으로 나누어 얻을 수 있습니다.
  • F 분포는 다음과 같습니다.두 개의 독립 카이제곱 분포 변수의 비율 확장 . F 분포는 두 분산을 비교하는 데 사용되며 두 카이제곱 분포 변수의 비율을 취하여 구성됩니다.