Обмен технологиями

[Математическая статистика] 2-Случайные величины и их распределения вероятностей.

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Определение и классификация случайных величин.

Определение: Случайная величина — это переменная, принимающая разные значения в случайном эксперименте.

  1. Категориальная случайная величина (номинальная)

    • Пример: пол (мужчина, женщина), род занятий (государственный служащий, корпоративный служащий, студент, пенсионер, безработный), результат теста (отрицательный, положительный).
  2. Упорядоченная категориальная случайная величина (Упорядоченная)

    • Примеры: отношение (полностью согласен, согласен, нейтрально, не согласен, категорически не согласен), частота использования (раз в неделю, раз в две недели, раз в полгода, почти никогда, никогда).
  3. Числовая случайная величина

    • Пример: Возраст (13, 14, 15, 16...), доход (можно указать любое значение)

2. Дискретное распределение вероятностей.

2.1 Биномиальное распределение

  • определение: описано в ннн Успешный результат в независимых испытаниях ккк Вероятность того, что каждое испытание окажется успешным, равна стр.п
  • формула X ∼ Bin ( n , p ) X сим текст{Bin}(n, p)ИксКорзина(н,п)
  • Функция массы вероятности (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = бином{n}{k} p^k (1-p)^{nk}п(Икс=к)=(кн)пк(1п)нк
  • Кумулятивная функция распределения (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = сумма_{i=0}^{k} бином{n}{i} p^i (1-p)^{ni}Ф(Икс=к)=я=0к(ян)пя(1п)ня

2.2 Распределение Бернулли

  • определение: Описывает вероятность успеха (или неудачи) эксперимента. Вероятность успеха равна. стр.п
  • формула X ∼ Берн ( p ) X сим текст{Берн}(p)ИксБерн(п)
  • Функция массы вероятности (PMF) P ( X = x ) = { p если x = 1 1 − p если x = 0 P(X = x) ={песлиИкс=11песлиИкс=0 п(Икс=Икс)={п1песлиИкс=1еслиИкс=0
  • Кумулятивная функция распределения (CDF) F ( X = x ) = { 0, если x &lt; 0 1 − p, если 0 ≤ x &lt; 1 1, если x ≥ 1 F(X = x) ={0еслиИкс<01песли0Икс<11еслиИкс1 Ф(Икс=Икс)= 01п1еслиИкс<0если0Икс<1еслиИкс1

2.3 Геометрическое распределение

  • определение: Описывает вероятность количества неудач до первого успеха. Вероятность успеха в каждом испытании равна. стр.п
  • формула X ∼ Geom ( p ) X сим текст{Geom}(p)ИксГеом(п)
  • Функция массы вероятности (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpп(Икс=к)=(1п)кп
  • Кумулятивная функция распределения (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}Ф(Икс=к)=1(1п)к+1

2.4 Отрицательное биномиальное распределение

  • определение: Описывает количество неудач до достижения r-го успеха. Вероятность успеха для каждого испытания равна. стр.п
  • формула X ∼ NegBin ( r , p ) X сим текст{NegBin}(r, p)ИксНегБин(р,п)
  • Функция массы вероятности (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = бином{k + r - 1}{k} p^r (1-p)^kп(Икс=к)=(кк+р1)пр(1п)к
  • Кумулятивная функция распределения (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = сумма_{i=0}^{k} бином{i + r - 1}{i} p^r (1-p)^iФ(Икс=к)=я=0к(яя+р1)пр(1п)я

2.5 Гипергеометрическое распределение

  • определение: Описывает выборку из конечной совокупности без замены. ннн раз, успешный ккк раз вероятность.
  • формула X ∼ Гипергеома ( N , K , n ) X сим текст{Гипергеома}(N, K, n)ИксГипергеом(Н,К,н)
  • Функция массы вероятности (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}п(Икс=к)=(нН)(кК)(нкНК)
  • Кумулятивная функция распределения (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = сумма_{i=0}^{k} дробь{бином{K}{i} бином{NK}{ni}}{бином{N}{n}}Ф(Икс=к)=я=0к(нН)(яК)(няНК)

2.6 Распределение Пуассона

  • определение: Описание происходит за единицу времени. ккк Вероятность события, средняя частота возникновения события, равна λ.
  • формула X ∼ Пуассона ( λ ) X sim text{Пуассона}(лямбда)ИксПуассон(λ)
  • Функция массы вероятности (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}п(Икс=к)=к!λкеλ
  • Кумулятивная функция распределения (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} сумма_{i=0}^{k} дробь{lambda^i}{i!}Ф(Икс=к)=еλя=0кя!λя

2.7 Отношения между ними

  • Распределение Бернуллиэто особенныйбиномиальное распределение,когда п = 1 п = 1н=1 час.
  • геометрическое распределение— это распределение числа испытаний, необходимых для достижения первого успеха, которое можно рассматривать какбиномиальное распределениерасширение.
  • отрицательное биномиальное распределениеможно рассматривать какгеометрическое распределениеОбобщение , используемое для описания количества неудач, необходимых для достижения r успехов.
  • гипергеометрическое распределениеПохожий набиномиальное распределение, но подходит для конечных популяций и выборки без замены.
  • распределение Пуассонадабиномиальное распределениеПредельный случай ннн очень большой и стр.п очень молодой и λ = нп лямбда = нпλ=нп держитесь постоянным.

3. Непрерывное распределение вероятностей

3.1 Экспоненциальное распределение

  • определение: Экспоненциальное распределение — это непрерывное распределение вероятностей, часто используемое для описания временных интервалов между независимыми событиями.

  • формула X ∼ Экспоненциальный ( λ ) X sim text{Экспоненциальный}(лямбда)ИксЭкспоненциальный(λ) λ &gt; 0 лямбда&gt;0λ>0 параметр скорости

  • Функция плотности вероятности (PDF) f ( x ; λ ) = λ e − λ x для x ≥ 0 f(x; лямбда) = лямбда e^{-лямбда x} quad text{for } x geq 0ф(Икс;λ)=λеλИксдляИкс0

  • Кумулятивная функция распределения (CDF) F ( x ; λ ) = 1 − e − λ x для x ≥ 0 F(x; лямбда) = 1 - e^{-лямбда x} quad text{for } x geq 0Ф(Икс;λ)=1еλИксдляИкс0

3.2 Гамма-распределение

  • определение: Описывает накопление времени ожидания и является обобщением экспоненциального распределения и распределения χ².

  • формула X ∼ Гамма ( k , θ ) X sim text{Gamma}(k, theta)ИксГамма(к,θ) к &gt; 0 к&gt;0к>0 параметр формы, θ &gt; 0 тета&gt;0θ>0 параметр масштаба

  • Функция плотности вероятности (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) для x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{for } x geq 0ф(Икс;к,θ)=θкΓ(к)Икск1еИкс/θдляИкс0 Γ (k) Гамма(k)Γ(к) это гамма-функция

  • Кумулятивная функция распределения (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}Ф(Икс;к,θ)=Γ(к)γ(к,Икс/θ) γ ( k , x / θ ) гамма(k, x/тета)γ(к,Икс/θ) является неполной гамма-функцией.

3.3 Нормальное распределение

  • определение: Описывает распределение суммы большого количества независимых случайных величин и широко используется в естественных и социальных науках.

  • формула X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)ИксН(μ,σ2),в, μ мюμ это среднее значение, σ 2 сигма^2σ2 это дисперсия

  • Функция плотности вероятности (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}ф(Икс;μ,σ2)=2πσ2 1е2σ2(Иксμ)2

  • Кумулятивная функция распределения (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}left[1 + имя_оператора{erf}left(frac{x-mu}{sqrt{2sigma^2}}right)right]Ф(Икс;μ,σ2)=21[1+ерф(2σ2 Иксμ)], где erf — функция ошибок.

3.4 t-распределение

  • определение: используется для проверки гипотез и оценки доверительного интервала в ситуациях с небольшой выборкой.

  • формула X ∼ t ( ν ) X сим t(nu)Икст(ν),в, ν нюν это степень свободы

  • Функция плотности вероятности (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}right)}{sqrt{nupi} Gammaleft(frac{nu}{2}right)} left(1 + frac{t^2}{nu}right)^{-frac{nu+1}{2}}ф(т;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νт2)2ν+1

  • Кумулятивная функция распределения (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} duФ(т;ν)=21+тπν Γ(2ν)Γ(2ν+1)0т(1+νты2)2ν+1гты

3.5 Распределение хи-квадрат

  • определение: Обычно используется для проверки гипотез и дисперсионного анализа.

  • формула X ∼ χ 2 ( k ) X сим хи^2(k)Иксχ2(к) ккк это степень свободы

  • Функция плотности вероятности (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 для x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{for } x geq 0ф(Икс;к)=2к/2Γ(к/2)1Икск/21еИкс/2дляИкс0

  • Кумулятивная функция распределения (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}right)}{Gammaleft(frac{k}{2}right)}Ф(Икс;к)=Γ(2к)γ(2к,2Икс)

3.6 F-распределение

  • определение: используется для сравнения дисперсии двух выборок.

  • формула X ∼ F ( d 1 , d 2 ) X сим F(d_1, d_2)ИксФ(г1,г2) д 1 д_1г1 и д 2 д_2г2 это степень свободы

  • Функция плотности вероятности (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) для x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{for } x geq 0ф(Икс;г1,г2)=ИксБ(2г1,2г2)(г1Икс+г2)г1+г2(г1Икс)г1г2г2 дляИкс0 ВВБ это бета-функция

  • Кумулятивная функция распределения (CDF) F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}влево(frac{d_1}{2}, frac{d_2}{2}вправо)Ф(Икс;г1,г2)=яг1Икс+г2г1Икс(2г1,2г2) IIя это неполная бета-функция

3.7 Отношения между ними

  • Распределение хи-квадратсумма квадратов нормального распределения . Например, ккк Сумма квадратов независимых стандартных нормальных переменных подчиняется степеням свободы как ккк распределение хи-квадрат.
  • Распределение t находится вПостроено на основе стандартного нормального распределения и распределения хи-квадрат. из. В частности, t-распределение можно получить путем деления стандартной нормальной переменной на квадратный корень из ее независимой переменной распределения хи-квадрат.
  • Распределение FРасширение отношения двух независимых распределенных переменных хи-квадрат . Распределение F используется для сравнения двух дисперсий и строится путем определения отношения двух распределенных переменных хи-квадрат.