Определение: Случайная величина — это переменная, принимающая разные значения в случайном эксперименте.
Категориальная случайная величина (номинальная)
Пример: пол (мужчина, женщина), род занятий (государственный служащий, корпоративный служащий, студент, пенсионер, безработный), результат теста (отрицательный, положительный).
Упорядоченная категориальная случайная величина (Упорядоченная)
Примеры: отношение (полностью согласен, согласен, нейтрально, не согласен, категорически не согласен), частота использования (раз в неделю, раз в две недели, раз в полгода, почти никогда, никогда).
Числовая случайная величина
Пример: Возраст (13, 14, 15, 16...), доход (можно указать любое значение)
2. Дискретное распределение вероятностей.
2.1 Биномиальное распределение
определение: описано в ннн Успешный результат в независимых испытаниях ккк Вероятность того, что каждое испытание окажется успешным, равна стр.п。
формула: X ∼ Bin ( n , p ) X сим текст{Bin}(n, p)Икс∼Корзина(н,п)
Функция массы вероятности (PMF): P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = бином{n}{k} p^k (1-p)^{nk}п(Икс=к)=(кн)пк(1−п)н−к
Кумулятивная функция распределения (CDF): F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = сумма_{i=0}^{k} бином{n}{i} p^i (1-p)^{ni}Ф(Икс=к)=∑я=0к(ян)пя(1−п)н−я
2.2 Распределение Бернулли
определение: Описывает вероятность успеха (или неудачи) эксперимента. Вероятность успеха равна. стр.п。
формула: X ∼ Берн ( p ) X сим текст{Берн}(p)Икс∼Берн(п)
Функция массы вероятности (PMF): P ( X = x ) = { p если x = 1 1 − p если x = 0 P(X = x) ={песлиИкс=11−песлиИкс=0п(Икс=Икс)={п1−песлиИкс=1еслиИкс=0
Кумулятивная функция распределения (CDF): F ( X = x ) = { 0, если x < 0 1 − p, если 0 ≤ x < 1 1, если x ≥ 1 F(X = x) ={0еслиИкс<01−песли0≤Икс<11еслиИкс≥1Ф(Икс=Икс)=⎩⎨⎧01−п1еслиИкс<0если0≤Икс<1еслиИкс≥1
2.3 Геометрическое распределение
определение: Описывает вероятность количества неудач до первого успеха. Вероятность успеха в каждом испытании равна. стр.п。
формула: X ∼ Geom ( p ) X сим текст{Geom}(p)Икс∼Геом(п)
Функция массы вероятности (PMF): P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpп(Икс=к)=(1−п)кп
Кумулятивная функция распределения (CDF): F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}Ф(Икс=к)=1−(1−п)к+1
2.4 Отрицательное биномиальное распределение
определение: Описывает количество неудач до достижения r-го успеха. Вероятность успеха для каждого испытания равна. стр.п。
формула: X ∼ NegBin ( r , p ) X сим текст{NegBin}(r, p)Икс∼НегБин(р,п)
Функция массы вероятности (PMF): P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = бином{k + r - 1}{k} p^r (1-p)^kп(Икс=к)=(кк+р−1)пр(1−п)к
Кумулятивная функция распределения (CDF): F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = сумма_{i=0}^{k} бином{i + r - 1}{i} p^r (1-p)^iФ(Икс=к)=∑я=0к(яя+р−1)пр(1−п)я
2.5 Гипергеометрическое распределение
определение: Описывает выборку из конечной совокупности без замены. ннн раз, успешный ккк раз вероятность.
формула: X ∼ Гипергеома ( N , K , n ) X сим текст{Гипергеома}(N, K, n)Икс∼Гипергеом(Н,К,н)
Функция массы вероятности (PMF): P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}п(Икс=к)=(нН)(кК)(н−кН−К)
Кумулятивная функция распределения (CDF): F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = сумма_{i=0}^{k} дробь{бином{K}{i} бином{NK}{ni}}{бином{N}{n}}Ф(Икс=к)=∑я=0к(нН)(яК)(н−яН−К)
2.6 Распределение Пуассона
определение: Описание происходит за единицу времени. ккк Вероятность события, средняя частота возникновения события, равна λ.
формула: X ∼ Пуассона ( λ ) X sim text{Пуассона}(лямбда)Икс∼Пуассон(λ)
Функция массы вероятности (PMF): P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}п(Икс=к)=к!λке−λ
Кумулятивная функция распределения (CDF): F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} сумма_{i=0}^{k} дробь{lambda^i}{i!}Ф(Икс=к)=е−λ∑я=0кя!λя
геометрическое распределение— это распределение числа испытаний, необходимых для достижения первого успеха, которое можно рассматривать какбиномиальное распределениерасширение.
отрицательное биномиальное распределениеможно рассматривать какгеометрическое распределениеОбобщение , используемое для описания количества неудач, необходимых для достижения r успехов.
гипергеометрическое распределениеПохожий набиномиальное распределение, но подходит для конечных популяций и выборки без замены.
распределение Пуассонадабиномиальное распределениеПредельный случай ннн очень большой и стр.п очень молодой и λ = нп лямбда = нпλ=нп держитесь постоянным.
3. Непрерывное распределение вероятностей
3.1 Экспоненциальное распределение
определение: Экспоненциальное распределение — это непрерывное распределение вероятностей, часто используемое для описания временных интервалов между независимыми событиями.
формула: X ∼ Экспоненциальный ( λ ) X sim text{Экспоненциальный}(лямбда)Икс∼Экспоненциальный(λ),в λ > 0 лямбда>0λ>0 параметр скорости
Функция плотности вероятности (PDF): f ( x ; λ ) = λ e − λ x для x ≥ 0 f(x; лямбда) = лямбда e^{-лямбда x} quad text{for } x geq 0ф(Икс;λ)=λе−λИксдляИкс≥0
Кумулятивная функция распределения (CDF): F ( x ; λ ) = 1 − e − λ x для x ≥ 0 F(x; лямбда) = 1 - e^{-лямбда x} quad text{for } x geq 0Ф(Икс;λ)=1−е−λИксдляИкс≥0
3.2 Гамма-распределение
определение: Описывает накопление времени ожидания и является обобщением экспоненциального распределения и распределения χ².
формула: X ∼ Гамма ( k , θ ) X sim text{Gamma}(k, theta)Икс∼Гамма(к,θ),в к > 0 к>0к>0 параметр формы, θ > 0 тета>0θ>0 параметр масштаба
Функция плотности вероятности (PDF): f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) для x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{for } x geq 0ф(Икс;к,θ)=θкΓ(к)Икск−1е−Икс/θдляИкс≥0,в Γ (k) Гамма(k)Γ(к) это гамма-функция
Кумулятивная функция распределения (CDF): F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}Ф(Икс;к,θ)=Γ(к)γ(к,Икс/θ),в γ ( k , x / θ ) гамма(k, x/тета)γ(к,Икс/θ) является неполной гамма-функцией.
3.3 Нормальное распределение
определение: Описывает распределение суммы большого количества независимых случайных величин и широко используется в естественных и социальных науках.
формула: X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)Икс∼Н(μ,σ2),в, μ мюμ это среднее значение, σ 2 сигма^2σ2 это дисперсия
Функция плотности вероятности (PDF): f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}ф(Икс;μ,σ2)=2πσ21е−2σ2(Икс−μ)2
Кумулятивная функция распределения (CDF): F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}left[1 + имя_оператора{erf}left(frac{x-mu}{sqrt{2sigma^2}}right)right]Ф(Икс;μ,σ2)=21[1+ерф(2σ2Икс−μ)], где erf — функция ошибок.
3.4 t-распределение
определение: используется для проверки гипотез и оценки доверительного интервала в ситуациях с небольшой выборкой.
формула: X ∼ t ( ν ) X сим t(nu)Икс∼т(ν),в, ν нюν это степень свободы
Кумулятивная функция распределения (CDF): F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} duФ(т;ν)=21+тπνΓ(2ν)Γ(2ν+1)∫0т(1+νты2)−2ν+1гты
3.5 Распределение хи-квадрат
определение: Обычно используется для проверки гипотез и дисперсионного анализа.
формула: X ∼ χ 2 ( k ) X сим хи^2(k)Икс∼χ2(к),в ккк это степень свободы
Функция плотности вероятности (PDF): f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 для x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{for } x geq 0ф(Икс;к)=2к/2Γ(к/2)1Икск/2−1е−Икс/2дляИкс≥0
Кумулятивная функция распределения (CDF): F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}right)}{Gammaleft(frac{k}{2}right)}Ф(Икс;к)=Γ(2к)γ(2к,2Икс)
3.6 F-распределение
определение: используется для сравнения дисперсии двух выборок.
формула: X ∼ F ( d 1 , d 2 ) X сим F(d_1, d_2)Икс∼Ф(г1,г2),в д 1 д_1г1 и д 2 д_2г2 это степень свободы
Функция плотности вероятности (PDF): f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) для x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{for } x geq 0ф(Икс;г1,г2)=ИксБ(2г1,2г2)(г1Икс+г2)г1+г2(г1Икс)г1г2г2дляИкс≥0,в ВВБ это бета-функция
Кумулятивная функция распределения (CDF): F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}влево(frac{d_1}{2}, frac{d_2}{2}вправо)Ф(Икс;г1,г2)=яг1Икс+г2г1Икс(2г1,2г2),в IIя это неполная бета-функция
3.7 Отношения между ними
Распределение хи-квадратсумма квадратов нормального распределения . Например, ккк Сумма квадратов независимых стандартных нормальных переменных подчиняется степеням свободы как ккк распределение хи-квадрат.
Распределение t находится вПостроено на основе стандартного нормального распределения и распределения хи-квадрат. из. В частности, t-распределение можно получить путем деления стандартной нормальной переменной на квадратный корень из ее независимой переменной распределения хи-квадрат.
Распределение FРасширение отношения двух независимых распределенных переменных хи-квадрат . Распределение F используется для сравнения двух дисперсий и строится путем определения отношения двух распределенных переменных хи-квадрат.