Beispiele: Einstellung (stimme völlig zu, stimme zu, neutral, stimme nicht zu, stimme überhaupt nicht zu), Häufigkeit der Nutzung (einmal pro Woche, einmal alle zwei Wochen, einmal alle sechs Monate, fast nie, nie)
Numerische Zufallsvariable
Beispiel: Alter (13, 14, 15, 16...), Einkommen (Sie können einen beliebigen Wert eingeben)
2. Diskrete Wahrscheinlichkeitsverteilung
2.1 Binomialverteilung
Definition: beschrieben in neinN Erfolgreich in unabhängigen Studien k.k.k Die Wahrscheinlichkeit, dass jeder Versuch erfolgreich ist, beträgt ppP。
Formel: X ∼ Bin ( n , p ) X sim text{Bin}(n, p)X∼Behälter(N,P)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}P(X=k)=(kN)Pk(1−P)N−k
Kumulative Verteilungsfunktion (CDF): F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = Summe_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}F(X=k)=∑ichchchchchchchchchchchchchch=0k(ichchchchchchchchchchchchchchN)Pichchchchchchchchchchchchchch(1−P)N−ichchchchchchchchchchchchchch
2.2 Bernoulli-Verteilung
Definition: Beschreibt die Erfolgswahrscheinlichkeit (oder Misserfolgswahrscheinlichkeit) eines Experiments ppP。
Formel: X ∼ Bern ( p ) X sim text{Bern}(p)X∼Bern(P)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = x ) = { p wenn x = 1 1 − p wenn x = 0 P(X = x) ={PWennX=11−PWennX=0P(X=X)={P1−PWennX=1WennX=0
Kumulative Verteilungsfunktion (CDF): F ( X = x ) = { 0 wenn x < 0 1 − p wenn 0 ≤ x < 1 1 wenn x ≥ 1 F(X = x) ={0WennX<01−PWenn0≤X<11WennX≥1F(X=X)=⎩⎨⎧01−P1WennX<0Wenn0≤X<1WennX≥1
2.3 Geometrische Verteilung
Definition: Beschreibt die Wahrscheinlichkeit der Anzahl der Fehlschläge vor dem ersten Erfolg. Die Erfolgswahrscheinlichkeit in jedem Versuch beträgt ppP。
Formel: X ∼ Geom ( p ) X sim text{Geom}(p)X∼Geom(P)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=k)=(1−P)kP
Kumulative Verteilungsfunktion (CDF): F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=k)=1−(1−P)k+1
2.4 Negative Binomialverteilung
Definition: Beschreibt die Anzahl der Fehler, bevor der r-te Erfolg erreicht wird. Die Erfolgswahrscheinlichkeit für jeden Versuch beträgt ppP。
Formel: X ∼ NegBin ( r , p ) X sim text{NegBin}(r, p)X∼NegBin(R,P)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kP(X=k)=(kk+R−1)PR(1−P)k
Kumulative Verteilungsfunktion (CDF): F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = Summe_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iF(X=k)=∑ichchchchchchchchchchchchchch=0k(ichchchchchchchchchchchchchchichchchchchchchchchchchchchch+R−1)PR(1−P)ichchchchchchchchchchchchchch
2.5 Hypergeometrische Verteilung
Definition: Beschreibt die ersatzlose Stichprobe aus einer endlichen Grundgesamtheit neinN mal erfolgreich k.k.k mal Wahrscheinlichkeit.
Formel: X ∼ Hypergeom ( N , K , n ) X sim text{Hypergeom}(N, K, n)X∼Hypergeom(N,K,N)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}P(X=k)=(NN)(kK)(N−kN−K)
Kumulative Verteilungsfunktion (CDF): F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = Summe_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=k)=∑ichchchchchchchchchchchchchch=0k(NN)(ichchchchchchchchchchchchchchK)(N−ichchchchchchchchchchchchchchN−K)
2.6 Poisson-Verteilung
Definition: Die Beschreibung erfolgt innerhalb der Zeiteinheit k.k.k Die Wahrscheinlichkeit eines Ereignisses, die durchschnittliche Häufigkeit des Auftretens eines Ereignisses, beträgt λ.
Formel: X ∼ Poisson ( λ ) X sim text{Poisson}(lambda)X∼Poisson(λ)
Wahrscheinlichkeitsmassenfunktion (PMF): P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=k)=k!λkt−λ
Kumulative Verteilungsfunktion (CDF): F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} sum_{i=0}^{k} frac{lambda^i}{i!}F(X=k)=t−λ∑ichchchchchchchchchchchchchch=0kichchchchchchchchchchchchchch!λichchchchchchchchchchchchchch
2.7 Beziehung zwischen ihnen
Bernoulli-Verteilungist etwas BesonderesBinomialverteilung,Wann n = 1 n = 1N=1 Stunde.
geometrische Verteilungist die Verteilung der Anzahl der Versuche, die bis zum ersten Erfolg erforderlich sind, und kann als angesehen werdenBinomialverteilungVerlängerung.
negative Binomialverteilungkann gesehen werden alsgeometrische VerteilungVerallgemeinerung von , wird verwendet, um die Anzahl der erforderlichen Fehler zu beschreiben, bevor r Erfolge erzielt werden.
hypergeometrische VerteilungÄhnlich zuBinomialverteilung, aber geeignet für endliche Populationen und ersatzlose Probenahme.
Poisson-VerteilungJaBinomialverteilungDer Grenzfall von neinN sehr groß und ppP sehr jung, und λ = np lambda = npλ=NP konstant halten.
3. Kontinuierliche Wahrscheinlichkeitsverteilung
3.1 Exponentielle Verteilung
Definition: Die Exponentialverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung, die häufig zur Beschreibung der Zeitintervalle zwischen unabhängigen Ereignissen verwendet wird.
Formel: X ∼ Exponential ( λ ) X sim text{Exponential}(lambda)X∼Exponentiell(λ),In λ > 0 lambda>0λ>0 ist der Geschwindigkeitsparameter
Wahrscheinlichkeitsdichtefunktion (PDF): f ( x ; λ ) = λ e − λ x für x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{für } x geq 0F(X;λ)=λt−λXfürX≥0
Kumulative Verteilungsfunktion (CDF): F ( x ; λ ) = 1 − e − λ x für x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{für } x geq 0F(X;λ)=1−t−λXfürX≥0
3.2 Gammaverteilung
Definition: Beschreibt die Akkumulation der Wartezeit und ist eine Verallgemeinerung der Exponentialverteilung und der χ²-Verteilung.
Formel: X ∼ Gamma ( k , θ ) X sim text{Gamma}(k, theta)X∼Gamma(k,θ),In k > 0 k>0k>0 ist der Formparameter, θ > 0 theta>0θ>0 ist der Skalenparameter
Wahrscheinlichkeitsdichtefunktion (PDF): f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) für x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{für } x geq 0F(X;k,θ)=θkΓ(k)Xk−1t−X/θfürX≥0,In Γ ( k ) Gamma(k)Γ(k) ist die Gammafunktion
Kumulative Verteilungsfunktion (CDF): F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}F(X;k,θ)=Γ(k)γ(k,X/θ),In γ ( k , x / θ ) gamma(k, x/theta)γ(k,X/θ) ist eine unvollständige Gammafunktion.
3.3 Normalverteilung
Definition: Beschreibt die Verteilung der Summe einer großen Anzahl unabhängiger Zufallsvariablen und wird häufig in den Natur- und Sozialwissenschaften verwendet.
Formel: X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)X∼N(μ,σ2),In, μ muμ ist der Mittelwert, σ 2 Sigma ^ 2σ2 ist die Varianz
Wahrscheinlichkeitsdichtefunktion (PDF): f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}F(X;μ,σ2)=2πσ21t−2σ2(X−μ)2
Kumulative Verteilungsfunktion (CDF): F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}links[1 + operatorname{erf}links(frac{x-mu}{sqrt{2sigma^2}}rechts)rechts]F(X;μ,σ2)=21[1+erf(2σ2X−μ)], wobei erf die Fehlerfunktion ist.
3.4 t-Verteilung
Definition: Wird zum Testen von Hypothesen und zur Schätzung des Konfidenzintervalls in Situationen mit kleinen Stichproben verwendet.
Formel: X ∼ t ( ν ) X sim t(nu)X∼T(ν),In, ν nuν ist der Freiheitsgrad
Kumulative Verteilungsfunktion (CDF): F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} duF(T;ν)=21+TπνΓ(2ν)Γ(2ν+1)∫0T(1+νSie2)−2ν+1DSie
3.5 Chi-Quadrat-Verteilung
Definition: Wird häufig zum Testen von Hypothesen und zur Varianzanalyse verwendet.
Formel: X ∼ χ 2 ( k ) X sim chi^2(k)X∼χ2(k),In k.k.k ist der Freiheitsgrad
Wahrscheinlichkeitsdichtefunktion (PDF): f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 für x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{für } x geq 0F(X;k)=2k/2Γ(k/2)1Xk/2−1t−X/2fürX≥0
Kumulative Verteilungsfunktion (CDF): F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}right)}{Gammaleft(frac{k}{2}right)}F(X;k)=Γ(2k)γ(2k,2X)
3.6 F-Verteilung
Definition: Wird zum Vergleich der Varianz zweier Stichproben verwendet.
Formel: X ∼ F ( d1, d2) X sim F(d_1, d_2)X∼F(D1,D2),In d_1D1 Und d 2 d_2D2 ist der Freiheitsgrad
Wahrscheinlichkeitsdichtefunktion (PDF): f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) für x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{für } x geq 0F(X;D1,D2)=XB(2D1,2D2)(D1X+D2)D1+D2(D1X)D1D2D2fürX≥0,In BBB ist eine Beta-Funktion
Kumulative Verteilungsfunktion (CDF): F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}links(frac{d_1}{2}, frac{d_2}{2}rechts)F(X;D1,D2)=ICHCHD1X+D2D1X(2D1,2D2),In IIICHCH ist eine unvollständige Betafunktion
3.7 Beziehung zwischen ihnen
Die Chi-Quadrat-Verteilung istSumme der Quadrate der Normalverteilung . Zum Beispiel, k.k.k Die Summe der Quadrate unabhängiger Standardnormalvariablen gehorcht den Freiheitsgraden als k.k.k Chi-Quadrat-Verteilung.
Die t-Verteilung ist inKonstruiert auf der Grundlage der Standardnormalverteilung und der Chi-Quadrat-Verteilung von. Konkret lässt sich die t-Verteilung ermitteln, indem man eine Standardnormalvariable durch die Quadratwurzel ihrer unabhängigen Chi-Quadrat-Verteilungsvariablen dividiert.
Die F-Verteilung istErweiterung des Verhältnisses zweier unabhängiger Chi-Quadrat-verteilter Variablen . Die F-Verteilung wird zum Vergleich zweier Varianzen verwendet und wird aus dem Verhältnis zweier Chi-Quadrat-verteilter Variablen erstellt.