Technologieaustausch

[Mathematische Statistik] 2-Zufallsvariablen und ihre Wahrscheinlichkeitsverteilungen

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Definition und Klassifizierung von Zufallsvariablen

Definition: Eine Zufallsvariable ist eine Variable, die in einem Zufallsexperiment unterschiedliche Werte annimmt.

  1. Kategoriale Zufallsvariable (Nominal)

    • Beispiel: Geschlecht (männlich, weiblich), Beruf (Beamter, Angestellter, Student, Rentner, arbeitslos), Testergebnis (negativ, positiv)
  2. Geordnete kategoriale Zufallsvariable (geordnet)

    • Beispiele: Einstellung (stimme völlig zu, stimme zu, neutral, stimme nicht zu, stimme überhaupt nicht zu), Häufigkeit der Nutzung (einmal pro Woche, einmal alle zwei Wochen, einmal alle sechs Monate, fast nie, nie)
  3. Numerische Zufallsvariable

    • Beispiel: Alter (13, 14, 15, 16...), Einkommen (Sie können einen beliebigen Wert eingeben)

2. Diskrete Wahrscheinlichkeitsverteilung

2.1 Binomialverteilung

  • Definition: beschrieben in neinN Erfolgreich in unabhängigen Studien k.k.k Die Wahrscheinlichkeit, dass jeder Versuch erfolgreich ist, beträgt ppP
  • Formel X ∼ Bin ( n , p ) X sim text{Bin}(n, p)XBehälter(N,P)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}P(X=k)=(kN)Pk(1P)Nk
  • Kumulative Verteilungsfunktion (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = Summe_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}F(X=k)=ichchchchchchchchchchchchchch=0k(ichchchchchchchchchchchchchchN)Pichchchchchchchchchchchchchch(1P)Nichchchchchchchchchchchchchch

2.2 Bernoulli-Verteilung

  • Definition: Beschreibt die Erfolgswahrscheinlichkeit (oder Misserfolgswahrscheinlichkeit) eines Experiments ppP
  • Formel X ∼ Bern ( p ) X sim text{Bern}(p)XBern(P)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = x ) = { p wenn x = 1 1 − p wenn x = 0 P(X = x) ={PWennX=11PWennX=0 P(X=X)={P1PWennX=1WennX=0
  • Kumulative Verteilungsfunktion (CDF) F ( X = x ) = { 0 wenn x &lt; 0 1 − p wenn 0 ≤ x &lt; 1 1 wenn x ≥ 1 F(X = x) ={0WennX<01PWenn0X<11WennX1 F(X=X)= 01P1WennX<0Wenn0X<1WennX1

2.3 Geometrische Verteilung

  • Definition: Beschreibt die Wahrscheinlichkeit der Anzahl der Fehlschläge vor dem ersten Erfolg. Die Erfolgswahrscheinlichkeit in jedem Versuch beträgt ppP
  • Formel X ∼ Geom ( p ) X sim text{Geom}(p)XGeom(P)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=k)=(1P)kP
  • Kumulative Verteilungsfunktion (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=k)=1(1P)k+1

2.4 Negative Binomialverteilung

  • Definition: Beschreibt die Anzahl der Fehler, bevor der r-te Erfolg erreicht wird. Die Erfolgswahrscheinlichkeit für jeden Versuch beträgt ppP
  • Formel X ∼ NegBin ( r , p ) X sim text{NegBin}(r, p)XNegBin(R,P)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kP(X=k)=(kk+R1)PR(1P)k
  • Kumulative Verteilungsfunktion (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = Summe_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iF(X=k)=ichchchchchchchchchchchchchch=0k(ichchchchchchchchchchchchchchichchchchchchchchchchchchchch+R1)PR(1P)ichchchchchchchchchchchchchch

2.5 Hypergeometrische Verteilung

  • Definition: Beschreibt die ersatzlose Stichprobe aus einer endlichen Grundgesamtheit neinN mal erfolgreich k.k.k mal Wahrscheinlichkeit.
  • Formel X ∼ Hypergeom ( N , K , n ) X sim text{Hypergeom}(N, K, n)XHypergeom(N,K,N)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}P(X=k)=(NN)(kK)(NkNK)
  • Kumulative Verteilungsfunktion (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = Summe_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=k)=ichchchchchchchchchchchchchch=0k(NN)(ichchchchchchchchchchchchchchK)(NichchchchchchchchchchchchchchNK)

2.6 Poisson-Verteilung

  • Definition: Die Beschreibung erfolgt innerhalb der Zeiteinheit k.k.k Die Wahrscheinlichkeit eines Ereignisses, die durchschnittliche Häufigkeit des Auftretens eines Ereignisses, beträgt λ.
  • Formel X ∼ Poisson ( λ ) X sim text{Poisson}(lambda)XPoisson(λ)
  • Wahrscheinlichkeitsmassenfunktion (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=k)=k!λktλ
  • Kumulative Verteilungsfunktion (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} sum_{i=0}^{k} frac{lambda^i}{i!}F(X=k)=tλichchchchchchchchchchchchchch=0kichchchchchchchchchchchchchch!λichchchchchchchchchchchchchch

2.7 Beziehung zwischen ihnen

  • Bernoulli-Verteilungist etwas BesonderesBinomialverteilung,Wann n = 1 n = 1N=1 Stunde.
  • geometrische Verteilungist die Verteilung der Anzahl der Versuche, die bis zum ersten Erfolg erforderlich sind, und kann als angesehen werdenBinomialverteilungVerlängerung.
  • negative Binomialverteilungkann gesehen werden alsgeometrische VerteilungVerallgemeinerung von , wird verwendet, um die Anzahl der erforderlichen Fehler zu beschreiben, bevor r Erfolge erzielt werden.
  • hypergeometrische VerteilungÄhnlich zuBinomialverteilung, aber geeignet für endliche Populationen und ersatzlose Probenahme.
  • Poisson-VerteilungJaBinomialverteilungDer Grenzfall von neinN sehr groß und ppP sehr jung, und λ = np lambda = npλ=NP konstant halten.

3. Kontinuierliche Wahrscheinlichkeitsverteilung

3.1 Exponentielle Verteilung

  • Definition: Die Exponentialverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung, die häufig zur Beschreibung der Zeitintervalle zwischen unabhängigen Ereignissen verwendet wird.

  • Formel X ∼ Exponential ( λ ) X sim text{Exponential}(lambda)XExponentiell(λ),In λ &gt; 0 lambda&gt;0λ>0 ist der Geschwindigkeitsparameter

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( x ; λ ) = λ e − λ x für x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{für } x geq 0F(X;λ)=λtλXfürX0

  • Kumulative Verteilungsfunktion (CDF) F ( x ; λ ) = 1 − e − λ x für x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{für } x geq 0F(X;λ)=1tλXfürX0

3.2 Gammaverteilung

  • Definition: Beschreibt die Akkumulation der Wartezeit und ist eine Verallgemeinerung der Exponentialverteilung und der χ²-Verteilung.

  • Formel X ∼ Gamma ( k , θ ) X sim text{Gamma}(k, theta)XGamma(k,θ),In k &gt; 0 k&gt;0k>0 ist der Formparameter, θ &gt; 0 theta&gt;0θ>0 ist der Skalenparameter

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) für x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{für } x geq 0F(X;k,θ)=θkΓ(k)Xk1tX/θfürX0,In Γ ( k ) Gamma(k)Γ(k) ist die Gammafunktion

  • Kumulative Verteilungsfunktion (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}F(X;k,θ)=Γ(k)γ(k,X/θ),In γ ( k , x / θ ) gamma(k, x/theta)γ(k,X/θ) ist eine unvollständige Gammafunktion.

3.3 Normalverteilung

  • Definition: Beschreibt die Verteilung der Summe einer großen Anzahl unabhängiger Zufallsvariablen und wird häufig in den Natur- und Sozialwissenschaften verwendet.

  • Formel X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)XN(μ,σ2),In, μ muμ ist der Mittelwert, σ 2 Sigma ^ 2σ2 ist die Varianz

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}F(X;μ,σ2)=2πσ2 1t2σ2(Xμ)2

  • Kumulative Verteilungsfunktion (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}links[1 + operatorname{erf}links(frac{x-mu}{sqrt{2sigma^2}}rechts)rechts]F(X;μ,σ2)=21[1+erf(2σ2 Xμ)], wobei erf die Fehlerfunktion ist.

3.4 t-Verteilung

  • Definition: Wird zum Testen von Hypothesen und zur Schätzung des Konfidenzintervalls in Situationen mit kleinen Stichproben verwendet.

  • Formel X ∼ t ( ν ) X sim t(nu)XT(ν),In, ν nuν ist der Freiheitsgrad

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}right)}{sqrt{nupi} Gammaleft(frac{nu}{2}right)} left(1 + frac{t^2}{nu}right)^{-frac{nu+1}{2}}F(T;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νT2)2ν+1

  • Kumulative Verteilungsfunktion (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}right)}{sqrt{pi nu} Gammaleft(frac{nu}{2}right)} int_0^{t} left(1 + frac{u^2}{nu}right)^{-frac{nu+1}{2}} duF(T;ν)=21+Tπν Γ(2ν)Γ(2ν+1)0T(1+νSie2)2ν+1DSie

3.5 Chi-Quadrat-Verteilung

  • Definition: Wird häufig zum Testen von Hypothesen und zur Varianzanalyse verwendet.

  • Formel X ∼ χ 2 ( k ) X sim chi^2(k)Xχ2(k),In k.k.k ist der Freiheitsgrad

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 für x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{für } x geq 0F(X;k)=2k/2Γ(k/2)1Xk/21tX/2fürX0

  • Kumulative Verteilungsfunktion (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}right)}{Gammaleft(frac{k}{2}right)}F(X;k)=Γ(2k)γ(2k,2X)

3.6 F-Verteilung

  • Definition: Wird zum Vergleich der Varianz zweier Stichproben verwendet.

  • Formel X ∼ F ( d1, d2) X sim F(d_1, d_2)XF(D1,D2),In d_1D1 Und d 2 d_2D2 ist der Freiheitsgrad

  • Wahrscheinlichkeitsdichtefunktion (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) für x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{für } x geq 0F(X;D1,D2)=XB(2D1,2D2)(D1X+D2)D1+D2(D1X)D1D2D2 fürX0,In BBB ist eine Beta-Funktion

  • Kumulative Verteilungsfunktion (CDF) F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}links(frac{d_1}{2}, frac{d_2}{2}rechts)F(X;D1,D2)=ICHCHD1X+D2D1X(2D1,2D2),In IIICHCH ist eine unvollständige Betafunktion

3.7 Beziehung zwischen ihnen

  • Die Chi-Quadrat-Verteilung istSumme der Quadrate der Normalverteilung . Zum Beispiel, k.k.k Die Summe der Quadrate unabhängiger Standardnormalvariablen gehorcht den Freiheitsgraden als k.k.k Chi-Quadrat-Verteilung.
  • Die t-Verteilung ist inKonstruiert auf der Grundlage der Standardnormalverteilung und der Chi-Quadrat-Verteilung von. Konkret lässt sich die t-Verteilung ermitteln, indem man eine Standardnormalvariable durch die Quadratwurzel ihrer unabhängigen Chi-Quadrat-Verteilungsvariablen dividiert.
  • Die F-Verteilung istErweiterung des Verhältnisses zweier unabhängiger Chi-Quadrat-verteilter Variablen . Die F-Verteilung wird zum Vergleich zweier Varianzen verwendet und wird aus dem Verhältnis zweier Chi-Quadrat-verteilter Variablen erstellt.