Condivisione della tecnologia

[Statistica matematica] 2-Variabili aleatorie e loro distribuzioni di probabilità

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Definizione e classificazione delle variabili casuali

Definizione: una variabile casuale è una variabile che assume valori diversi in un esperimento casuale.

  1. Variabile casuale categoriale (Nominale)

    • Esempio: sesso (maschio, femmina), professione (funzionario pubblico, dipendente aziendale, studente, pensionato, disoccupato), risultato del test (negativo, positivo)
  2. Variabile casuale categorica ordinata (ordinata)

    • Esempi: atteggiamento (fortemente d'accordo, d'accordo, neutrale, in disaccordo, fortemente in disaccordo), frequenza d'uso (una volta alla settimana, una volta ogni due settimane, una volta ogni sei mesi, quasi mai, mai)
  3. Variabile casuale numerica

    • Esempio: Età (13, 14, 15, 16...), reddito (è possibile inserire qualsiasi valore)

2. Distribuzione discreta di probabilità

2.1 Distribuzione binomiale

  • definizione: descritto in non-negligenzaN Successo in studi indipendenti ciaoK La probabilità di successo in ogni prova è ppP
  • formula X ∼ Bin ( n , p ) X testo sim{Bin}(n, p)XBidone(N,P)
  • Funzione di massa di probabilità (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}P(X=K)=(KN)PK(1P)NK
  • Funzione di distribuzione cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = somma_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}F(X=K)=ioooooooooooooo=0K(iooooooooooooooN)Pioooooooooooooo(1P)Nioooooooooooooo

2.2 Distribuzione di Bernoulli

  • definizione: Descrive la probabilità di successo (o fallimento) in un esperimento ppP
  • formula X ∼ Berna ( p ) X sim testo{Berna}(p)XBerna(P)
  • Funzione di massa di probabilità (PMF) P ( X = x ) = { p se x = 1 1 − p se x = 0 P(X = x) ={PSeX=11PSeX=0 P(X=X)={P1PSeX=1SeX=0
  • Funzione di distribuzione cumulativa (CDF) F ( X = x ) = { 0 se x &lt; 0 1 − p se 0 ≤ x &lt; 1 1 se x ≥ 1 F(X = x) ={0SeX<01PSe0X<11SeX1 F(X=X)= 01P1SeX<0Se0X<1SeX1

2.3 Distribuzione geometrica

  • definizione: Descrive la probabilità del numero di fallimenti prima del primo successo. La probabilità di successo in ogni prova è ppP
  • formula X ∼ Geom ( p ) X sim testo{Geom}(p)XGeometra(P)
  • Funzione di massa di probabilità (PMF) P(X = k) = (1 − p) kp P(X = k) = (1-p)^kpP(X=K)=(1P)KP
  • Funzione di distribuzione cumulativa (CDF) F(X = k) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=K)=1(1P)K+1

2.4 Distribuzione binomiale negativa

  • definizione: Descrive il numero di fallimenti prima di raggiungere l'resimo successo. La probabilità di successo per ogni prova è ppP
  • formula X ∼ NegBin ( r , p ) X testo sim{NegBin}(r, p)XNegativo(R,P)
  • Funzione di massa di probabilità (PMF) P(X = k) = ( k + r − 1 k ) pr( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kP(X=K)=(KK+R1)PR(1P)K
  • Funzione di distribuzione cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = somma_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iF(X=K)=ioooooooooooooo=0K(iooooooooooooooioooooooooooooo+R1)PR(1P)ioooooooooooooo

2.5 Distribuzione ipergeometrica

  • definizione: Descrive il campionamento da una popolazione finita senza sostituzione non-negligenzaN volte, con successo ciaoK volte probabilità.
  • formula X ∼ Ipergeometria ( N , K , n ) X sim text{Ipergeometria}(N, K, n)XIpergeo(N,K,N)
  • Funzione di massa di probabilità (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}P(X=K)=(NN)(KK)(NKNK)
  • Funzione di distribuzione cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = somma_{i=0}^{k} frazione{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=K)=ioooooooooooooo=0K(NN)(iooooooooooooooK)(NiooooooooooooooNK)

2.6 Distribuzione di Poisson

  • definizione: La descrizione avviene entro l'unità di tempo ciaoK La probabilità di un evento, il tasso medio di accadimento dell'evento è λ.
  • formula X ∼ Poisson ( λ ) X sim testo{Poisson}(lambda)XPesce(λ)
  • Funzione di massa di probabilità (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=K)=K!λKeλ
  • Funzione di distribuzione cumulativa (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} somma_{i=0}^{k} frazione{lambda^i}{i!}F(X=K)=eλioooooooooooooo=0Kioooooooooooooo!λioooooooooooooo

2.7 Rapporto tra loro

  • Distribuzione di Bernoulliè uno specialedistribuzione binomiale,Quando n = 1 n = 1N=1 ora.
  • distribuzione geometricaè la distribuzione del numero di prove richieste prima del primo successo, che può essere vista comedistribuzione binomialeestensione.
  • distribuzione binomiale negativapuò essere visto comedistribuzione geometricaGeneralizzazione di , utilizzata per descrivere il numero di fallimenti richiesti prima di r successi.
  • distribuzione ipergeometricaSimile adistribuzione binomiale, ma adatto per popolazioni finite e campionamento senza sostituzione.
  • Distribuzione di Poissondistribuzione binomialeIl caso limite di non-negligenzaN molto grande e ppP molto giovane, e λ = np lambda = npλ=NP mantenersi costante.

3. Distribuzione continua di probabilità

3.1 Distribuzione esponenziale

  • definizione: La distribuzione esponenziale è una distribuzione di probabilità continua spesso utilizzata per descrivere gli intervalli di tempo tra eventi indipendenti.

  • formula X ∼ Esponenziale ( λ ) X sim text{Esponenziale}(lambda)XEsponenziale(λ),In λ &gt; 0 lambda&gt;0λ>0 è il parametro della velocità

  • Funzione di densità di probabilità (PDF) f ( x ; λ ) = λ e − λ x per x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{per } x geq 0F(X;λ)=λeλXperX0

  • Funzione di distribuzione cumulativa (CDF) F ( x ; λ ) = 1 − e − λ x per x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{per } x geq 0F(X;λ)=1eλXperX0

3.2 Distribuzione gamma

  • definizione: Descrive l'accumulo del tempo di attesa ed è una generalizzazione della distribuzione esponenziale e della distribuzione χ².

  • formula X ∼ Gamma ( k , θ ) X testo sim{Gamma}(k, theta)XGamma(K,θ),In k &gt; 0 k&gt;0K>0 è il parametro di forma, θ &gt; 0 theta&gt;0θ>0 è il parametro di scala

  • Funzione di densità di probabilità (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) per x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{per } x geq 0F(X;K,θ)=θKΓ(K)XK1eX/θperX0,In Γ ( k ) Gamma( k )Γ(K) è la funzione gamma

  • Funzione di distribuzione cumulativa (CDF) F(x; k, θ) = γ(k, x/θ) Γ(k) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}F(X;K,θ)=Γ(K)γ(K,X/θ),In γ ( k , x / θ ) gamma( k , x/theta)γ(K,X/θ) è una funzione gamma incompleta.

3.3 Distribuzione normale

  • definizione: Descrive la distribuzione della somma di un gran numero di variabili casuali indipendenti ed è ampiamente utilizzato nelle scienze naturali e nelle scienze sociali.

  • formula X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)XN(μ,σ2),In, mi muμ è il valore medio, σ 2 sigma^2σ2 è la varianza

  • Funzione di densità di probabilità (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}F(X;μ,σ2)=2πσ2 1e2σ2(Xμ)2

  • Funzione di distribuzione cumulativa (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}sinistra[1 + nomeoperatore{erf}sinistra(frac{x-mu}{sqrt{2sigma^2}}destra)destra]F(X;μ,σ2)=21[1+uomo(2σ2 Xμ)], dove erf è la funzione di errore.

3.4 t-Distribuzione

  • definizione: Utilizzato per la verifica delle ipotesi e la stima dell'intervallo di confidenza in situazioni di campioni ridotti.

  • formula X ∼ t ( ν ) X sim t(nu)XT(ν),In, non oraν è il grado di libertà

  • Funzione di densità di probabilità (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}destra)}{sqrt{nupi} Gammaleft(frac{nu}{2}destra)} sinistra(1 + frac{t^2}{nu}destra)^{-frac{nu+1}{2}}F(T;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νT2)2ν+1

  • Funzione di distribuzione cumulativa (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}destra)}{sqrt{pi nu} Gammaleft(frac{nu}{2}destra)} int_0^{t} sinistra(1 + frac{u^2}{nu}destra)^{-frac{nu+1}{2}} duF(T;ν)=21+Tπν Γ(2ν)Γ(2ν+1)0T(1+νio2)2ν+1Dio

3.5 Distribuzione chi-quadrato

  • definizione: Comunemente utilizzato per la verifica delle ipotesi e l'analisi della varianza.

  • formula X ∼ χ 2 ( k ) X sim chi^2(k)Xχ2(K),In ciaoK è il grado di libertà

  • Funzione di densità di probabilità (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 per x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{per } x geq 0F(X;K)=2K/2Γ(K/2)1XK/21eX/2perX0

  • Funzione di distribuzione cumulativa (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammasinistra(frac{k}{2}, frac{x}{2}destra)}{Gammasinistra(frac{k}{2}destra)}F(X;K)=Γ(2K)γ(2K,2X)

3.6 Distribuzione F

  • definizione: Utilizzato per confrontare la varianza di due campioni.

  • formula X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)XF(D1,D2),In il 1 il_1D1 E e 2 e 2D2 è il grado di libertà

  • Funzione di densità di probabilità (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) per x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac{d_1}{2}, frac{d_2}{2}right)} quad text{per } x geq 0F(X;D1,D2)=XB(2D1,2D2)(D1X+D2)D1+D2(D1X)D1D2D2 perX0,In BBB è una funzione beta

  • Funzione di distribuzione cumulativa (CDF) F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F ( x ; d_1, d_2 ) = I_{frac{d_1 x}{d_1 x + d_2}} sinistra (frac{d_1}{2}, frac{d_2}{2} destra )F(X;D1,D2)=IOOD1X+D2D1X(2D1,2D2),In Io sonoIOO è una funzione beta incompleta

3.7 Rapporto tra loro

  • La distribuzione chi-quadrato èSomma dei quadrati della distribuzione normale . Per esempio, ciaoK La somma dei quadrati delle variabili normali standard indipendenti obbedisce ai gradi di libertà di ciaoK distribuzione chi quadrato.
  • La distribuzione t è presenteCostruito sulla base della distribuzione normale standard e della distribuzione chi-quadrato Di. Nello specifico, la distribuzione t può essere ottenuta dividendo una variabile normale standard per la radice quadrata della sua variabile di distribuzione chi-quadrato indipendente.
  • La distribuzione F èEstensione del rapporto tra due variabili distribuite chi-quadrato indipendenti . La distribuzione F viene utilizzata per confrontare due varianze ed è costruita prendendo il rapporto di due variabili distribuite chi-quadrato.