Partage de technologie

[Statistiques mathématiques] 2-Variables aléatoires et leurs distributions de probabilité

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Définition et classification des variables aléatoires

Définition : Une variable aléatoire est une variable qui prend différentes valeurs dans une expérience aléatoire.

  1. Variable aléatoire catégorielle (nominale)

    • Exemple : sexe (homme, femme), profession (fonctionnaire, employé d'entreprise, étudiant, retraité, chômeur), résultat du test (négatif, positif)
  2. Variable aléatoire catégorielle ordonnée (Ordonné)

    • Exemples : attitude (tout à fait d'accord, d'accord, neutre, en désaccord, fortement en désaccord), fréquence d'utilisation (une fois par semaine, une fois toutes les deux semaines, une fois tous les six mois, presque jamais, jamais)
  3. Variable aléatoire numérique

    • Exemple : Âge (13, 14, 15, 16...), revenus (vous pouvez renseigner n'importe quelle valeur)

2. Distribution de probabilité discrète

2.1 Distribution binomiale

  • définition: décrit dans nnn Réussite dans les essais indépendants kk La probabilité de succès de chaque essai est ppp
  • formule X ∼ Bin ( n , p ) X sim texte{Bin}(n, p)XPoubelle(n,p)
  • Fonction de masse de probabilité (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binôme{n}{k} p^k (1-p)^{nk}P(X=k)=(kn)pk(1p)nk
  • Fonction de distribution cumulative (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = somme_{i=0}^{k} binôme{n}{i} p^i (1-p)^{ni}F(X=k)=je=0k(jen)pje(1p)nje

2.2 Distribution de Bernoulli

  • définition: Décrit la probabilité de succès (ou d’échec) d’une expérience. La probabilité de succès est. ppp
  • formule X ∼ Berne ( p ) X sim texte{Berne}(p)XBern(p)
  • Fonction de masse de probabilité (PMF) P ( X = x ) = { p si x = 1 1 − p si x = 0 P(X = x) ={psiX=11psiX=0 P(X=X)={p1psiX=1siX=0
  • Fonction de distribution cumulative (CDF) F ( X = x ) = { 0 si x &lt; 0 1 − p si 0 ≤ x &lt; 1 1 si x ≥ 1 F(X = x) ={0siX<01psi0X<11siX1 F(X=X)= 01p1siX<0si0X<1siX1

2.3 Distribution géométrique

  • définition: Décrit la probabilité du nombre d'échecs avant le premier succès. La probabilité de succès dans chaque essai est. ppp
  • formule X ∼ Geom ( p ) X sim texte{Geom}(p)XGéom(p)
  • Fonction de masse de probabilité (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=k)=(1p)kp
  • Fonction de distribution cumulative (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=k)=1(1p)k+1

2.4 Distribution binomiale négative

  • définition: Décrit le nombre d'échecs avant d'atteindre le rème succès. La probabilité de succès pour chaque essai est. ppp
  • formule X ∼ NegBin ( r , p ) X sim texte{NegBin}(r, p)XNégBin(l,p)
  • Fonction de masse de probabilité (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binôme {k + r - 1}{k} p^r (1-p)^kP(X=k)=(kk+l1)pl(1p)k
  • Fonction de distribution cumulative (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = somme_{i=0}^{k} binôme{i + r - 1}{i} p^r (1-p)^iF(X=k)=je=0k(jeje+l1)pl(1p)je

2.5 Distribution hypergéométrique

  • définition: Décrit l'échantillonnage à partir d'une population finie sans remplacement nnn fois, avec succès kk fois la probabilité.
  • formule X ∼ Hypergeom ( N , K , n ) X sim texte{Hypergeom}(N, K, n)XHypergéome(N,K,n)
  • Fonction de masse de probabilité (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binôme{K}{k} binôme{NK}{nk}}{binôme{N}{n}}P(X=k)=(nN)(kK)(nkNK)
  • Fonction de distribution cumulative (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = somme_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=k)=je=0k(nN)(jeK)(njeNK)

2.6 Distribution de Poisson

  • définition: La description se produit dans l'unité de temps kk La probabilité d'un événement, le taux moyen d'occurrence de l'événement est λ.
  • formule X ∼ Poisson ( λ ) X sim texte{Poisson}(lambda)XPoisson(λ)
  • Fonction de masse de probabilité (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=k)=k!λketttttttλ
  • Fonction de distribution cumulative (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} somme_{i=0}^{k} frac{lambda^i}{i!}F(X=k)=etttttttλje=0kje!λje

2.7 Relation entre eux

  • Distribution de Bernoulliest un spécialdistribution binomiale,quand n = 1 n = 1n=1 heure.
  • distribution géométriqueest la répartition du nombre d'essais requis avant le premier succès, qui peut être considérée commedistribution binomialeextension.
  • distribution binomiale négativepeut être vu commedistribution géométriqueGénéralisation de , utilisée pour décrire le nombre d'échecs requis avant r succès.
  • distribution hypergéométriqueSemblable àdistribution binomiale, mais adapté aux populations finies et à l'échantillonnage sans remplacement.
  • Distribution de PoissonOuidistribution binomialeLe cas limite de nnn très grand et ppp très jeune, et λ = np lambda = npλ=np rester constant.

3. Distribution de probabilité continue

3.1 Distribution exponentielle

  • définition: La distribution exponentielle est une distribution de probabilité continue souvent utilisée pour décrire les intervalles de temps entre des événements indépendants.

  • formule X ∼ Exponentiel ( λ ) X sim texte{Exponentiel}(lambda)XExponentiel(λ),dans λ &gt; 0 lambda&gt;0λ>0 est le paramètre de taux

  • Fonction de densité de probabilité (PDF) f ( x ; λ ) = λ e − λ x pour x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad texte{pour } x geq 0F(X;λ)=λetttttttλXpourX0

  • Fonction de distribution cumulative (CDF) F ( x ; λ ) = 1 − e − λ x pour x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad texte{pour } x geq 0F(X;λ)=1etttttttλXpourX0

3.2 Distribution gamma

  • définition: Décrit l'accumulation du temps d'attente et est une généralisation de la distribution exponentielle et de la distribution χ².

  • formule X ∼ Gamma ( k , θ ) X sim texte{Gamma}(k, thêta)XGamma(k,θ),dans k &gt; 0 k&gt;0k>0 est le paramètre de forme, θ &gt; 0 thêta&gt;0θ>0 est le paramètre d'échelle

  • Fonction de densité de probabilité (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) pour x ≥ 0 f(x; k, thêta) = frac{x^{k-1}e^{-x/thêta}}{thêta^k Gamma(k)} quad texte{pour } x geq 0F(X;k,θ)=θkΓ(k)Xk1etttttttX/θpourX0,dans Γ ( k ) Gamma(k)Γ(k) est la fonction gamma

  • Fonction de distribution cumulative (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, thêta) = frac{gamma(k, x/thêta)}{Gamma(k)}F(X;k,θ)=Γ(k)γ(k,X/θ),dans γ ( k , x / θ ) gamma(k, x/thêta)γ(k,X/θ) est une fonction gamma incomplète.

3.3 Distribution normale

  • définition: Décrit la distribution de la somme d'un grand nombre de variables aléatoires indépendantes et est largement utilisé en sciences naturelles et en sciences sociales.

  • formule X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)XN(μ,σ2),dans, μmuμ est la valeur moyenne, σ 2 sigma^2σ2 est la variance

  • Fonction de densité de probabilité (PDF) f ( x ; µ , σ 2 ) = 1 2 π σ 2 e − ( x − µ ) 2 2 σ 2 f(x; µm, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-µm)^2}{2sigma^2}}F(X;μ,σ2)=2πσ2 1ettttttt2σ2(Xμ)2

  • Fonction de distribution cumulative (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}gauche[1 + nomopérateur{erf}gauche(frac{x-mu}{sqrt{2sigma^2}}droite)droite]F(X;μ,σ2)=21[1+erf(2σ2 Xμ)], où erf est la fonction d'erreur.

3.4 t-Distribution

  • définition: Utilisé pour tester des hypothèses et estimer l’intervalle de confiance dans des situations de petits échantillons.

  • formule X ∼ t ( ν ) X sim t(nu)Xt(ν),dans, ν nuν est le degré de liberté

  • Fonction de densité de probabilité (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}droite)}{sqrt{nupi} Gammaleft(frac{nu}{2}droite)} gauche(1 + frac{t^2}{nu}droite)^{-frac{nu+1}{2}}F(t;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νt2)2ν+1

  • Fonction de distribution cumulative (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t ; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}droite)}{sqrt{pi nu} Gammaleft(frac{nu}{2}droite)} int_0^{t} gauche(1 + frac{u^2}{nu}droite)^{-frac{nu+1}{2}} duF(t;ν)=21+tπν Γ(2ν)Γ(2ν+1)0t(1+νtoi2)2ν+1dtoi

3.5 Distribution du chi carré

  • définition: Couramment utilisé pour les tests d’hypothèses et l’analyse de la variance.

  • formule X ∼ χ 2 ( k ) X sim chi^2(k)Xχ2(k),dans kk est le degré de liberté

  • Fonction de densité de probabilité (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 pour x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad texte{pour } x geq 0F(X;k)=2k/2Γ(k/2)1Xk/21etttttttX/2pourX0

  • Fonction de distribution cumulative (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammagauche(frac{k}{2}, frac{x}{2}droite)}{Gammagauche(frac{k}{2}droite)}F(X;k)=Γ(2k)γ(2k,2X)

3.6 Distribution F

  • définition: Utilisé pour comparer la variance de deux échantillons.

  • formule X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)XF(d1,d2),dans d 1 d_1d1 et d 2 d_2d2 est le degré de liberté

  • Fonction de densité de probabilité (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) pour x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bgauche(frac{d_1}{2}, frac{d_2}{2}droite)} texte quadruple{pour } x geq 0F(X;d1,d2)=XB(2d1,2d2)(d1X+d2)d1+d2(d1X)d1d2d2 pourX0,dans BBB est la fonction bêta

  • Fonction de distribution cumulative (CDF) F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}gauche(frac{d_1}{2}, frac{d_2}{2}droite)F(X;d1,d2)=jed1X+d2d1X(2d1,2d2),dans IIje est une fonction bêta incomplète

3.7 Relation entre eux

  • La distribution du chi carré estsomme des carrés de distribution normale . Par exemple, kk La somme des carrés des variables normales standard indépendantes obéit aux degrés de liberté tels que kk distribution du chi carré.
  • La distribution t est dansConstruit sur la base de la distribution normale standard et de la distribution du chi carré de. Plus précisément, la distribution t peut être obtenue en divisant une variable normale standard par la racine carrée de sa variable de distribution chi carré indépendante.
  • La distribution F estExtension du rapport de deux variables distribuées indépendantes du chi carré . La distribution F est utilisée pour comparer deux variances et est construite en prenant le rapport de deux variables distribuées du chi carré.