Exemples : attitude (tout à fait d'accord, d'accord, neutre, en désaccord, fortement en désaccord), fréquence d'utilisation (une fois par semaine, une fois toutes les deux semaines, une fois tous les six mois, presque jamais, jamais)
Variable aléatoire numérique
Exemple : Âge (13, 14, 15, 16...), revenus (vous pouvez renseigner n'importe quelle valeur)
2. Distribution de probabilité discrète
2.1 Distribution binomiale
définition: décrit dans nnn Réussite dans les essais indépendants kk La probabilité de succès de chaque essai est ppp。
formule: X ∼ Bin ( n , p ) X sim texte{Bin}(n, p)X∼Poubelle(n,p)
Fonction de masse de probabilité (PMF): P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binôme{n}{k} p^k (1-p)^{nk}P(X=k)=(kn)pk(1−p)n−k
Fonction de distribution cumulative (CDF): F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = somme_{i=0}^{k} binôme{n}{i} p^i (1-p)^{ni}F(X=k)=∑je=0k(jen)pje(1−p)n−je
2.2 Distribution de Bernoulli
définition: Décrit la probabilité de succès (ou d’échec) d’une expérience. La probabilité de succès est. ppp。
formule: X ∼ Berne ( p ) X sim texte{Berne}(p)X∼Bern(p)
Fonction de masse de probabilité (PMF): P ( X = x ) = { p si x = 1 1 − p si x = 0 P(X = x) ={psiX=11−psiX=0P(X=X)={p1−psiX=1siX=0
Fonction de distribution cumulative (CDF): F ( X = x ) = { 0 si x < 0 1 − p si 0 ≤ x < 1 1 si x ≥ 1 F(X = x) ={0siX<01−psi0≤X<11siX≥1F(X=X)=⎩⎨⎧01−p1siX<0si0≤X<1siX≥1
2.3 Distribution géométrique
définition: Décrit la probabilité du nombre d'échecs avant le premier succès. La probabilité de succès dans chaque essai est. ppp。
formule: X ∼ Geom ( p ) X sim texte{Geom}(p)X∼Géom(p)
Fonction de masse de probabilité (PMF): P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=k)=(1−p)kp
Fonction de distribution cumulative (CDF): F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=k)=1−(1−p)k+1
2.4 Distribution binomiale négative
définition: Décrit le nombre d'échecs avant d'atteindre le rème succès. La probabilité de succès pour chaque essai est. ppp。
formule: X ∼ NegBin ( r , p ) X sim texte{NegBin}(r, p)X∼NégBin(l,p)
Fonction de masse de probabilité (PMF): P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binôme {k + r - 1}{k} p^r (1-p)^kP(X=k)=(kk+l−1)pl(1−p)k
Fonction de distribution cumulative (CDF): F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = somme_{i=0}^{k} binôme{i + r - 1}{i} p^r (1-p)^iF(X=k)=∑je=0k(jeje+l−1)pl(1−p)je
2.5 Distribution hypergéométrique
définition: Décrit l'échantillonnage à partir d'une population finie sans remplacement nnn fois, avec succès kk fois la probabilité.
formule: X ∼ Hypergeom ( N , K , n ) X sim texte{Hypergeom}(N, K, n)X∼Hypergéome(N,K,n)
Fonction de masse de probabilité (PMF): P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binôme{K}{k} binôme{NK}{nk}}{binôme{N}{n}}P(X=k)=(nN)(kK)(n−kN−K)
Fonction de distribution cumulative (CDF): F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = somme_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=k)=∑je=0k(nN)(jeK)(n−jeN−K)
2.6 Distribution de Poisson
définition: La description se produit dans l'unité de temps kk La probabilité d'un événement, le taux moyen d'occurrence de l'événement est λ.
formule: X ∼ Poisson ( λ ) X sim texte{Poisson}(lambda)X∼Poisson(λ)
Fonction de masse de probabilité (PMF): P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=k)=k!λkettttttt−λ
Fonction de distribution cumulative (CDF): F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} somme_{i=0}^{k} frac{lambda^i}{i!}F(X=k)=ettttttt−λ∑je=0kje!λje
2.7 Relation entre eux
Distribution de Bernoulliest un spécialdistribution binomiale,quand n = 1 n = 1n=1 heure.
distribution géométriqueest la répartition du nombre d'essais requis avant le premier succès, qui peut être considérée commedistribution binomialeextension.
distribution binomiale négativepeut être vu commedistribution géométriqueGénéralisation de , utilisée pour décrire le nombre d'échecs requis avant r succès.
distribution hypergéométriqueSemblable àdistribution binomiale, mais adapté aux populations finies et à l'échantillonnage sans remplacement.
Distribution de PoissonOuidistribution binomialeLe cas limite de nnn très grand et ppp très jeune, et λ = np lambda = npλ=np rester constant.
3. Distribution de probabilité continue
3.1 Distribution exponentielle
définition: La distribution exponentielle est une distribution de probabilité continue souvent utilisée pour décrire les intervalles de temps entre des événements indépendants.
formule: X ∼ Exponentiel ( λ ) X sim texte{Exponentiel}(lambda)X∼Exponentiel(λ),dans λ > 0 lambda>0λ>0 est le paramètre de taux
Fonction de densité de probabilité (PDF): f ( x ; λ ) = λ e − λ x pour x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad texte{pour } x geq 0F(X;λ)=λettttttt−λXpourX≥0
Fonction de distribution cumulative (CDF): F ( x ; λ ) = 1 − e − λ x pour x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad texte{pour } x geq 0F(X;λ)=1−ettttttt−λXpourX≥0
3.2 Distribution gamma
définition: Décrit l'accumulation du temps d'attente et est une généralisation de la distribution exponentielle et de la distribution χ².
formule: X ∼ Gamma ( k , θ ) X sim texte{Gamma}(k, thêta)X∼Gamma(k,θ),dans k > 0 k>0k>0 est le paramètre de forme, θ > 0 thêta>0θ>0 est le paramètre d'échelle
Fonction de densité de probabilité (PDF): f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) pour x ≥ 0 f(x; k, thêta) = frac{x^{k-1}e^{-x/thêta}}{thêta^k Gamma(k)} quad texte{pour } x geq 0F(X;k,θ)=θkΓ(k)Xk−1ettttttt−X/θpourX≥0,dans Γ ( k ) Gamma(k)Γ(k) est la fonction gamma
Fonction de distribution cumulative (CDF): F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, thêta) = frac{gamma(k, x/thêta)}{Gamma(k)}F(X;k,θ)=Γ(k)γ(k,X/θ),dans γ ( k , x / θ ) gamma(k, x/thêta)γ(k,X/θ) est une fonction gamma incomplète.
3.3 Distribution normale
définition: Décrit la distribution de la somme d'un grand nombre de variables aléatoires indépendantes et est largement utilisé en sciences naturelles et en sciences sociales.
formule: X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)X∼N(μ,σ2),dans, μmuμ est la valeur moyenne, σ 2 sigma^2σ2 est la variance
Fonction de densité de probabilité (PDF): f ( x ; µ , σ 2 ) = 1 2 π σ 2 e − ( x − µ ) 2 2 σ 2 f(x; µm, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-µm)^2}{2sigma^2}}F(X;μ,σ2)=2πσ21ettttttt−2σ2(X−μ)2
Fonction de distribution cumulative (CDF): F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}gauche[1 + nomopérateur{erf}gauche(frac{x-mu}{sqrt{2sigma^2}}droite)droite]F(X;μ,σ2)=21[1+erf(2σ2X−μ)], où erf est la fonction d'erreur.
3.4 t-Distribution
définition: Utilisé pour tester des hypothèses et estimer l’intervalle de confiance dans des situations de petits échantillons.
formule: X ∼ t ( ν ) X sim t(nu)X∼t(ν),dans, ν nuν est le degré de liberté
Fonction de densité de probabilité (PDF): f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1}{2}droite)}{sqrt{nupi} Gammaleft(frac{nu}{2}droite)} gauche(1 + frac{t^2}{nu}droite)^{-frac{nu+1}{2}}F(t;ν)=νπΓ(2ν)Γ(2ν+1)(1+νt2)−2ν+1
Fonction de distribution cumulative (CDF): F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t ; nu) = frac{1}{2} + tfrac{Gammaleft(frac{nu+1}{2}droite)}{sqrt{pi nu} Gammaleft(frac{nu}{2}droite)} int_0^{t} gauche(1 + frac{u^2}{nu}droite)^{-frac{nu+1}{2}} duF(t;ν)=21+tπνΓ(2ν)Γ(2ν+1)∫0t(1+νtoi2)−2ν+1dtoi
3.5 Distribution du chi carré
définition: Couramment utilisé pour les tests d’hypothèses et l’analyse de la variance.
formule: X ∼ χ 2 ( k ) X sim chi^2(k)X∼χ2(k),dans kk est le degré de liberté
Fonction de densité de probabilité (PDF): f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 pour x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad texte{pour } x geq 0F(X;k)=2k/2Γ(k/2)1Xk/2−1ettttttt−X/2pourX≥0
Fonction de distribution cumulative (CDF): F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammagauche(frac{k}{2}, frac{x}{2}droite)}{Gammagauche(frac{k}{2}droite)}F(X;k)=Γ(2k)γ(2k,2X)
3.6 Distribution F
définition: Utilisé pour comparer la variance de deux échantillons.
formule: X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)X∼F(d1,d2),dans d 1 d_1d1 et d 2 d_2d2 est le degré de liberté
Fonction de densité de probabilité (PDF): f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) pour x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bgauche(frac{d_1}{2}, frac{d_2}{2}droite)} texte quadruple{pour } x geq 0F(X;d1,d2)=XB(2d1,2d2)(d1X+d2)d1+d2(d1X)d1d2d2pourX≥0,dans BBB est la fonction bêta
Fonction de distribution cumulative (CDF): F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}gauche(frac{d_1}{2}, frac{d_2}{2}droite)F(X;d1,d2)=jed1X+d2d1X(2d1,2d2),dans IIje est une fonction bêta incomplète
3.7 Relation entre eux
La distribution du chi carré estsomme des carrés de distribution normale . Par exemple, kk La somme des carrés des variables normales standard indépendantes obéit aux degrés de liberté tels que kk distribution du chi carré.
La distribution t est dansConstruit sur la base de la distribution normale standard et de la distribution du chi carré de. Plus précisément, la distribution t peut être obtenue en divisant une variable normale standard par la racine carrée de sa variable de distribution chi carré indépendante.
La distribution F estExtension du rapport de deux variables distribuées indépendantes du chi carré . La distribution F est utilisée pour comparer deux variances et est construite en prenant le rapport de deux variables distribuées du chi carré.