1. Definición y clasificación de variables aleatorias.
Definición: Una variable aleatoria es una variable que toma diferentes valores en un experimento aleatorio.
Variable aleatoria categórica (Nominal)
Ejemplo: género (masculino, femenino), ocupación (funcionario público, empleado corporativo, estudiante, jubilado, desempleado), resultado de la prueba (negativo, positivo)
Variable aleatoria categórica ordenada (Ordenada)
Ejemplos: actitud (muy de acuerdo, de acuerdo, neutral, en desacuerdo, totalmente en desacuerdo), frecuencia de uso (una vez por semana, una vez cada dos semanas, una vez cada seis meses, casi nunca, nunca)
definición: descrito en nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte Exitoso en ensayos independientes yoa La probabilidad de éxito en cada prueba es páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag。
fórmula: X ∼ Bin ( n , p ) X sim texto{Bin}(n, p)X∼Papelera(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte,pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
Función de masa de probabilidad (PMF): P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}PAGAGAGAGAGAG(X=a)=(anorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte−a
Función de distribución acumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = suma_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}F(X=a)=∑i=0a(inorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)pagagagagagagagagagagagagagagagagagagagagagagagagagagagi(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte−i
2.2 Distribución de Bernoulli
definición: Describe la probabilidad de éxito (o fracaso) en un experimento. La probabilidad de éxito es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag。
fórmula: X ∼ Berna ( p ) X sim texto{Berna}(p)X∼Berna(pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
Función de masa de probabilidad (PMF): P ( X = x ) = { p si x = 1 1 − p si x = 0 P(X = x) ={pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=11−pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=0PAGAGAGAGAGAG(X=X)={pagagagagagagagagagagagagagagagagagagagagagagagagagagag1−pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=1siX=0
Función de distribución acumulativa (CDF): F ( X = x ) = { 0 si x < 0 1 − p si 0 ≤ x < 1 1 si x ≥ 1 F(X = x) ={0siX<01−pagagagagagagagagagagagagagagagagagagagagagagagagagagagsi0≤X<11siX≥1F(X=X)=⎩⎨⎧01−pagagagagagagagagagagagagagagagagagagagagagagagagagagag1siX<0si0≤X<1siX≥1
2.3 Distribución geométrica
definición: Describe la probabilidad del número de fracasos antes del primer éxito. La probabilidad de éxito en cada prueba es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag。
fórmula: X ∼ Geom ( p ) X sim texto{Geom}(p)X∼Geometría(pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
Función de masa de probabilidad (PMF): P(X = k) = (1 − p) kp P(X = k) = (1-p)^kpPAGAGAGAGAGAG(X=a)=(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)apagagagagagagagagagagagagagagagagagagagagagagagagagagag
Función de distribución acumulativa (CDF): F(X = k) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=a)=1−(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)a+1
2.4 Distribución Binomial Negativa
definición: Describe el número de fracasos antes de alcanzar el r-ésimo éxito. La probabilidad de éxito de cada intento es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag。
fórmula: X ∼ NegBin ( r , p ) X sim texto{NegBin}(r, p)X∼Negativo(a,pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
Función de masa de probabilidad (PMF): P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kPAGAGAGAGAGAG(X=a)=(aa+a−1)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)a
Función de distribución acumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = suma_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iF(X=a)=∑i=0a(ii+a−1)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1−pagagagagagagagagagagagagagagagagagagagagagagagagagagag)i
2.5 Distribución hipergeométrica
definición: Describe el muestreo de una población finita sin reemplazo nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte veces, exitoso yoa multiplicado por la probabilidad.
fórmula: X ∼ Hipergeoma ( N , K , n ) X sim text{Hipergeoma}(N, K, n)X∼Hipergeoma(norte,K,norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)
Función de masa de probabilidad (PMF): P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}PAGAGAGAGAGAG(X=a)=(norteorteorteorteorteorteorteorteorteorteorteorteorteorteortenorte)(aK)(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte−anorte−K)
Función de distribución acumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = suma_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=a)=∑i=0a(norteorteorteorteorteorteorteorteorteorteorteorteorteorteortenorte)(iK)(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte−inorte−K)
2.6 Distribución de Poisson
definición: La descripción ocurre dentro de la unidad de tiempo. yoa La probabilidad de un evento, la tasa promedio de ocurrencia de un evento, es λ.
fórmula: X ∼ Poisson ( λ ) X sim text{Poisson}(lambda)X∼Pescado(λ)
Función de masa de probabilidad (PMF): P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}PAGAGAGAGAGAG(X=a)=a!λami−λ
Distribución de Bernoullies un especialDistribución binomial,cuando n = 1 n = 1norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte=1 hora.
distribución geométricaes la distribución del número de pruebas necesarias antes del primer éxito, que puede verse comoDistribución binomialextensión.
distribución binomial negativapuede ser visto comodistribución geométricaGeneralización de , utilizada para describir el número de fracasos necesarios antes de r éxitos.
distribución hipergeométricaSimilar aDistribución binomial, pero adecuado para poblaciones finitas y muestreo sin reemplazo.
distribución de venenoSíDistribución binomialEl caso límite de nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte muy grande y páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag muy joven y λ = np lambda = npλ=norteorteorteorteorteorteorteorteorteorteorteorteorteorteortepagagagagagagagagagagagagagagagagagagagagagagagagagagag manténgase constante.
3. Distribución de probabilidad continua
3.1 Distribución exponencial
definición: La distribución exponencial es una distribución de probabilidad continua que se utiliza a menudo para describir los intervalos de tiempo entre eventos independientes.
fórmula: X ∼ Exponencial ( λ ) X sim text{Exponencial}(lambda)X∼Exponencial(λ),en λ > 0 lambda>0λ>0 es el parámetro de tasa
Función de densidad de probabilidad (PDF): f ( x ; λ ) = λ e − λ x para x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{para } x geq 0F(X;λ)=λmi−λXparaX≥0
Función de distribución acumulativa (CDF): F ( x ; λ ) = 1 − e − λ x para x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{para } x geq 0F(X;λ)=1−mi−λXparaX≥0
3.2 Distribución gamma
definición: Describe la acumulación de tiempo de espera y es una generalización de la distribución exponencial y la distribución χ².
fórmula: X ∼ Gamma ( k , θ ) X sim text{Gamma}(k, theta)X∼Gama(a,θ),en k > 0 k > 0a>0 es el parámetro de forma, θ > 0 theta>0θ>0 es el parámetro de escala
Función de densidad de probabilidad (PDF): f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) para x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{para } x geq 0F(X;a,θ)=θaΓ(a)Xa−1mi−X/θparaX≥0,en Γ(k) Gamma(k)Γ(a) es la función gamma
Función de distribución acumulativa (CDF): F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}F(X;a,θ)=Γ(a)γ(a,X/θ),en γ ( k , x / θ ) gamma(k, x/theta)γ(a,X/θ) es una función gamma incompleta.
3.3 Distribución Normal
definición: Describe la distribución de la suma de una gran cantidad de variables aleatorias independientes y se usa ampliamente en ciencias naturales y ciencias sociales.
fórmula: X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)X∼norte(μ,σ2),en, μmμ es el valor medio, σ 2 sigma^2σ2 es la varianza
Función de densidad de probabilidad (PDF): f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}F(X;μ,σ2)=2πσ21mi−2σ2(X−μ)2
Función de distribución acumulativa (CDF): F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}izquierda[1 + nombredeloperador{erf}izquierda(frac{x-mu}{sqrt{2sigma^2}}derecha)derecha]F(X;μ,σ2)=21[1+campo(2σ2X−μ)], donde erf es la función de error.
3.4 Distribución t
definición: Se utiliza para pruebas de hipótesis y estimación de intervalos de confianza en situaciones de muestras pequeñas.
fórmula: X ∼ t ( ν ) X sim t(nu)X∼a(ν),en, yo noν es el grado de libertad
Función de densidad de probabilidad (PDF): f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaizquierda(frac{nu+1}{2}derecha)}{sqrt{nupi} Gammaizquierda(frac{nu}{2}derecha)} izquierda(1 + frac{t^2}{nu}derecha)^{-frac{nu+1}{2}}F(a;ν)=νπΓ(2ν)Γ(2ν+1)(1+νa2)−2ν+1
Función de distribución acumulativa (CDF): F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaizquierda(frac{nu+1}{2}derecha)}{sqrt{pi nu} Gammaizquierda(frac{nu}{2}derecha)} int_0^{t} izquierda(1 + frac{u^2}{nu}derecha)^{-frac{nu+1}{2}} duF(a;ν)=21+aπνΓ(2ν)Γ(2ν+1)∫0a(1+νtú2)−2ν+1dtú
3.5 Distribución Chi-Cuadrado
definición: Comúnmente utilizado para pruebas de hipótesis y análisis de varianza.
fórmula: X ∼ χ 2 ( k ) X sim chi^2(k)X∼χ2(a),en yoa es el grado de libertad
Función de densidad de probabilidad (PDF): f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 para x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{para } x geq 0F(X;a)=2a/2Γ(a/2)1Xa/2−1mi−X/2paraX≥0
Función de distribución acumulativa (CDF): F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaizquierda(frac{k}{2}, frac{x}{2}derecha)}{Gammaizquierda(frac{k}{2}derecha)}F(X;a)=Γ(2a)γ(2a,2X)
3.6 Distribución F
definición: Se utiliza para comparar la varianza de dos muestras.
fórmula: X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)X∼F(d1,d2),en el 1 el_1d1 y el 2 el 2d2 es el grado de libertad
Función de densidad de probabilidad (PDF): f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) para x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bizquierda(frac{d_1}{2}, frac{d_2}{2}derecha)} quad text{para } x geq 0F(X;d1,d2)=XB(2d1,2d2)(d1X+d2)d1+d2(d1X)d1d2d2paraX≥0,en CAMA Y DESAYUNOB es una función beta
Función de distribución acumulativa (CDF): F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}izquierda(frac{d_1}{2}, frac{d_2}{2}derecha)F(X;d1,d2)=Id1X+d2d1X(2d1,2d2),en III es una función beta incompleta
3.7 Relación entre ellos
La distribución chi-cuadrado esSuma de cuadrados de distribución normal . Por ejemplo, yoa La suma de cuadrados de variables normales estándar independientes obedece a los grados de libertad como yoa distribución chi-cuadrado.
La distribución t está enConstruido sobre la base de la distribución normal estándar y la distribución chi-cuadrado de. Específicamente, la distribución t se puede obtener dividiendo una variable normal estándar por la raíz cuadrada de su variable de distribución chi-cuadrado independiente.
La distribución F esAmpliación de la relación de dos variables independientes distribuidas chi-cuadrado . La distribución F se utiliza para comparar dos varianzas y se construye tomando la relación de dos variables distribuidas chi-cuadrado.