Compartir tecnología

[Estadística Matemática] 2-Variables aleatorias y sus distribuciones de probabilidad

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Definición y clasificación de variables aleatorias.

Definición: Una variable aleatoria es una variable que toma diferentes valores en un experimento aleatorio.

  1. Variable aleatoria categórica (Nominal)

    • Ejemplo: género (masculino, femenino), ocupación (funcionario público, empleado corporativo, estudiante, jubilado, desempleado), resultado de la prueba (negativo, positivo)
  2. Variable aleatoria categórica ordenada (Ordenada)

    • Ejemplos: actitud (muy de acuerdo, de acuerdo, neutral, en desacuerdo, totalmente en desacuerdo), frecuencia de uso (una vez por semana, una vez cada dos semanas, una vez cada seis meses, casi nunca, nunca)
  3. Variable aleatoria numérica

    • Ejemplo: Edad (13, 14, 15, 16...), ingresos (puedes introducir cualquier valor)

2. Distribución de probabilidad discreta

2.1 Distribución Binomial

  • definición: descrito en nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte Exitoso en ensayos independientes yoa La probabilidad de éxito en cada prueba es páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag
  • fórmula X ∼ Bin ( n , p ) X sim texto{Bin}(n, p)XPapelera(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte,pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
  • Función de masa de probabilidad (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}PAGAGAGAGAGAG(X=a)=(anorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)norteorteorteorteorteorteorteorteorteorteorteorteorteorteortea
  • Función de distribución acumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = suma_{i=0}^{k} binom{n}{i} p^i (1-p)^{ni}F(X=a)=i=0a(inorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)pagagagagagagagagagagagagagagagagagagagagagagagagagagagi(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)norteorteorteorteorteorteorteorteorteorteorteorteorteorteortei

2.2 Distribución de Bernoulli

  • definición: Describe la probabilidad de éxito (o fracaso) en un experimento. La probabilidad de éxito es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag
  • fórmula X ∼ Berna ( p ) X sim texto{Berna}(p)XBerna(pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
  • Función de masa de probabilidad (PMF) P ( X = x ) = { p si x = 1 1 − p si x = 0 P(X = x) ={pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=11pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=0 PAGAGAGAGAGAG(X=X)={pagagagagagagagagagagagagagagagagagagagagagagagagagagag1pagagagagagagagagagagagagagagagagagagagagagagagagagagagsiX=1siX=0
  • Función de distribución acumulativa (CDF) F ( X = x ) = { 0 si x &lt; 0 1 − p si 0 ≤ x &lt; 1 1 si x ≥ 1 F(X = x) ={0siX<01pagagagagagagagagagagagagagagagagagagagagagagagagagagagsi0X<11siX1 F(X=X)= 01pagagagagagagagagagagagagagagagagagagagagagagagagagagag1siX<0si0X<1siX1

2.3 Distribución geométrica

  • definición: Describe la probabilidad del número de fracasos antes del primer éxito. La probabilidad de éxito en cada prueba es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag
  • fórmula X ∼ Geom ( p ) X sim texto{Geom}(p)XGeometría(pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
  • Función de masa de probabilidad (PMF) P(X = k) = (1 − p) kp P(X = k) = (1-p)^kpPAGAGAGAGAGAG(X=a)=(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)apagagagagagagagagagagagagagagagagagagagagagagagagagagag
  • Función de distribución acumulativa (CDF) F(X = k) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=a)=1(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)a+1

2.4 Distribución Binomial Negativa

  • definición: Describe el número de fracasos antes de alcanzar el r-ésimo éxito. La probabilidad de éxito de cada intento es. páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag
  • fórmula X ∼ NegBin ( r , p ) X sim texto{NegBin}(r, p)XNegativo(a,pagagagagagagagagagagagagagagagagagagagagagagagagagagag)
  • Función de masa de probabilidad (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kPAGAGAGAGAGAG(X=a)=(aa+a1)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)a
  • Función de distribución acumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = suma_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iF(X=a)=i=0a(ii+a1)pagagagagagagagagagagagagagagagagagagagagagagagagagagaga(1pagagagagagagagagagagagagagagagagagagagagagagagagagagag)i

2.5 Distribución hipergeométrica

  • definición: Describe el muestreo de una población finita sin reemplazo nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte veces, exitoso yoa multiplicado por la probabilidad.
  • fórmula X ∼ Hipergeoma ( N , K , n ) X sim text{Hipergeoma}(N, K, n)XHipergeoma(norte,K,norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte)
  • Función de masa de probabilidad (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}PAGAGAGAGAGAG(X=a)=(norteorteorteorteorteorteorteorteorteorteorteorteorteorteortenorte)(aK)(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorteanorteK)
  • Función de distribución acumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = suma_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=a)=i=0a(norteorteorteorteorteorteorteorteorteorteorteorteorteorteortenorte)(iK)(norteorteorteorteorteorteorteorteorteorteorteorteorteorteorteinorteK)

2.6 Distribución de Poisson

  • definición: La descripción ocurre dentro de la unidad de tiempo. yoa La probabilidad de un evento, la tasa promedio de ocurrencia de un evento, es λ.
  • fórmula X ∼ Poisson ( λ ) X sim text{Poisson}(lambda)XPescado(λ)
  • Función de masa de probabilidad (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}PAGAGAGAGAGAG(X=a)=a!λamiλ
  • Función de distribución acumulativa (CDF) F(X = k) = e^{-lambda} suma_{i=0}^{k} frac{lambda^i}{i!}F(X=a)=miλi=0ai!λi

2.7 Relación entre ellos

  • Distribución de Bernoullies un especialDistribución binomial,cuando n = 1 n = 1norteorteorteorteorteorteorteorteorteorteorteorteorteorteorte=1 hora.
  • distribución geométricaes la distribución del número de pruebas necesarias antes del primer éxito, que puede verse comoDistribución binomialextensión.
  • distribución binomial negativapuede ser visto comodistribución geométricaGeneralización de , utilizada para describir el número de fracasos necesarios antes de r éxitos.
  • distribución hipergeométricaSimilar aDistribución binomial, pero adecuado para poblaciones finitas y muestreo sin reemplazo.
  • distribución de venenoDistribución binomialEl caso límite de nnnorteorteorteorteorteorteorteorteorteorteorteorteorteorteorte muy grande y páginaspagagagagagagagagagagagagagagagagagagagagagagagagagagag muy joven y λ = np lambda = npλ=norteorteorteorteorteorteorteorteorteorteorteorteorteorteortepagagagagagagagagagagagagagagagagagagagagagagagagagagag manténgase constante.

3. Distribución de probabilidad continua

3.1 Distribución exponencial

  • definición: La distribución exponencial es una distribución de probabilidad continua que se utiliza a menudo para describir los intervalos de tiempo entre eventos independientes.

  • fórmula X ∼ Exponencial ( λ ) X sim text{Exponencial}(lambda)XExponencial(λ),en λ &gt; 0 lambda&gt;0λ>0 es el parámetro de tasa

  • Función de densidad de probabilidad (PDF) f ( x ; λ ) = λ e − λ x para x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{para } x geq 0F(X;λ)=λmiλXparaX0

  • Función de distribución acumulativa (CDF) F ( x ; λ ) = 1 − e − λ x para x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{para } x geq 0F(X;λ)=1miλXparaX0

3.2 Distribución gamma

  • definición: Describe la acumulación de tiempo de espera y es una generalización de la distribución exponencial y la distribución χ².

  • fórmula X ∼ Gamma ( k , θ ) X sim text{Gamma}(k, theta)XGama(a,θ),en k &gt; 0 k &gt; 0a>0 es el parámetro de forma, θ &gt; 0 theta&gt;0θ>0 es el parámetro de escala

  • Función de densidad de probabilidad (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) para x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{para } x geq 0F(X;a,θ)=θaΓ(a)Xa1miX/θparaX0,en Γ(k) Gamma(k)Γ(a) es la función gamma

  • Función de distribución acumulativa (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, theta) = frac{gamma(k, x/theta)}{Gamma(k)}F(X;a,θ)=Γ(a)γ(a,X/θ),en γ ( k , x / θ ) gamma(k, x/theta)γ(a,X/θ) es una función gamma incompleta.

3.3 Distribución Normal

  • definición: Describe la distribución de la suma de una gran cantidad de variables aleatorias independientes y se usa ampliamente en ciencias naturales y ciencias sociales.

  • fórmula X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)Xnorte(μ,σ2),en, μmμ es el valor medio, σ 2 sigma^2σ2 es la varianza

  • Función de densidad de probabilidad (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}F(X;μ,σ2)=2πσ2 1mi2σ2(Xμ)2

  • Función de distribución acumulativa (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}izquierda[1 + nombredeloperador{erf}izquierda(frac{x-mu}{sqrt{2sigma^2}}derecha)derecha]F(X;μ,σ2)=21[1+campo(2σ2 Xμ)], donde erf es la función de error.

3.4 Distribución t

  • definición: Se utiliza para pruebas de hipótesis y estimación de intervalos de confianza en situaciones de muestras pequeñas.

  • fórmula X ∼ t ( ν ) X sim t(nu)Xa(ν),en, yo noν es el grado de libertad

  • Función de densidad de probabilidad (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaizquierda(frac{nu+1}{2}derecha)}{sqrt{nupi} Gammaizquierda(frac{nu}{2}derecha)} izquierda(1 + frac{t^2}{nu}derecha)^{-frac{nu+1}{2}}F(a;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νa2)2ν+1

  • Función de distribución acumulativa (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gammaizquierda(frac{nu+1}{2}derecha)}{sqrt{pi nu} Gammaizquierda(frac{nu}{2}derecha)} int_0^{t} izquierda(1 + frac{u^2}{nu}derecha)^{-frac{nu+1}{2}} duF(a;ν)=21+aπν Γ(2ν)Γ(2ν+1)0a(1+ν2)2ν+1d

3.5 Distribución Chi-Cuadrado

  • definición: Comúnmente utilizado para pruebas de hipótesis y análisis de varianza.

  • fórmula X ∼ χ 2 ( k ) X sim chi^2(k)Xχ2(a),en yoa es el grado de libertad

  • Función de densidad de probabilidad (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 para x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gamma(k/2)} x^{k/2-1} e^{-x/2} quad text{para } x geq 0F(X;a)=2a/2Γ(a/2)1Xa/21miX/2paraX0

  • Función de distribución acumulativa (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaizquierda(frac{k}{2}, frac{x}{2}derecha)}{Gammaizquierda(frac{k}{2}derecha)}F(X;a)=Γ(2a)γ(2a,2X)

3.6 Distribución F

  • definición: Se utiliza para comparar la varianza de dos muestras.

  • fórmula X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)XF(d1,d2),en el 1 el_1d1 y el 2 el 2d2 es el grado de libertad

  • Función de densidad de probabilidad (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) para x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bizquierda(frac{d_1}{2}, frac{d_2}{2}derecha)} quad text{para } x geq 0F(X;d1,d2)=XB(2d1,2d2)(d1X+d2)d1+d2(d1X)d1d2d2 paraX0,en CAMA Y DESAYUNOB es una función beta

  • Función de distribución acumulativa (CDF) F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}izquierda(frac{d_1}{2}, frac{d_2}{2}derecha)F(X;d1,d2)=Id1X+d2d1X(2d1,2d2),en III es una función beta incompleta

3.7 Relación entre ellos

  • La distribución chi-cuadrado esSuma de cuadrados de distribución normal . Por ejemplo, yoa La suma de cuadrados de variables normales estándar independientes obedece a los grados de libertad como yoa distribución chi-cuadrado.
  • La distribución t está enConstruido sobre la base de la distribución normal estándar y la distribución chi-cuadrado de. Específicamente, la distribución t se puede obtener dividiendo una variable normal estándar por la raíz cuadrada de su variable de distribución chi-cuadrado independiente.
  • La distribución F esAmpliación de la relación de dos variables independientes distribuidas chi-cuadrado . La distribución F se utiliza para comparar dos varianzas y se construye tomando la relación de dos variables distribuidas chi-cuadrado.