Compartilhamento de tecnologia

[Estatística Matemática] 2-Variáveis ​​aleatórias e suas distribuições de probabilidade

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Definição e classificação de variáveis ​​aleatórias

Definição: Uma variável aleatória é uma variável que assume valores diferentes em um experimento aleatório.

  1. Variável aleatória categórica (nominal)

    • Exemplo: Gênero (masculino, feminino), ocupação (funcionário público, funcionário corporativo, estudante, aposentado, desempregado), resultado do teste (negativo, positivo)
  2. Variável aleatória categórica ordenada (ordenada)

    • Exemplos: atitude (concordo totalmente, concordo, neutro, discordo, discordo totalmente), frequência de uso (uma vez por semana, uma vez a cada duas semanas, uma vez a cada seis meses, quase nunca, nunca)
  3. Variável aleatória numérica

    • Exemplo: Idade (13, 14, 15, 16...), renda (pode preencher qualquer valor)

2. Distribuição de probabilidade discreta

2.1 Distribuição Binomial

  • definição: descrito em nãoe Sucesso em testes independentes kko A probabilidade de cada tentativa ser bem sucedida é ppp
  • Fórmula X ∼ Bin ( n , p ) X sim texto{Bin}(n, p)XLixeira(e,p)
  • Função de massa de probabilidade (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binômio{n}{k} p^k (1-p)^{nk}P(X=o)=(oe)po(1p)eo
  • Função de distribuição cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = soma_{i=0}^{k} binômio{n}{i} p^i (1-p)^{ni}F(X=o)=eu=0o(eue)peu(1p)eeu

2.2 Distribuição Bernoulli

  • definição: Descreve a probabilidade de sucesso (ou fracasso) em um experimento. A probabilidade de sucesso é. ppp
  • Fórmula X ∼ Berna ( p ) X sim texto{Bern}(p)XBern(p)
  • Função de massa de probabilidade (PMF) P ( X = x ) = { p se x = 1 1 − p se x = 0 P(X = x) ={psex=11psex=0 P(X=x)={p1psex=1sex=0
  • Função de distribuição cumulativa (CDF) F ( X = x ) = { 0 se x &lt; 0 1 − p se 0 ≤ x &lt; 1 1 se x ≥ 1 F(X = x) ={0sex<01pse0x<11sex1 F(X=x)= 01p1sex<0se0x<1sex1

2.3 Distribuição Geométrica

  • definição: Descreve a probabilidade do número de falhas antes do primeiro sucesso. A probabilidade de sucesso em cada tentativa é. ppp
  • Fórmula X ∼ Geom ( p ) X sim texto{Geom}(p)XGeométrica(p)
  • Função de massa de probabilidade (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=o)=(1p)op
  • Função de distribuição cumulativa (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=o)=1(1p)o+1

2.4 Distribuição Binomial Negativa

  • definição: Descreve o número de falhas antes de atingir o enésimo sucesso. A probabilidade de sucesso para cada tentativa é. ppp
  • Fórmula X ∼ NegBin ( r , p ) X sim texto{NegBin}(r, p)XNegBin(r,p)
  • Função de massa de probabilidade (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binômio{k + r - 1}{k} p^r (1-p)^kP(X=o)=(oo+r1)pr(1p)o
  • Função de distribuição cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = soma_{i=0}^{k} binômio{i + r - 1}{i} p^r (1-p)^iF(X=o)=eu=0o(eueu+r1)pr(1p)eu

2.5 Distribuição Hipergeométrica

  • definição: Descreve a amostragem de uma população finita sem reposição nãoe vezes, bem sucedido kko vezes a probabilidade.
  • Fórmula X ∼ Hipergeom ( N , K , n ) X sim texto{Hipergeom}(N, K, n)XHipergeom(Nãoãoãoãoãoão,E,e)
  • Função de massa de probabilidade (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}P(X=o)=(eNãoãoãoãoãoão)(oE)(eoNãoãoãoãoãoãoE)
  • Função de distribuição cumulativa (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = soma_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=o)=eu=0o(eNãoãoãoãoãoão)(euE)(eeuNãoãoãoãoãoãoE)

2.6 Distribuição de Poisson

  • definição: A descrição ocorre dentro da unidade de tempo kko A probabilidade de um evento, a taxa média de ocorrência do evento é λ.
  • Fórmula X ∼ Poisson ( λ ) X sim texto{Poisson}(lambda)XPoisson(λ)
  • Função de massa de probabilidade (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=o)=o!λoeλ
  • Função de distribuição cumulativa (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} soma_{i=0}^{k} frac{lambda^i}{i!}F(X=o)=eλeu=0oeu!λeu

2.7 Relacionamento entre eles

  • Distribuição Bernoullié um especialdistribuição binomial,quando n = 1 n = 1e=1 hora.
  • distribuição geométricaé a distribuição do número de tentativas necessárias antes do primeiro sucesso, que pode ser visto comodistribuição binomialextensão.
  • distribuição binomial negativapode ser visto comodistribuição geométricaGeneralização de, usada para descrever o número de falhas necessárias antes de r sucessos.
  • distribuição hipergeométricaIgual adistribuição binomial, mas adequado para populações finitas e amostragem sem reposição.
  • Distribuição de venenosimdistribuição binomialO caso limite de nãoe muito grande e ppp muito jovem e λ = np lambda = npλ=ep mantenha constante.

3. Distribuição de probabilidade contínua

3.1 Distribuição Exponencial

  • definição: A distribuição exponencial é uma distribuição de probabilidade contínua frequentemente usada para descrever os intervalos de tempo entre eventos independentes.

  • Fórmula X ∼ Exponencial ( λ ) X sim texto{Exponencial}(lambda)XExponencial(λ),em λ &gt; 0 lambda&gt;0λ>0 é o parâmetro de taxa

  • Função de densidade de probabilidade (PDF) f ( x ; λ ) = λ e − λ x para x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{para } x geq 0e(x;λ)=λeλxparax0

  • Função de distribuição cumulativa (CDF) F ( x ; λ ) = 1 − e − λ x para x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{para } x geq 0F(x;λ)=1eλxparax0

3.2 Distribuição Gama

  • definição: Descreve o acúmulo de tempo de espera e é uma generalização da distribuição exponencial e da distribuição χ².

  • Fórmula X ∼ Gamma ( k , θ ) X sim texto{Gamma}(k, theta)XGama(o,θ),em k &gt; 0 k&gt;0o>0 é o parâmetro de forma, θ &gt; 0 teta&gt;0θ>0 é o parâmetro de escala

  • Função de densidade de probabilidade (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) para x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{para } x geq 0e(x;o,θ)=θoΓ(o)xo1ex/θparax0,em Γ ( k ) Gama(k)Γ(o) é a função gama

  • Função de distribuição cumulativa (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, teta) = frac{gama(k, x/teta)}{gama(k)}F(x;o,θ)=Γ(o)γ(o,x/θ),em γ ( k , x / θ ) gama(k, x/teta)γ(o,x/θ) é uma função gama incompleta.

3.3 Distribuição Normal

  • definição: Descreve a distribuição da soma de um grande número de variáveis ​​aleatórias independentes e é amplamente utilizado em ciências naturais e ciências sociais.

  • Fórmula X ∼ N ( μ , σ 2 ) X sim matemática{N}(mu, sigma^2)XNãoãoãoãoãoão(μ,σ2),em, μmμ é o valor médio, σ 2 sigma^2σ2 é a variação

  • Função de densidade de probabilidade (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}e(x;μ,σ2)=2πσ2 1e2σ2(xμ)2

  • Função de distribuição cumulativa (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}esquerda[1 + nome do operador{erf}esquerda(frac{x-mu}{sqrt{2sigma^2}}direita)direita]F(x;μ,σ2)=21[1+terra firme(2σ2 xμ)], onde erf é a função de erro.

3.4 Distribuição t

  • definição: Usado para testes de hipóteses e estimativas de intervalos de confiança em situações de amostras pequenas.

  • Fórmula X ∼ t ( ν ) X sim t(nu)Xpara(ν),em, ν agoraν é o grau de liberdade

  • Função de densidade de probabilidade (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gamaesquerda(frac{nu+1}{2}direita)}{sqrt{nupi} Gamaesquerda(frac{nu}{2}direita)} esquerda(1 + frac{t^2}{nu}direita)^{-frac{nu+1}{2}}e(para;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νpara2)2ν+1

  • Função de distribuição cumulativa (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gamaesquerda(frac{nu+1}{2}direita)}{sqrt{pi nu} Gamaesquerda(frac{nu}{2}direita)} int_0^{t} esquerda(1 + frac{u^2}{nu}direita)^{-frac{nu+1}{2}} duF(para;ν)=21+paraπν Γ(2ν)Γ(2ν+1)0para(1+νvocê2)2ν+1evocê

3.5 Distribuição Qui-Quadrado

  • definição: comumente usado para testes de hipóteses e análises de variância.

  • Fórmula X ∼ χ 2 ( k ) X sim chi^2(k)Xχ2(o),em kko é o grau de liberdade

  • Função de densidade de probabilidade (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 para x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gama(k/2)} x^{k/2-1} e^{-x/2} quad text{para } x geq 0e(x;o)=2o/2Γ(o/2)1xo/21ex/2parax0

  • Função de distribuição cumulativa (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gamaesquerda(frac{k}{2}, frac{x}{2}direita)}{gamaesquerda(frac{k}{2}direita)}F(x;o)=Γ(2o)γ(2o,2x)

3.6 Distribuição F

  • definição: Usado para comparar a variância de duas amostras.

  • Fórmula X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)XF(e1,e2),em e 1 d_1e1 e d 2 d_2e2 é o grau de liberdade

  • Função de densidade de probabilidade (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) para x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Besquerda(frac{d_1}{2}, frac{d_2}{2}direita)} quad text{para } x geq 0e(x;e1,e2)=xB(2e1,2e2)(e1x+e2)e1+e2(e1x)e1e2e2 parax0,em BBB é uma função beta

  • Função de distribuição cumulativa (CDF) F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}esquerda(frac{d_1}{2}, frac{d_2}{2}direita)F(x;e1,e2)=EUe1x+e2e1x(2e1,2e2),em IIEU é uma função beta incompleta

3.7 Relacionamento entre eles

  • A distribuição qui-quadrado ésoma dos quadrados da distribuição normal . Por exemplo, kko A soma dos quadrados das variáveis ​​normais padrão independentes obedece aos graus de liberdade como kko distribuição qui-quadrado.
  • A distribuição t está emConstruído com base na distribuição normal padrão e distribuição qui-quadrado de. Especificamente, a distribuição t pode ser obtida dividindo uma variável normal padrão pela raiz quadrada de sua variável independente de distribuição qui-quadrado.
  • A distribuição F éExtensão da razão de duas variáveis ​​​​independentes distribuídas pelo qui-quadrado . A distribuição F é usada para comparar duas variâncias e é construída tomando a razão de duas variáveis ​​distribuídas qui-quadrado.