1. Definição e classificação de variáveis aleatórias
Definição: Uma variável aleatória é uma variável que assume valores diferentes em um experimento aleatório.
Variável aleatória categórica (nominal)
Exemplo: Gênero (masculino, feminino), ocupação (funcionário público, funcionário corporativo, estudante, aposentado, desempregado), resultado do teste (negativo, positivo)
Variável aleatória categórica ordenada (ordenada)
Exemplos: atitude (concordo totalmente, concordo, neutro, discordo, discordo totalmente), frequência de uso (uma vez por semana, uma vez a cada duas semanas, uma vez a cada seis meses, quase nunca, nunca)
Variável aleatória numérica
Exemplo: Idade (13, 14, 15, 16...), renda (pode preencher qualquer valor)
2. Distribuição de probabilidade discreta
2.1 Distribuição Binomial
definição: descrito em nãoe Sucesso em testes independentes kko A probabilidade de cada tentativa ser bem sucedida é ppp。
Fórmula: X ∼ Bin ( n , p ) X sim texto{Bin}(n, p)X∼Lixeira(e,p)
Função de massa de probabilidade (PMF): P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binômio{n}{k} p^k (1-p)^{nk}P(X=o)=(oe)po(1−p)e−o
Função de distribuição cumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = soma_{i=0}^{k} binômio{n}{i} p^i (1-p)^{ni}F(X=o)=∑eu=0o(eue)peu(1−p)e−eu
2.2 Distribuição Bernoulli
definição: Descreve a probabilidade de sucesso (ou fracasso) em um experimento. A probabilidade de sucesso é. ppp。
Fórmula: X ∼ Berna ( p ) X sim texto{Bern}(p)X∼Bern(p)
Função de massa de probabilidade (PMF): P ( X = x ) = { p se x = 1 1 − p se x = 0 P(X = x) ={psex=11−psex=0P(X=x)={p1−psex=1sex=0
Função de distribuição cumulativa (CDF): F ( X = x ) = { 0 se x < 0 1 − p se 0 ≤ x < 1 1 se x ≥ 1 F(X = x) ={0sex<01−pse0≤x<11sex≥1F(X=x)=⎩⎨⎧01−p1sex<0se0≤x<1sex≥1
2.3 Distribuição Geométrica
definição: Descreve a probabilidade do número de falhas antes do primeiro sucesso. A probabilidade de sucesso em cada tentativa é. ppp。
Fórmula: X ∼ Geom ( p ) X sim texto{Geom}(p)X∼Geométrica(p)
Função de massa de probabilidade (PMF): P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpP(X=o)=(1−p)op
Função de distribuição cumulativa (CDF): F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}F(X=o)=1−(1−p)o+1
2.4 Distribuição Binomial Negativa
definição: Descreve o número de falhas antes de atingir o enésimo sucesso. A probabilidade de sucesso para cada tentativa é. ppp。
Fórmula: X ∼ NegBin ( r , p ) X sim texto{NegBin}(r, p)X∼NegBin(r,p)
Função de massa de probabilidade (PMF): P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binômio{k + r - 1}{k} p^r (1-p)^kP(X=o)=(oo+r−1)pr(1−p)o
Função de distribuição cumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = soma_{i=0}^{k} binômio{i + r - 1}{i} p^r (1-p)^iF(X=o)=∑eu=0o(eueu+r−1)pr(1−p)eu
2.5 Distribuição Hipergeométrica
definição: Descreve a amostragem de uma população finita sem reposição nãoe vezes, bem sucedido kko vezes a probabilidade.
Fórmula: X ∼ Hipergeom ( N , K , n ) X sim texto{Hipergeom}(N, K, n)X∼Hipergeom(Nãoãoãoãoãoão,E,e)
Função de massa de probabilidade (PMF): P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{N}{n}}P(X=o)=(eNãoãoãoãoãoão)(oE)(e−oNãoãoãoãoãoão−E)
Função de distribuição cumulativa (CDF): F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = soma_{i=0}^{k} frac{binom{K}{i} binom{NK}{ni}}{binom{N}{n}}F(X=o)=∑eu=0o(eNãoãoãoãoãoão)(euE)(e−euNãoãoãoãoãoão−E)
2.6 Distribuição de Poisson
definição: A descrição ocorre dentro da unidade de tempo kko A probabilidade de um evento, a taxa média de ocorrência do evento é λ.
Fórmula: X ∼ Poisson ( λ ) X sim texto{Poisson}(lambda)X∼Poisson(λ)
Função de massa de probabilidade (PMF): P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}P(X=o)=o!λoe−λ
Função de distribuição cumulativa (CDF): F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-lambda} soma_{i=0}^{k} frac{lambda^i}{i!}F(X=o)=e−λ∑eu=0oeu!λeu
2.7 Relacionamento entre eles
Distribuição Bernoullié um especialdistribuição binomial,quando n = 1 n = 1e=1 hora.
distribuição geométricaé a distribuição do número de tentativas necessárias antes do primeiro sucesso, que pode ser visto comodistribuição binomialextensão.
distribuição binomial negativapode ser visto comodistribuição geométricaGeneralização de, usada para descrever o número de falhas necessárias antes de r sucessos.
distribuição hipergeométricaIgual adistribuição binomial, mas adequado para populações finitas e amostragem sem reposição.
Distribuição de venenosimdistribuição binomialO caso limite de nãoe muito grande e ppp muito jovem e λ = np lambda = npλ=ep mantenha constante.
3. Distribuição de probabilidade contínua
3.1 Distribuição Exponencial
definição: A distribuição exponencial é uma distribuição de probabilidade contínua frequentemente usada para descrever os intervalos de tempo entre eventos independentes.
Fórmula: X ∼ Exponencial ( λ ) X sim texto{Exponencial}(lambda)X∼Exponencial(λ),em λ > 0 lambda>0λ>0 é o parâmetro de taxa
Função de densidade de probabilidade (PDF): f ( x ; λ ) = λ e − λ x para x ≥ 0 f(x; lambda) = lambda e^{-lambda x} quad text{para } x geq 0e(x;λ)=λe−λxparax≥0
Função de distribuição cumulativa (CDF): F ( x ; λ ) = 1 − e − λ x para x ≥ 0 F(x; lambda) = 1 - e^{-lambda x} quad text{para } x geq 0F(x;λ)=1−e−λxparax≥0
3.2 Distribuição Gama
definição: Descreve o acúmulo de tempo de espera e é uma generalização da distribuição exponencial e da distribuição χ².
Fórmula: X ∼ Gamma ( k , θ ) X sim texto{Gamma}(k, theta)X∼Gama(o,θ),em k > 0 k>0o>0 é o parâmetro de forma, θ > 0 teta>0θ>0 é o parâmetro de escala
Função de densidade de probabilidade (PDF): f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) para x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x/theta}}{theta^k Gamma(k)} quad text{para } x geq 0e(x;o,θ)=θoΓ(o)xo−1e−x/θparax≥0,em Γ ( k ) Gama(k)Γ(o) é a função gama
Função de distribuição cumulativa (CDF): F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, teta) = frac{gama(k, x/teta)}{gama(k)}F(x;o,θ)=Γ(o)γ(o,x/θ),em γ ( k , x / θ ) gama(k, x/teta)γ(o,x/θ) é uma função gama incompleta.
3.3 Distribuição Normal
definição: Descreve a distribuição da soma de um grande número de variáveis aleatórias independentes e é amplamente utilizado em ciências naturais e ciências sociais.
Fórmula: X ∼ N ( μ , σ 2 ) X sim matemática{N}(mu, sigma^2)X∼Nãoãoãoãoãoão(μ,σ2),em, μmμ é o valor médio, σ 2 sigma^2σ2 é a variação
Função de densidade de probabilidade (PDF): f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e^{-frac{(x-mu)^2}{2sigma^2}}e(x;μ,σ2)=2πσ21e−2σ2(x−μ)2
Função de distribuição cumulativa (CDF): F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}esquerda[1 + nome do operador{erf}esquerda(frac{x-mu}{sqrt{2sigma^2}}direita)direita]F(x;μ,σ2)=21[1+terra firme(2σ2x−μ)], onde erf é a função de erro.
3.4 Distribuição t
definição: Usado para testes de hipóteses e estimativas de intervalos de confiança em situações de amostras pequenas.
Fórmula: X ∼ t ( ν ) X sim t(nu)X∼para(ν),em, ν agoraν é o grau de liberdade
Função de densidade de probabilidade (PDF): f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gamaesquerda(frac{nu+1}{2}direita)}{sqrt{nupi} Gamaesquerda(frac{nu}{2}direita)} esquerda(1 + frac{t^2}{nu}direita)^{-frac{nu+1}{2}}e(para;ν)=νπΓ(2ν)Γ(2ν+1)(1+νpara2)−2ν+1
Função de distribuição cumulativa (CDF): F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{1}{2} + tfrac{Gamaesquerda(frac{nu+1}{2}direita)}{sqrt{pi nu} Gamaesquerda(frac{nu}{2}direita)} int_0^{t} esquerda(1 + frac{u^2}{nu}direita)^{-frac{nu+1}{2}} duF(para;ν)=21+paraπνΓ(2ν)Γ(2ν+1)∫0para(1+νvocê2)−2ν+1evocê
3.5 Distribuição Qui-Quadrado
definição: comumente usado para testes de hipóteses e análises de variância.
Fórmula: X ∼ χ 2 ( k ) X sim chi^2(k)X∼χ2(o),em kko é o grau de liberdade
Função de densidade de probabilidade (PDF): f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 para x ≥ 0 f(x; k) = frac{1}{2^{k/2} Gama(k/2)} x^{k/2-1} e^{-x/2} quad text{para } x geq 0e(x;o)=2o/2Γ(o/2)1xo/2−1e−x/2parax≥0
Função de distribuição cumulativa (CDF): F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gamaesquerda(frac{k}{2}, frac{x}{2}direita)}{gamaesquerda(frac{k}{2}direita)}F(x;o)=Γ(2o)γ(2o,2x)
3.6 Distribuição F
definição: Usado para comparar a variância de duas amostras.
Fórmula: X ∼ F ( d 1 , d 2 ) X sim F(d_1, d_2)X∼F(e1,e2),em e 1 d_1e1 e d 2 d_2e2 é o grau de liberdade
Função de densidade de probabilidade (PDF): f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) para x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Besquerda(frac{d_1}{2}, frac{d_2}{2}direita)} quad text{para } x geq 0e(x;e1,e2)=xB(2e1,2e2)(e1x+e2)e1+e2(e1x)e1e2e2parax≥0,em BBB é uma função beta
Função de distribuição cumulativa (CDF): F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2}}esquerda(frac{d_1}{2}, frac{d_2}{2}direita)F(x;e1,e2)=EUe1x+e2e1x(2e1,2e2),em IIEU é uma função beta incompleta
3.7 Relacionamento entre eles
A distribuição qui-quadrado ésoma dos quadrados da distribuição normal . Por exemplo, kko A soma dos quadrados das variáveis normais padrão independentes obedece aos graus de liberdade como kko distribuição qui-quadrado.
A distribuição t está emConstruído com base na distribuição normal padrão e distribuição qui-quadrado de. Especificamente, a distribuição t pode ser obtida dividindo uma variável normal padrão pela raiz quadrada de sua variável independente de distribuição qui-quadrado.
A distribuição F éExtensão da razão de duas variáveis independentes distribuídas pelo qui-quadrado . A distribuição F é usada para comparar duas variâncias e é construída tomando a razão de duas variáveis distribuídas qui-quadrado.