Κοινή χρήση τεχνολογίας

[Μαθηματική Στατιστική] 2-Τυχαίες μεταβλητές και οι κατανομές πιθανοτήτων τους

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


1. Ορισμός και ταξινόμηση τυχαίων μεταβλητών

Ορισμός: Μια τυχαία μεταβλητή είναι μια μεταβλητή που παίρνει διαφορετικές τιμές σε ένα τυχαίο πείραμα.

  1. Κατηγορική τυχαία μεταβλητή (Ονομαστική)

    • Παράδειγμα: Φύλο (άνδρας, γυναίκα), επάγγελμα (δημόσιος υπάλληλος, εταιρικός υπάλληλος, φοιτητής, συνταξιούχος, άνεργος), αποτέλεσμα εξέτασης (αρνητικό, θετικό)
  2. Ταξινομημένη κατηγορική τυχαία μεταβλητή (Παραγγελία)

    • Παραδείγματα: στάση (συμφωνώ απόλυτα, συμφωνώ, ουδέτερος, διαφωνώ, διαφωνώ απόλυτα), συχνότητα χρήσης (μία φορά την εβδομάδα, μία φορά κάθε δύο εβδομάδες, μία φορά κάθε έξι μήνες, σχεδόν ποτέ, ποτέ)
  3. Αριθμητική τυχαία μεταβλητή

    • Παράδειγμα: Ηλικία (13, 14, 15, 16...), εισόδημα (μπορείτε να συμπληρώσετε οποιαδήποτε τιμή)

2. Διακριτή κατανομή πιθανοτήτων

2.1 Διωνυμική Κατανομή

  • ορισμός: περιγράφεται στο nnn Επιτυχής σε ανεξάρτητες δοκιμές κκκ Η πιθανότητα επιτυχίας σε κάθε δοκιμή είναι σελΠ
  • τύπος X ∼ Bin ( n , p ) X sim text{Bin}(n, p)ΧΑποθήκη(n,Π)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = k ) = ( nk ) pk ( 1 − p ) n − k P(X = k) = binom{n}{k} p^k (1-p)^{nk}Π(Χ=κ)=(κn)Πκ(1Π)nκ
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = k ) = ∑ i = 0 k ( ni ) pi ( 1 − p ) n − i F(X = k) = sum_{i=0}^{k} binom{n}{i} p^ i (1-p)^{ni}φά(Χ=κ)=Εγώ=0κ(Εγώn)ΠΕγώ(1Π)nΕγώ

2.2 Κατανομή Bernoulli

  • ορισμός: Περιγράφει την πιθανότητα επιτυχίας (ή αποτυχίας) σε ένα πείραμα Η πιθανότητα επιτυχίας είναι σελΠ
  • τύπος X ∼ Βέρνη ( p ) X sim text{Bern}(p)ΧΒέρνη(Π)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = x ) = { p if x = 1 1 − p if x = 0 P(X = x) ={ΠανΧ=11ΠανΧ=0 Π(Χ=Χ)={Π1ΠανΧ=1ανΧ=0
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = x ) = { 0 εάν x &lt; 0 1 − p εάν 0 ≤ x &lt; 1 1 εάν x ≥ 1 F(X = x) ={0ανΧ<01Παν0Χ<11ανΧ1 φά(Χ=Χ)= 01Π1ανΧ<0αν0Χ<1ανΧ1

2.3 Γεωμετρική Κατανομή

  • ορισμός: Περιγράφει την πιθανότητα του αριθμού των αποτυχιών πριν από την πρώτη επιτυχία Η πιθανότητα επιτυχίας σε κάθε δοκιμή είναι σελΠ
  • τύπος X ∼ Geom ( p ) X sim text{Geom}(p)ΧGeom(Π)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = k ) = ( 1 − p ) kp P(X = k) = (1-p)^kpΠ(Χ=κ)=(1Π)κΠ
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1}φά(Χ=κ)=1(1Π)κ+1

2.4 Αρνητική διωνυμική κατανομή

  • ορισμός: Περιγράφει τον αριθμό των αποτυχιών πριν φτάσει στην rth επιτυχία Η πιθανότητα επιτυχίας για κάθε δοκιμή είναι σελΠ
  • τύπος X ∼ NegBin ( r , p ) X sim text{NegBin}(r, p)ΧNegBin(r,Π)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = k ) = ( k + r − 1 k ) pr ( 1 − p ) k P(X = k) = binom{k + r - 1}{k} p^r (1-p)^kΠ(Χ=κ)=(κκ+r1)Πr(1Π)κ
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) pr ( 1 − p ) i F(X = k) = sum_{i=0}^{k} binom{i + r - 1}{i} p^r (1-p)^iφά(Χ=κ)=Εγώ=0κ(ΕγώΕγώ+r1)Πr(1Π)Εγώ

2.5 Υπεργεωμετρική Κατανομή

  • ορισμός: Περιγράφει δειγματοληψία από πεπερασμένο πληθυσμό χωρίς αντικατάσταση nnn φορές, επιτυχημένη κκκ φορές πιθανότητα.
  • τύπος X ∼ Hypergeom ( N , K , n ) X sim text{Hypergeom}(N, K, n)ΧΥπεργεώμ(Ν,κ,n)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = frac{binom{K}{k} binom{NK}{nk}}{binom{ N}{n}}Π(Χ=κ)=(nΝ)(κκ)(nκΝκ)
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = sum_{i=0}^{k} frac{binom{K }{i} binom{NK}{ni}}{binom{N}{n}}φά(Χ=κ)=Εγώ=0κ(nΝ)(Εγώκ)(nΕγώΝκ)

2.6 Διανομή Poisson

  • ορισμός: Η περιγραφή εμφανίζεται εντός μονάδας χρόνου κκκ Η πιθανότητα ενός συμβάντος, ο μέσος ρυθμός εμφάνισης του συμβάντος είναι λ.
  • τύπος X ∼ Poisson ( λ ) X sim text{Poisson}(λάμδα)ΧPoisson(λ)
  • Συνάρτηση μάζας πιθανότητας (PMF) P ( X = k ) = λ ke − λ k ! P(X = k) = frac{lambda^ke^{-lambda}}{k!}Π(Χ=κ)=κ!λκμιλ
  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ ii ! F(X = k) = e^{-λάμδα} sum_{i=0}^{k} frac{lambda^i}{i!}φά(Χ=κ)=μιλΕγώ=0κΕγώ!λΕγώ

2.7 Η μεταξύ τους σχέση

  • Κατανομή Bernoulliείναι ένα ιδιαίτεροδιωνυμική κατανομή,πότε n = 1 n = 1n=1 ώρα.
  • γεωμετρική κατανομήείναι η κατανομή του αριθμού των δοκιμών που απαιτούνται πριν από την πρώτη επιτυχία, η οποία μπορεί να θεωρηθεί ωςδιωνυμική κατανομήεπέκταση.
  • αρνητική διωνυμική κατανομήμπορεί να θεωρηθεί ωςγεωμετρική κατανομήΓενίκευση του , χρησιμοποιείται για να περιγράψει τον αριθμό των αστοχιών που απαιτούνται πριν από τις επιτυχίες r.
  • υπεργεωμετρική κατανομήΠαρόμοιο μεδιωνυμική κατανομή, αλλά κατάλληλο για πεπερασμένους πληθυσμούς και δειγματοληψία χωρίς αντικατάσταση.
  • Κατανομή PoissonΝαίδιωνυμική κατανομήΗ οριακή περίπτωση του nnn πολύ μεγάλο και σελΠ πολύ νέος, και λ = np λάμδα = npλ=nΠ κρατήστε σταθερό.

3. Συνεχής κατανομή πιθανοτήτων

3.1 Εκθετική Κατανομή

  • ορισμός: Η εκθετική κατανομή είναι μια συνεχής κατανομή πιθανότητας που χρησιμοποιείται συχνά για να περιγράψει τα χρονικά διαστήματα μεταξύ ανεξάρτητων γεγονότων.

  • τύπος X ∼ Εκθετικό ( λ ) X sim text{Exponential}(λάμδα)ΧΕκθετικός(λ),σε λ &gt; 0 λάμδα&gt;0λ>0 είναι η παράμετρος του ποσοστού

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( x ; λ ) = λ e − λ x για x ≥ 0 f(x; λάμδα) = λάμδα e^{-λάμδα x} τετραπλό κείμενο{for } x geq 0φά(Χ;λ)=λμιλΧΓιαΧ0

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( x ; λ ) = 1 − e − λ x για x ≥ 0 F(x; λάμδα) = 1 - e^{-λάμδα x} quad text{for } x geq 0φά(Χ;λ)=1μιλΧΓιαΧ0

3.2 Κατανομή γάμμα

  • ορισμός: Περιγράφει τη συσσώρευση του χρόνου αναμονής και είναι μια γενίκευση της εκθετικής κατανομής και της κατανομής χ².

  • τύπος X ∼ Γάμμα ( k , θ ) X sim text{Gamma}(k, theta)ΧΓάμμα(κ,θ),σε k &gt; 0 k&gt;0κ>0 είναι η παράμετρος σχήματος, θ &gt; 0 θήτα&gt;0θ>0 είναι η παράμετρος κλίμακας

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( x ; k , θ ) = xk − 1 e − x / θ θ k Γ ( k ) for x ≥ 0 f(x; k, theta) = frac{x^{k-1}e^{-x /theta}}{theta^k Gamma(k)} τετραπλό κείμενο{για } x geq 0φά(Χ;κ,θ)=θκΓ(κ)Χκ1μιΧ/θΓιαΧ0,σε Γ ( k ) Gamma(k)Γ(κ) είναι η συνάρτηση γάμμα

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, θήτα) = frac{gamma(k, x/theta)}{Gamma(k)}φά(Χ;κ,θ)=Γ(κ)γ(κ,Χ/θ),σε γ ( k , x / θ ) γάμμα(k, x/theta)γ(κ,Χ/θ) είναι μια ατελής συνάρτηση γάμμα.

3.3 Κανονική κατανομή

  • ορισμός: Περιγράφει την κατανομή του αθροίσματος ενός μεγάλου αριθμού ανεξάρτητων τυχαίων μεταβλητών και χρησιμοποιείται ευρέως στις φυσικές και κοινωνικές επιστήμες.

  • τύπος X ∼ N ( μ , σ 2 ) X sim mathcal{N}(mu, sigma^2)ΧΝ(μ,σ2),σε, μ muμ είναι η μέση τιμή, σ 2 σίγμα^2σ2 είναι η διακύμανση

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; mu, sigma^2) = frac{1}{sqrt{2pisigma^2}} e ^{-frac{(x-mu)^2}{2sigma^2}}φά(Χ;μ,σ2)=2πσ2 1μι2σ2(Χμ)2

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; mu, sigma^2) = frac{1}{2}left[1 + όνομα χειριστή{ erf}αριστερά(frac{x-mu}{sqrt{2sigma^2}}δεξιά)δεξιά]φά(Χ;μ,σ2)=21[1+erf(2σ2 Χμ)], όπου erf είναι η συνάρτηση σφάλματος.

3.4 t-Κατανομή

  • ορισμός: Χρησιμοποιείται για τον έλεγχο υποθέσεων και την εκτίμηση του διαστήματος εμπιστοσύνης σε καταστάσεις μικρών δειγμάτων.

  • τύπος X ~ t ( ν ) X sim t(nu)Χt(ν),σε, ν nuν είναι ο βαθμός ελευθερίας

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; nu) = frac{Gammaleft(frac{nu+1} {2}δεξιά)}{sqrt{nupi} Gammaleft(frac{nu}{2}δεξιά)} αριστερά(1 + frac{t^2}{nu}δεξιά)^{-frac{nu+1}{2} }φά(t;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νt2)2ν+1

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 du F(t; nu) = frac{ 1}{2} + tfrac{Gammaleft(frac{nu+1}{2}δεξιά)}{sqrt{pi nu} Gammaleft(frac{nu}{2}δεξιά)} int_0^{t} αριστερά(1 + frac {u^2}{nu}δεξιά)^{-frac{nu+1}{2}} duφά(t;ν)=21+tπν Γ(2ν)Γ(2ν+1)0t(1+νu2)2ν+1ρεu

3.5 Κατανομή Chi-Square

  • ορισμός: Χρησιμοποιείται συνήθως για τον έλεγχο υποθέσεων και την ανάλυση της διακύμανσης.

  • τύπος X ~ χ 2 ( k ) X sim chi^2(k)Χχ2(κ),σε κκκ είναι ο βαθμός ελευθερίας

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 για x ≥ 0 f(x; k) = frac{1}{2^{k/2 } Gamma(k/2)} x^{k/2-1} e^{-x/2} τετραγωνικό κείμενο{for } x geq 0φά(Χ;κ)=2κ/2Γ(κ/2)1Χκ/21μιΧ/2ΓιαΧ0

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = frac{gammaleft(frac{k}{2}, frac{x}{2}δεξιά)}{ Gammaleft(frac{k}{2}δεξιά)}φά(Χ;κ)=Γ(2κ)γ(2κ,2Χ)

3.6 Κατανομή F

  • ορισμός: Χρησιμοποιείται για τη σύγκριση της διακύμανσης δύο δειγμάτων.

  • τύπος X ~ F (d 1 , d 2 ) X sim F(d_1, d_2)Χφά(ρε1,ρε2),σε d 1 d_1ρε1 και d 2 d_2ρε2 είναι ο βαθμός ελευθερίας

  • Συνάρτηση πυκνότητας πιθανότητας (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) για x ≥ 0 f(x; d_1, d_2) = frac{sqrt{frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x Bleft(frac {d_1}{2}, frac{d_2}{2}right)} quad text{for } x geq 0φά(Χ;ρε1,ρε2)=Χσι(2ρε1,2ρε2)(ρε1Χ+ρε2)ρε1+ρε2(ρε1Χ)ρε1ρε2ρε2 ΓιαΧ0,σε ΒΒσι είναι μια συνάρτηση βήτα

  • Συνάρτηση αθροιστικής κατανομής (CDF) F ( x ; d 1 , d 2 ) = I d 1 xd 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{frac{d_1 x}{d_1 x + d_2 }}αριστερά(frac{d_1}{2}, frac{d_2}{2}δεξιά)φά(Χ;ρε1,ρε2)=Εγώρε1Χ+ρε2ρε1Χ(2ρε1,2ρε2),σε IIΕγώ είναι μια ατελής συνάρτηση βήτα

3.7 Η μεταξύ τους σχέση

  • Η κατανομή χ-τετράγωνο είναιΆθροισμα τετραγώνων κανονικής κατανομής . Για παράδειγμα, κκκ Το άθροισμα των τετραγώνων των ανεξάρτητων τυπικών κανονικών μεταβλητών υπακούει στους βαθμούς ελευθερίας όπως κκκ κατανομή χι-τετράγωνο.
  • Η κατανομή t είναι μέσαΚατασκευάστηκε με βάση την τυπική κανονική κατανομή και την κατανομή χι-τετράγωνο του. Συγκεκριμένα, η κατανομή t μπορεί να ληφθεί διαιρώντας μια τυπική κανονική μεταβλητή με την τετραγωνική ρίζα της ανεξάρτητης μεταβλητής κατανομής χ-τετράγωνο.
  • Η κατανομή F είναιΕπέκταση του λόγου δύο ανεξάρτητων κατανεμημένων μεταβλητών χ-τετράγωνο . Η κατανομή F χρησιμοποιείται για τη σύγκριση δύο διακυμάνσεων και κατασκευάζεται λαμβάνοντας τον λόγο δύο κατανεμημένων μεταβλητών χ-τετράγωνο.