Κοινή χρήση τεχνολογίας

[Complete Stanford Causal Inference Course] 2_No confusion and trend points 1

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Πίνακας περιεχομένων

Πέρα από μια ενιαία τυχαιοποιημένη ελεγχόμενη δοκιμή

Συνάθροιση εκτιμητών διαφοράς μέσων

Το συνεχές Χ και η βαθμολογία τάσης


Μία από τις απλούστερες επεκτάσεις των τυχαιοποιημένων δοκιμών είναι η απεριόριστη εκτίμηση των επιπτώσεων της παρέμβασης. Από ποιοτική άποψη, ο απεριόριστος χαρακτήρας είναι σημαντικός όταν θέλουμε να εκτιμήσουμε ένα αποτέλεσμα θεραπείας που δεν είναι τυχαίο, αλλά είναι τόσο καλό όσο και τυχαίο όταν ελέγχουμε ένα σύνολο συμμεταβλητών Xi.

Ο σκοπός αυτής της διάλεξης είναι να συζητήσει τον προσδιορισμό και την εκτίμηση των μέσων επιπτώσεων της παρέμβασης υπό αυτήν την απεριόριστη υπόθεση. Όπως και πριν, θα υιοθετήσουμε μια μη παραμετρική προσέγγιση: δεν θα υποθέσουμε καλή προδιαγραφή οποιουδήποτε παραμετρικού μοντέλου και ο προσδιορισμός των μέσων επιπτώσεων της θεραπείας θα βασίζεται εξ ολοκλήρου στον σχεδιασμό (δηλ. ισχυρισμοί ανεξαρτησίας υπό όρους σε σχέση με πιθανά αποτελέσματα και θεραπείες παρέμβασης).

Πέρα από μια ενιαία τυχαιοποιημένη ελεγχόμενη δοκιμή

Ορίζουμε το αιτιολογικό αποτέλεσμα μιας θεραπείας με βάση το πιθανό αποτέλεσμα παρέμβασής της. Για μια δυαδική παρέμβαση w∈{0, 1}, ορίζουμε πιθανά αποτελέσματα Yi(1) και Yi(0), που αντιστοιχούν στα αποτελέσματα που θα είχε το i-ο υποκείμενο όταν λάμβανε ή δεν λάμβανε την παρέμβαση, αντίστοιχα. Υποθέτουμε ότι το SUTVA,Y_i = Y_i (W_i), και επιθυμούν να εκτιμήσουν το μέσο αποτέλεσμα παρέμβασης

text{ATE}=mathbb{E}αριστερά[Y_i(1)-Y_i(0)δεξιά]

Στην πρώτη διάλεξη, υποθέσαμε την ανάθεση τυχαίας παρέμβασης,{Y_i(0), Y_i(1)}perp W_i, και μελετώνται αρκετοί √n συνεπείς εκτιμητές της ΑΤΕ.

Ο ευκολότερος τρόπος για να προχωρήσετε πέρα ​​από ένα RCT είναι να εξετάσετε δύο RCT. Ως συγκεκριμένο παράδειγμα, ας υποθέσουμε ότι μας ενδιαφέρει να δώσουμε στους εφήβους χρηματικές ανταμοιβές για να τους αποθαρρύνουμε από το κάπνισμα. Πέντε τοις εκατό των εφήβων στο Πάλο Άλτο της Καλιφόρνια και το 20% των εφήβων στη Γενεύη της Ελβετίας είχαν δικαίωμα συμμετοχής στη μελέτη.

Μέσα σε κάθε πόλη είχαμε τυχαιοποιημένες ελεγχόμενες μελέτες και ήταν πραγματικά εύκολο να δούμε ότι η παρέμβαση βοήθησε. Ωστόσο, η εξέταση των συγκεντρωτικών δεδομένων μπορεί να είναι παραπλανητική, με αποτέλεσμα να φαίνεται ότι μια παρέμβαση προκαλεί βλάβη, αυτό είναι ένα παράδειγμα αυτού που μερικές φορές ονομάζεται Παράδοξο του Simpson: Μόλις συγκεντρώσαμε τα δεδομένα, αυτό δεν ήταν πλέον RCT, επειδή οι κάτοικοι της Γενεύης ήταν και πιο πιθανό να υποβληθούν σε θεραπεία και να καπνίσουν, ανεξάρτητα από το αν ήταν σε θεραπεία. Για να λάβουμε συνεπείς εκτιμήσεις της ATE, πρέπει να εκτιμήσουμε το αποτέλεσμα παρέμβασης ξεχωριστά για κάθε πόλη:start{aligned} &hat{tau}_{mathrm{PA}}=frac{5}{152+5}-frac{122}{2362+122}περίπου-1,7%, \ &hat{tau}_{mathrm{GVA }}=frac{350}{350+581}-frac{1979}{2278+1979}περίπου-8,9% \ &begin{aligned}hat{tau}=frac{2641}{2641+5188}hat{tau}_ {mathrm{PA}}+frac{5188}{2641+5188}hat{tau}_{mathrm{GVA}}περίπου-6,5%.end{aligned} end{aligned}

Ποιες είναι οι στατιστικές ιδιότητες αυτού του εκτιμητή; Πώς γενικεύεται αυτή η ιδέα σε διαδοχικά x;

Συνάθροιση εκτιμητών διαφοράς μέσων

Ας υποθέσουμε ότι η συμμεταβλητή Xi παίρνει τιμές στον διακριτό χώρο Xi∈X,|mathcal{X}|=σελ . Ας υποθέσουμε περαιτέρω ότι η κατανομή της θεραπείας είναι τυχαία ανάθεση υπό όρους Xi (δηλαδή, κάθε ομάδα έχει ένα RCT που ορίζεται από το επίπεδο x): {Y_i(0), Y_i(1)} perp W_i μεγάλο|  X_i=x, κείμενο{για όλα} xinmathcal{X}.

Καθορίστε το μέσο αποτέλεσμα θεραπείας εντός της ομάδας ωςtau(x)=mathbb{E}begin{bmatrix}Y_i(1)-Y_i(0)&X_i=xend{bmatrix}

Στη συνέχεια, όπως αναφέρθηκε παραπάνω, μπορούμε να υπολογίσουμε την ATE τ αθροίζοντας εκτιμήσεις επίδρασης θεραπείας σε επίπεδο ομάδας,

start{aligned}hat{tau}_{AGG}=sum_{xinmathcal{X}}frac{n_x}{n}hat{tau}(x),quadhat{tau}(x)=frac{1}{n_{ x1}}sum_{{X_i=x,W_i=1}}Y_i-frac{1}{n_{x0}}sum_{{X_i=x,W_i=0}}Y_i,end{στοίχιση}

σε n_x=|{i:X_i=x}|start{aligned}n_{xw}=|{i:X_i=x, W_i=w}|end{aligned} . Πόσο καλή είναι αυτή η εκτίμηση;Διαισθητικά, πρέπει να εκτιμήσουμε|mathcal{X}|=σελ "παράμετρος", οπότε θα μπορούσαμε να περιμένουμε ότι η διακύμανση θα είναι γραμμική με το p?

Για να μελετήσουμε αυτήν την εκτίμηση, μπορούμε να την γράψουμε ως εξής. Πρώτον, για οποιαδήποτε ομάδα με συμμεταβλητή x, ορίστε την e(x) ως την πιθανότητα λήψης θεραπείας σε αυτήν την ομάδα, e(x)=mathbb{P}αριστερά[W_{i}=1 μεγάλο|  X_{i}=xright] , και σημείωσε

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{text{Var}left[Y_i(0) big| X_i=xright]}{1- e(x)}+frac{text{Var}left[Y_i(1) big|.

Επιπλέον, σύμφωνα με mathrm{Var}begin{bmatrix}Y(w)&X=xend{bmatrix} =sigma^{2}(x) Χωρίς να βασιζόμαστε στις απλοποιητικές υποθέσεις του w, μπορούμε να πάρουμε

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{sigma^2(x)}{e(x)(1-e(x)) }σωστά).

Στη συνέχεια, για τον εκτιμητή συνόλου, θα το κάνουμε καπέλο{pi}(x) = n_x/n οριζεται ωςX_{i}=x Η αναλογία των παρατηρήσεων θα είναιpi(x)=mathbb{P}αριστερά[X_i=xright] Ορίζεται ως η αναμενόμενη τιμή του, μπορούμε να πάρουμε

Συνδυάζοντας αυτά τα μέρη παίρνουμεsqrt{n}αριστερά(καπέλο{tau}_{AGG}-taurright)Rightarrowmathcal{N}αριστερά(0,V_{AGG}δεξιά)

 start{gathered} V_{AGG} =mathrm{Var}αριστερά[tau(X_{i})right]+sum_{xinmathcal{X}}pi^{2}(x)frac{1}{pi(x)} frac{sigma^{2}(x)}{e(x)(1-e(x))} \ =mathrm{Var}left[tau(X_i)right]+mathbb{E}left[frac{sigma^ 2(X_i)}{e(X_i)(1-e(X_i))}δεξιά].  τέλος{μαζεμένος}

Αξίζει να σημειωθεί ότι η ασυμπτωτική διακύμανση VAGG δεν εξαρτάται από τον αριθμό των ομάδων |mathcal{X}|=p,Όπως θα δούμε στη συνέχεια, αυτό το γεγονός παίζει βασικό ρόλο στην αποτελεσματική εξαγωγή ημιπαραμετρικών συμπερασμάτων σχετικά με τις μέσες επιδράσεις της παρέμβασης σε μελέτες παρατήρησης.

Συνεχής Χ και το σκορ ροπής

Στα παραπάνω, εξετάσαμε την περίπτωση όπου το X είναι διακριτό και ο αριθμός των επιπέδων περιορισμένος και η επεξεργασία Wi είναι τόσο τυχαία όσο η συνθήκη Xi = x στο (2.1). Σε αυτήν την περίπτωση, διαπιστώνουμε ότι η ATE μπορεί ακόμα να εκτιμηθεί με ακρίβεια αθροίζοντας εκτιμήσεις επίδρασης της θεραπείας εντός της ομάδας και ο ακριβής αριθμός των ομάδων |X = p δεν επηρεάζει την ακρίβεια του συμπεράσματος. Ωστόσο, αυτό το αποτέλεσμα δεν ισχύει άμεσα εάν το X είναι συνεχές (ή αν ο αριθμός χ-τετράγωνο του Ορίστε τ (x) όπως στο .

Για να γενικεύσουμε την ανάλυσή μας πέρα ​​από την περίπτωση διακριτού-Χ, δεν μπορούμε πλέον απλώς να προσπαθήσουμε να υπολογίσουμε τ(x) για κάθε τιμή του Για να γίνει αυτό, πρέπει πρώτα να γενικεύσουμε την υπόθεση ότι υπάρχει ένα RCT για κάθε ομάδα.Τυπικά, απλώς γράφουμε το ίδιο

 {Y_i(0),Y_i(1)}perp W_i big|  X_i,quad(2.6)

Αν και τώρα το Xi μπορεί να είναι μια αυθαίρετη τυχαία μεταβλητή, αυτή η δήλωση μπορεί να χρειαστεί να ερμηνευτεί με μεγαλύτερη προσοχή. Από ποιοτική άποψη, μια κατανόηση του (2.6) είναι ότι έχουμε μετρήσει αρκετές συμμεταβλητές για να καταγράψουμε οποιαδήποτε εξάρτηση μεταξύ του Wi και του πιθανού αποτελέσματος, έτσι ώστε δεδομένου του Xi, το Wi δεν μπορεί να "Peep"{Yi(0), Yi(1)} .Αυτήν την υπόθεση την ονομάζουμεασύγχυση.

Η υπόθεση (2.6) φαίνεται δύσκολο να χρησιμοποιηθεί στην πράξη επειδή περιλαμβάνει συνθήκες για συνεχείς τυχαίες μεταβλητές.Ωστόσο, όπως επισημαίνουν οι Rosenbaum και Rubin (1983), λαμβάνοντας υπόψη τη βαθμολογία τάσης e(x)=mathbb{P}αρχή{bmatrix}W_i=1 μεγάλο|  X_i=xend{bmatrix}

Στατιστικά, μια βασική ιδιότητα της βαθμολογίας τάσης είναι ότι είναι μια ισορροπημένη βαθμολογία: αν ισχύει (2,6), τότε στην πραγματικότητα

 {Y_i(0),Y_i(1)}perp W_i |  e(X_i),quad(2.8)

Δηλαδή, στην πραγματικότητα χρειάζεται μόνο να ελέγξετε το e(X) παρά το X για να εξαλείψετε την προκατάληψη που σχετίζεται με τη μη τυχαία ανάθεση στην παρέμβαση. Μπορούμε να επαληθεύσουμε αυτή τη δήλωση με:

 start{aligned} &mathbb{P}αριστερά[W_{i}=w μεγάλο|  {Y_{i}(0), Y_{i}(1)μεγάλο} , e(X_{i})δεξιά] \ &=int_{mathcal{X}}mathbb{P}αριστερά[W_i=w μεγάλο|  {Y_i(w)} ,X_i=xright]mathbb{P}αριστερά[X_i=x μεγάλο|  {Y_i(w)} , e(X_i)δεξιά] dx \ &=int_{mathcal{X}}mathbb{P}αριστερά[W_i=w μεγάλο|  X_i=xright]mathbb{P}αριστερά[X_i=x μεγάλο|  big{Y_i(w)big} , e(X_i)right] dxquadtext{(unconf.)} \ &=e(X_{i})mathbf{1}_{w=1}+(1-e(X_{ i}))mathbf{1}_{w=0}.  end{ευθυγραμμισμένο}

Η επίπτωση του (2.8) είναι ότι αν μπορούμε να χωρίσουμε τις παρατηρήσεις σε ομάδες με (σχεδόν) σταθερές τιμές της βαθμολογίας τάσης e(x), τότε μπορούμεκαπέλο{tau}_{AGG} Παραλλαγές της σταθερής εκτίμησης του μέσου αποτελέσματος παρέμβασης.