2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Sisällysluettelo
Yhden satunnaistetun kontrolloidun tutkimuksen lisäksi
Keskiarvoeron estimaattorien yhdistäminen
Yksi satunnaistettujen kokeiden yksinkertaisimmista laajennuksista on interventiovaikutusten rajoittamaton estimointi. Laadullisesti katsottuna rajattomuudella on merkitystä, kun haluamme arvioida hoitovaikutuksen, joka ei ole satunnainen, vaan on yhtä hyvä kuin satunnainen, kun kontrolloimme kovariaattien Xi joukkoa.
Tämän luennon tarkoituksena on keskustella keskimääräisten interventiovaikutusten tunnistamisesta ja arvioinnista tällä rajoittamattomalla oletuksella. Kuten ennenkin, omaksumme ei-parametrisen lähestymistavan: emme oleta minkään parametrisen mallin hyvää spesifikaatiota, ja keskimääräisten hoitovaikutusten tunnistaminen perustuu kokonaan suunnitteluun (eli ehdollisiin riippumattomuusvaatimuksiin mahdollisten interventiotulosten ja hoitojen suhteen).
Määrittelemme hoidon kausaalisen vaikutuksen sen mahdollisen interventiotuloksen perusteella. Binääriselle interventiolle w∈{0, 1} määritämme mahdolliset tulokset Yi(1) ja Yi(0), jotka vastaavat tuloksia, jotka i:s koehenkilö kokisi, kun hän saa tai ei saa interventiota. Oletamme, että SUTVA,ja haluavat arvioida keskimääräisen interventiovaikutuksen
Ensimmäisellä luennolla otimme satunnaisen interventiotehtävän,, ja useita √n johdonmukaisia ATE:n estimaattoreita tutkitaan.
Helpoin tapa ylittää yhden RCT:n on harkita kahta RCT:tä. Konkreettisena esimerkkinä oletetaan, että olemme kiinnostuneita antamasta teini-ikäisille käteispalkkioita, jotta he eivät rohkaise tupakoimaan. Viisi prosenttia Kalifornian Palo Alton nuorista ja 20 prosenttia Sveitsin Genevessä olevista nuorista oli oikeutettuja osallistumaan tutkimukseen.
Jokaisessa kaupungissa meillä oli satunnaistettuja kontrolloituja tutkimuksia, ja oli itse asiassa helppo nähdä, että interventio auttoi. Aggregoitujen tietojen katsominen voi kuitenkin olla harhaanjohtavaa, jolloin vaikuttaa siltä, että interventio aiheuttaa haittaa, tämä on esimerkki siitä, mitä joskus kutsutaan Simpsonin paradoksiksi: Kun tiedot yhdistettiin, tämä ei enää ollut RCT, koska genevalaiset olivat todennäköisemmin hoidossa ja tupakoivat todennäköisemmin riippumatta siitä, olivatko he hoidossa. Jotta saadaan johdonmukaiset ATE-arviot, meidän on arvioitava interventiovaikutus erikseen jokaiselle kaupungille:
Mitkä ovat tämän estimaattorin tilastolliset ominaisuudet? Miten tämä ajatus yleistyy peräkkäisiin x:ihin?
Oletetaan, että kovariaatti Xi saa arvot diskreetissä avaruudessa Xi∈X, . Oletetaan lisäksi, että hoidon jakaminen on satunnaista jakoa, joka riippuu Xi:stä (eli jokaisella ryhmällä on x-tason määrittelemä RCT):
Määrittele keskimääräinen hoitovaikutus ryhmän sisällä
Sitten, kuten edellä mainittiin, voimme arvioida ATE τ:n aggregoimalla ryhmätason hoitovaikutusestimaatteja,
sisään ,
. Kuinka hyvä tämä arvio on?Intuitiivisesti meidän on arvioitava
"parametri", joten voimme odottaa varianssin olevan lineaarinen p:n kanssa?
Tämän arvion tutkimiseksi voimme kirjoittaa sen seuraavasti. Ensinnäkin mille tahansa ryhmälle, jolla on kovariaatti x, määritä e(x) todennäköisyydeksi saada hoitoa kyseisessä ryhmässä, , ja huomautti
Lisäksi mukaan Luottamatta w:n yksinkertaistaviin oletuksiin voimme saada
Seuraavaksi teemme kokonaisuuden arvioijan määritelty
Havaintojen osuus tulee olemaan
Määritelty sen odotettu arvo, voimme saada
Yhdistämällä nämä osat saamme
On syytä huomata, että asymptoottinen varianssi VAGG ei riipu ryhmien lukumäärästä Kuten näemme myöhemmin, tällä tosiasialla on keskeinen rooli tehtäessä tehokkaasti puoliparametrisia päätelmiä keskimääräisistä interventiovaikutuksista havainnointitutkimuksissa.
Yllä olevassa tarkasteltiin tapausta, jossa X on diskreetti ja tasojen lukumäärä on rajoitettu, ja hoito Wi on yhtä satunnainen kuin ehto Xi = x in (2.1). Tässä tapauksessa havaitsemme, että ATE voidaan silti arvioida tarkasti kokoamalla ryhmän sisäisiä hoitovaikutusestimaatteja, eikä ryhmien tarkka lukumäärä |X| = p vaikuta päättelyn tarkkuuteen. Tämä tulos ei kuitenkaan päde suoraan, jos X on jatkuva (tai jos khi-neliöluku Määritä τ (x) kuten kohdassa .
Yleistääksemme analyysimme diskreetin X-tapauksen ulkopuolelle, emme voi enää yksinkertaisesti yrittää estimoida τ(x):tä jokaiselle Tätä varten meidän on ensin yleistettävä hypoteesi, että jokaiselle ryhmälle on olemassa RCT.Muodollisesti kirjoitamme vain samaa
Vaikka nyt Xi voi olla mielivaltainen satunnaismuuttuja, tätä lausetta on ehkä tulkittava varovaisemmin. Kvalitatiivisesta näkökulmasta yksi käsitys (2.6):sta on se, että olemme mitanneet tarpeeksi kovariaatteja kaapataksemme mahdollisen riippuvuuden Wi:n ja mahdollisen tuloksen välillä, joten kun Xi, Wi ei voi "piipiä"{Yi(0), Yi(1)} .Kutsumme tätä hypoteesiksihämmennys.
Oletus (2.6) näyttää vaikealta käyttää käytännössä, koska se sisältää ehtoja jatkuville satunnaismuuttujille.Kuitenkin, kuten Rosenbaum ja Rubin (1983) huomauttavat, ottamalla huomioon taipumuspisteet
Tilastollisesti taipumuspisteiden keskeinen ominaisuus on, että se on tasapainoinen pistemäärä: jos (2,6) pätee, niin itse asiassa
Toisin sanoen sinun tarvitsee vain ohjata e(X):tä X:n sijaan, jotta interventio ei-satunnaiseen määrittämiseen liittyy harhaa. Voimme vahvistaa tämän lausunnon seuraavasti:
(2.8):n implikaatio on, että jos voimme jakaa havainnot ryhmiin, joilla on (melkein) vakioarvot taipumuspisteessä e(x), niin voimme Vaihtoehdot arvioivat johdonmukaisesti keskimääräisen interventiovaikutuksen.