2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Table des matières
Au-delà d’un seul essai contrôlé randomisé
Agrégation des estimateurs de différence de moyennes
X continu et le score de propension
L’une des extensions les plus simples des essais randomisés est l’estimation sans contrainte des effets de l’intervention. D'un point de vue qualitatif, le caractère illimité est pertinent lorsque nous voulons estimer un effet de traitement qui n'est pas aléatoire, mais qui est presque aléatoire une fois que nous contrôlons un ensemble de covariables Xi.
Le but de cette conférence est de discuter de l'identification et de l'estimation des effets moyens de l'intervention sous cette hypothèse illimitée. Comme auparavant, nous adopterons une approche non paramétrique : nous ne supposerons pas une bonne spécification d'un modèle paramétrique, et l'identification des effets moyens du traitement sera entièrement déterminée par la conception (c'est-à-dire les affirmations d'indépendance conditionnelle par rapport aux résultats potentiels de l'intervention et des traitements).
Nous définissons l'effet causal d'un traitement par le résultat potentiel de l'intervention. Pour une intervention binaire w∈{0, 1}, nous définissons les résultats potentiels Yi(1) et Yi(0), correspondant aux résultats que le i-ème sujet connaîtrait en recevant ou non l'intervention, respectivement. Nous supposons que SUTVA,, et souhaite estimer l’effet moyen de l’intervention
Dans le premier cours, nous avons supposé une assignation d'intervention aléatoire,, et plusieurs √n estimateurs cohérents de l'ATE sont étudiés.
Le moyen le plus simple d’aller au-delà d’un seul ECR est d’envisager deux ECR. À titre d'exemple concret, supposons que nous souhaitions offrir des récompenses en espèces aux adolescents pour les décourager de fumer. Cinq pour cent des adolescents de Palo Alto, en Californie, et 20 % des adolescents de Genève, en Suisse, étaient éligibles pour participer à l'étude.
Dans chaque ville, nous avons mené des études contrôlées randomisées et il était en fait facile de constater que l'intervention avait aidé. Cependant, l'examen des données globales peut être trompeur, donnant l'impression qu'une intervention cause un préjudice ; il s'agit d'un exemple de ce que l'on appelle parfois le paradoxe de Simpson : Une fois les données regroupées, il ne s’agissait plus d’un ECR car les Genevois étaient à la fois plus susceptibles d’être sous traitement et plus susceptibles de fumer, qu’ils soient ou non sous traitement. Afin d’obtenir des estimations ATE cohérentes, nous devons estimer l’effet de l’intervention séparément pour chaque ville :
Quelles sont les propriétés statistiques de cet estimateur ? Comment cette idée se généralise-t-elle aux x consécutifs ?
Supposons que la covariable Xi prend des valeurs dans l'espace discret Xi∈X, . Supposons en outre que l'attribution du traitement soit une assignation aléatoire conditionnelle à Xi (c'est-à-dire que chaque groupe a un ECR défini par le niveau x) :
Définissez l’effet moyen du traitement au sein du groupe comme suit :
Ensuite, comme mentionné ci-dessus, nous pouvons estimer l'ATE τ en agrégeant les estimations de l'effet du traitement au niveau du groupe,
dans ,
. Quelle est la qualité de cette estimation ?Intuitivement, nous devons estimer
"paramètre", donc on pourrait s'attendre à ce que la variance soit linéaire avec p ?
Pour étudier cette estimation, nous pouvons l’écrire comme suit. Premièrement, pour tout groupe avec une covariable x, définissez e(x) comme la probabilité de recevoir un traitement dans ce groupe, , et a noté
Par ailleurs, selon Sans recourir aux hypothèses simplificatrices de w, on peut obtenir
Ensuite, pour l’estimateur d’ensemble, nous allons défini comme
La proportion d'observations sera
Défini comme sa valeur attendue, on peut obtenir
En rassemblant ces pièces, nous obtenons
Il est à noter que la variance asymptotique VAGG ne dépend pas du nombre de groupes Comme nous le verrons plus tard, ce fait joue un rôle clé dans la réalisation efficace d’inférences semi-paramétriques sur les effets moyens des interventions dans les études observationnelles.
Dans ce qui précède, nous avons considéré le cas où X est discret et le nombre de niveaux est limité, et le traitement Wi est aussi aléatoire que la condition Xi = x dans (2.1). Dans ce cas, nous constatons que l'ATE peut toujours être estimé avec précision en agrégeant les estimations de l'effet du traitement au sein du groupe, et que le nombre exact de groupes |X| n'affecte pas la précision de l'inférence. Cependant, ce résultat ne s'applique pas directement si X est continu (ou si le nombre du chi carré de Définir τ (x) comme dans .
Pour généraliser notre analyse au-delà du cas des X discrets, nous ne pouvons plus simplement essayer d'estimer τ(x) pour chaque valeur de Pour ce faire, il faut d’abord généraliser l’hypothèse selon laquelle il existe un ECR pour chaque groupe.Formellement, nous écrivons simplement la même chose
Bien que Xi puisse désormais être une variable aléatoire arbitraire, cette affirmation doit peut-être être interprétée avec plus de prudence. D'un point de vue qualitatif, une compréhension de (2.6) est que nous avons mesuré suffisamment de covariables pour capturer toute dépendance entre Wi et le résultat potentiel, de sorte que étant donné Xi, Wi ne peut pas « Peep » {Yi(0), Yi(1)} .Nous appelons cette hypothèseincompréhension.
L’hypothèse (2.6) semble difficile à utiliser en pratique car elle implique des conditions pour des variables aléatoires continues.Cependant, comme le soulignent Rosenbaum et Rubin (1983), en considérant le score de propension
Statistiquement, une propriété clé du score de propension est qu’il s’agit d’un score équilibré : si (2.6) est vérifié, alors en fait
Autrement dit, il vous suffit en réalité de contrôler e(X) plutôt que X pour éliminer le biais associé à une affectation non aléatoire à l'intervention. Nous pouvons vérifier cette affirmation par :
L’implication de (2.8) est que si nous pouvons diviser les observations en groupes avec des valeurs (presque) constantes du score de propension e(x), alors nous pouvons Des variantes d'estimation cohérente de l'effet moyen de l'intervention.