Обмен технологиями

[Полный Стэнфордский курс причинно-следственных выводов] 2_Без путаницы и тенденций 1

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Оглавление

Помимо одного рандомизированного контролируемого исследования

Агрегирование оценок разницы средних значений

Непрерывный X и показатель склонности


Одним из простейших расширений рандомизированных исследований является неограниченная оценка эффектов вмешательства. С качественной точки зрения неограниченность важна, когда мы хотим оценить эффект лечения, который не является случайным, но является настолько же случайным, если мы контролируем набор ковариат Xi.

Целью данной лекции является обсуждение выявления и оценки средних эффектов вмешательства при этом неограниченном предположении. Как и прежде, мы примем непараметрический подход: мы не будем предполагать хорошую спецификацию какой-либо параметрической модели, а выявление средних эффектов лечения будет полностью зависеть от дизайна (т. е. требований условной независимости в отношении потенциальных результатов вмешательства и лечения).

Помимо одного рандомизированного контролируемого исследования

Мы определяем причинный эффект лечения по его потенциальному результату вмешательства. Для бинарного вмешательства wε{0, 1} мы определяем потенциальные результаты Yi(1) и Yi(0), соответствующие результатам, которые i-й субъект получит или не получит вмешательство соответственно. Мы предполагаем, что СУТВА,Y_i = Y_i(W_i)и хотим оценить средний эффект вмешательства

текст{ATE}=mathbb{E}влево[Y_i(1)-Y_i(0)вправо]

В первой лекции мы предполагали случайное распределение вмешательств.{Y_i(0), Y_i(1)}perp W_iи изучаются несколько √n непротиворечивых оценок ATE.

Самый простой способ выйти за рамки одного РКИ — рассмотреть два РКИ. В качестве конкретного примера предположим, что мы заинтересованы в том, чтобы давать подросткам денежное вознаграждение, чтобы отговорить их от курения. В исследовании имели право участвовать пять процентов подростков в Пало-Альто, Калифорния, и 20% подростков в Женеве, Швейцария.

В каждом городе мы провели рандомизированные контролируемые исследования, и было легко увидеть, что вмешательство помогло. Однако рассмотрение совокупных данных может ввести в заблуждение, создавая впечатление, что вмешательство причиняет вред. Это пример того, что иногда называют парадоксом Симпсона: После того, как мы объединили данные, это уже не было РКИ, поскольку жители Женевы с большей вероятностью получали лечение и чаще курили независимо от того, проходили ли они лечение. Чтобы получить согласованные оценки ATE, нам необходимо оценить эффект вмешательства отдельно для каждого города:begin{align} &hat{tau}_{mathrm{PA}}=frac{5}{152+5}-frac{122}{2362+122}приблизительно -1,7%, \ &hat{tau}_{mathrm{GVA}}=frac{350}{350+581}-frac{1979}{2278+1979}приблизительно -8,9% \ &begin{align}hat{tau}=frac{2641}{2641+5188}hat{tau}_{mathrm{PA}}+frac{5188}{2641+5188}hat{tau}_{mathrm{GVA}}приблизительно -6,5%.end{align} end{align}

Каковы статистические свойства этой оценки? Как эта идея распространяется на последовательные x?

Агрегирование оценок разницы средних значений

Предположим, что ковариата Xi принимает значения в дискретном пространстве XiεX,|математический{X}|=p . Предположим далее, что распределение лечения является случайным, зависящим от Xi (т. е. каждая группа имеет РКИ, определенное уровнем x):{Y_i(0), Y_i(1)} perp W_i big| X_i=x, text{для всех} xinmathcal{X}.

Определим средний эффект лечения внутри группы кактау(x)=mathbb{E}begin{bmatrix}Y_i(1)-Y_i(0)&X_i=xend{bmatrix}

Затем, как упоминалось выше, мы можем оценить ATE τ путем агрегирования оценок эффекта лечения на уровне группы:

begin{align}hat{tau}_{AGG}=sum_{xinmathcal{X}}frac{n_x}{n}hat{tau}(x),quadhat{tau}(x)=frac{1}{n_{x1}}sum_{{X_i=x,W_i=1}}Y_i-frac{1}{n_{x0}}sum_{{X_i=x,W_i=0}}Y_i,end{align}

в n_x=|{i:X_i=x}|begin{выровнено}n_{xw}=|{i:X_i=x, W_i=w}|end{выровнено} . Насколько хороша эта оценка?Интуитивно нам нужно оценить|математический{X}|=p «параметр», поэтому мы можем ожидать, что дисперсия будет линейной с p?

Для изучения этой оценки можно записать ее следующим образом. Во-первых, для любой группы с ковариатой x определите e(x) как вероятность получения лечения в этой группе:e(x)=mathbb{P}влево[W_{i}=1 большой| X_{i}=xвправо] и отметил

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{text{Var}left[Y_i(0) big| X_i=xright]}{1-e(x)}+frac{text{Var}left[Y_i(1) big| X_i=xright]}{e(x)}right)

Кроме того, согласно mathrm{Var}begin{bmatrix}Y(w)&X=xend{bmatrix} =sigma^{2}(x) Не полагаясь на упрощающие предположения w, мы можем получить

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{sigma^2(x)}{e(x)(1-e(x))}right).

Далее, для оценки ансамбля, мы будем шляпа{пи}(x) = n_x/n определяется какX_{i}=x Доля наблюдений будетpi(x)=mathbb{P}влево[X_i=xвправо] Определив его ожидаемое значение, мы можем получить

Сложив эти части вместе, мы получимsqrt{n}left(hat{tau}_{AGG}-tauright)Rightarrowmathcal{N}left(0,V_{AGG}right)

begin{gathered} V_{AGG} =mathrm{Var}left[tau(X_{i})right]+sum_{xinmathcal{X}}pi^{2}(x)frac{1}{pi(x)}frac{sigma^{2}(x)}{e(x)(1-e(x))} \ =mathrm{Var}left[tau(X_i)right]+mathbb{E}left[frac{sigma^2(X_i)}{e(X_i)(1-e(X_i))}right]. end{gathered}

Стоит отметить, что асимптотическая дисперсия VAGG не зависит от количества групп. |математический{X}|=p,Как мы увидим позже, этот факт играет ключевую роль в эффективном получении полупараметрических выводов о средних эффектах вмешательства в наблюдательных исследованиях.

Непрерывный Икс и показатель склонности

Выше мы рассматривали случай, когда X дискретно, число уровней ограничено, а обработка Wi столь же случайна, как и условие Xi = x в (2.1). В этом случае мы обнаруживаем, что ATE все еще можно точно оценить путем агрегирования оценок эффекта лечения внутри группы, и точное количество групп |X = p не влияет на точность вывода. Однако этот результат не применим напрямую, если X является непрерывным (или если число хи-квадрат Define τ (x), как в .

Чтобы обобщить наш анализ за пределами случая дискретного X, мы больше не можем просто пытаться оценить τ(x) для каждого значения Для этого нам сначала необходимо обобщить гипотезу о том, что для каждой группы существует РКИ.Формально мы просто пишем одно и то же

{Y_i(0),Y_i(1)}perp W_i большой| X_i,quad(2.6)

Хотя теперь Xi может быть произвольной случайной величиной, возможно, это утверждение следует интерпретировать с большей осторожностью. С качественной точки зрения одно понимание (2.6) состоит в том, что мы измерили достаточно ковариат, чтобы уловить любую зависимость между Wi и потенциальным результатом, так что при заданном Xi Wi не может «подглядывать» {Yi(0), Yi(1)} .Мы называем эту гипотезунесообразительность.

Предположение (2.6) кажется трудным для практического использования, поскольку оно включает условия для непрерывных случайных величин.Однако, как отмечают Розенбаум и Рубин (1983), принимая во внимание показатель склонностиe(x)=mathbb{P}begin{bmatrix}W_i=1 big| X_i=xend{bmatrix}

Статистически ключевым свойством показателя склонности является то, что это сбалансированный показатель: если (2.6) выполняется, то фактически

{Y_i(0),Y_i(1)}perp W_i | e(X_i),quad(2.8)

То есть на самом деле вам нужно контролировать только e(X), а не X, чтобы устранить предвзятость, связанную с неслучайным назначением вмешательства. Мы можем проверить это утверждение:

begin{aligned} &mathbb{P}left[W_{i}=w большой| {Y_{i}(0), Y_{i}(1)большой} , e(X_{i})правый] \ &=int_{mathcal{X}}mathbb{P}left[W_i=w большой| {Y_i(w)} ,X_i=xправый]mathbb{P}left[X_i=x большой| {Y_i(w)} , e(X_i)правый] dx \ &=int_{mathcal{X}}mathbb{P}left[W_i=w большой| X_i=xправый]mathbb{P}left[X_i=x большой|  big{Y_i(w)big} , e(X_i)right] dxquadtext{(неконф.)} \ &=e(X_{i})mathbf{1}_{w=1}+(1-e(X_{i}))mathbf{1}_{w=0}. end{выровнено}

Смысл (2.8) состоит в том, что если мы можем разделить наблюдения на группы с (почти) постоянными значениями показателя склонности e(x), то мы можемшляпа{тау}_{AGG} Варианты последовательно оценивают средний эффект вмешательства.