技術共有

【スタンフォード因果推論完全講座】2_混乱しない・傾向ポイント1

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

目次

単一のランダム化比較試験を超えて

平均差推定値の集計

連続Xと傾向スコア


ランダム化試験の最も単純な拡張の 1 つは、介入効果の制約なしの推定です。定性的に言えば、ランダムではないが、共変量 Xi のセットを制御すればランダムと同じくらい良好な治療効果を推定したい場合、無制限性が関係します。

この講義の目的は、この無制限の仮定の下での平均介入効果の特定と推定について議論することです。以前と同様に、我々はノンパラメトリックアプローチを採用します。つまり、いかなるパラメトリックモデルも適切に仕様化されているとは想定せず、平均的な治療効果の特定は完全に設計によって推進されます(つまり、潜在的な介入結果と治療法に関する条件付き独立性の主張)。

単一のランダム化比較試験を超えて

私たちは、治療の因果関係を、その潜在的な介入結果によって定義します。二項介入 w∈{0, 1} の場合、i 番目の被験者が介入を受ける場合と受けない場合に経験するであろう結果にそれぞれ対応する、潜在的な結果 Yi(1) と Yi(0) を定義します。 SUTVA であると仮定します。Y_i = Y_i(W_i)、平均介入効果を推定したい

テキスト{ATE}=mathbb{E}左[Y_i(1)-Y_i(0)右]

最初の講義ではランダム介入課題を想定し、{Y_i(0), Y_i(1)}直交W_i、および ATE のいくつかの √n 一貫した推定量が研究されています。

1 つの RCT を超える最も簡単な方法は、2 つの RCT を検討することです。具体的な例として、ティーンエイジャーに喫煙を思いとどまらせるために現金を与えることに興味があるとします。カリフォルニア州パロアルトの青少年の5%、スイスのジュネーブの青少年の20%がこの研究に参加する資格があった。

各都市内でランダム化比較研究を行ったところ、介入が効果があることは実際に簡単にわかりました。ただし、集計データを見ると誤解を招く可能性があり、介入が害を及ぼすように見える可能性があります。これは、シンプソンのパラドックスと呼ばれることがあるものの例です。データをプールすると、ジュネーブ人は治療を受けている可能性が高く、治療を受けているかどうかに関係なく喫煙する可能性が高いため、これは RCT ではなくなりました。一貫した ATE 推定値を取得するには、都市ごとに介入効果を個別に推定する必要があります。begin{aligned} &hat{tau}_{mathrm{PA}}=frac{5}{152+5}-frac{122}{2362+122}約-1.7%、\ &hat{tau}_{mathrm{GVA}}=frac{350}{350+581}-frac{1979}{2278+1979}約-8.9% \ &begin{aligned}hat{tau}=frac{2641}{2641+5188}hat{tau}_{mathrm{PA}}+frac{5188}{2641+5188}hat{tau}_{mathrm{GVA}}約-6.5%。end{aligned} end{aligned}

この推定量の統計的特性は何ですか?この考え方は、連続する x にどのように一般化されるのでしょうか?

平均差推定値の集計

共変量 Xi が離散空間 Xi∈X 内の値をとると仮定すると、|数学X|=p 。さらに、治療の割り当てが Xi を条件としたランダムな割り当てであると仮定します (つまり、各グループには x レベルで定義された RCT があります)。{Y_i(0), Y_i(1)} は W_i に対して大きい| X_i=x、text{すべてに対して} xinmathcal{X}。

グループ内の平均治療効果を次のように定義します。tau(x)=mathbb{E}begin{bmatrix}Y_i(1)-Y_i(0)&X_i=xend{bmatrix}

次に、上で述べたように、グループレベルの治療効果推定値を集計することで ATE τ を推定できます。

begin{aligned}hat{tau}_{AGG}=sum_{xinmathcal{X}}frac{n_x}{n}hat{tau}(x),quadhat{tau}(x)=frac{1}{n_{x1}}sum_{{X_i=x,W_i=1}}Y_i-frac{1}{n_{x0}}sum_{{X_i=x,W_i=0}}Y_i,end{aligned}

n_x=|{i:X_i=x}|開始{aligned}n_{xw}=|{i:X_i=x, W_i=w}|終了{aligned} 。この見積もりはどの程度妥当なものでしょうか?直感的に推定する必要があります|数学X|=p 「パラメータ」なので、分散は p に対して線形であると期待できますか?

この推定を調べるには、次のように書くことができます。まず、共変量 x を持つ任意のグループについて、そのグループで治療を受ける確率として e(x) を定義します。e(x)=mathbb{P}左[W_{i}=1 大きい| X_{i}=x右] 、と指摘しました

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{text{Var}left[Y_i(0) big| X_i=xright]}{1-e(x)}+frac{text{Var}left[Y_i(1) big| X_i=xright]}{e(x)}right)

さらに、によれば、 行列の開始 Y(w)&X=x 行列の終了 =sigma^2(x) w の単純化仮定に依存せずに、次のようになります。

sqrt{n_x}left(hat{tau}(x)-tau(x)right)Rightarrowmathcal{N}left(0, frac{sigma^2(x)}{e(x)(1-e(x))}right).

次に、アンサンブル推定器については、次のようにします。 ハットπ(x) = n_x/n として定義されるX_{i} = x 観測値の割合は次のようになります。π(x)=mathbb{P}左[X_i=x右] その期待値として定義すると、次のようになります。

これらの部品を組み合わせると、次のようになりますsqrt{n}left(hat{tau}_{AGG}-tauright)Rightarrowmathcal{N}left(0,V_{AGG}right)

収集開始 V_{AGG} =mathrm{Var}left[tau(X_{i})right]+sum_{xinmathcal{X}}pi^{2}(x)frac{1}{pi(x)}frac{sigma^{2}(x)}{e(x)(1-e(x))} \ =mathrm{Var}left[tau(X_i)right]+mathbb{E}left[frac{sigma^2(X_i)}{e(X_i)(1-e(X_i))}right]。収集終了

漸近分散 VAGG がグループの数に依存しないことは注目に値します。 |数学X|=p,後で説明するように、この事実は、観察研究における平均介入効果についてセミパラメトリック推論を効率的に行う上で重要な役割を果たします。

連続 バツ 傾向スコア

上記では、X が離散的でレベル数が制限されており、扱い Wi が (2.1) の Xi = x の条件と同じくらいランダムである場合を考えました。この場合、グループ内の治療効果推定値を集計することで ATE を正確に推定でき、グループの正確な数 |X| = p は推論の精度に影響を与えないことがわかります。ただし、この結果は、X が連続の場合 (または τ (x) の定義のカイ二乗数が の場合) には直接当てはまりません。

離散 X の場合を超えて分析を一般化するために、単純に の各値について τ(x) を推定しようとすることはできなくなります。これを行うには、まず各グループに RCT があるという仮説を一般化する必要があります。形式的には同じことを書くだけです

{Y_i(0),Y_i(1)}直交W_i 大きい| X_i,quad(2.6)

Xi は任意の確率変数である可能性がありますが、この記述はより注意して解釈する必要があるかもしれません。定性的な観点から見ると、(2.6) の 1 つの理解は、Wi と潜在的な結果の間の依存関係を捉えるのに十分な共変量を測定したため、Xi が与えられた場合、Wi は「のぞき見」{Yi(0), Yi(1)} できないということです。 。これを仮説と呼びます平静さ.

仮定 (2.6) は連続確率変数の条件が関係しているため、実際に使用するのは難しいようです。ただし、Rosenbaum と Rubin (1983) が指摘しているように、傾向スコアを考慮すると、e(x)=mathbb{P}begin{bmatrix}W_i=1 大きい| X_i=xend{bmatrix}

統計的に、傾向スコアの重要な特性は、それがバランスのとれたスコアであることです。(2.6) が当てはまる場合、実際には

{Y_i(0),Y_i(1)}直交W_i | e(X_i),quad(2.8)

つまり、介入への非ランダムな割り当てに関連するバイアスを排除するには、実際には X ではなく e(X) を制御するだけで済みます。このステートメントは次のようにして検証できます。

begin{aligned} &mathbb{P}left[W_{i}=w big| {Y_{i}(0), Y_{i}(1)big} , e(X_{i})right] \ &=int_{mathcal{X}}mathbb{P}left[W_i=w big| {Y_i(w)} ,X_i=xright]mathbb{P}left[X_i=x big| {Y_i(w)} , e(X_i)right] dx \ &=int_{mathcal{X}}mathbb{P}left[W_i=w big| X_i=xright]mathbb{P}left[X_i=x big| 大きい{Y_i(w)大きい}、e(X_i)右] dxquadtext{(未確認)} \ &=e(X_{i})mathbf{1}_{w=1}+(1-e(X_{i}))mathbf{1}_{w=0}。終了{整列}

(2.8) の意味は、観測値を傾向スコア e(x) の (ほぼ) 一定の値を持つグループに分割できれば、帽子{タウ}_{AGG} の変形では、平均介入効果を一貫して推定します。