メディカルアフェアーズ情報
情報提供に関する留意事項
こちらのエリアでは、メディカルアフェアーズ部門が医学的・科学的な専門性に基づき、弊社製品および関連する疾患情報などを提供しています。
こちらに掲載しているコンテンツは、弊社の市販製品の安全で効果的な使用、及び開発中のアステラスの医薬品又は製品の治療対象疾患に関する理解のために情報を提供するものであり、アステラス製品の処方の創出や需要拡大等を目的に弊社製品並びに当社製品の効能・効果を宣伝、広告するものではありません。
また、こちらのエリアでは弊社製品の臨床試験や研究結果の提供にあたり自社以外の製品について本邦では未承認の医薬品や効能・効果、用法・用量の情報が含まれていることがあります。
医療行為におけるご判断は、医療従事者の裁量と責任のもとに行っていただきますようお願いいたします。
製品のご使用にあたっては、その製品の最新の添付文書をご確認ください。
上記の本エリアの目的および留意事項をお読みいただき内容に同意いただきましたら、以下の「同意する」をクリックして本エリアにお進みください。
観察研究には実臨床に近いデータが得られるという強みがある一方、アウトカムに影響する多数の交絡が存在する。傾向スコア解析は、患者背景をスコア化し、そのスコアを用いて比較群間の患者背景を揃えることで交絡に対処する手法の1つである。ここでは、傾向スコア解析と、その中で多用される傾向スコアマッチングの基本的な考え方や解析方法を解説する。
RCTでは対象者をランダムに対照群または治療群に割付け、治療介入以外のすべての背景因子を平均的に揃えることで、治療効果が公平に比較可能となる。ただし、対象者を選択・除外基準を用いて限定するため、実験的で代表性は乏しいとされる(表1)1)。
観察研究では、RCTと異なり治療選択への介入はしないため、臨床現場で選択された治療に基づき治療効果が評価される。しかし、例えば、重症者では治療群の治療ばかり選択されていた場合、比較群間で患者背景に一定の偏り(バイアス)が生じるため、治療効果を正しく評価できないことがある。傾向スコア解析は、この影響を調整する手法の1つである。ただし、RCTとは異なり観察された患者背景のみ調整が可能なため、比較可能性はRCTよりも劣ると考えられる1)。
表1:ランダム化比較試験と傾向スコア解析の特徴1)
| ランダム化比較試験 | 傾向スコア解析 |
データソース | 実験研究(臨床試験) | 観察研究(疫学研究) |
外的妥当性 | 実験環境下 代表性に欠ける | リアルワールド 代表性に優れる |
内的妥当性 | 比較可能性に優れる | 比較可能性に劣る |
共変量調整 | 観察・非観察ともに共変量で調整される | 観察された共変量のみ調整される |
立証アウトカム | 有効性 | 有用性 |
研究の公正性 | 高い | 低い |
折笠秀樹. 薬理と治療 43 (8): 1101-1108. 2015より引用(一部改変)
傾向スコア解析は、図1に示すように、大きく4つのステップに分かれる。Step1で推定される“傾向スコア”とは患者背景や検査データなどの情報を用いて、その患者が研究対象の治療を受ける確率として算出された値である。この傾向スコアを用いた解析方法にはマッチング、層別化、重み付けなどがあり、傾向スコアを用いた報告の大多数がマッチング法を用いている1-3)。
Step 1:傾向スコアの推定3,4)
Step 1は傾向スコアの推定であり、多くの医学論文では推定方法としてロジスティック回帰モデルが用いられている。
治療法の選択(治療A/Bなど)を目的変数、治療効果に影響する患者背景情報を説明変数とするロジスティック回帰モデルを用いて、研究対象の治療を受ける確率を予測する。この際、説明変数の数に厳密な制限はなく、通常の多変量解析とは異なり多重共線性もほとんど問題にならない3)。説明変数が適切に選ばれているか確認するためのポイントを以下に示す。
説明変数として選択する変数
・治療選択と治療効果(アウトカム)の両方に関連する変数(交絡因子)
・治療効果(アウトカム)のみに関連する変数
説明変数から除外する変数
・治療選択のみに関連する変数
・治療選択後に得られた変数
Step 2:傾向スコア解析1,3,4)
推定された傾向スコアを用い、患者の背景因子のバランスがとれるようなデータを抽出し解析する。解析方法としてよく知られるのは、マッチング、層別化、重み付けの3つである(表2)。ここでは利用頻度が高いマッチングについて解説する。
表2:傾向スコア解析のバリエーション
マッチング | 層別化 stratification | 重み付け weighting |
マッチングされた患者集団の情報のみで比較検討される。比較群間の傾向スコアを揃えることで患者背景を均一化し、2群を比較する。 | 全患者集団の情報を用いて比較検討される。推定された傾向スコアをもとに患者を層別化し(多くは5等分)、分類された層を考慮して比較する。層別解析の結果を併合することもできる。 | 全患者集団の情報を用いて比較検討される。中でも使用頻度が高いのは、傾向スコアの逆数で重み付けを行う、inverse probability of treatment weighting(IPTW)である。 |
マッチングでは、傾向スコアの近い患者同士は背景の特徴が似ているという考えのもと、比較群間で傾向スコアを揃え、患者背景が均一化された比較可能な2群を作る。マッチする相手がいない患者は解析対象から除かれるため、効果推定に用いられるのは一部の患者集団のデータである。
マッチングの方法・設定は下記のポイントに示すように多様であるが、最近傍法(図2)が最も一般的に用いられる3,4)。
Step 3:比較群間のバランスの確認1,3,4)
マッチングをした後、2群間のバランスを評価する基準はさまざまであるが、標準化差(standardized difference)の絶対値が0.1未満であればバランスがとれていると判断する場合が多い5)。
また、傾向スコアの分布の確認も必須である(図3)。傾向スコア解析では治療群と対照群の傾向スコアの重なりが必要である。この重なりがない場合(図3右)、患者背景が均一な2群とはいえず、得られた治療効果を解釈できないため再検討が必要となる。
Step 4:治療効果の推定と比較3,4)
比較可能と判断できた治療群と対照群の2群比較を行う。
マッチングで作成した2群の比較は、アウトカムの変数に応じて一般的な2群比較の統計手法で解析される(t検定、カイ二乗検定など)。
傾向スコア解析の代表的な注意点2つを以下に示す3)。
傾向スコア解析が適切に用いられているかを判断するためのポイントを以下に挙げる。
観察研究で交絡因子を調整する方法として、傾向スコア解析の他に多変量解析がある。傾向スコアマッチングと多変量解析には、以下の3点に相違がある3)。
治療効果を比較評価するためのゴールドスタンダードはRCTであるが、RCTを用いることが倫理的に不可能な場合や費用面から現実的でない場合もあり、傾向スコア解析を用いた医学論文報告数は年々増加している。RCTとは異なり、測定できた交絡因子しか調整できないものの、傾向スコア解析は多数の治療効果に関連する背景因子を傾向スコアという1つの数値に集約し、比較群間の患者背景の調整を可能とする。観察研究で交絡因子を調整するにあたり、傾向スコアマッチングが常に多変量解析より優れるわけではない。重要なのは、研究目的に応じて適切な統計手法が選択され、結果が解釈されているかどうかである。
用語解説
交絡:要因とアウトカムの両方に関連する因子(交絡因子)によってもたらされる影響。例えば、性別(要因)が肺がん罹患(アウトカム)に及ぼす影響を評価する際、性別に関連し、結果にも影響を与える喫煙歴や飲酒歴(交絡因子)があると、性別のみがもたらす真の影響や関係を評価できない。
代表性:目的母集団の性質が反映されている類似度合いのことをいい、研究対象(サンプル)にどの程度の代表性があるかは研究結果の一般化可能性に影響を与える要因の1つである。
目的変数/説明変数:統計解析モデルの中で解析の目的となる変数を目的変数、目的の事象に関連する変数を説明変数という。例えば、新規治療薬の効果を検討する場合、治療薬による効果(アウトカム)が目的変数であり、治療薬を服用したかどうか(介入)が説明変数となる。その他にアウトカムに影響を及ぼす患者背景(年齢や検査値など)も説明変数となる。説明変数は交絡因子である場合とそうでない場合がある。
多重共線性:多変量解析でモデルに含めた説明変数同士に相関関係(共線性)があると、推定精度が不良になることを指す。例えば、多重共線性の問題を回避するため、体重とBMIを同時にモデルに含めることはできない。
参考文献
Webによるお問い合わせにつきましては、お問い合わせの内容により弊社から電話させていただくことがございます。
電話番号のご記入をお願いいたします。
次の画面にて、製品名、問い合わせ内容等を入力してください。
4月29日(水)~5月6日(水)は会社休業日です。
回答は5月7日(木)以降になります。ご了承ください。
※製品Q&Aを公開しておりますので、ご参照ください。
会員になると以下のコンテンツ、サイト機能をご利用いただけます。