ホーム 一覧 実績の紹介 プロペンシティスコアマッチングとRMSTを用いた生存時間解析

プロペンシティスコアマッチングとRMSTを用いた生存時間解析

※本記事は、実際の解析実績を基に作成しておりますが、お客様との秘密保持契約(NDA)の観点により、医学・医療分野という枠組みは維持しつつ、疾患名や変数などの具体的な内容を実際の事例から大きく改変して記述しております。あらかじめご了承ください。

本事例は、進行性固形ガン患者に対する新規分子標的薬の治療において、標準治療と比較した「全生存期間(OS)」および「無増悪生存期間(PFS)」への有効性を、患者のベースライン背景因子を調整した上で評価したものです。臨床観察データにおいては、治療群間で患者背景に偏りが生じる交絡が避けられません。

本分析を通じて、プロペンシティスコアマッチング(PSM)による交絡調整を行い、さらに生存時間解析における「比例ハザード性の仮定」が満たされない場合の堅牢な評価手法を提供することを目指しました。Dr.データサイエンスは、RMST(制限付き平均生存時間)などの高度な統計手法を駆使することで、バイアスの少ない精緻な有効性評価を提供し、実臨床における治療選択のエビデンス構築に貢献しました。

分析背景・目的

本事例では、新規分子標的薬(介入群)と標準治療(対照群)において、生存期間に統計学的な有意差があるかを明らかにすることが求められました。分析の主な目的は、治療法の違いが生存に与える影響を評価するとともに、「特定のバイオマーカーの発現レベル(高・低)」や「腫瘍の進行度」といったサブグループごとにおける治療効果の違いを定量的に明らかにすることでした。

データと変数

本分析では、特定の医療機関から提供された観察研究データを使用しました。主要な分析対象変数は以下の通りです。

    • 目的変数:全生存期間(OS)および 無増悪生存期間(PFS)、ならびにそれぞれのイベント発生の有無。観察期間は最大36ヶ月に設定しました。
    • 主要な説明変数(介入):新規分子標的薬の使用 vs 標準治療の使用。
    • 調整変数および層別化変数:バイオマーカー発現レベル、腫瘍進行度、年齢、性別(male、femaleの順)、ECOGパフォーマンスステータス、BMIなど。

分析手法

本事例では、群間の交絡因子の調整および、生存時間解析における数理的仮定の制約に対処するため、以下の統計手法を選択・適用しました。

  1. 交絡因子の調整(PSM)
    • 採用した手法:プロペンシティスコアマッチング(PSM)
      ロジスティック回帰を用いて傾向スコアを算出し、スコアの差が0.2以下のサンプルを対象に1対1の比率でマッチングを実施しました。マッチング後の共変量バランスの評価には、p値だけでなく標準化差(SMD)を採用し、SMDの絶対値が0.1未満であることを目安に不均衡を評価しました。
    • 採用しなかった手法:p値のみへの依存
      背景因子のバランス評価において、検定のp値のみを用いることは見送りました。サンプルサイズが小さい場合、多少の変動でp値が有意になりやすく、逆にサンプルサイズが大きいと臨床的に無意味な差でも有意と判定されるため、実質的なバランスを示すSMDを重視すべきと判断したためです。
  2. 背景因子の群間比較
    • 採用した手法:フィッシャーの正確検定
      マッチング後の背景因子表の作成において、カテゴリ変数の比較に採用しました。
    • 採用しなかった手法:カイ二乗検定
      当初はカイ二乗検定を優先する方針でしたが、データセットにおいて期待度数が5未満となるセルが全体の2割を超えており、適応条件を満たさなかったため、不適切と判断して採用を見送りました。
  3. 生存時間解析と比例ハザード性の検証
    • 採用した手法:ログランク検定 および Cox比例ハザードモデル(一般モデル)、シェーンフィールド残差
      生存期間の群間比較にはログランク検定とCox比例ハザードモデルを採用しました。同時に、Coxモデルの前提となる「ハザード比が時間経過によらず一定であること(比例ハザード性)」が満たされているかを確認するため、シェーンフィールド残差を用いた検定を実施しました。
  4. 比例ハザード性が崩れた場合の対応
    • 採用した手法:RMST(制限付き平均生存時間)
      一部のサブグループ解析において比例ハザード性の仮定に難がある(生存曲線が交差する等)ことが判明しました。そのため、特定の時点(本事例では36ヶ月)までの生存曲線の下面積を算出して比較するRMSTモデルを採用し、RMSTの差および比の検定を行いました。
    • 採用しなかった手法:Coxモデルのハザード比のみによる解釈
      比例ハザード性が満たされないデータに対して、Coxモデルのハザード比(HR)単独で治療効果を決定づけることは、効果の過大評価や過小評価に繋がるリスクがあるため採用を見送りました。

主な結果の概要と臨床的考察

PSMによる背景因子調整後の解析において、全生存期間(OS)および無増悪生存期間(PFS)の両方で、介入群(新規分子標的薬)が対照群に対して有意な生存期間の延長を示しました。ログランク検定によるOSの有意確率は p = 0.003、PFSの有意確率は p = 0.001 と、極めて高い信頼性をもって効果が確認されました。

特筆すべきは、一部のデータセットで比例ハザード性の仮定が満たされていなかったものの、RMSTを用いた36ヶ月時点の解析により、介入群のRMSTが有意に長く(RMSTの差および比に有意差あり)、治療の有効性が頑健であることが証明された点です。

また、サブグループ解析の結果、特定のバイオマーカーが高発現している患者群において特に強い治療効果が認められました。一方で、バイオマーカー低発現群ではPSM後における有意差の消失( p = 0.056 )やハザード比の減弱が観察され、層別化医療の観点から、どのような患者プロファイルに当該治療を優先すべきかという明確なリスクファクターを提示することができました。

Dr.データサイエンスの貢献

Dr.データサイエンスは、本事例において、生存時間解析に潜む前提条件の罠を回避し、臨床現場の意思決定に直結する強固なエビデンスを創出しました。

  1. 厳密な前提条件の確認と最適な手法選択
    • 生存時間解析において機械的にCoxモデルを適用するのではなく、シェーンフィールド残差を用いて比例ハザード性を徹底的に検証しました。仮定が崩れているケースを見逃さず、RMSTという代替的かつ堅牢な評価手法へ切り替えることで、偏りのない客観的なエビデンスを導き出しました。
  2. PSMの品質担保と多角的なバランス評価
    • 単なるp値のみに依存した評価を避け、SMD(標準化差)を用いて共変量のバランスを客観的に評価することで、サンプルサイズの影響を排除した真の交絡調整を実現しました。小規模データにおける期待度数の偏りに対してはフィッシャーの正確検定に切り替えるなど、細部に至るまで統計学的妥当性を追求しました。
  3. 結果の明確な解釈と臨床的示唆の提供
    • 単変量解析から多変量解析へのハザード比の推移(交絡の影響)を詳細にトラッキングし、真の独立したリスクファクターを特定しました。これにより、単なる「効果があった・なかった」を超え、実際の臨床現場における適応患者の絞り込みに直結する価値ある知見を提供しました。

© 2023 Dr.データサイエンス. All Rights Reserved.