ホーム 一覧 実績の紹介 反復測定相関(rmcorr)を用いた縦断的データにおける関連性評価

反復測定相関(rmcorr)を用いた縦断的データにおける関連性評価

※本記事は、実際の解析実績を基に作成しておりますが、お客様との秘密保持契約(NDA)の観点により、医学・医療分野という枠組みは維持しつつ、疾患名や変数などの具体的な内容を実際の事例から大きく改変して記述しております。あらかじめご了承ください。

本事例は、特定の慢性疾患患者に対して導入された「治療補助アプリ(DTx)」の経時的な利用状況(ログデータ)が、患者の「臨床検査値(アウトカム)」の改善にどのように関連しているかを評価したものです。一人の患者から長期間にわたって複数回データを取得する縦断的(反復測定)データにおいて、単純な相関分析を行うことは、見せかけの相関を生むリスクを伴います。

本分析を通じて、患者個々人のベースライン(基準値)の違いを統計的に調整し、同一患者内での「アプリ利用のアクティビティ変動」と「検査値の変動」の真の関連性を抽出することを目指しました。Dr.データサイエンスは、反復測定相関(Repeated Measures Correlation)という特殊な相関手法を用いることで、個人差というノイズを排除し、効果的なデジタル介入指標を特定することに貢献しました。

分析背景・目的

本事例では、治療補助アプリを利用する患者群において、「どのアプリ機能(学習コンテンツの閲覧、セルフケア記録など)を多く利用した月に、症状スコアが改善する傾向があるか」を明らかにすることが求められました。分析の主な目的は、多数の「アプリアクティビティ変数」と「臨床検査値・症状スコア」の組み合わせ(数十パターン)を網羅的に解析し、治療効果に直結する重要なデジタルバイオマーカー(行動指標)を定量的に特定することでした。

データと変数

本分析では、特定の医療機関から提供された複数月にわたる患者ごとのアプリログおよび電子カルテデータを使用しました。主要な分析対象変数は以下の通りです。

    • クラスター変数:患者識別ID
    • 評価変数1(介入指標):月間の「学習動画の視聴時間」「オンライン問診の回答完了率」「セルフケア記録の日数」などのアプリ利用アクティビティ(連続変数)。
    • 評価変数2(臨床アウトカム):月間の「平均疼痛スコア(VAS)」「特定バイオマーカーの血中濃度」「QOLスコア」など(連続変数)。

分析手法

本事例では、同一患者から複数回取得されたデータ構造(反復測定データ)を正しく評価するため、以下の統計手法を選択・適用しました。

  1. 相関関係の評価
    • 採用した手法:反復測定相関(Repeated Measures Correlation)
      同一患者から複数月にわたって取得したデータには、患者固有の「個人差(ベースラインの違い)」が存在します。反復測定相関は、患者ごとに異なる切片(基準値)を共分散分析(ANCOVA)のアプローチを用いて調整し、全患者に共通する「同一患者内での2変数間の傾き(相関)」を推定できるため採用しました。並列処理(マルチプロセッシング)を用いて、膨大な変数ペアの相関を網羅的かつ高速に計算しました。
    • 採用しなかった手法:ピアソン相関分析 および スピアマンの順位相関係数
      ピアソン相関分析やスピアマンの順位相関係数は、「すべてのデータが互いに独立している(別々の人から1回ずつ取ったデータである)」ことを大前提としています。今回のような縦断的データをそのままこれらの手法に投入すると、患者間の個人差を相関と見誤る「シンプソンのパラドックス(生態学的誤謬)」を引き起こし、誤った結論(正の相関が負の相関として計算されるなど)を導く危険性が極めて高いため、明確に除外しました。
  2. 信頼区間の算出
    • 各相関係数(R値)の強さだけでなく、その推定精度のブレを評価するため、すべての変数ペアに対して95%信頼区間(CI)を算出し、結果の確実性を担保しました。

主な結果の概要と臨床的考察

網羅的な反復測定相関解析の結果、「セルフケア記録の日数」と「平均疼痛スコア(VAS)」の間に、患者内での有意な負の相関関係が認められました( p = 0.002 )。これは、単に「もともと記録マメな人は痛みが少ない」という患者間の比較ではなく、「同じ患者において、記録日数が多かった月は、少なかった月に比べて痛みが軽減している傾向がある」という、より因果関係の示唆に近い臨床的に意義深い結果です。

一方で、「学習動画の視聴時間」と各種臨床アウトカムとの間には統計的に有意な相関は認められませんでした(例として p = 0.450 )。

この結果から、単にアプリを開いてコンテンツを眺める「受動的な利用」よりも、日々の状態を自ら入力する「能動的なセルフモニタリング」の方が、症状コントロールに対してより強い関連性を持つことが示唆されました。

Dr.データサイエンスの貢献

Dr.データサイエンスは、本事例において、大量の時系列データに潜む「見せかけの相関」を排除し、真に臨床的意義のある関連性を抽出しました。

  1. データ構造に合わせた高度な手法選択
    • 反復測定データに対して安易にピアソン相関分析を適用するリスクを回避し、反復測定相関(rmcorr)を的確に適用しました。これにより、統計学的な誤謬(シンプソンのパラドックス)を防ぎ、医学論文としても妥当性の高い厳密な解析結果を提供しました。
  2. 計算効率の最適化
    • 数十に及ぶアプリアクティビティ変数と臨床変数のすべての組み合わせ(数百ペア)に対する相関計算において、並列処理を実装することで解析時間を大幅に短縮し、迅速な意思決定を支援しました。
  3. 介入最適化に向けたエビデンス創出
    • 「どの機能の利用を促せば患者のアウトカム改善に繋がりやすいか」という、アプリ開発・運用における最重要課題に対し、統計的に裏付けられた客観的な指標を提供しました。これにより、より効果的な治療用アプリへのアップデートや、患者への的確な利用指導プランの策定が可能となりました。

© 2023 Dr.データサイエンス. All Rights Reserved.