多変量ロジスティック回帰分析と各種指標を用いたリスク因子を特定する探索的データ解析

※本記事は、実際の解析実績を基に作成しておりますが、お客様との秘密保持契約（NDA）の観点により、医学・医療分野という枠組みは維持しつつ、疾患名や変数などの具体的な内容を実際の事例から大きく改変して記述しております。あらかじめご了承ください。

本事例は、高齢者の大規模な腹部外科手術後において、頻発する重大な合併症である「術後せん妄（POD）」の発生に寄与する真のリスク因子を、探索的なデータ解析および多変量モデリングを通じて網羅的に特定したものです。

実臨床の観察研究において、ある疾患や合併症を引き起こす要因を探る際、単一の要因だけを比較する「単変量解析」に依存することは極めて危険です。なぜなら、患者の年齢、基礎疾患の重症度、認知機能の低下具合といった多数の背景因子は互いに複雑に絡み合っており、単変量解析では「見せかけの関連性（交絡）」を真の要因と誤認してしまう可能性が高いからです。

本分析を通じて、まずは患者背景の偏りを適切に可視化し、数十項目に及ぶ変数群から統計学的に意味のある変数を絞り込む探索的検定を実施しました。その上で、複数の要因を同時に考慮できる「多変量ロジスティック回帰分析」を適用し、単変量解析と多変量解析の結果の乖離を論理的に解釈しました。Dr.データサイエンスは、AUCやAICといった複数の適合度評価指標を用いて最適な予測モデルを構築することで、臨床現場の医師が「手術前にどの数値を最も警戒すべきか」を的確に判断するための、極めて信頼性の高い客観的根拠を提供しました。

分析背景・目的

本事例では、地域の基幹病院における過去数年間の外科手術レジストリデータを用いて、「どのような術前状態の患者が、術後せん妄を発症しやすいか」を明確にすることが求められました。

術後せん妄は、患者の回復を遅らせるだけでなく、転倒による骨折や医療スタッフへの負担増大など、多大な不利益をもたらします。臨床現場では、「高齢であること」や「事前の認知機能テスト（MMSE）の点数が低いこと」、「特定のフレイルスコア（虚弱度）が高いこと」などが経験的に危険視されていましたが、これらの項目のうち「どれが最も直接的かつ強力な引き金になっているのか」が統計学的に証明されていませんでした。また、同じ「認知機能」を測る指標でも、連続した点数として扱うべきか、あるいは「異常あり・なし」の2つのグループに分けて扱うべきかといった、変数の取り扱いに関する統計学的な方針も定まっていませんでした。

分析の主な目的は、第一に、術後せん妄を発症した群と発症しなかった群の間に存在する患者背景の違いを、適切な指標を用いて評価することでした。第二に、重複する意味を持つ変数を整理した上で多変量解析を実行し、他の要因の影響を差し引いてもなお残る「独立した強力なリスク因子」を特定することでした。さらに、複数の変数の組み合わせパターン（モデル）を比較評価し、最もデータに適合しつつ臨床的にも解釈しやすい最適なモデルを導き出すことを最終目標としました。

データと変数

本分析では、腹部大手術を受けた数百名規模の高齢患者の周術期データを使用しました。解析を精緻に行うため、術前の詳細な検査数値から術後の経過まで多岐にわたる変数を収集・整理しました。主要な分析対象変数は以下の通りです。

- 目的変数（アウトカム）：術後1週間以内における「術後せん妄の発生の有無（発生あり＝1、発生なし＝0の二値変数）」。
- 主要な説明変数（リスク因子候補）：年齢、性別、BMI、術前の各種血液検査値などの基本情報。
- 臨床スコア変数：術前認知機能評価スコア（連続変数、および特定基準値で区切った名義変数の2パターン）、フレイルスコア（連続変数）、過去の脳血管疾患の既往の有無、手術の推定出血量など計30項目以上。

分析手法

本事例では、変数の選定からモデルの構築・評価に至るまで、統計学的な誤謬を防ぐために以下の極めて厳密な統計手法と解析手順を段階的に選択・適用しました。

患者背景の客観的評価と可視化
- 採用した手法：標準化差（SMD）を用いた背景因子表の作成
  せん妄発生群と非発生群の患者背景を比較する際、単なるp値を用いた検定（t検定など）に依存することを意図的に避けました。サンプルサイズが大きい観察研究においては、臨床的に全く意味のない微小な差であってもp値が有意（ p < 0.05 ）になってしまうという問題があります。そのため、サンプルの大きさに依存せず、群間の実質的な偏りの大きさを示す「標準化差（SMD）」を算出し、SMDの絶対値が0.1以上であるか否かを基準として背景の不均衡を評価する手法を採用しました。
- 採用しなかった手法：背景因子表における画一的なp値の提示
  上述の理由から、背景因子の偏りを確認する目的においてp値を提示することは、臨床的な判断を誤らせる「p値への過度な依存（p-value hacking）」を助長する危険性があるため、本解析においては主要な評価基準から除外しました。
探索的な差の検定と変数の整理
- 採用した手法：マン・ホイットニーのU検定およびカイ二乗検定による事前スクリーニング
  全31項目の変数に対し、せん妄発生群と非発生群の間で統計学的な差があるかを探索的に検定しました。その際、連続変数である「認知機能スコア」と、それを基準値で分割した名義変数である「認知機能低下グループ」のように、内容が重複する変数が複数存在していました。これらを両方とも後の多変量解析に投入すると「多重共線性」というモデル崩壊の原因となるため、研究目的に最も合致し、かつ検定結果の傾向が明確な変数を一方だけ優先して選定するデータ整理を行いました。
単変量および多変量ロジスティック回帰分析
- 採用した手法：交絡を調整する多変量ロジスティック回帰分析の優先的解釈
  整理された各変数に対して、まず一つずつ独立して評価する単変量解析を実施し、その後、複数の変数を同時にモデルに組み込む多変量解析を実施しました。解釈の原則として、「単変量解析で有意なオッズ比が得られても、多変量解析で非有意となった場合は、その変数は独立したリスク因子ではない（見せかけの相関である）」と厳格に判定しました。逆に「単変量で非有意であっても、多変量で有意となった場合」は、隠れていた真のリスク因子として評価しました。このように、常に多変量解析の結果を絶対的な優先基準として採用しました。
最適な変数の組み合わせ（モデル）の評価と選定
- 採用した手法：AUC、AIC、BIC、F1スコアなどの適合度評価指標に基づく比較
  臨床的な観点から「脳血管疾患の既往」「認知機能スコア」「フレイルスコア」を中心とした7通りの変数の組み合わせ（モデルパターン）を作成し、それぞれに対して多変量解析を実行しました。各モデルの良し悪しを比較するため、予測の正確さを示すAUC（ROC曲線下面積）だけでなく、モデルの複雑さへの罰則を加味したAIC（赤池情報量規準）やBIC（ベイズ情報量規準）、さらには適合率と再現率の調和平均であるF1スコアなど、多角的な適合度指標を算出しました。これらの指標を総合的に比較することで、無駄な変数が少なく、かつ最も事象を正確に説明できる「パターン4」を最適モデルとして特定しました。

主な結果の概要と臨床的考察

厳密な多変量ロジスティック回帰分析の結果、単変量解析の段階では術後せん妄のリスクを高めると見えていた「年齢」や「特定の軽微な血液検査の異常」といった項目が、多変量解析においては統計学的な有意差を完全に失う（例として p = 0.345 ）ことが確認されました。これは、高齢であること自体がせん妄を引き起こすのではなく、高齢の患者に多く見られる「術前の認知機能低下」こそが真の引き金であったという、交絡因子の存在を見事に証明する結果です。

一方で、最適な変数組み合わせとして選定された「パターン4」の多変量モデルにおいては、「脳血管疾患の既往」および「術前認知機能評価スコアの低下」が、他のすべての背景因子を差し引いた後でも、術後せん妄に対する極めて強力で独立したリスク因子であることが証明されました（それぞれ p = 0.002 および p < 0.001 ）。

特に、各種の適合度指標（AUCやAIC）を比較した結果、単に多くの変数を投入した複雑なモデルよりも、臨床現場で容易に取得できるこれら少数の強力な指標に絞り込んだ「パターン4」のモデルの方が、情報量規準（AIC）が最も低く、優れた当てはまりを示すことが定量的に明らかになりました。本研究の主目的は「予測」ではなく「リスク因子の同定」でしたが、結果としてこのパターン4のモデルは予測能（AUC）においても非常に高い水準を記録しました。

これらの解析結果は、手術前の限られた時間の中で、医療スタッフが「どの検査項目に最も注意を払い、どの患者に対して予防的な介入（早期離床の徹底や睡眠環境の調整など）を最優先で行うべきか」を決定するための、極めて実用的で強力な客観的根拠となります。

Dr.データサイエンスの貢献

Dr.データサイエンスは、本事例において、単に計算ソフトの結果を出力するだけでなく、結果をどのように解釈し、どの数値を採用すべきかという「統計学的思考のプロセス」そのものをお客様に提供し、研究の質を根本から引き上げました。

臨床的誤謬を防ぐ厳格な解析ルールの提示
- 「単変量解析と多変量解析の結果が矛盾した場合、必ず多変量解析を優先する」という疫学の基本原則を明確に提示し、見せかけの相関（交絡）に踊らされるリスクを完全に排除しました。これにより、現場の医師が真に警戒すべき的確なターゲットを絞り込むことに貢献しました。
多重共線性の回避とデータ次元の最適化
- 同じ事象を指し示す連続変数と名義変数の重複投与によるモデルの崩壊（多重共線性）を未然に防ぐため、探索的検定の結果を踏まえた論理的な変数の取捨選択を実施しました。この前処理により、多変量解析の係数推定の安定性を飛躍的に向上させました。
多角的な適合度指標に基づく客観的なモデル選択
- 単に「p値が有意かどうか」に留まらず、AICやAUC、F1スコアといった機械学習の分野でも用いられる多角的な評価指標を駆使して複数のモデルを比較しました。これにより、「なぜこの変数の組み合わせが最適と言えるのか」という問いに対し、数字に基づく極めて説得力のある論拠を創出しました。

多重代入法と多角的な相関評価を用いた重回帰分析

一般化推定方程式（GEE）と多重代入法を活用した反復測定データの要因分析