
「システマティックレビューとメタアナリシスって、どう違うんですか?」
PT・OTの後輩から、こんな質問を受けたことはないでしょうか。
論文を読んでいると、両者はほぼ同じ意味のように使われていることがあります。一方でCochraneレビューやPRISMA 2020声明では、明確に別の概念として整理されています。
本記事では、システマティックレビューとメタアナリシスの違いを、PRISMA 2020・Cochrane Handbookの公式定義に沿って整理し、フォレストプロットの読み方や、リハビリ臨床への活かし方まで一気通貫で解説します。
情報の信頼性について
・本記事はBRAIN代表/理学療法士の針谷が執筆しています(執筆者情報は記事最下部)。
・本記事はPRISMA 2020声明(Page MJ, 2021)、Cochrane Handbook更新版(Cumpston M, 2019)、および脳卒中リハビリ領域のSR/MA論文を一次情報源として引用しています。
自分で調べられるセラピストへ。
オンライン/PT・OT向け/BRAINアカデミー
本記事の結論
- システマティックレビュー(SR)は、臨床疑問に対して網羅的・透明・再現可能に文献を集め評価する「研究の手法そのもの」
- メタアナリシス(MA)は、SRで集めた研究結果を統計的に統合して1つの効果量を出す「統計手法」
- SRはMAを含む場合と含まない場合があり、エビデンスピラミッドの最上位に位置する
- リハビリ臨床では、SR/MAの「介入定義・対象集団・効果量・異質性(I²)」を確認して自分の患者に当てはめる
以下、詳しく解説していきます。
システマティックレビューとは|定義とPRISMA 2020の手順
システマティックレビュー(Systematic Review:SR)とは、明確に設定した臨床疑問に対して、あらかじめ決めた方法で網羅的に文献を集め、評価し、結果を統合する研究手法です。
「ある先生が読んだ論文をまとめた解説記事」と同じに見えますが、根本的に違うのは「事前にプロトコル(手順書)を作り、誰がやっても同じ結果が再現できる」点です。
2021年にBMJ等で同時発表されたPRISMA 2020声明では、SRの報告に必要な27項目のチェックリストが提示されています(Page et al, 2021)。これはSRを書く側だけでなく、読む側のチェックリストとしても使えます。
SRの典型的な7ステップ
- 臨床疑問のPICO化:Patient(対象)・Intervention(介入)・Comparison(比較)・Outcome(アウトカム)に分解する
- プロトコル登録:PROSPERO等の登録機関に検索式・取り込み除外基準を事前公開する
- 網羅的な文献検索:PubMed・Cochrane CENTRAL・Embase・PEDro等の複数DBを検索する
- スクリーニング:1次(タイトル・抄録)→2次(全文)を2名独立で実施する
- バイアスリスク評価:Cochrane Risk of Bias 2.0等のツールで研究の質を評価する
- データ抽出:各研究の対象・介入・アウトカム・結果を統一フォーマットで抜き出す
- 結果統合:定量的統合(=メタアナリシス)または定性的統合(叙述的)で結論を出す
この一連の手続きが「システマティック(系統的)」と呼ばれる理由です。2019年に更新されたCochrane Handbook第6版でも、ほぼ同じ流れが標準として定義されています(Cumpston et al, 2019)。
BRAINの判断!
BRAINでは、新しい介入を導入するかどうかの検討で、必ずSRレベルの文献から確認するようにしています。1本のRCTだけで判断すると、追試で結論が変わったときに患者さんに迷惑をかけるからです。
メタアナリシスとは|効果量を統計的に統合する手法
メタアナリシス(Meta-Analysis:MA)とは、SRで集めた個々の研究結果を、統計的に1つの効果量に統合する手法です。
たとえば、脳卒中後の上肢リハビリに関する10本のRCTがあるとします。それぞれが「介入群と対照群の平均差」を報告しています。10本の結果を単純平均してはいけません。サンプル数も研究の質も違うからです。
MAは、各研究のサンプル数・分散に応じて重み付けし、加重平均を取ることで「総合的な効果量」を算出します。
2022年にIndian Pediatr誌に掲載された初学者向けガイドでは、MAの本質を「個々の研究を意味のある形で要約し、効果の方向と大きさを定量化すること」と説明しています(Mathew, 2022)。
効果量の代表的な指標
- SMD(標準化平均差):異なる評価尺度を統一指標に変換する。0.2=小、0.5=中、0.8=大が目安
- MD(平均差):同じ評価尺度(例:FMA-UE点数)の差をそのまま表示する
- OR・RR(オッズ比・リスク比):2値アウトカム(例:転倒あり/なし)で使用する
- 95%信頼区間(CI):効果量の不確実性を示す範囲。CIに0を含むと有意差なしと判定
SRで集めた研究が「同じ介入・同じアウトカム・統計的に統合可能」な場合のみMAが実施されます。研究間のばらつき(異質性)が大きい場合や、結果の指標が揃わない場合は、MAを行わず叙述的に統合します。これを2020年にBMJで提唱されたSWiM(Synthesis Without Meta-analysis)報告ガイドラインと呼びます(Campbell et al, 2020)。
2つの違いを表で整理|SRはMAを含む場合と含まない場合がある
SRとMAは「包含関係」になっています。SRが大きな箱で、その中の統計的統合パートだけがMAです。

| 項目 | システマティックレビュー(SR) | メタアナリシス(MA) |
|---|---|---|
| 性質 | 研究の手法(プロセス全体) | 統計手法(結果統合の一部) |
| 含む工程 | PICO設定〜検索〜選択〜評価〜統合 | 効果量の重み付け平均 |
| 必要な研究数 | 結果がゼロでも成立する | 最低2件以上(実用上3件以上) |
| 同質性の要件 | 定性的に多様な研究もOK | 介入・対象・アウトカムが揃う必要あり |
| 結果の出力 | 叙述的サマリー+(あれば)フォレストプロット | フォレストプロット+統合効果量 |
| 報告ガイドライン | PRISMA 2020 | PRISMA 2020(MA章節) |
つまり、「SR with MA(メタアナリシス付き)」「SR without MA(叙述的統合のみ)」の2パターンがあります。タイトルだけ見て「SRとMA」と並列に書いてある論文は、ほぼ前者です。
2023年にJ Educ Eval Health Profで発表された方法論研究では、SR/MA論文の批判的読解で「MAだけを見て満足せず、SRの検索戦略・スクリーニング・バイアスリスク評価を必ず確認する」ことが推奨されています(Myung, 2023)。
関連する内部記事として「取り込み基準・除外基準とは|セラピストのための論文選別の判断軸」も併せて読むと、SRの「3. 網羅的な文献検索」「4. スクリーニング」の理解が深まります。
フォレストプロットの読み方|PT・OTが押さえる4要素
MAの結果は「フォレストプロット」と呼ばれる図で示されます。
森の樹冠のように見えることから名付けられた、SR/MA論文の主役級の図です。一見複雑ですが、見るべきポイントは4つだけです。

- 個別研究のマーカー:四角の大きさ=重み(サンプル数の大きさ)。中央の点が効果量の点推定値
- 横棒(信頼区間):個別研究の95%CI。短いほど精度が高い
- ひし形(統合効果量):横幅=統合CI、中央点=統合効果量。ひし形が無効ライン(差なし)をまたぐと有意差なし
- I²と異質性:研究間のばらつきを示す指標。0〜100%で、25%=小・50%=中・75%=大が目安
2020年にJ Clin Psychiatryで発表された解説論文では、「フォレストプロットの中央のひし形が無効ライン(0または1)をまたいでいないか」が、最初に見るべきポイントとされています(Andrade, 2020)。
さらに2022年にEye (Lond)誌で発表された「5分でわかるフォレストプロット解説」では、個別研究のひし形と統合ひし形の位置関係をみることで、結果が一貫しているか直感的に判断できると説明されています(Chang & Phillips, 2022)。
異質性I²の解釈
異質性指標I²の原典は、2002年にStat Medで発表されたHigginsらの論文です(Higgins & Thompson, 2002)。
2022年にRes Synth Methods誌に発表された最新のレビューでは、I²が高い(例えば75%以上)場合は、効果量を単純に統合せず、サブグループ解析・メタ回帰でばらつきの原因を探るべきと推奨されています(Migliavaca et al, 2022)。
BRAINの判断!
BRAINでは、フォレストプロットを読むときにI²と95%CIの幅をセットでチェックしています。統合効果量が大きくてもI²が80%超だと、「平均値の臨床的意味は弱い」と判断し、その内訳のサブグループ(重症度・発症期等)を必ず確認します。
SR/MAをリハビリ臨床にどう活かすか|脳卒中領域の代表例3本
SR/MAは、エビデンスピラミッドの最上位に位置するため、臨床現場でも介入選択の根拠として強力です。脳卒中リハビリ領域から代表例を3本紹介します。
①トレッドミル+免荷歩行訓練:Cochrane SR/MA 2017
Mehrholzらの2017年Cochraneレビューは、脳卒中後の歩行訓練としてトレッドミル±体重免荷(BWS)の効果を56本のRCT(合計3,105例)で統合しています(Mehrholz et al, 2017)。
歩行自立度・歩行速度・歩行耐久性で有意な改善が示され、特に既に歩行可能な患者で効果が大きいと結論づけられています。SRの網羅性とMAの定量化が組み合わさった代表例です。
②脳卒中後の体幹訓練:SR/MA 2019
Van Criekingeらの2019年SR/MAは、体幹訓練が脳卒中後の体幹コントロール・座位/立位バランス・モビリティに与える効果を統合しています(Van Criekinge et al, 2019)。
体幹訓練群で体幹インペアメント尺度(TIS)が有意に改善した一方で、立位バランスへの効果は研究間ばらつきが大きく結論が分かれたと報告されています。「アウトカムごとに効果量の確からしさが違う」というSR/MAの典型的読み解き方が学べる論文です。
③上肢リハの介入比較:ネットワークMA 2023
Tenbergらの2023年論文はStroke誌に掲載されたネットワークメタアナリシス(NMA)です(Tenberg et al, 2023)。複数の介入を直接比較できない(同じRCT内に存在しない)場合でも、共通比較対照を介して間接比較できるのがNMAの特徴です。
上肢機能(FMA-UE)への効果順位として、CIMT・課題指向型訓練・ロボット支援が上位に位置づけられました。「自分の患者にどの介入を優先すべきか」を考えるとき、NMAは非常に役立ちます。
BRAINでの活用事例|SR/MAを介入選択にどう使うか
BRAIN(株式会社BRAINが運営する脳卒中専門リハビリ施設)では、新しい介入を導入するときや既存介入の使い分けを判断するときに、必ずSR/MAを起点に検討します。
事例①:BCI(ブレイン・マシン・インターフェース)の導入判断
2025年にJ Neuroeng Rehabil誌で発表されたLiらのMA(24本のRCT、計858例)では、脳卒中後の上肢リハに対するBCI訓練がFMA-UE・MAS・Barthel Indexを有意に改善させたと報告されています(Li et al, 2025)。
BRAINでは、この論文を含む複数のSR/MAを参照し、重度上肢麻痺(FMA-UE 22点以下)の患者への第一選択の介入としてBCIを位置づけています。論文の対象集団とBRAINの実患者群が概ね一致していることを確認した上での判断です。
事例②:鏡像療法の位置づけ
2025年にClin Rehabil誌で発表されたSaragihらのSR/MAでは、鏡像療法(ミラーセラピー)が脳卒中後の上肢運動機能を有意に改善することが確認されています(Saragih et al, 2025)。
ただし対象集団・介入頻度・期間で異質性が大きく、I²が高めに出ています。BRAINでは「軽中等度麻痺で運動イメージが保たれる患者への補助療法」として位置づけ、第一選択にはしていません。
事例③:ロボット支援上肢訓練の使い分け
2020年にJ Neuroeng Rehabil誌に発表されたロボット支援上肢訓練のネットワークMAでは、エンドエフェクタ型・外骨格型・健側上肢駆動型を比較しています(Mehrholz & Pollock et al, 2020)。
BRAINではこのNMAの結論を踏まえつつ、独自に開発したTOT-S(Task-Oriented Training for Severe)と組み合わせる方針を採っています。SR/MAは「最終回答」ではなく、自施設の介入設計に組み込むための土台として使うのが本質です。
BRAINの判断!
BRAINでは、SR/MAを読むたびに「このレビューの対象集団は自分の患者と何が違うか」を必ずメモしています。論文の効果量をそのまま自分の患者に適用するのではなく、患者の重症度・発症期・併存症で補正して判断するのが、エビデンスを臨床に翻訳するということだと考えています。
SR/MAを読むときの3つの注意点
注意点①:対象集団が自分の患者に近いか
2014年にPLoS One誌で発表されたVeerbeekらの脳卒中PTの包括的SR/MAは467本のRCTを統合した大規模研究です(Veerbeek et al, 2014)。脳卒中PTの全体像を見るには有用ですが、対象集団が「亜急性期〜慢性期混在」「軽症から重症まで広い」ため、自分の担当患者(例:発症3ヶ月の重度上肢麻痺)に直接当てはまるとは限りません。
SR/MAの「全体結論」と「サブグループ解析の結論」を分けて読むのが鉄則です。
注意点②:MAの結論を「効果あり/なし」の二択にしない
p値が0.05未満でも、効果量が極めて小さければ臨床的意義は薄いです。逆にp値が0.05超でも、95%CIが広く症例数が少ない場合は「効果なし」とは言えません。
常に「効果量+95%CI+I²」をセットで判断する習慣をつけましょう。
注意点③:MAができていないSRも有用
研究間で介入・アウトカム・対象が揃わない領域(例:地域包括ケアの介入研究等)では、SWiM(叙述的統合)に留まるSRが多くあります。「MAがないからエビデンスが弱い」とは限りません。
適切にプロトコル化されたSRであれば、叙述的統合でも十分に意思決定の根拠になります。
よくある質問(FAQ)
Q1:SRとMAはどちらがエビデンスレベルが高いですか?
厳密には「比較対象」が違います。エビデンスピラミッドでは、SR/MA(特に質の高いRCTを統合したもの)が最上位に置かれます。SRの中にMAが含まれていれば、定量的な効果量が示されている分、意思決定材料としての強度は高くなります。
Q2:1本のRCTとSR/MAが矛盾したらどちらを信じますか?
原則としてSR/MAを優先します。ただしSR/MAが古い場合、新しい大規模RCTが結論を変える可能性があるので、SR/MAの「最終検索日」と新しいRCTの「発表年」を必ず確認してください。
Q3:MAの結果がCochraneと別のSR/MAで違うときは?
取り込み基準・検索式・統合方法が違うと、同じテーマでも結論が分かれます。SRごとのPICO・対象集団・除外論文一覧を見比べると、なぜ違うか追跡できます。詳しくは「システマティックレビューで結果が異なるとき確認すべきポイント 〜PICOS〜」をご覧ください。
Q4:I²が80%超だったらMAの結論は使えませんか?
使えないわけではありませんが、「全体の平均値」を鵜呑みにせず、サブグループ解析・メタ回帰の結果を確認してください。臨床応用のヒントはサブグループに隠れていることが多いです。
Q5:SR/MAを自分で書くにはどうしたらいいですか?
PRISMA 2020声明とCochrane Handbookを読むのが王道です。本記事冒頭で紹介したPage et al, 2021とCumpston et al, 2019が出発点になります。また、BRAINアカデミーのEBP実践プログラムでも、SR/MA読解の演習を扱っています(記事末尾のCTAをご参照ください)。
本記事のまとめ
- SRは研究の手法そのもの、MAはSRの中で行う統計的統合の部分
- SRはMAを含む場合(SR with MA)と含まない場合(SR without MA)の2パターンがある
- フォレストプロットは「個別研究のマーカー・横棒・ひし形・I²」の4要素で読む
- リハビリ臨床では、SR/MAの「対象集団・効果量・95%CI・I²」をセットで確認し、自分の患者に当てはめる
本記事の内容が、SR/MAをより深く読み解きたいセラピストの役に立てましたら幸いです。さらに体系的に文献検索とエビデンス活用を学びたい方は、書籍『文献検索の超基本』(針谷遼著)が網羅的な入門書としておすすめです(記事末尾CTAをご覧ください)。
参考文献
Page MJ, McKenzie JE, et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ. 2021. PMID: 33782057
Cumpston M, Li T, et al. Updated guidance for trusted systematic reviews: a new edition of the Cochrane Handbook for Systematic Reviews of Interventions. Cochrane Database Syst Rev. 2019. PMID: 31643080
Mathew JL. Systematic Reviews and Meta-Analysis: A Guide for Beginners. Indian Pediatr. 2022. PMID: 34183469
Myung SK. How to review and assess a systematic review and meta-analysis article: a methodological study. J Educ Eval Health Prof. 2023. PMID: 37619974
Campbell M, McKenzie JE, et al. Synthesis without meta-analysis (SWiM) in systematic reviews: reporting guideline. BMJ. 2020. PMID: 31948937
Andrade C. Understanding the Basics of Meta-Analysis and How to Read a Forest Plot: As Simple as It Gets. J Clin Psychiatry. 2020. PMID: 33027562
Chang Y, Phillips MR, et al. The 5 min meta-analysis: understanding how to read and interpret a forest plot. Eye (Lond). 2022. PMID: 34987196
Higgins JP, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002. PMID: 12111919
Migliavaca CB, Stein C, et al. Meta-analysis of prevalence: I² statistic and how to deal with heterogeneity. Res Synth Methods. 2022. PMID: 35088937
Veerbeek JM, van Wegen E, et al. What is the evidence for physical therapy poststroke? A systematic review and meta-analysis. PLoS One. 2014. PMID: 24505342
Mehrholz J, Thomas S, et al. Treadmill training and body weight support for walking after stroke. Cochrane Database Syst Rev. 2017. PMID: 28815562
Mehrholz J, Pollock A, et al. Systematic review with network meta-analysis of randomized controlled trials of robotic-assisted arm training. J Neuroeng Rehabil. 2020. PMID: 32605587
Van Criekinge T, Truijen S, et al. The effectiveness of trunk training on trunk control, sitting and standing balance and mobility post-stroke: a systematic review and meta-analysis. Clin Rehabil. 2019. PMID: 30791703
Tenberg S, Mueller S, et al. Comparative Effectiveness of Upper Limb Exercise Interventions in Individuals With Stroke: A Network Meta-Analysis. Stroke. 2023. PMID: 37293804
Saragih ID, Priyanti RP, et al. Effects of mirror therapy on upper limb motor function of patients with stroke: A systematic review and meta-analysis of randomized controlled trials. Clin Rehabil. 2025. PMID: 39834285
Li D, Li R, et al. Effects of brain-computer interface based training on post-stroke upper-limb rehabilitation: a meta-analysis. J Neuroeng Rehabil. 2025. PMID: 40033447
自分で調べられるセラピストへ。
オンライン/PT・OT向け/BRAINアカデミー


