論文の読み方｜PT・OTが押さえる「方法」と「結果」の2つだけ - | BRAIN | 東京都世田谷区の自費リハビリ施設BRAIN【脳卒中専門】

「論文を最初から最後まで読もうとして、いつも途中で挫折する」——そんな経験はありませんか？

養成校で「論文を読みなさい」と言われても、序論から考察まで全部丁寧に読むのは時間がかかりすぎて、臨床業務の合間にはとても続きません。

結論から言うと、PT・OT・STが日常的に論文を読むときに本当に押さえるべきは「方法（Methods）」と「結果（Results）」の2つだけです。

「序論」と「考察」は、後回しでも臨床判断には大きな影響がありません。

本記事では、論文を「方法」と「結果」だけで読み解くための具体的なステップ、効果量・信頼区間・p値の解釈、抄読会で使える3つの質問、明日から始める3ステップまでを、PT・OTが現場で使える形で解説します。

情報の信頼性について
・本記事はBRAIN代表／理学療法士の針谷が執筆しています（執筆者情報は記事最下部）。
・本記事はSackett 1996（BMJ）・Sicily Statement 2005（BMC Med Educ）等のEBP国際合意文書、およびcritical appraisal・journal club・統計解釈に関する2018〜2026年のレビュー・原著研究のデータを基に解説しています。

BASIC COURSE ｜ EBP・文献検索

エビデンスを、
自分で調べられるセラピストへ。

英語論文の読み方、PubMedを使った文献検索、批判的吟味を体系的に。ElicitなどのAI活用も含め、「なんとなく」ではなく臨床に活かす文献検索が身につきます。

英語論文の読み方　／　PubMed検索　／　批判的吟味

ベーシックコースを見る →

毎月1日開講・いつでもエントリー可能
オンライン／PT・OT向け／BRAINアカデミー

本記事の結論
なぜ「方法」と「結果」だけで十分なのか
論文構造の俯瞰｜IMRaDとは
ステップ1：方法（Methods）の読み方｜5つのチェックポイント
ステップ2：結果（Results）の読み方｜効果量・信頼区間・p値の3点セット
「考察」「序論」を後回しにすべき3つの理由
抄読会で使える3つの質問
明日から始める3ステップ
よくある質問（FAQ）
本記事のまとめ
参考文献

本記事の結論

論文はIMRaD（Introduction-Methods-Results-Discussion）構造で書かれており、PT・OTが読むべき本体は「方法」と「結果」の2つに集約される
方法では「研究デザイン・対象・介入・評価指標・統計手法」の5点だけを押さえれば、研究の信頼性が判断できる
結果は「効果量・信頼区間・p値」の3点セットで読み、p値だけで「効いた／効かない」と判断しないことが重要
明日から始める3ステップは「方法と結果だけ読む練習」「3つの質問で読む」「同僚と抄読会で共有」

以下、詳しく解説していきます。

なぜ「方法」と「結果」だけで十分なのか

「論文は最初から最後まで丁寧に読むのが当たり前」と思っているセラピストは多いはずです。

しかし、忙しい臨床業務のなかで毎回フルテキストを精読していたら、年間に読める論文の本数は限られてしまいます。

2021年にInternational Journal for Quality in Health Careで発表された物理療法でのEBP障壁に関するシステマティックレビュー・メタアナリシスでも、PT領域のEBP障壁トップは「時間不足」と報告されています（Paci et al., 2021）。

つまり、論文を読む時間を確保するには「全部読まない」戦略が必須になります。

結論から言うと、臨床判断に必要な情報は「方法（Methods）」と「結果（Results）」の2セクションにほぼすべて集約されています。

その理由は、批判的吟味（critical appraisal）の標準的フレームワークそのものが「方法と結果」を中心に評価する設計になっているからです。

2025年にThe Journal of the Royal College of Physicians of Edinburghで発表された原著論文の批判的吟味ガイドでも、研究の妥当性・信頼性・適用可能性・一般化可能性を評価する核心は、研究デザイン・対象・介入・評価・統計といった「方法」と、効果推定値や信頼区間といった「結果」の精査にあると整理されています（Santhanam et al., 2025）。

「序論」は研究の背景説明、「考察」は著者の解釈と限界の議論であり、いずれも臨床判断の一次データではありません。

「方法」と「結果」を先に読んでから、必要なときだけ「考察」「序論」を補助的に確認する——これが時短で論文を読むための基本戦略です。

※ 論文を読む前提として、EBPそのものの定義を整理したい方は、別記事「EBP/EBMとは｜リハビリ臨床への活かし方｜PT・OTのための実践ガイド」で詳しく解説しています。

論文構造の俯瞰｜IMRaDとは

論文を読むときに最初に押さえるべき大前提が、IMRaD（イムラッド）と呼ばれる論文構造です。

IMRaDは、Introduction（序論）・Methods（方法）・Results（結果）・Discussion（考察）の頭文字を取った名称で、医学・リハビリを含む臨床系の研究論文の標準構造として国際的に確立しています。

2025年にPuerto Rico Health Sciences Journalで発表された臨床科学者向け研究・科学的執筆ガイドでも、原著論文を構成する4つの基本要素としてIMRaDが繰り返し提示されており、各セクションが担う役割は次のように整理されています（De Jesus, 2025）。

Introduction（序論）：「なぜこの研究をしたか」——背景・先行研究・研究疑問・仮説を述べる部分
Methods（方法）：「どう調べたか」——研究デザイン・対象・介入・評価・統計を記述する部分
Results（結果）：「何がわかったか」——効果量・信頼区間・p値などの実測データを示す部分
Discussion（考察）：「結果をどう解釈したか」——著者による意味付け・限界・今後の課題を論じる部分

この4つのうち、客観的な事実が記載されているのは「方法」と「結果」だけです。

「序論」と「考察」は、著者の主観や解釈が入る余地が大きく、論文を批判的に読む立場のセラピストにとっては「参考情報」にとどめるのが妥当です。

逆に言えば、「方法」と「結果」だけで論文の核心を読み取れるようになれば、忙しい臨床のなかでも年間で読める論文の本数を大きく増やせます。

ステップ1：方法（Methods）の読み方｜5つのチェックポイント

方法セクションは、論文の「信頼性」を判断する最も重要なパートです。

批判的吟味では、研究の内的妥当性（バイアスリスク）と外的妥当性（自分の患者への一般化可能性）を「方法」を読みながら評価していきます（Santhanam et al., 2025）。

方法セクションを読むときに押さえるべきは、次の5点だけです。

チェック①：研究デザイン

まず確認すべきは、研究デザインの種類です。

ランダム化比較試験（RCT）・コホート研究・症例対照研究・横断研究・症例報告など、デザインによってエビデンスレベルと得られる情報が大きく異なります。

「介入の効果」を知りたいときはRCTやシステマティックレビュー、「予後予測」を知りたいときはコホート研究、というように研究疑問とデザインの整合性をまず確認しましょう。

チェック②：対象（参加者）

次に、研究対象の特性を確認します。

「年齢」「発症からの期間」「重症度」「除外基準」などを読み、自分の担当患者さんと近いプロファイルかを判断します。

例えば、急性期の若年RCTを慢性期の高齢患者にそのまま当てはめるのは無理があります。

外的妥当性（generalizability）の判断は、ここで決まります。

チェック③：介入の内容

介入セクションでは、「何を・どのくらい・どの頻度で・何週間」行ったかを具体的に確認します。

例えば「課題指向型訓練を週5回・40分・8週間」のように、再現可能な詳細が記載されているかが重要です。

記載が曖昧な介入は、自施設で再現できないため臨床応用が困難になります。

対照群（コントロール）が「通常リハビリ」なのか「無治療」なのかも確認しましょう。

チェック④：評価指標（アウトカム）

評価指標は「主要アウトカム（primary outcome）」と「副次アウトカム（secondary outcome）」に分かれます。

主要アウトカムが、その研究で「最も検証したかった効果」なので、まず主要アウトカムの結果を見れば研究の結論が分かります。

FMA-UE・FIM・10m歩行速度・MAS・mRSなど、評価指標が自施設で使えるかも確認しておきましょう。

チェック⑤：統計手法

統計手法は、群間比較なら「t検定」「Mann-Whitney U検定」「ANOVA」、効果検証なら「ANCOVA」「混合効果モデル」などが使われます。

細かい統計理論まで理解する必要はなく、「想定される統計手法が使われているか」「サンプルサイズ計算が記載されているか」を確認すれば十分です。

サンプルサイズ計算が記載されていない研究は、検出力不足（検定の結果を信頼できない）の可能性があります。

※ 方法を読む前段階で、PubMedで適切な論文を絞り込むスキルが必要です。詳しくは別記事「PubMedの使い方｜PT・OTのための完全ガイド」で解説しています。

ステップ2：結果（Results）の読み方｜効果量・信頼区間・p値の3点セット

結果セクションは、論文で最も時間をかけて読むべきパートです。

結果を正しく解釈するためには、「効果量（effect size）」「信頼区間（confidence interval）」「p値（p-value）」の3点セットで読むのが鉄則です。

① 効果量（Effect Size）

効果量は「差の大きさ」を表す指標です。

例えば「介入群と対照群でFMA-UEが平均5点違う」「Cohen’s d=0.5」など、群間差の絶対値や標準化された値で示されます。

2018年にAnesthesia and Analgesiaで発表されたPT/OT研究者向け統計解説でも、効果量は「治療効果や変数間の関連の強さを定量化する指標」と整理されており、効果量を見ずにp値だけで判断する誤りに注意が促されています（Schober et al., 2018）。

「効果量が大きい＝臨床的に意味がある」とは限らない点も重要です。

例えば「FMA-UEで5点改善」と聞いても、その評価指標のMCID（Minimal Clinically Important Difference：臨床的に意味のある最小変化量）と比べて十分な大きさかを照合する必要があります。

② 信頼区間（Confidence Interval, CI）

信頼区間は「効果量がどの範囲に収まる可能性が高いか」を示す統計指標です。

論文では95%信頼区間（95%CI）が標準的に使われ、「真の効果がこの幅のなかに含まれる確率が95%」と解釈します。

2020年のAnesthesia and Analgesia誌でも、信頼区間は効果推定の不確実性を表現する指標として、p値以上に臨床的解釈に役立つことが指摘されています（Schober et al., 2020）。

例えば「平均差5点（95%CI: 2〜8点）」なら、真の効果は2点〜8点の範囲にある可能性が高いと読めます。

信頼区間が広い研究は推定の精度が低く、信頼区間が狭い研究は精度が高いと判断できます。

2026年にJournal of Clinical Epidemiologyで発表されたMcMaster大学の調査では、内科医の多くが「信頼区間が0をまたぐと効果なし」と誤解していたことが報告されています（Agarwal et al., 2026）。

「CIが0をまたぐ＝効果なし」ではなく、「効果あり」「効果なし」のどちらの可能性も残っているという意味として読むのが正解です。

③ p値（p-value）

p値は「観察された差が偶然で生じる確率」を示す統計指標です。

慣例的に「p<0.05」を統計的有意水準としますが、p値だけで「効いた／効かなかった」と判断するのは大きな誤りです。

2025年にJournal of Trauma and Acute Care Surgeryで発表された臨床研究の統計的落とし穴ガイドでも、p値・信頼区間・オッズ比などの誤解釈が広く存在することが指摘されており、frequentist統計（頻度論統計）の慎重な解釈が推奨されています（Choi & Garwe, 2025）。

具体的には、以下の誤解が頻発します。

誤解①：p<0.05なら「効果がある」と確定する → 正しくは「偶然では説明しにくい差がある」程度の意味
誤解②：p>0.05なら「効果がない」と確定する → 正しくは「効果がないと結論づけるには情報不足」
誤解③：p値が小さいほど効果が大きい → 正しくは「p値の大小と効果量の大小は別物」

つまり、結果を読むときは「効果量＝どれくらい効いたか」「信頼区間＝どの範囲に真の値があるか」「p値＝偶然でこの差が出る確率」の3つを必ずセットで読むようにしましょう。

「考察」「序論」を後回しにすべき3つの理由

「序論」と「考察」も丁寧に読まないといけないと思っているセラピストもいます。

しかし、忙しい臨床のなかでは、これらは「後回し」または「飛ばす」のが現実的です。

その理由は、次の3つです。

理由①：序論は「背景説明」であり、結論には影響しない

序論は、研究を行った背景・先行研究・仮説を述べるパートです。

「なぜこの研究が必要か」を理解するうえでは有益ですが、「結局この研究で何がわかったか」を判断する一次データは含まれていません。

序論を飛ばしても、研究の核心である「方法」と「結果」を読み解くことは十分可能です。

理由②：考察は「著者の解釈」であり、客観的な事実ではない

考察は、結果を著者の視点で解釈する部分です。

著者の主張が含まれるため、結果から導かれる解釈が著者の希望的観測に偏っている可能性もあります。

「方法」と「結果」を自分で読んで判断したうえで、最後に「著者はどう解釈したか」を補助情報として確認するくらいでちょうどよいです。

文献検索・批判的吟味を体系的に身につけたい方へ。

ベーシックコースの詳細を見る →

理由③：考察を先に読むとバイアスがかかる

考察を先に読むと、著者の結論に引きずられて、自分で結果を解釈する力が育ちません。

批判的吟味の本質は「結果を自分の頭で解釈すること」なので、まず方法と結果を読み、自分なりの結論を出してから著者の解釈と照合するのが理想的です。

※ より体系的に批判的吟味を学びたい方は、別記事「EBPをリハビリに取り入れるために学習すべき70項目【コア・コンピテンシー】」でEBPコア・コンピテンシー一覧を参照してください。

抄読会で使える3つの質問

論文を1人で読み続けるのは難しいので、同僚との抄読会（journal club）が効果的です。

2023年にJournal of Allied Healthで発表された理学療法学生対象の縦断研究では、抄読会への継続的な参加が研究論文の批判的吟味スキルを有意に向上させたことが報告されています（Xia et al., 2023）。

2024年にScandinavian Journal of Occupational Therapyで発表された作業療法学生の調査でも、抄読会は批判的吟味スキルと研究方法への理解を高める学習活動として有効と評価されています（Helgøy et al., 2024）。

抄読会で使える具体的な質問は、次の3つに集約できます。

質問①：「この研究の対象は、自分の患者さんと近いか？」

研究の対象（年齢・発症期・重症度）が、自分の担当患者さんとどれくらい近いかを議論します。

外的妥当性の判断は、抄読会で議論することで多角的な視点が得られます。

質問②：「効果量は、臨床的に意味のある大きさか？」

「p<0.05で有意」だけで満足せず、効果量と評価指標のMCIDを照合します。

「FMA-UEで5点改善」が大きいか小さいかは、評価指標のMCIDを知っていないと判断できません。

抄読会で「この評価指標のMCIDはいくつか？」を一緒に調べる癖をつけましょう。

質問③：「自分の施設で再現可能か？」

研究で使われた介入の頻度・時間・期間が、自分の施設の制約（保険制度・スタッフ数・治療時間）で再現できるかを議論します。

再現できないなら、現実的な代替案を考えるのが臨床応用のステップです。

2025年にBMC Medical Educationで発表されたTREAT journal clubの研究でも、効果的な抄読会の鍵は「臨床現場の文脈に合った議論」と報告されており、3つの質問はそのフレームに合致します（Wenke et al., 2025）。

明日から始める3ステップ

「論文を読み始めたいけれど、何から手をつけたらよいかわからない」というセラピストに向けて、明日から始められる3ステップを提案します。

ステップ1：方法と結果だけ読む練習を1本ずつ

まずは、英語論文を1本選び、序論と考察は飛ばして方法と結果だけ読む練習をしてみてください。

1本15〜30分程度で読み終わるはずです。

慣れてきたら、「この対象は自分の患者と近いか」「効果量はMCIDより大きいか」を自問する習慣をつけましょう。

※ 英語論文が苦手な方は、別記事「英語論文を簡単に読む方法【AI翻訳の活用】」でDeepL・ChatGPT・NotebookLMの使い方を解説しています。

ステップ2：3つの質問でフレーム化する

論文を読むときに、必ず先述の3つの質問（対象・効果量・再現可能性）を自問する癖をつけましょう。

1本の論文に対して3つの質問の回答をメモに書き留めるだけで、批判的吟味の型が身につきます。

これは2025年のSanthanamらの critical appraisal フレームワークとも整合する読み方です（Santhanam et al., 2025）。

ステップ3：同僚と抄読会を始める

1人で論文を読み続けるのは難しいので、同僚と月2回30分の抄読会を始めるのがおすすめです。

1回1本だけ読み、3つの質問で議論する——このシンプルな形でも、続けることで批判的吟味スキルが組織文化として定着します。

2024年のEBP教育サーベイでも、PT/OTの研修プログラムにおけるEBP教育の主要な手法として抄読会が最も頻繁に採用されていることが報告されています（Kumbhare et al., 2024）。

※ 抄読会の効率化には、AI読解ツールの併用が有効です。詳しくは別記事「NotebookLMで論文を読む方法【PT・OT向け】」を参照してください。

よくある質問（FAQ）

Q1：論文を全部読まないと不誠実な気がするのですが？

「方法と結果」を読むことが、論文を最も誠実に読む方法です。

批判的吟味の核心は研究デザイン・対象・介入・評価・統計と、効果推定値の精査にあり、これらは「方法」と「結果」に集約されています（Santhanam et al., 2025）。

「序論と考察まで全部丁寧に読む」は、忙しい臨床のなかでは現実的に続きません。

Q2：統計が苦手なのですが、結果セクションは読めますか？

結果セクションを読むのに、高度な統計知識は不要です。

「効果量＝差の大きさ」「信頼区間＝推定の幅」「p値＝偶然で出る確率」の3点だけ覚えておけば、臨床判断に十分な情報が得られます（Schober et al., 2018）。

p値だけで判断する誤りを避け、信頼区間と効果量を必ずセットで読むようにしてください。

Q3：論文1本を読むのにどれくらい時間をかけるべきですか？

方法と結果だけなら、1本15〜30分が目安です。

慣れてくれば10分以内で読めるようになります。

「全部読む」ことが目的ではなく、「臨床判断に必要な情報を取り出す」ことが目的なので、必要十分な時間で構いません。

Q4：日本語論文と英語論文、どちらから始めるべきですか？

英語論文から始めることをおすすめします。

国際的なエビデンスは英語で発表されることがほとんどであり、日本語論文だけで臨床判断を補えるケースは限られます。

DeepL・ChatGPT・NotebookLM等のAIツールを使えば、英語が苦手でも内容把握は十分可能です。

Q5：信頼区間が0をまたぐ研究は意味がないのですか？

「CIが0をまたぐ＝効果なし」と決めつけるのは誤解です。

2026年のMcMaster大学の調査でも、内科医がこの誤解をする頻度が高いことが報告されています（Agarwal et al., 2026）。

「効果あり」と「効果なし」の両方の可能性が残っているという、推定の不確実性を示すサインとして読むのが正解です。

本記事のまとめ

論文はIMRaD構造（序論・方法・結果・考察）で書かれており、PT・OTが読むべき本体は「方法」と「結果」（De Jesus, 2025）
方法は「研究デザイン・対象・介入・評価指標・統計手法」の5点をチェック（Santhanam et al., 2025）
結果は「効果量・信頼区間・p値」の3点セットで読み、p値だけで判断しない（Schober et al., 2018）
抄読会で使える質問は「対象は近いか」「効果量は意味のある大きさか」「自施設で再現可能か」の3つ（Wenke et al., 2025）
明日から始める3ステップは「方法と結果だけ読む練習」「3つの質問で読む」「同僚と抄読会で共有」

本記事の内容が、論文を臨床に活かしたいPT・OTの役に立てましたら幸いです。

参考文献

Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS. Evidence based medicine: what it is and what it isn’t. BMJ. 1996. PMID: 8555924

Dawes M, Summerskill W, Glasziou P, et al. Sicily statement on evidence-based practice. BMC Med Educ. 2005. PMID: 15634359

Santhanam S, Ravindran V, Wincup C. Critical appraisal of an original research article. J R Coll Physicians Edinb. 2025. PMID: 40996352

De Jesus O. The Art of Research and Scientific Writing in the Clinical Sciences: A Practical Guide. P R Health Sci J. 2025. PMID: 41401093

Agarwal A, Santesso N, Agoritsas T, Guyatt G, Brignardello-Petersen R. Crossing the null does not mean “no effect”: a survey of internal medicine physicians on the interpretation of effect estimates with wide confidence intervals. J Clin Epidemiol. 2026. PMID: 41765348

Choi J, Garwe T. Common statistical pitfalls in clinical research: The guide to avoid misinterpreting p values, confidence intervals, odds ratios, and more. J Trauma Acute Care Surg. 2025. PMID: 40611376

Schober P, Bossers SM, Schwarte LA. Statistical Significance Versus Clinical Importance of Observed Effect Sizes: What Do P Values and Confidence Intervals Really Represent? Anesth Analg. 2018. PMID: 29337724

Schober P, Vetter TR. Confidence Intervals in Clinical Research. Anesth Analg. 2020. PMID: 32287136

Wenke R, Wiseman J, Stehlik P, et al. What do clinicians perceive as the effective implementation strategies for TREAT journal clubs? A qualitative study. BMC Med Educ. 2025. PMID: 40122791

Xia R, Morris S, Klappa SG, Colgrove Y. A Longitudinal Study of Journal Club to Enhance Physical Therapy Students’ Research Appraisal Skill for Evidence-Based Practice: A Mixed-Methods Study. J Allied Health. 2023. PMID: 37728359

Helgøy KV, Bonsaksen T, Mørk G. Occupational therapy students’ experiences and perceptions of journal club participation. Scand J Occup Ther. 2024. PMID: 38652886

Kumbhare D, Rizzo JR, Bean A, Annaswamy T. Evidence-based practice education in physical medicine and rehabilitation residency programs: A Canadian national survey. Am J Phys Med Rehabil. 2024. PMID: 38363717

Paci M, Faedda G, Ugolini A, Pellicciari L. Barriers to evidence-based practice implementation in physiotherapy: a systematic review and meta-analysis. Int J Qual Health Care. 2021. PMID: 34110410

BASIC COURSE ｜ EBP・文献検索

エビデンスを、
自分で調べられるセラピストへ。

英語論文の読み方　／　PubMed検索　／　批判的吟味

ベーシックコースを見る →

毎月1日開講・いつでもエントリー可能
オンライン／PT・OT向け／BRAINアカデミー

書籍｜文献検索の超基本

「先輩に聞けばいい」から卒業しませんか？

本書は、PT・OT・STが最短で文献検索を身につけるための一冊です。172ページ＋40本の動画で、PubMed検索からAI活用まで実践的に学べます。ChatGPT、Elicit、Semantic ScholarなどのAIツールを”なんとなく使う”のではなく、正しく臨床に活かす方法を体系的に解説。文献検索は、早く身につけた人が圧倒的に伸びます。エビデンスを自分で調べられるセラピストになりませんか？

詳細はこちら