ARAT(Action Research Arm Test)は、脳卒中リハビリテーションで上肢の運動パフォーマンスを評価する代表的な指標の一つです。

把握(Grasp)・握り(Grip)・つまみ(Pinch)・粗大運動(Gross movement)の4カテゴリ・19項目を0〜3点で採点し、合計0〜57点で表します。

信頼性・妥当性・反応性のいずれも高く、急性期から慢性期まで幅広く使えるうえ、近年は予後予測アルゴリズムPREP2の主要アウトカムとしても採用されています。

この記事では、ARATの正しい測定方法から、信頼性・妥当性・反応性(SEM・MDC・MCID)、FMA-UEとの対応カットオフまでを、2026年時点の最新エビデンスに基づいて網羅的に解説します。

臨床で「この変化は本当に改善なのか?」と迷ったときの判断基準として、ぜひご活用ください。

この記事は、脳卒中専門リハビリ施設BRAINが運営する「BRAINアカデミー」アドバンスコースの講義内容をもとに、最新の査読付き論文エビデンスを加えて作成しています。

目次
  1. 概要
  2. 測定方法
    1. 必要な器具
    2. 検査手順(標準化マニュアルに基づく)
    3. 4サブテスト・19項目の構成
      1. A. Grasp(把握):6項目・0〜18点
      2. B. Grip(握り):4項目・0〜12点
      3. C. Pinch(つまみ):6項目・0〜18点
      4. D. Gross movement(粗大運動):3項目・0〜9点
    4. 採点基準
    5. 実施上の注意点
    6. 日本語版の有無
    7. 派生バージョン
  3. 信頼性
    1. 検査者内信頼性(Intra-rater reliability)
    2. 検査者間信頼性(Inter-rater reliability)
    3. 再テスト信頼性(Test-retest reliability)
    4. 信頼性に関する注意点
  4. 妥当性
    1. 構成概念妥当性(Construct validity)
    2. 一次元性(Unidimensionality)
    3. 床効果・天井効果
  5. 反応性
    1. 測定誤差・LoA(慢性期)
    2. MCID(急性期)
    3. 反応性(介入効果を捉える能力)
  6. カットオフ値
    1. FMA-UEとの対応カットオフ(5段階分類)
    2. 3カテゴリ運用(現代版)
    3. 「最低限の上肢能力」のカットオフ
    4. 上肢機能の予後予測(PREP2アルゴリズム)
  7. 規範的データ
    1. 健常成人の規範データ
    2. 脳卒中患者のスコア例
    3. 比較のポイント
  8. よくある測定ミス TOP5
    1. 階層構造のショートカット規則を使わない
    2. 麻痺側から先に測定する
    3. 60秒を超えた試行を「2点」と採点してしまう
    4. サブテスト別の合計点だけを報告する
    5. 道具の規格を独自にアレンジする
  9. 類似評価指標との比較表:ARAT vs FMA-UE vs BBT vs WMFT、どれを選ぶ?
    1. BRAINでの使い分け
  10. BRAINの臨床意思決定フロー(BRAINオリジナル)
    1. 重症度による振り分けと、4サブテストパターンによるボトルネックの特定
    2. LoA/MCIDを「超えた/超えなかった」後の判断
    3. 患者への結果説明(Shared Decision Making への接続)
    4. BRAINで意図的に「やらない」5つの判断
  11. ARAT重症度かんたん判定ツール
    1. ARAT 重症度かんたん判定ツール
  12. ワークショップ:臨床判断トレーニング
  13. 参考文献

概要

■ 正式名称
Action Research Arm Test(略称:ARAT)
■ 開発の背景
開発者:Ronald C. Lyle / 発表年:1981年(Lyle, 1981) / 原型:Carrollの Upper Extremity Function Test(UEFT, 1965)を再構成したもの / 標準化マニュアル:Yozbatiran, Der-Yeghiaian, Cramer(2008)
■ スコアリング
各項目0〜3点、合計0〜57点。高いほど良好

ARATは、脳卒中をはじめとする上肢障害者の運動パフォーマンスを評価する標準化されたパフォーマンステストです。

把握・握り・つまみ・粗大運動の4側面を網羅し、ICF分類では「活動(Activity)」レベルを測定します。

ARATは「リーチ→把握→移動→離す」という一連の上肢動作をタスクごとに段階的に評価できる指標で、脳卒中上肢評価の国際的なゴールドスタンダードの一つです。

欧州の専門家コンセンサスCAULIN(Prange-Lasonder et al., 2021)でも、上肢評価の「extended set」としてFMA-UEと並ぶ位置づけが与えられています。

測定方法

この手順は Lyle(1981)の原著論文と、その後の標準化マニュアルである Yozbatiran et al.(2008)に基づきます。

必要な器具

ARATは規格化された専用キットを使用します。

原著(Lyle, 1981)に基づく主な道具は以下の通りです。

国内での入手:日本ではインターリハ株式会社が公式の検査キット「IP-ARATS」(ケース寸法750×130×400mm/重量11.5kg/4種類19項目セット)を販売しており、棚板・課題物が標準化された配置・寸法でパッケージ化されています。

自作よりも標準化マニュアル(Yozbatiran et al., 2008)の規格を満たしやすいため、研究や複数施設での比較を行う場合は推奨されます(インターリハ株式会社, 2026)。

カテゴリ品目規格
テーブル92cm × 45cm、高さ83cm。手前端から37cm高の位置に棚(93cm × 10cm)
椅子肘掛けなし・背もたれ付き座面高44cm
Grasp用木製立方体ブロック一辺2.5cm/5cm/7.5cm/10cm 各1個
Grasp用クリケットボール直径7.5cm
Grasp用砥石(sharpening stone)規格は原著に明記なし。施設で代用可
Grip用合金製チューブ(太)直径2.25cm × 長さ11.5cm
Grip用合金製チューブ(細)直径1.0cm × 長さ16cm
Grip用グラス(水を注ぎ替える用)2個
Grip用ワッシャーとボルト1セット
Pinch用ビー玉直径1.5cm
Pinch用ボールベアリング(鋼球)直径6mm
その他ストップウォッチ、記録用紙

検査手順(標準化マニュアルに基づく)

  1. 患者を椅子に座らせ、背もたれに体幹を密着させる。足底を床にしっかり接地させる
  2. 両手を回内位でテーブル上に置く(開始姿勢)
  3. 非麻痺側(less-affected hand)から測定を開始する
  4. 各サブテスト内では、最も難しい項目(=配列上の1項目目)から開始する
  5. 1項目目が3点満点なら、残りの項目はすべて3点扱いで省略し、次のサブテストへ進む
  6. 1項目目が0〜2点なら、次にそのサブテストの最も易しい項目(=2項目目)を実施する
  7. 最も易しい項目が0点なら、残りの中間項目はすべて0点扱いで省略し、次のサブテストへ
  8. 易しい項目で1点以上が取れた場合のみ、そのサブテストの残り項目をすべて実施する
  9. 非麻痺側が完了したら、同じ手順で麻痺側(affected hand)を評価する

4サブテスト・19項目の構成

ARATは難易度順に配列された4つのサブテストで構成されています。

A. Grasp(把握):6項目・0〜18点

机上の物品を持ち上げて37cm高の棚に移動する課題。

  1. 10cm立方体ブロックを棚へ
  2. 2.5cm立方体ブロックを棚へ
  3. 5cm立方体ブロックを棚へ
  4. 7.5cm立方体ブロックを棚へ
  5. クリケットボール(直径7.5cm)を棚へ
  6. 砥石を棚へ

B. Grip(握り):4項目・0〜12点

掌全体で把持し、机の反対側まで移動、または注ぐ動作。

  1. 一方のグラスから他方のグラスへ水を注ぐ
  2. チューブ(直径2.25cm × 11.5cm)を机の反対側へ移動
  3. チューブ(直径1.0cm × 16cm)を机の反対側へ移動
  4. ワッシャーをボルトに通す(ボルトに乗せる)

C. Pinch(つまみ):6項目・0〜18点

指先で対象をつまみ上げ、37cm高の棚に乗せる課題。

母指と他指の組み合わせ・対象の大小で6項目に分かれます。

  1. ボールベアリング(6mm)を母指と薬指でつまむ
  2. ビー玉(1.5cm)を母指と示指でつまむ
  3. ボールベアリング(6mm)を母指と中指でつまむ
  4. ボールベアリング(6mm)を母指と示指でつまむ
  5. ビー玉(1.5cm)を母指と薬指でつまむ
  6. ビー玉(1.5cm)を母指と中指でつまむ

D. Gross movement(粗大運動):3項目・0〜9点

上肢全体を使った大きな動作。

  1. 手を後頭部に置く
  2. 手を頭頂部に置く
  3. 手を口元に運ぶ

採点基準

各項目は以下の0〜3点で採点します(Lyle, 1981/Yozbatiran et al., 2008)。

定義時間基準
3点正常に遂行できる5秒未満で完了
2点遂行はできるが明らかに時間がかかる/困難5〜60秒で完了
1点部分的にしか遂行できない
0点全く遂行できない

「5秒/60秒」の時間カットオフは、Yozbatiran et al.(2008)が健常高齢者のノルムをもとに明文化した基準です。

Lyle原著では「unduly slow(不当に遅い)」という定性的表現にとどまっていました。

60秒を超えた場合は試行を中断し、1点を付与します。

実施上の注意点

  • 非麻痺側を必ず先に測定する。これは課題内容の理解と練習を兼ねる
  • 口頭指示で理解できない場合は評価者が実演(demonstration)してよい
  • 麻痺側の正式採点では、1試行が原則。同一項目を何度も繰り返して最良値を採るのは不可
  • 指切断などの身体欠損がある場合、Pinchサブテストおよび当該動作が必要な項目はすべて0点とする(Yozbatiran et al., 2008)
  • 全身状態の悪化・疼痛増悪・安全性が確保できない場合は中止する

日本語版の有無

StrokengineおよびShirley Ryan AbilityLabのデータベース上には、公式な日本語翻訳版(採点票・項目記述の正式翻訳)は登録されていません。

ただし、日本国内では原著者Thomas Platzらの書籍『ARM – Arm Rehabilitation Measurement』の版権許諾を得て翻訳された『脳卒中上肢機能評価 ARATパーフェクトマニュアル』(安保雅博 監修, 中野枝里子・田中智子 編, 金原出版, 2015年, DVD付)が出版されており、実施法・採点法を日本語で参照できます(金原出版, 2015)。

また、日本語版ARATの計量心理学的特性についても、大場ら(2011)が急性期脳卒中患者40名を対象に検者間信頼性・内的整合性・併存的妥当性(FMAおよびSTEFとの相関)を検証し、いずれも良好であることを報告しています(総合リハビリテーション 39巻3号 pp.265-271)。

検査キットも前述の通りインターリハ株式会社が国内販売しており、日本国内で標準化された運用を行うインフラは整っています。

派生バージョン

近年、項目数を絞った短縮版がいくつか提案されています。

  • 15項目版:van der Lee et al.(2002)が一次元性分析に基づき提案
  • Mini-ARAT:Daghsen et al.(2022)が把握・つまみのみで構成
  • ARAT-DT(決定木版):Zonjee et al.(2022)が最大4項目で原ARATと差0.19点と報告
  • 決定規則版(15項目):Amano et al.(2023)/Yoshihara et al.(2025)

ただし臨床・研究のスタンダードは依然として原著(Lyle, 1981)の19項目版です。

本記事では原著版の数値データに基づいて解説します。

信頼性

ARATの脳卒中患者における信頼性は極めて高く、複数の研究で報告されています。

検査者内信頼性(Intra-rater reliability)

著者(年)ICC対象者備考
van der Lee et al.(2001)> 0.98慢性期脳卒中20名(年齢中央値62歳、発症後中央値3.6年)ビデオ再評価。加重κ中央値 > 0.92
Platz et al.(2005)> 0.95脳卒中37名+多発性硬化症14名+外傷性脳損傷5名(計56名)標準化ガイドライン使用下
Nordin et al.(2014)全19項目中18項目で「satisfactory」慢性期脳卒中35名項目レベル分析

検査者間信頼性(Inter-rater reliability)

著者(年)ICC対象者備考
van der Lee et al.(2001)> 0.98慢性期脳卒中20名評価者間で系統差わずか(mean difference 0.75点)
Hsieh et al.(1998)0.98脳卒中50名3名のPTがそれぞれ評価
Platz et al.(2005)> 0.95脳卒中37名+MS14名+TBI5名標準化手順下

再テスト信頼性(Test-retest reliability)

著者(年)ICC対象者再テスト間隔
Platz et al.(2005)> 0.95脳卒中37名+MS14名+TBI5名1週間
van der Lee et al.(2001)> 0.98慢性期脳卒中20名(ビデオ再評価のため実質的に再テスト要素を含む)
🔍 ICCの解釈基準(参考)
・0.90以上:優秀(Excellent)
・0.75〜0.89:良好(Good)
・0.50〜0.74:中等度(Moderate)
・0.50未満:不良(Poor)

ARATの再テスト信頼性は ICC > 0.95 と「優秀」の範囲にあり、臨床現場での経時的評価に十分耐えうる信頼性を持ちます。

信頼性に関する注意点

Pike et al.(2018)はCOSMINメソッドに基づく系統的レビューで、「ARATの intra-rater 信頼性については中程度の肯定的エビデンスがあるが、inter-rater 信頼性・test-retest 信頼性・測定誤差については厳密な質を満たす研究が不足している」と指摘しています。

実臨床では十分高い信頼性を持つと考えてよいですが、研究目的で使用する際は標準化マニュアル(Yozbatiran et al., 2008)の手順を厳格に守ることが推奨されます。

妥当性

構成概念妥当性(Construct validity)

ARATは脳卒中患者で他の上肢評価指標と高い相関を示します。

比較指標相関係数対象者著者(年)
FMA-UErho = 0.77(入院時)/0.87(退院時)急性期脳卒中104名(平均72歳、発症後16日)Rabadi & Rabadi(2006)
FMA-UErho > 0.92脳卒中37名+MS14名+TBI5名Platz et al.(2005)
BBT高相関(具体値はChanubol論文で報告)亜急性期初発脳卒中40名Chanubol et al.(2012)
Motor Assessment Scale UEr = 0.96脳卒中50名Hsieh et al.(1998)
Motricity Index armr = 0.87脳卒中50名Hsieh et al.(1998)

一次元性(Unidimensionality)

van der Lee et al.(2002, Clin Rehabil)はMokken scale分析により、ARAT 19項目すべてが単一の構成概念を測定していることを実証しました(scalability H = 0.79、reliability ρ = 0.98)。

これは「ARATは4つのサブテストに分けて報告するよりも、合計57点を一次元の上肢能力指標として扱うべき」という重要な学術的根拠です。

床効果・天井効果

著者(年)知見対象者
Lin et al.(2009)UE-FMを除く全尺度(ARAT含む)で1時点以上に有意な床効果または天井効果を検出脳卒中53名(発症後14・30・90・180日)
Chanubol et al.(2012)BBTには床効果あり、ARATには軽度の天井効果あり亜急性期初発脳卒中40名
Wilson et al.(2021, RATULS)ARATサブスケール分布はU字型を示し、床・天井効果が顕著RATULS試験参加者

実務上のポイント:ARATは重度麻痺では床効果(合計0点付近に集まる)軽症例では天井効果(57点付近に集まる)が出ます。

重度群にはFMA-UEを、軽症群にはWMFTやMALを併用することで、ARATの限界を補えます。

反応性

🔍 用語解説
SEM(Standard Error of Measurement):測定の標準誤差。同じ患者を繰り返し測ったときに生じる「測定誤差の大きさ」
MDC95(Minimal Detectable Change at 95% confidence):95%の信頼度で「測定誤差を超えた真の変化」と判断できる最小の変化量
MCID(Minimal Clinically Important Difference):臨床的に意味のある最小の変化量
LoA(Limits of Agreement):Bland-Altman法で算出される一致の限界。安定個体で想定される測定誤差の上下限

測定誤差・LoA(慢性期)

van der Lee et al.(2001, J Rehabil Med)は、慢性期脳卒中患者22名に対して2週間隔でARATを2回測定し、Bland-Altman法による一致の限界を算出しました。

著者(年)LoA対象者備考
van der Lee et al.(2001)−5.7 〜 +6.2点慢性期脳卒中22名(年齢中央値58.5歳、発症後中央値3.6年)反応性比 ARAT = 2.03(FMA-UE = 0.41)

事実:この「±約6点」がARATの測定誤差の上限にあたります。

慢性期では「6点を超える変化が真の変化」と解釈するのが妥当です。

MCID(急性期)

Lang et al.(2008)はVECTORS試験データを用い、急性期脳卒中患者52名でARATのMCIDをアンカーベース法(患者のglobal rating of change)により算出しました。

著者(年)MCID対象者備考
Lang et al.(2008)利き手(dominant)が麻痺側:12点急性期脳卒中52名(ベースライン平均9.5日、再評価平均25.9日後)アンカー法、利き手・非利き手別
Lang et al.(2008)非利き手(non-dominant)が麻痺側:17点同上

MCIDは利き手・非利き手で大きく異なる点に注意してください。

「ARATのMCID = 12点」と単純に書くのは不正確で、必ず「利き手12点/非利き手17点」と区別する必要があります。

反応性(介入効果を捉える能力)

著者(年)指標対象者
Lang et al.(2006)効果量・反応性比効果量 > 1.0、反応性比 7.0(3か月時点)急性期脳卒中50名(VECTORS)
Rabadi & Rabadi(2006)SRM(Standardized Response Mean)0.68(入院時→退院時)急性期脳卒中104名
van der Lee et al.(2001)反応性比2.03(FMA-UEの 0.41 に対し約5倍)慢性期脳卒中22名

ARATは急性期・慢性期ともに高い反応性を示し、特に慢性期ではFMA-UEより変化を捉えやすいことが van der Lee et al.(2001)から示唆されます。

カットオフ値

FMA-UEとの対応カットオフ(5段階分類)

Hoonhorst et al.(2015)は初発虚血性脳卒中460名のデータから、FMA-UE と ARAT の対応カットオフを導出しました。

これはARATの重症度分類の決定的なエビデンスです。

重症度FMA-UEARATAUC臨床的意味
No capacity(能力なし)0〜22点0〜10点0.987上肢の使用能力なし
Poor(不良)23〜31点11〜21点0.988軽い物の把持が部分的に可能
Limited(限定的)32〜47点22〜42点0.916把持は可能だが速度・質に限界
Notable(顕著)48〜52点43〜54点0.948日常動作で使用可能
Full(完全)53〜66点55〜57点日常動作でほぼ制限なし

すべてAUC > 0.91、感度0.99と非常に高い識別力を示しています(Hoonhorst et al., 2015)。

3カテゴリ運用(現代版)

Brunner et al.(2024)は動的予測モデルの外部妥当性検証で、よりシンプルな3カテゴリ運用を採用しました。

カテゴリARAT解釈
Severe(重度)0〜22点重度上肢機能障害
Moderate(中等度)23〜47点中等度上肢機能障害
Mild(軽度)48〜57点軽度上肢機能障害

「最低限の上肢能力」のカットオフ

Winters et al.(2016)は、ARAT ≥ 10点を「最低限の上肢能力(小物を拾える)」のカットオフとして提案しました。

発症8±4日で指伸展のなかった脳卒中100例のうち、6か月後にARAT≥10を達成したのは45例でした。

上肢機能の予後予測(PREP2アルゴリズム)

ARATは予後予測アルゴリズムPREP2の主要アウトカムとして採用されています。

  • Nijland et al.(2010, EPOS):発症2日目に随意的な指伸展と肩外転(SAFE)がある患者は、6か月で一定の巧緻性を獲得する確率0.98、ない患者は0.25
  • Stinear et al.(2012, PREP原著):SAFEスコア+TMS(皮質脊髄路機能)+DTI(内包構造)をアルゴリズム化し、12週時点のARATスコアを予測
  • Stinear et al.(2017, PREP2実装):PREP2は3か月時点のARATスコアカテゴリを80%の精度で予測。実装群で在院期間が1週間短縮(11日 vs 17日、p=0.001)

急性期にARATを測定し、PREP2のカテゴリ判定(Excellent / Good / Limited / Poor)と照らし合わせておくことは、退院後のリハ計画と患者・家族への説明に大きな価値があると考えます。

規範的データ

健常成人の規範データ

ARATは天井効果のため健常成人ではほぼ全員が満点(57点)を取ります。

このため、独立した「健常成人の規範データ研究」はPubMed上にほとんど存在しません(CROエージェント検索による)。

実務的には健常成人 = 57点(満点)と扱うのが一般的です。

脳卒中患者のスコア例

著者(年)病期nARATスコア(平均±SD)
van der Lee et al.(2001)慢性期2238.0(範囲広い)
van der Lee et al.(2001)慢性期2029.2
Rabadi & Rabadi(2006)急性期入院時104平均10点改善で退院

比較のポイント

  • 健常成人:満点57点
  • 慢性期脳卒中患者:個人差が極めて大きく、平均は20〜40点に分布する
  • ARATの変化を解釈する際は、FMA-UEとの対応カットオフ表(Hoonhorst, 2015)で「どのカテゴリからどのカテゴリへ移ったか」を確認するのが実践的

よくある測定ミス TOP5

実際の臨床現場でセラピストが陥りやすいARATの測定ミスを5つ紹介します。

階層構造のショートカット規則を使わない

なぜ問題か:ARATは「最も難しい項目から開始し、3点なら以下満点扱いで省略」というGuttman型階層尺度です。

すべての項目を律儀に1から実施すると時間が大幅に伸び、患者の疲労によってスコアが下がります。

正しいやり方:標準化マニュアル(Yozbatiran et al., 2008)のショートカット規則に従い、各サブテストで最難項目→最易項目の順に判定する。

麻痺側から先に測定する

なぜ問題か:麻痺側を先に行うと、患者がルールを十分理解しないまま正式採点に入ってしまい、本来より低いスコアになります。

正しいやり方:必ず非麻痺側→麻痺側の順で測定する。

非麻痺側は実質的な練習試行を兼ねます。

60秒を超えた試行を「2点」と採点してしまう

なぜ問題か:60秒を超えた時点で1点を付与して中断するのが標準化マニュアルのルールです。

「時間がかかったから2点」と誤って付ける施設が散見されます。

正しいやり方:5秒未満=3点、5〜60秒=2点、60秒経過時点で中断=1点と明確に区別する。

サブテスト別の合計点だけを報告する

なぜ問題か:ARATは van der Lee et al.(2002, Clin Rehabil)のMokken分析で単一次元であることが実証されており、サブテスト別の合計点を独立に解釈することは統計的には支持されません。

正しいやり方合計57点満点を主指標として記録し、サブテスト別スコアは参考情報として併記する。

道具の規格を独自にアレンジする

なぜ問題か:木製ブロックのサイズや椅子・テーブルの高さは原著(Lyle, 1981)で厳密に規定されています。

市販の代替品で「だいたい同じ」を使うと、施設間・経時比較の妥当性が失われます。

正しいやり方:規格化された専用キットを購入するか、原著の寸法に厳密に従って自作する。

テーブル高(83cm)・椅子座面高(44cm)・棚の高さ(37cm)は特に重要。

類似評価指標との比較表:ARAT vs FMA-UE vs BBT vs WMFT、どれを選ぶ?

上肢の運動機能・運動パフォーマンスを評価する代表的な4つのテストを比較します。

項目ARATFMA-UEBBTWMFT
評価対象把握・握り・つまみ・粗大運動の包括評価共同運動・分離運動の段階評価粗大巧緻性(リーチ・把握・移動)15項目の動作(時間 + 機能)
ICF分類活動心身機能活動活動
スコア形式19項目を0〜3点で採点(0〜57点)33項目を0〜2点で採点(0〜66点)60秒間に運んだ個数各項目の所要時間 + FAS(0〜5点)
所要時間約7〜10分約20〜30分約2〜3分約20〜30分
重度麻痺での測定床効果あり段階的に評価可能床効果が大きい実施困難な項目あり
軽症例での測定天井効果あり天井効果やや大天井効果やや小反応性は良好
MCID急性期12点(利き手)/17点(非利き手)4〜7点(病期別)5.5〜7点1〜1.2点(FAS)
FMA-UEとの相関rho = 0.77〜0.92r = 0.78〜0.92r = 0.80前後

BRAINでの使い分け

  • 急性期の予後予測 → ARAT(PREP2の主要アウトカム)
  • 運動機能の質を細かく見たい・重度麻痺 → FMA-UE
  • 短時間スクリーニング・経時モニタリング → BBT
  • 動作の速度と質を同時に見たい → WMFT
  • 詳細な機能評価・研究 → ARAT(一次元性が担保された包括指標)

▼関連記事:FMA(Fugl-Meyer Assessment)の測定方法と信頼性・MDC・カットオフ値を完全解説

さらに実践的に学びたい方は、BRAINアカデミーアドバンスコース上肢で評価指標の臨床活用からSDMまで体系的に習得できます。

BRAINアカデミー

エビデンスに基づく脳卒中リハビリテーションを体系的・網羅的に学ぶ、3ヶ月間のオンライン学習プログラムです。

①動画教材 ②課題 ③フィードバックを通じて、EBMを身に付けましょう!
詳細はこちら

BRAINの臨床意思決定フロー(BRAINオリジナル)

ここまでの数値の読み方を解説してきましたが、臨床現場で本当に難しいのは「測ったあと、明日のリハビリで何をするか」です。

このセクションでは、BRAINがこの評価指標の結果をどのように臨床判断に翻訳しているかを共有します。

査読付き論文に基づく事実と、BRAIN内部の運用ルール(意見)を分けて記載します。

重症度による振り分けと、4サブテストパターンによるボトルネックの特定

事実
Hoonhorst MH(2015)は脳卒中急性期患者でARATの5段階分類(pour/poor/limited/notable/full)を確立しました。

0〜10点が重度、11〜21点が中等度、22〜57点が軽度〜回復の目安です。

BRAINの判断!
BRAINではARATを「合計点による重症度による振り分け」と「4サブテスト(Grasp/Grip/Pinch/Gross movement)別パターンによるボトルネックの特定」をセットで使います。

合計点だけで治療方針を決めることはありません。

ARATのスコアからの分類

  • 0〜10点(重度)→ 重症度優先:Gross movementから積み上げる。リーチング動作の獲得が最初のステップ
  • 11〜21点(中等度)→ 構成要素優先:Graspの獲得が分岐点。サブテスト別パターンでボトルネックを特定
  • 22〜56点(軽度)→ 質的優先:Pinchの細分化された課題。日常動作への般化
  • 57点(最軽度)→ ARATでは天井効果。BBT・9HPT・MALへ移行

4サブテスト別のボトルネックの読み方

  • Grasp(6項目)がボトルネック → 把握動作がボトルネック。手指屈筋群と手関節伸展の同時収縮トレーニング
  • Grip(4項目)がボトルネック → 円柱握りがボトルネック。前腕回内外と手関節肢位の練習
  • Pinch(6項目)がボトルネック → 親指と他指の対立がボトルネック。母指の選択的運動課題
  • Gross movement(3項目)がボトルネック → 肩・肘の粗大運動がボトルネック。FMA-UE A項目との整合を確認

ARATは階層構造(hierarchy)があるため、上位項目で得点を取れない場合は下位項目を全て0点とみなすショートカット規則があります。

これを必ず守ります。

サブテスト別パターンとボトルネックの特定は、BRAINアカデミーの上肢コースで実践演習として扱っています。

LoA/MCIDを「超えた/超えなかった」後の判断

事実
Hoonhorst MH(2015)は急性期のSDD(smallest detectable difference)を約3点、van der Lee JH(2001)は慢性期のMCIDを5.7点と報告しています。

利き手・非利き手で異なる場合があります。

BRAINの判断!
BRAINでは「LoA/MCIDを超えた/超えなかった」を二者択一で判断せず、病期と利き手/非利き手に合ったMCIDを使い、4ステップで確認します。

【MCIDを超えた場合】

  1. 介入内容を維持し、次回も同じ条件(座位姿勢・テーブル高・採点者)で再評価
  2. 患者本人に「どのサブテストが改善したか」を具体的にフィードバック
  3. MAL(実生活での使用頻度)と整合しているか確認
  4. 次のボトルネックサブテストを特定して介入方針を決める

【MCIDを超えなかった場合】

  1. 病期に合ったMCIDを使ったか確認
  2. 合計点は変わっていなくても、特定サブテスト(例:Grasp)が改善している可能性を確認
  3. ショートカット規則の適用が前回と一致しているか確認(採点者の判断揺れがないか)
  4. 患者のGROCとMALを聞く
  5. 4週連続でMCID未達なら介入ターゲットを見直す

患者への結果説明(Shared Decision Making への接続)

事実
ARATは欧州CAULINコンセンサス(Prange-Lasonder, 2021)でFMA-UEと並ぶ「extended set」として推奨されている、上肢機能評価の国際標準の一つです。

BRAINの判断!
ARATの結果を患者本人に説明する際、BRAINは以下の運用ルールを守ります。

  1. 合計点だけを伝えない。「25点でした」ではなく「物の掴み(Grasp)はある程度できますが、つまみ(Pinch)が難しい状態で、ボタンかけや小さな物の操作が課題です」とサブテストレベルで言語化
  2. 経時変化はグラフで可視化(合計とサブテスト別の両方)
  3. PREP2(予後予測アルゴリズム)の予測カテゴリと現在の位置を示す
  4. 「次の4週でPinchサブテストを中心に介入し、3点改善を目標にします」と具体目標で合意
  5. 治療オプションを3〜5個提示してから決定する

BRAINで意図的に「やらない」5つの判断

事実と解釈の境界を明確にするため、BRAINではエビデンスが不十分な以下の判断を意図的に避けています。

これらは「絶対やってはいけない」のではなく、「現時点のエビデンスでは支持できないので、BRAINでは慎重を期して避けている」という運用ルールです。

エビデンスが蓄積されれば見直す可能性があります。

  1. ARATだけで上肢機能を断定する → 「能力」評価のため、必ずMALと併用する
  2. ショートカット規則を正しく適用しない → 採点の標準化が前後比較の前提
  3. 57点を「完全回復」と判定する → 天井効果があるため、BBT・9HPT・MALへ移行を検討
  4. 病期・利き手の違いを無視してMCIDを当てはめる → 急性期と慢性期、利き手と非利き手で基準が異なる
  5. 標準セット以外の物品で代用する → 標準化された物品(木製ブロック・グラス等)を使用する

「やらない判断」の根拠と、それでも臨床判断が必要な場面でのBRAINの代替アプローチについては、BRAINアカデミーの症例検討会で議論しています。

ARAT重症度かんたん判定ツール

ARAT 重症度かんたん判定ツール

ARATの合計スコアと利き手・病期を入力すると、Hoonhorst(2015)の5段階重症度分類と、前回値からの変化が測定誤差・MCIDを超えたかを自動判定します。

今回のARATスコア / 57点
麻痺側
病期
前回スコア(任意) / 57点

※ この判定ツールは参考情報を提供するものであり、臨床判断を代替するものではありません。患者個々の状態を総合的に評価してください。
※ 重症度分類の出典:Hoonhorst MH et al. How Do Fugl-Meyer Arm Motor Scores Relate to Dexterity According to the Action Research Arm Test at 6 Months Poststroke? Arch Phys Med Rehabil. 2015;96(10):1845-1849.
※ 急性期MCIDの出典:Lang CE et al. Estimating minimal clinically important differences of upper-extremity measures early after stroke. Arch Phys Med Rehabil. 2008;89(9):1693-1700.
※ 慢性期LoAの出典:van der Lee JH et al. The responsiveness of the Action Research Arm test and the Fugl-Meyer Assessment scale in chronic stroke patients. J Rehabil Med. 2001;33(3):110-113.

ARATの合計スコアを入力すると、Hoonhorst et al.(2015)の5段階分類に基づく重症度判定と、前回値からの変化量がMDC(LoA)・MCIDを超えたかを自動判定するツールです。

臨床評価の参考にご活用ください。

※このツールは参考情報を提供するものであり、臨床判断を代替するものではありません。

最終的な評価は患者個別の状況を踏まえてセラピストが行ってください。

ワークショップ:臨床判断トレーニング

以下の症例を読んで、ARATの結果をどのように解釈すべきか考えてみましょう。「回答を見る」をクリックすると解説が表示されます。

慢性期:LoAを使った変化の解釈

慢性期脳卒中患者(66歳男性、発症後2.5年、右片麻痺・利き手麻痺)の麻痺側ARATが、4週間の課題指向型訓練の前後で 24点 → 31点(7点改善)でした。これは「測定誤差ではない真の改善」と言えますか?また、臨床的に意味のある改善でしょうか?

回答:はい、慢性期の測定誤差を超える真の改善であり、臨床的にも意味のある改善である可能性が高いです。

van der Lee et al.(2001, J Rehabil Med)は、慢性期脳卒中患者22名を対象にBland-Altman法でARATの一致の限界(LoA)を −5.7 〜 +6.2点 と報告しています。慢性期では「±約6点を超える変化」を測定誤差を超える真の変化と判断するのが標準です。今回の7点改善はこのLoAを上回るため、「真の変化」と言えると判断できます。

また、Hoonhorst et al.(2015)の5段階分類では、24点(Limited)から31点(Limited〜Notableの境界)へ移行しており、機能カテゴリの上昇を伴っています。重症度カテゴリの境界をまたぐ変化は、臨床的にも患者・家族が体感できる改善につながりやすいです。

意見:慢性期で「7点」というARATの変化を確実に出せる介入は限られています。CIMTやハイインテンシティの課題指向型訓練の効果サイズに匹敵する改善であり、今後の介入計画は同方向の課題量を維持することが推奨されます。

急性期:利き手・非利き手のMCIDの使い分け

急性期脳卒中患者2名のARATを、入院時と3週間後で比較しました。
・症例A:64歳男性、利き手(右手)麻痺。ARAT 18点 → 30点(12点改善)
・症例B:64歳女性、非利き手(左手)麻痺。ARAT 18点 → 30点(12点改善)
同じ12点の改善ですが、両者は同じ「臨床的に意味のある改善」と判断してよいでしょうか?

回答:いいえ。利き手か非利き手かでMCIDが異なるため、解釈を分ける必要があります。

  • Lang et al.(2008, VECTORS試験データ)は、急性期脳卒中患者52名でアンカーベース法(患者のglobal rating of change)からARAT MCIDを算出し、利き手が麻痺側の場合12点、非利き手が麻痺側の場合17点 と報告しています
  • 症例A(利き手麻痺):12点改善はMCID 12点ぴったりに到達しており、「臨床的に意味のある改善が認められた」と判断できます
  • 症例B(非利き手麻痺):12点改善はMCID 17点に届いていないため、「現時点ではMCID未達」と判断するのが正確です。患者の主観的変化や日常使用頻度(MAL)も併せて確認し、追加の介入期間が必要かを検討する必要があります
  • 背景:非利き手麻痺の方がMCIDが大きい理由は、非利き手は元々の使用頻度が低いため、患者が「明らかに改善した」と感じるためにより大きな変化量が必要だからと解釈されています(Lang et al., 2008)
  • 実臨床では、ARATの変化量を解釈する際に必ず「どちらの手が麻痺しているか・利き手か」を確認してください

急性期:PREP2と組み合わせた予後予測

急性期病棟に入院した脳卒中患者(72歳女性、発症後5日、左片麻痺、上肢FMA-UE 14点)の麻痺側ARATを測定したところ、3点でした。SAFEスコア(肩外転+指伸展のMRC合計)は4点です。この患者の3か月後のARATスコアと、退院後リハビリの方針をどう考えますか?

回答:PREP2アルゴリズムに照らすと「Limited」カテゴリに該当する可能性が高く、3か月後のARATスコアは個人差を含めて10〜30点程度の範囲が予想されます。

  • Stinear et al.(2017, PREP2)のアルゴリズムでは、SAFE合計5点未満の場合は皮質脊髄路機能(TMS-MEP)の有無で「Limited」または「Poor」に分かれます。SAFE 4点はSAFE 5点の境界より下のため、TMS結果なしでは「Limited(限定的回復)」または「Poor(重度残存)」のいずれかが想定されます
  • 「Limited」カテゴリの患者は、3か月後のARATスコアは 0〜30点程度(個人差大)の範囲に分布します。Hoonhorst et al.(2015)の対応関係では「No capacity(0〜10点)」または「Poor(11〜21点)」のカテゴリに該当するレベルです
  • 急性期入院時にARAT 3点というスコアは、Hoonhorst 2015の「No capacity(0〜10点)」に該当します。Winters et al.(2016)のカットオフ「ARAT ≥ 10点で最低限の上肢能力を獲得」にも未達です
  • 退院後リハビリの方針:(1)3か月時点でARAT ≥ 10点に到達するかどうかが大きな分岐点。到達すれば「小物を拾う」ような実用動作が可能になる、(2)到達しない場合は非麻痺側の代償戦略の確立と、麻痺側の二次的合併症(拘縮・痙縮・肩痛)の予防を主軸にする、(3)患者・家族への説明では、PREP2の予測カテゴリを根拠に「現実的な目標設定」を共有することが重要
  • ARATのモニタリング頻度:急性期病棟入院中は週1回、回復期で2週に1回程度、ARATを定点観測することで、PREP2予測との一致/乖離を早期に検知できます。LoA ±6点以上の改善が見られた場合は、PREP2予測より良好な経過と判断し、介入強度を上げることを検討します
  • 意見:PREP2の予測は「平均的な経過」を示すもので、個別の患者がそれを上回る/下回ることは当然あり得ます。ARATの定点観測が予測の補正に役立つ点を、チームで共有することが大切です

ARATを臨床で使いこなすための3問の臨床判断トレーニングです。

LoAを使った変化の解釈、急性期MCIDの利き手・非利き手の使い分け、PREP2予後予測カテゴリの活用について、エビデンスに基づいた回答とともに学べます。

この記事で引用した21本の論文は、すべてPubMedから系統的に検索・選定したものです。

「自分でもエビデンスを探せるようになりたい」という方には、書籍『文献検索の超基本』(金芳堂)がおすすめです。

PubMedの使い方から論文の批判的吟味まで、ステップバイステップで学べます。

書籍|文献検索の超基本

「先輩に聞けばいい」から卒業しませんか?

本書は、PT・OT・STが最短で文献検索を身につけるための一冊です。

172ページ+40本の動画で、PubMed検索からAI活用まで実践的に学べます。

ChatGPT、Elicit、Semantic ScholarなどのAIツールを”なんとなく使う”のではなく、正しく臨床に活かす方法を体系的に解説。

文献検索は、早く身につけた人が圧倒的に伸びます。

エビデンスを自分で調べられるセラピストになりませんか?

詳細はこちら

さらに実践的に学びたい方は、BRAINアカデミーアドバンスコース上肢で評価指標の臨床活用からSDMまで体系的に習得できます。

BRAINアカデミー

エビデンスに基づく脳卒中リハビリテーションを体系的・網羅的に学ぶ、3ヶ月間のオンライン学習プログラムです。

①動画教材 ②課題 ③フィードバックを通じて、EBMを身に付けましょう!
詳細はこちら

参考文献

  1. Lyle RC. A performance test for assessment of upper limb function in physical rehabilitation treatment and research. Int J Rehabil Res. 1981;4(4):483-492. PMID: 7333761
  2. Yozbatiran N, Der-Yeghiaian L, Cramer SC. A standardized approach to performing the action research arm test. Neurorehabil Neural Repair. 2008;22(1):78-90. PMID: 17704352
  3. van der Lee JH, De Groot V, Beckerman H, Wagenaar RC, Lankhorst GJ, Bouter LM. The intra- and interrater reliability of the action research arm test: a practical test of upper extremity function in patients with stroke. Arch Phys Med Rehabil. 2001;82(1):14-19. PMID: 11239280
  4. van der Lee JH, Beckerman H, Lankhorst GJ, Bouter LM. The responsiveness of the Action Research Arm test and the Fugl-Meyer Assessment scale in chronic stroke patients. J Rehabil Med. 2001;33(3):110-113. PMID: 11482350
  5. van der Lee JH, Roorda LD, Beckerman H, Lankhorst GJ, Bouter LM. Improving the Action Research Arm test: a unidimensional hierarchical scale. Clin Rehabil. 2002;16(6):646-653. PMID: 12392340
  6. Hsieh CL, Hsueh IP, Chiang FM, Lin PH. Inter-rater reliability and validity of the Action Research Arm Test in stroke patients. Age Ageing. 1998;27(2):107-113. PMID: 16296669
  7. Platz T, Pinkowski C, van Wijck F, Kim IH, di Bella P, Johnson G. Reliability and validity of arm function assessment with standardized guidelines for the Fugl-Meyer Test, Action Research Arm Test and Box and Block Test: a multicentre study. Clin Rehabil. 2005;19(4):404-411. PMID: 15929509
  8. Nordin Å, Alt Murphy M, Danielsson A. Intra-rater and inter-rater reliability at the item level of the Action Research Arm Test for patients with stroke. J Rehabil Med. 2014;46(8):738-745. PMID: 24953235
  9. Lang CE, Edwards DF, Birkenmeier RL, Dromerick AW. Estimating minimal clinically important differences of upper-extremity measures early after stroke. Arch Phys Med Rehabil. 2008;89(9):1693-1700. PMID: 18760153
  10. Lang CE, Wagner JM, Dromerick AW, Edwards DF. Measurement of upper-extremity function early after stroke: properties of the Action Research Arm Test. Arch Phys Med Rehabil. 2006;87(12):1605-1610. PMID: 17141640
  11. Rabadi MH, Rabadi FM. Comparison of the Action Research Arm Test and the Fugl-Meyer Assessment as measures of upper-extremity motor weakness after stroke. Arch Phys Med Rehabil. 2006;87(7):962-966. PMID: 16813784
  12. Hoonhorst MH, Nijland RH, van den Berg JS, Emmelot CH, Kollen BJ, Kwakkel G. How Do Fugl-Meyer Arm Motor Scores Relate to Dexterity According to the Action Research Arm Test at 6 Months Poststroke? Arch Phys Med Rehabil. 2015;96(10):1845-1849. PMID: 26143054
  13. Nijland RH, van Wegen EE, Harmeling-van der Wel BC, Kwakkel G; EPOS Investigators. Presence of finger extension and shoulder abduction within 72 hours after stroke predicts functional recovery: early prediction of functional outcome after stroke: the EPOS cohort study. Stroke. 2010;41(4):745-750. PMID: 20167916
  14. Stinear CM, Barber PA, Petoe M, Anwar S, Byblow WD. The PREP algorithm predicts potential for upper limb recovery after stroke. Brain. 2012;135(Pt 8):2527-2535. PMID: 22689909
  15. Stinear CM, Byblow WD, Ackerley SJ, Smith MC, Borges VM, Barber PA. PREP2: A biomarker-based algorithm for predicting upper limb function after stroke. Ann Clin Transl Neurol. 2017;4(11):811-820. PMID: 28280137
  16. Winters C, van Wegen EE, Daffertshofer A, Kwakkel G. Generalizability of the Proportional Recovery Model for the Upper Extremity After an Ischemic Stroke. Neurorehabil Neural Repair. 2015;29(7):614-622. PMID: 25527488
  17. Lin JH, Hsu MJ, Sheu CF, Wu TS, Lin RT, Chen CH, Hsieh CL. Psychometric comparisons of 4 measures for assessing upper-extremity function in people with stroke. Phys Ther. 2009;89(8):840-850. PMID: 19556333
  18. Chanubol R, Wongphaet P, Ot NC, Chira-Adisai W, Kuptniratsaikul P, Jitpraphai C. Correlation between the Action Research Arm Test and the Box and Block Test of upper extremity function in stroke patients. J Med Assoc Thai. 2012;95(4):590-597. PMID: 22612016
  19. Brunner I, Lundquist CB, Pedersen AR, Spaich EG, Dosen S, Savic A, Pasi M, Bevilacqua F, Pisani M, Cattaneo D. External validity of a dynamic prediction model for upper extremity function after stroke. Sci Rep. 2024;14(1):5403. PMID: 38482101
  20. Pike S, Lannin NA, Wales K, Cusick A. A systematic review of the psychometric properties of the Action Research Arm Test in neurorehabilitation. Aust Occup Ther J. 2018;65(5):449-471. PMID: 30306610
  21. Prange-Lasonder GB, Alt Murphy M, Lamers I, Hughes AM, Buurke JH, Feys P, Keller T, Klamroth-Marganska V, Tarkka IM, Timmermans A, Burridge JH. European evidence-based recommendations for clinical assessment of upper limb in neurorehabilitation (CAULIN): data synthesis from systematic reviews, clinical practice guidelines and expert consensus. J Neuroeng Rehabil. 2021;18(1):162. PMID: 34749752
  22. 大場秀樹, 原譲之, 新藤恵一郎, 早稲田真. Action Research Arm Test(ARAT)の信頼性,妥当性,反応性の検討. 総合リハビリテーション. 2011;39(3):265-271.
  23. 安保雅博 監修, 中野枝里子, 田中智子 編. 脳卒中上肢機能評価 ARATパーフェクトマニュアル(DVD付). 金原出版; 2015. ISBN: 978-4-307-75046-2.
  24. インターリハ株式会社. ARAT(IP-ARATS)製品情報. https://www.irc-web.co.jp/arat(2026年4月閲覧).

この記事の内容は、BRAINアカデミーの講義資料および査読付き学術論文に基づいています。


最終更新:2026年4月