研修の理解度テスト完全ガイド|設計・運用・導入を実証研究と実務経験から解説

研修の理解度テスト完全ガイド

研修の効果測定KPIを「設定していない」企業が6割——HR総研の調査(2020年)は、日本企業の研修の現実をこの一文で映し出しています。その一方で、企業向け研修サービス市場は5,370億円(矢野経済研究所, 2023年)に拡大し、産労総合研究所の調査(2023年)では教育研修費を今後「増やす」と答えた企業が62.8%と10年間で最高水準。投資は増えるのに、効果を測っていない。これが「やりっぱなし研修」の正体です。

実際、ある民間調査では研修内容を「覚えていない」と答えた受講者が約8割(79%)にのぼり、学んだことを業務に活かせた人はわずか3割という結果も出ています(EdWorks, 2023年)。つまり、受講者10人のうち約7人は、研修で学んだことを業務に活かせていない計算です。

「研修はやっているのに、成果が見えない」——この課題に心当たりがある人事・育成担当者は多いのではないでしょうか。しかも2023年3月期からは人的資本の情報開示が義務化され、「研修を何時間やったか」だけでなく「社員の能力がどう変わったか」をデータで示す必要が出てきました。

では、どうすればいいのか。最もシンプルで、かつ科学的にも効果が裏づけられた方法が、研修後の理解度テストです。「テスト=受講者を試すもの」と思われがちですが、実はテストを受けること自体が、最も効果的な復習になることが認知心理学で実証されています。

本記事では、テストの設計から運用、組織への導入ステップ、結果を活かした改善サイクルまでを、実務で使える具体例や企業事例とともに体系的に解説します。

📌 この記事で分かること

「やりっぱなし研修」の実態を示す調査データ/テストそのものが学習を促進する「テスティング・エフェクト」のメタ分析結果/大手機械メーカー10年間・7,000名の実証事例に学ぶ改善施策/カークパトリックモデルにおける理解度テストの位置づけ/効果が出るテスト設計の5原則と出題形式の選び方/テストブループリント(出題設計図)と良問チェックリスト/分散テスト・即時フィードバックなど運用のコツ/オンラインテストの不正対策と受験者体験の両立/理解度テストの組織導入3ステップ・ロードマップ/よくある失敗パターンと改善策/テスト結果を研修改善と人的資本開示に活かす方法

目次

1. なぜ今、研修後の理解度テストが重要なのか

1-1. 「やりっぱなし研修」の実態

冒頭の数字は氷山の一角にすぎません。EdWorksの調査(2023年9月)によれば、8割の研修でフォローアップが行われておらず、研修後に上司と振り返りをした人はわずか22%。「効果を測っていない」どころか、「やったかどうか」すら追いかけていないのが実態です。

フォローアップが行われていないという状況は、多くの研修担当者にとって身に覚えがあるのではないでしょうか。新入社員研修の最終日にアンケートを配って満足度4.2を確認し、「概ね好評でした」と報告して終わり。半年後、配属先の上司から「研修で何を学んだのか、さっぱりわからない」と言われる——こうした光景は珍しくありません。

筆者自身も、この「やりっぱなし」を何度も経験してきました。たとえば、オンボーディング研修でGA4(Googleアナリティクス)やGoogleタグマネージャーの操作方法を一通り説明しても、実務で使うまでに数週間〜数ヶ月空いてしまうと、いざ本番というときにはほぼ記憶に残っていないのです。「ここ、研修で説明しましたよね?」と言いたくなる場面が繰り返されるたびに、説明の仕方ではなく研修の仕組みそのものに問題があるのだと気づかされました。

投資は増える。でも、効果を測っていない——この矛盾を解消する第一歩が、研修後の理解度テストです。

出典:HR総研「新入社員研修に関するアンケート調査」(2020年)/EdWorks「社会人の学びに関する意識調査」(2023年4月)/「研修効果に関する調査」(2023年9月)/産労総合研究所「教育研修費用の実態調査」(2023年)

1-2. 人的資本開示時代の効果測定

2023年3月期から始まった人的資本の情報開示義務化は、研修の効果測定に対する経営層の関心を一気に高めました。研修時間や費用といったインプット指標だけでなく、「その投資によって社員の能力がどう変化したか」というアウトカム指標の開示が求められています。

理解度テストのスコア推移は、最もシンプルで説得力のあるアウトカム指標のひとつです。「新入社員研修の理解度テスト平均点が前年比+10ポイント」といったデータは、ステークホルダーに対する教育投資の成果を明確に示します。

1-3. テストは「評価」ではなく「学習そのもの」——テスティング・エフェクト

「研修後にテストを出すと、受講者から嫌がられるのでは?」——この懸念はよく聞きます。しかし、認知心理学では1世紀以上前から、テストそのものが復習よりも強力な学習手段であることが知られています。テキストを読み返すよりも、テストで思い出そうとする方が、記憶に残る。これが「テスティング・エフェクト(テスト効果)」です。

思い当たる方も多いのではないでしょうか。受験勉強や資格試験の準備で、教科書を繰り返し読むよりも、過去問や問題集を解いた方が記憶に定着し、成績が伸びた——あの体験こそ、テスティング・エフェクトそのものです。研修後の理解度テストも原理は同じ。「テストされる」ことが苦痛なのではなく、「思い出そうとする」行為自体が脳に記憶を刻み込む最良のトレーニングなのです。

📌 テスティング・エフェクト(テスト効果)とは

学習後にテスト(想起練習)を行うと、同じ時間を再読・復習に充てるよりも記憶の長期定着が大幅に向上する現象です。2006年のRoediger & Karpickeの実験以降、大規模な実証研究が急速に進みました。テストは「評価の道具」ではなく「学習を促進する仕組み」なのです。

「本当にそんなに効果があるのか?」という疑問に対して、世界中で行われた数百件の研究結果を統合した分析が、明確な答えを出しています。

研究 何がわかったか
Rowland (2014)
159件の研究を統合
テストを受けたグループは、同じ時間を復習に充てたグループと比べて記憶の定着が統計的に有意に優れる。教育分野では「中程度の効果」に分類される安定した結果
Yang et al. (2021)
実際の教室・研修での研究
実験室だけでなく、実際の授業や研修の場面でも同等の効果を確認。企業研修にも適用できる
Pan & Rickard (2018)
テスト学習の波及効果
テストで出題された範囲だけでなく、出題されなかった関連知識の記憶も向上する
Roediger & Karpicke (2006)
テスト効果研究の包括的レビューと教育実践への示唆
学習直後は復習グループと差がないが、1週間後には大きな差が開く。テストの効果は時間が経つほど顕著になる

つまり、研修後のテストは「受講者を試す場」ではなく「受講者の記憶を定着させる場」です。テストを実施するだけで、復習と比べて統計的に有意な学習効果が得られ、しかもその効果はテスト範囲外の知識の記憶にも好影響を及ぼす——人事担当者にとって、これほど費用対効果の高い施策はなかなかありません。

日本の企業研修でも同様の効果は確認されています。佐々・向後(2021)は、大手機械メーカーX社の技術者向け集合型研修において、2008〜2019年度の10年間・継続講座19件・延べ約7,000名分のアンケートデータを分析しました。X社では研修工程の各段階に対応する4つの改善施策——①講座体系の整備、②受講前アンケートの実施、③講座の重要ポイントの策定、④テスト結果の即時フィードバック——を2〜3年間隔で順次導入し、各施策の効果を比較しています。

結果は明快でした。施策を重ねるにつれ授業理解度は統計的に有意に上昇し、全施策完了後には中程度の効果量(Cohen’s d)が認められました。個別の施策の中で理解度向上に有意に寄与したのは①講座体系の整備、③重要ポイントの策定、④テスト結果の即時フィードバックの3つであり、なかでも④即時フィードバックはレクチャー型・実習型の双方で安定して効果を示した唯一の施策です。興味深いのは授業形式による差で、レクチャー型の講座では③重要ポイントの策定が最大の効果を示し、実習型では④即時フィードバックが最大でした。「どの施策が効くかは授業形式によって異なる」という知見は、テスト設計の実務に直結します。

この研究が注目に値するのは、10年という長期実践の中で「施策を積み上げるほど理解度が上昇する」という累積効果モデルを実証した点です。単発の施策ではなく、複数の改善を組み合わせて継続的に回すことが重要——これは、第5章で解説するPDCAサイクルの考え方と一致します。第6章では、この事例をもとに自社で理解度テストを導入する際の具体的なステップを解説します。

出典:Roediger, H.L. & Karpicke, J.D. (2006). Perspectives on Psychological Science, 1(3), 181-210.Rowland, C.A. (2014). Psychological Bulletin, 140(6), 1432-1463.Yang, C. et al. (2021). Psychological Bulletin, 147(4), 399-435./佐々裕美・向後千春(2021)「企業内研修における研修改善の長期的実践と授業理解度に対する効果の評価」日本教育工学会論文誌, 45(2), 185-194.

2. カークパトリックモデル——「アンケートだけでOK」からの脱却

2-1. 研修評価の4段階、あなたの会社はどこまでやっていますか?

研修後に「満足度アンケート」を取っている企業は多いでしょう。「講師の説明はわかりやすかったか」「研修の内容は役に立ちそうか」——5段階評価で集計して、平均4.2ならまず安心。しかし、満足度が高いことと、知識が定着していることは別の話です

この「評価のレベル」を整理したのが、研修評価の世界標準であるカークパトリックの4段階モデルです。

レベル 名称 内容 代表的な測定方法
1 反応(Reaction) 受講者の満足度や研修への印象 アンケート
2 学習(Learning) 知識やスキルの習得度合い 理解度テスト ← 本記事のテーマ
3 行動(Behavior) 学習内容を業務でどう実践しているか 上司による観察・面談
4 成果(Results) 業績指標への影響 KPI分析・ROI算出

佐々・向後(2024)は、企業内研修の評価について次のように整理しています。レベル1の評価はアンケートで、レベル2の評価は理解度確認テストなどで実施できるのに対し、職場での仕事の成果に関わるレベル3やレベル4の評価は難しく、評価の実施例は少ないのが実態です。

出典:佐々裕美・向後千春(2024)「企業内技術研修における研修転移意志への影響要因と自律的な研修転移の促進に関する検討」日本教育工学会論文誌, 48(2), 381-390.

2-2. レベル1だけで終わっていませんか?

ここで正直に振り返ってみてください。自社の研修で「レベル2以上」を実施しているものは、全体の何割でしょうか。実際、日本企業で研修効果の実証的な検証まで行っている例はまだ少数派です(小薗・大内, 2016)。レベル3(行動変容)以上の評価に取り組む前に、まずはレベル2(理解度テスト)を確実に実施することが現実的な第一歩になります。

出典:小薗修・大内章子(2016)「能力・態度における研修効果に影響を与える要因とその関連性」日本労務学会誌, 17(1), 50-68.

2-3. 新カークパトリックモデル——「まず業績目標から逆算する」

2016年に発表された「新カークパトリックモデル(The New World Kirkpatrick Model)」では、従来のレベル1→4の順番ではなく、レベル4(成果)→3→2→1の逆順で設計することが推奨されています。

たとえば、コンプライアンス研修を例にすると、「コンプライアンス違反件数ゼロ(レベル4)」→「全社員がリスク場面で正しく判断できる(レベル3)」→「判断基準と対応手順を正しく理解している(レベル2)」→「研修で学ぶ意義を実感している(レベル1)」と逆算していく発想です。レベル4から逆算して設計すると、理解度テストで「何を測るべきか」が業績目標から自動的に決まります。

出典:Kirkpatrick, J. D. & Kirkpatrick, W. K. (2016). Kirkpatrick’s Four Levels of Training Evaluation. ATD Press.

3. 効果が出る理解度テストの作り方【設計編】

3-1. テスト設計の出発点——「何を測るのか」を明確にする

効果的なテストを作る第一歩は、研修の学習目標を明確にすることです。「何を教えたか」ではなく「受講者が何をできるようになるべきか」を基準にテストを設計します。

ここで重要なのが、「学習目標のタイプによって、適切なテスト形式が違う」という原則です。教育設計の分野では「ガニェの学習成果5分類」として知られる考え方で、研修設計の第一人者である鈴木克明(熊本大学名誉教授)は、これを「整合性」——学習目標・評価方法・研修内容の三者が合致すること——として企業研修へ適用する方法論を提案しています(『研修設計マニュアル』p.106)。

また鈴木(2019)は、インストラクショナルデザイン(ID)の半世紀にわたる研究成果を概説する中で、教育設計の出発点は「①どこへ行くのか(学習目標)→②たどり着いたかどうかをどう知るか(評価技法)→③どうやってそこへ行くか(教授方略)」の順で考える「逆向き設計」にあると述べています。つまり、テストの設計は研修の「おまけ」ではなく、学習目標の策定直後に着手すべき工程なのです。

下の表は、学習目標のタイプ別に「どんなテスト形式が適しているか」を整理したものです(ガニェの5分類のうち、研修テストとの関連が強い4分類を抜粋)。自社の研修テストが、学習目標のタイプと合っているか確認してみてください。

学習成果の種類 研修例 適したテスト形式 設問例
言語情報
(知識の記憶)
コンプライアンス研修
製品知識研修
○×問題
選択式問題
「個人情報保護法で保護対象となるのは次のうちどれか」
知的技能
(ルールの適用)
業務プロセス研修
設計手法研修
ケース問題
記述式
「以下の状況で、どの手順を選ぶか。理由とともに述べよ」
態度
(価値観・姿勢)
ビジネスマナー研修
ハラスメント研修
場面判断型
選択問題
「上司への報告が遅れた場合の対応として最も適切なものは」
認知的方略
(学び方・考え方)
問題解決研修
ロジカルシンキング研修
未知の問題への
応用課題
「以下のデータから問題の根本原因を特定し、対策を提案せよ」

出典:鈴木克明(2019)「インストラクショナルデザイン ―学びの「効果・効率・魅力」の向上を目指した技法―」通信ソサイエティマガジン(B-plus), 13(2), 110-117./鈴木克明ほか「インストラクショナルデザインによる企業での学習支援」デザイン学会研究紀要, 4, 75-84.

3-2. テスト設計の5つの基本原則

原則1:研修目標に紐づいた出題。学習目標ごとに少なくとも1問を対応させます。研修で触れていない内容を出題しないのは当然ですが、逆に研修の重要ポイントが出題されていないケースも要注意です。佐々・向後(2021)の研究では、講座の重要ポイントを1講座あたり10個程度策定し、受講者に事前に通知するとともに、テストの設問もこの重要ポイントに紐づけて作成する施策が、理解度向上に有意に寄与したことが報告されています。

原則2:難易度の混在。基礎問題(選択式)と応用問題(記述・ケース問題)を組み合わせることで、「覚えただけ」と「使える」の違いを測定できます。目安として基礎7割・応用3割が取り組みやすいバランスです。

実際のところ、研修後テストやeラーニング後の確認テストでよく見られるのは、設問が簡単すぎて全員が満点近くになってしまうパターンです。これでは「やった感」はあっても、理解度の差が見えず、改善につなげようがありません。応用問題を意図的に混ぜることで初めて、「研修内容を聞いて覚えた人」と「実務で使えるレベルまで理解した人」の差が浮き彫りになります。

なぜ混在が必要なのか。鈴木(2015)は、知識の暗記(言語情報)と、ルールを実務に応用する力(知的技能)では、テストの作り方がまったく異なると指摘しています。たとえばコンプライアンス研修なら、「個人情報保護法の定義を選べ」は暗記の確認ですが、「以下の顧客対応で個人情報の取り扱いとして適切なものはどれか」はルール適用の確認です。暗記問題だけでは「知っているけど使えない」受講者を見逃してしまいます(『研修設計マニュアル』pp.106-107)。

原則3:実務への転用を意識した設問。「自社の場合どうするか」「あなたの担当業務に当てはめると」といった設問は、レベル3(行動変容)への橋渡しになります。

教育設計の共通原則でも、効果的な学習の第一条件は「現実に起こりそうな問題に挑戦する」ことだとされています(鈴木・根本, 2011)。テストも同じで、抽象的な知識確認にとどまらず、受講者が月曜日の朝に職場で直面しうる場面を設問にすることで、「学んだことを使ってみよう」という意識が自然に生まれます。

原則4:事前テスト(プレテスト)の実施。研修前に同じテストを実施しておくと、研修前後の差分で効果を定量化できます。人的資本開示に使えるアウトカム指標としても有用です。

原則5:合格基準の事前設定。「80点以上で合格」のように基準を事前に決め、受講者にも告知します。研修への真剣度が上がるとともに、達成できなかった受講者へのフォローアップの基準にもなります。

出典:鈴木克明(2015)『研修設計マニュアル 人材育成のためのインストラクショナルデザイン』北大路書房/鈴木克明・根本淳子(2011)「教育設計についての三つの第一原理の誕生をめぐって」教育システム情報学会誌, 28(2), 168-176.

💡 設問数と所要時間の目安

新入社員研修後のテストであれば、10〜20問・所要時間15〜30分が目安です。多すぎると受講者の負担が大きくなり、少なすぎると理解度を網羅的に測定できません。研修1時間あたり3〜5問を基準に設計するとバランスが取りやすくなります。

3-3. テストブループリント——出題の「設計図」を先に作る

テストの品質を安定させるには、設問を書き始める前に「テストブループリント(出題設計図)」を作成することが効果的です。テストブループリントとは、研修の学習目標ごとに出題数と配点比率を定めた一覧表で、テスト全体のバランスを事前に可視化するための道具です。

たとえば、コンプライアンス研修(全15問)のブループリントは次のようになります。

学習目標の領域 学習成果の種類 出題数 配点比率 出題形式
法令・社内規程の基礎知識 言語情報 5問 30% ○×問題・選択式
違反事例の判断・対応手順 知的技能 6問 45% ケース問題・場面判断型
相談窓口・通報の手順 言語情報 2問 10% 選択式
当事者意識・行動姿勢 態度 2問 15% 場面判断型

ブループリントを先に作る利点は3つあります。第一に、3-1で紹介したガニェの学習成果分類と出題形式の「整合性」を設計段階で担保できること。第二に、暗記で答えられる問題に偏りすぎていないかをテスト全体で確認できること。第三に、テスト作成を複数の担当者で分担する際にも品質のばらつきを抑えられることです。ブループリントは研修設計と同時に作成し、研修目標が変わるたびに更新するのが理想です。

3-4. 良問チェックリストとパイロットテスト——「悪問」を本番前に排除する

テストの品質は設問の品質で決まります。以下のチェックリストで、本番前に全設問を点検しましょう。

No. チェック項目 NGの例
1 正答が読解で一意に定まるか(解釈の余地がないか) 「最も適切なもの」が複数に見える選択肢設計
2 研修で扱った内容の範囲内か(未教授の知識を前提としていないか) 研修テキストに出ていない法令の条文番号を問う
3 「ひっかけ」が知識量勝負になっていないか 二重否定や曖昧な限定詞(「必ずしも〜ない場合もある」)で混乱させる
4 制限時間内に解答可能か(想定解法があるか) ケース問題の状況説明が長すぎて読み切れない
5 ブループリント上の学習目標に紐づいているか 「面白いから」「難易度を上げたいから」という理由で追加された設問

チェックリストに加えて、本番前の小規模パイロットテストを強く推奨します。前年度の内定者や若手社員10〜20名に試行してもらい、設問別の正答率と所要時間を確認します。正答率が95%を超える設問は易しすぎて弁別力がなく、20%を下回る設問は難しすぎるか、設問自体に問題がある可能性があります。パイロットの結果をもとに「悪問」を除外・修正してから本番に臨むことで、テストの信頼性が格段に向上します。

4. テストの効果を最大化する運用方法【実施・運用編】

4-1. 分散テスト——「いつ」テストするかが効果を左右する

テストは1回で終わりにするのではなく、間隔を空けて複数回実施する「分散テスト」が極めて効果的です。第1章で触れたGA4やGoogleタグマネージャーの例のように、研修から実務までに間が空くと記憶は急速に薄れます。しかし裏を返せば、その「間」にテストを挟むことで記憶の消失を食い止められるということでもあります。

どのくらい効果があるのか。Latimier et al.(2021)が39件の研究を統合分析した結果、間隔を空けて繰り返しテストを行うグループは、1回だけまとめてテストを行うグループと比べて記憶定着の差が非常に大きいことが確認されています。第1章で紹介したテスティング・エフェクト(テストを受けること自体の効果)に加え、「間隔を空ける」ことの追加効果がさらに上乗せされるイメージです。

具体的には、以下の3回実施が推奨されます。

タイミング 目的 ポイント
第1回 研修直後 即時の理解度確認 研修の最後の15〜30分で実施。「何を学んだか」の記憶が鮮明なうちに
第2回 1〜2週間後 短期記憶→長期記憶への定着チェック 忘却が大きく進行する前に想起を促す。同じ問題でも、1週間後の正答率低下は「定着していない部分」を明確に示す
第3回 1〜3ヶ月後 長期定着の確認、行動変容との接続 応用問題・ケース問題の比率を高め、「業務で活用できているか」を測る

出典:Latimier, A. et al. (2021). A meta-analytic review of the benefit of spacing out retrieval practice episodes on retention. Educational Psychology Review, 33, 959-987.

4-2. 即時フィードバック——テスト直後の解説が効果を大きく高める

テストの効果を最大化するには、点数を返すだけでなく、正答と解説をその場で共有することが重要です。

第1章で紹介した佐々・向後(2021)の大手機械メーカー10年間の実証研究では、4つの改善施策のうち④テスト結果の即時フィードバックが理解度向上に最も大きく寄与し、中程度の効果量が認められました。

向後(2014)はeラーニングの特質として「反復学習の最適化が可能」「学習者に対するフィードバックがシステムとして可能」を挙げています。オンラインテストツールを活用すれば、採点からフィードバック表示までを自動化でき、受講者は受験完了と同時に自分の弱点領域を把握できるようになります。

💡 即時フィードバックの具体的な方法

・個人別スコアと全体平均を比較して、相対的な位置を把握させる
・正答率が低い設問をピックアップし、フォロー解説を表示する
・カテゴリ別のレーダーチャートで「強い領域」「弱い領域」を可視化する
・不合格者には具体的な学習リソース(テキストの該当ページ、eラーニングの該当講座等)を案内する

出典:向後千春(2014)「eラーニングに関する実践的研究の進展と課題」教育心理学年報, 53, 156-165.

4-3. テスト結果を現場につなぐ——自律的転移と上司連携の使い分け

研修で学んだことが実際に業務で活用される——すなわち「研修転移」の実現には、上司の関与が重要だとされてきました。しかし、佐々・向後(2024)の最新研究は、興味深い別の側面を明らかにしています。

佐々・向後(2024)による103講座・1,441件のアンケート分析の結果、研修直後の理解度や満足度が高い受講者は、職場の支援に依存するよりも自律的に研修転移を起こす傾向が強いことが明らかになりました。具体的には、研修直後と6ヶ月後の2時点でアンケートを実施し、共分散構造分析で影響要因間の関係を検証しています。業務での活用実績が高い群では「受講成果→研修転移意志」のパス係数が低い群の約1.9倍と有意に高く、一方で「職場環境→研修転移意志」には両群間で有意差がありませんでした。つまり、研修の場でテストを通じてしっかり理解させること自体が、職場での行動変容の最大の推進力になるのです。

📌 2024年の最新研究が示す「自律的な研修転移」

佐々・向後(2024)は、103講座・1,441件のデータを分析し、研修転移(学んだことを業務で活かすこと)の影響要因を検証しました。同研究では「XYZ法」と呼ぶ評価手法を考案し、受講者に「どんな研修内容を(X)・どんな業務において(Y)・どのように活用したか(Z)」を文章で記述させることで、自己評価の信頼性を高めています。共分散構造分析の結果、研修内容を業務で高く活用している群では、「受講成果(理解度・満足度)」が「職場環境(上司の支援等)」よりも研修転移に対して有意に大きい影響を持つことが確認されました。理解度テストで高いスコアを達成した受講者は、上司の後押しがなくても自主的に学びを業務に活かす傾向がある——これは、テストの投資対効果を裏付ける強力なエビデンスです。

もちろん、上司との連携も効果を高めます。EdWorksの調査(2023年9月)では、研修後に上司と振り返りをした人はわずか22%でした。テスト結果という「具体的な材料」があれば、上司も「何を重点的にOJTすべきか」が一目でわかり、振り返りの質が格段に向上します。

筆者がテスト導入を支援した現場でも、テスト結果をもとに上司が部下に「この領域をもう一度学んでほしい」「この知識が実務のどの場面で必要になるか」を具体的に説明したケースでは、2回目以降のテストで該当箇所のスコアが明確に改善しています。点数という客観データがあることで、上司も「何となくできていない気がする」ではなく、根拠を持ってフォローできるようになるのです。

テスト結果を上司と共有する際のポイントは3つあります。第一に、個人の点数だけでなく「理解が不足している領域」を具体的に示すこと。第二に、上司に「フォロー面談シート」を提供してテスト結果と業務課題を紐づけて話し合える仕組みを用意すること。第三に、研修担当部門→上司→受講者のフィードバックループを月次で回すことです。

ただし、テスト結果を現場に渡す際には「ラベリングしすぎない」ことが欠かせません。「この人はコンプライアンスに弱い」「論理的思考が苦手」といった固定的なラベルは、上司のバイアスを強め、本人の成長機会を狭めるリスクがあります。共有する情報は「〇〇領域の理解度がやや低め→重点的なOJTを推奨」程度にとどめ、あくまで育成の起点として活用する姿勢を徹底しましょう。テスト結果は本人の「能力の限界」ではなく「現時点の到達度」であり、研修後のフォローで伸びる余地があることを、上司と本人の双方に伝えることが大切です。

4-4. オンラインテストの公正性確保——不正対策と受験者体験の両立

研修のオンライン化が進むなか、理解度テストもWebで実施する企業が増えています。とくにコンプライアンス研修やセキュリティ研修など、合格基準が厳格に設定されるテストでは、受験者の不正(テキスト参照、他者への依頼等)への対策が課題です。

不正対策は「厳しければ良い」わけではありません。監視が過剰になれば受験者にストレスを与え、「学びの場」であるはずのテストが「監視の場」に変わってしまいます。研修の種類や目的に応じて、以下の3段階から適切な強度を選択するのが実務的なアプローチです。

強度 対策内容 適した研修テスト
ランダム出題(設問プール〈テストバンク〉から抽出)、制限時間の設定、選択肢の並び順シャッフル 一般研修の振り返りテスト、知識定着チェック(テスティング・エフェクト目的)
上記に加え、受験者のログイン認証、受験ログの記録(開始・終了時刻、中断回数)、IPアドレスの記録 コンプライアンス研修、情報セキュリティ研修など合格が業務要件になるテスト
上記に加え、Webカメラによる本人確認やオンライン監督(プロクタリング)、ブラウザ制限(他のタブやアプリを開けなくする) 資格認定に関わるテスト、法的要件を満たす必要がある研修の修了テスト

多くの研修テストでは「軽〜中」の対策で十分です。学習促進を主目的とするテスト(テスティング・エフェクト目的)であれば、ランダム出題と時間制限だけで実用上の問題はありません。不正対策の強度を上げるほど受験者体験は低下するため、「このテストで不正が起きた場合のリスクはどの程度か」を基準に、必要十分な対策を選びましょう。

なお、どの強度であっても、受験者への事前説明は欠かせません。「なぜこのテストを実施するのか」「テストの目的は評価ではなく学習の定着確認である」ことを明示するだけで、受験者のストレスは大幅に軽減されます。

5. テスト結果を活かした研修改善のPDCA

5-1. テスト結果の分析で見えること

テスト結果は、受講者の理解度を測るだけでなく、研修そのものの品質を評価するデータでもあります。以下の3つの視点で分析することで、次回の研修改善に直結する示唆が得られます。

分析の視点 考えられる原因と対策
全体の正答率が低い問題がある 研修内容やテキストの説明がわかりにくい可能性。講師の説明方法や教材の見直しを検討
特定グループだけスコアが低い 前提知識の不足や研修方法のミスマッチ。事前学習の追加やグループ別の研修設計を検討
研修直後は高いが1ヶ月後に大幅下落 知識定着の仕組みが不足。分散テストの追加や、eラーニングでの復習コンテンツ提供を検討

5-2. データに基づく改善サイクル

テスト結果の分析で「特定の設問の正答率が低い」とわかったとき、原因は研修内容なのか、テスト設問なのか、受講者の前提知識なのか——この切り分けが改善の出発点です。

注目したいのは、冨永ほか(2009)のメタ分析です。136本のeラーニング研究を統合した結果、学習効果を高める最大の要因は「受講者が『なぜこれを学ぶのか』を理解していること」であることが明らかになりました。テスト結果が低い研修があれば、「内容が難しい」のではなく「学ぶ意義が伝わっていない」可能性を疑ってみてください。研修冒頭の導入方法や、研修前に送る事前案内の工夫で改善できる場合があります。

小薗・大内(2016)は、4社約180名のアンケートデータを分析し、研修効果に影響を与える要因として学習レディネス(学ぶ準備状態)・上司のサポート・職場の学習風土など10の要因を特定しました。注目すべきは、上司のサポートや職場の風土が受講者の「学習レディネス」を高め、それが研修効果に波及するという連鎖的な関係です。テスト結果を改善するには、設問やカリキュラムの見直しだけでなく、受講者が研修に臨む前段階——上司からの声かけや、研修の目的を事前に共有する仕組み——にも目を向ける必要があるということです。

出典:冨永敦子ほか(2009)「高等教育におけるe-Learningの効果に関するメタ分析」日本教育工学会論文誌, 32(4)./小薗修・大内章子(2016)「能力・態度における研修効果に影響を与える要因とその関連性」日本労務学会誌, 17(1), 50-68.

研修と理解度テストの改善サイクルは、次のように回します。

📌 研修改善のPDCAサイクル

Plan:研修目標に紐づいたテスト設計(第3章の原則に従う)
Do:研修実施→テスト実施→即時フィードバック
Check:テスト結果の分析(上記3つの視点)+受講者アンケートとの突き合わせ
Act:研修内容・テキスト・テスト問題の改訂。次年度以降の年次比較に備えてデータを蓄積

5-3. 人的資本開示への活用

毎年のテスト結果データを蓄積し、年次比較を行うことで、研修品質の推移を可視化できます。

指標の種類 具体例
インプット指標 研修時間数、教育研修費、受講者数
アウトカム指標 理解度テスト平均スコア推移、合格率推移、研修前後のスコア差分

これらをセットで開示することで、「投資に見合った成果を出している」ことをステークホルダーに説明できます。佐々・向後(2021)が10年間にわたってテスト結果を蓄積し年次比較を行ったように、データの経年変化こそが研修品質の改善を証明する最も説得力のある材料です。

6. 理解度テストの組織導入——3ステップ・ロードマップ

ここまでテストの設計・運用・改善の方法論を解説してきましたが、大企業の研修担当者が実際に直面するのは「どうやって組織に導入するか」という問題です。「テストを追加したい」と提案しても、経営層からは「投資対効果は?」、現場の管理職からは「また業務が増えるのか」、受講者からは「評価に使われるのでは」という反応が返ってくるのは珍しくありません。

ここでは、いきなり全社展開するのではなく、段階的に導入して実績を積み上げるロードマップを提案します。

6-1. ステップ1:1つの研修でパイロット導入する(1〜2ヶ月)

最初から全研修にテストを導入しようとすると、設問作成の負荷も社内調整のコストも膨大になります。まずは1つの研修で小さく始めるのが鉄則です。

パイロットに適しているのは、以下の条件を満たす研修です。

💡 パイロット導入に適した研修の条件

・受講者数がある程度多い(30名以上が目安。統計的に意味のあるデータが取れる)
・学習目標が明確で、テスト化しやすい(コンプライアンス研修、製品知識研修など)
・研修担当者がテスト導入に前向き(協力者がいる研修を選ぶ)
・定期的に繰り返し実施される研修(年次比較データが蓄積できる)

パイロットでは、第3章の原則に従って10〜15問の選択式テストを作成し、研修直後に実施します。この段階では専用のオンラインテストツールを使うのが効率的ですが、まずはGoogleフォームやMicrosoft Formsなどの汎用フォームツールでも構いません。大事なのは「テストを実施して、データを取る」という実績を作ることです。

パイロット段階でもうひとつ重要なのが、受講者への目的説明です。第7章の失敗パターンでも触れますが、「テスト=監視」と受け取られると、受講者の反発を招きます。「テスティング・エフェクト」を簡潔に紹介し、テストは評価ではなく学習定着の仕組みであることを事前に伝えてください。

6-2. ステップ2:成果を可視化し、社内を説得する(2〜3ヶ月)

パイロットで得たデータを使って、上申資料を作ります。経営層や関係部門を動かすには、「感覚」ではなく「数字」が必要です。

具体的に用意すべきデータは3つです。第一に、テスト結果そのもの——全体の平均点、正答率の分布、設問別の正答率。「コンプライアンス研修の平均点が65点で、”利益相反”に関する正答率が32%だった」といったファクトは、研修内容の改善にも経営層への報告にも使えます。第二に、受講者の反応——テスト実施後のアンケートで「テストを受けて気づきがあったか」「テストの難易度は適切だったか」を聞きます。第三に、プレテストとの差分——もし事前テストを実施していれば、研修前後のスコア差が「研修の効果」を最も直接的に示す指標になります。

GEのリーダーシップ研修では、研修直後のアンケート満足度ではなく、3ヶ月後に上司が部下のリーダーシップ発揮状況を評価するスコアリングを効果測定指標に採用しています。研修担当者が「満足度4.2でした」と報告するのと、「研修受講者の上司のうち80%が”リーダーシップが向上した”と評価した」と報告するのでは、経営層の反応はまったく違います。理解度テストのスコアも同じで、「数字で語れる成果」を持って初めて、次のステップの承認を得られます。

📌 上申資料に入れるべき3つの要素

①課題の提示:「研修効果測定KPI未設定6割」「フォローアップ未実施8割」のデータで現状の問題を示す
②パイロットの成果:テスト結果の具体的な数字と、受講者のポジティブな反応を報告する
③展開計画と投資対効果:全社展開に必要なコスト(ツール導入費・設問作成工数)と、期待される効果(人的資本開示への活用、研修改善サイクルの実現)を示す

6-3. ステップ3:対象を拡大し、運用を仕組み化する(3〜6ヶ月)

パイロットの成果をもとに、テスト導入の対象研修を拡大します。この段階では3つの実務課題に対処する必要があります。

課題1:現場管理職の巻き込み。テスト結果を現場に届ける際、最大のハードルは「上司が忙しくて対応できない」ことです。佐々・向後(2024)の研究が示すように、理解度が高い受講者は上司の支援がなくても自律的に学びを業務に活かす傾向があります。しかし、理解度が低い受講者こそ上司のフォローが必要です。上司の負荷を最小化するには、テスト結果を「この人は〇〇領域の理解度がやや低め。次回の1on1で確認を推奨」という1行メッセージに要約して送る仕組みが効果的です。GEのクロトンビル研修所では、上司向けに「1ページの事前・事後面談シート」を提供し、忙しいマネージャーでも5分で対応できるようにしています。

課題2:既存のLMS・研修管理システムとの連携。大企業ではすでにLMS(学習管理システム)を導入しているケースが多いでしょう。理解度テストの運用を紙やExcelで続けると、採点・集計の手間、経年データの管理、大人数のスケーラビリティに限界が出ます。とくに第4章の「分散テスト(3回実施)」や「即時フィードバック」を手作業で行おうとすると、運用負荷は飛躍的に膨らみます。既存のLMSにテスト機能がある場合はそれを活用し、機能が不足する場合はオンラインテストツールの導入を検討します。ポイントは、自動採点・即時フィードバック・設問プールの蓄積・受験者別の弱点分析・年次データの蓄積比較——この5つの機能が揃っているかどうかです。

ただし、このシステム移行自体がハードルになることも少なくありません。たとえば紙で実施していたテストをオンライン化するだけでも、業務フローが大きく変わるため、IT部門・人事部門・現場の研修担当者・受講者の上司など、様々な部門との調整が必要になります。「今のやり方で回っているのに、なぜ変えるのか」という声は必ず出ます。このとき、ステップ2で作成した「パイロットの成果データ」が説得材料として威力を発揮します。感覚ではなく数字で「こう変わった」と示せれば、調整のハードルは大幅に下がります。

課題3:受講者の抵抗感への対処。「テスト=管理強化」という現場の反発は、テスト導入の最大の障壁になりえます。対処のカギは2つあります。ひとつは、テスティング・エフェクトの簡潔な説明を研修冒頭に組み込むことです。「テストを受けること自体が最も効果的な復習法であり、点数をつけることが目的ではない」と伝えるだけで、受講者のストレスは大幅に軽減されます。もうひとつは、テスト結果を人事評価に直結させないことです。テスト結果はあくまで育成の起点であり、合格・不合格のラベルではなく「現時点の到達度」として位置づけることを、受講者と上司の双方に明示してください。

6-4. 他社の導入事例に学ぶ

第1章で紹介した大手機械メーカーX社の事例(佐々・向後, 2021)は、まさにこのロードマップを10年かけて実践したものです。4つの改善施策を2〜3年間隔で段階的に導入し、最終的に全施策完了後には統計的に有意な理解度の向上が確認されました。一度にすべてを変えるのではなく、小さな改善を積み重ねて成果を蓄積するアプローチは、大企業の組織導入に最も適した方法です。

ある数千人規模の小売業では、2日間の階層別集合研修を「事前学習(反転学習)→研修本編→事後実践→フォロー研修」のインターバル型に移行し、研修前後に理解度テストを組み込みました。事前テストと事後テストのスコア差を可視化し、さらにフォロー研修で実践結果を報告させる仕組みを導入した結果、受講者の大多数が学んだことを現場で実践し、70%以上が成果につなげたと報告されています(Wick et al., 2015)。

NTTドコモではモバイル端末を活用した研修後テストを導入し、リアルタイムの集計と研修内容の振り返りを両立させています。日立総合経営研修所ではタブレット端末を用いてアンケートのペーパーレス化を実現し、集計や管理の効率化を図っています(鈴木克明ほか「インストラクショナルデザインによる企業での学習支援」)。いずれの事例にも共通するのは、テスト導入を「評価の強化」ではなく「学びの仕組み改善」として位置づけ、段階的に展開している点です。

なお、自社の業務内容に即したオリジナル研修を新たに設計したいケースでは、研修プログラムの企画段階から理解度テストをセットで設計することが理想的です。研修の学習目標とテストの出題範囲を最初から連動させることで、本記事で解説した「学習目標に紐づいた出題(原則1)」や「プレテストの実施(原則4)」をスムーズに実現できます。サイトエンジンでは、階層別・テーマ別の企業向け研修から、貴社独自のオリジナル研修の企画開発まで対応しており、研修設計と効果測定を一貫して支援しています。

7. よくある失敗と改善パターン

ここでは、研修後の理解度テスト運用で起こりがちな失敗と、その改善策を整理します。

よくある失敗 なぜ起こるか 改善策
テストが「受講者への不信」と受け取られ、モチベーションが下がる テストの目的説明がなく、いきなり「試験」として実施される。受講者が「粗探しをされている」と感じる テストの目的(学習定着、研修改善の材料)を事前に明示する。「テスティング・エフェクト」を簡潔に紹介し、テスト自体が学びの一環であることを伝える
暗記で答えられる問題ばかりで、テストが「作業」になっている テストブループリントを作らず、出題しやすい○×問題だけで構成してしまう 第3章のブループリントとガニェの学習成果分類に立ち返り、知的技能・態度を測る設問を意図的に組み込む。基礎7割・応用3割を目安にする
テスト結果が研修改善にも育成にも活かされず、放置される テスト実施が「目的」になり、結果の分析・活用フローが設計されていない テスト設計時に「結果の使い方」を先に決める。研修担当→上司へのフィードバック共有フォーマットを固定化し、運用を属人化させない
オンラインテストの不正対策が厳しすぎて、受験者の離脱やクレームが増える すべてのテストに一律に最高レベルの監視を適用してしまう 第4章の3段階フレームワークに基づき、研修の種類と目的に応じて不正対策の強度を切り替える。学習促進が主目的のテストなら「軽」で十分
毎年同じ問題を使い回し、テストが形骸化する 設問更新の仕組みがなく、正答が出回ってしまう 設問プール(テストバンク)を構築し、毎年一定割合を入れ替える。パイロットテスト(第3章)を年次で実施し、設問品質を継続的に管理する

これらの失敗パターンに共通するのは、テストを「一度作って終わり」にしてしまうことです。テストは研修と同様に、設計→実施→分析→改善のサイクルで継続的にアップデートしていくものだという意識が重要です。

まとめ

研修後の理解度テストは、「受講者を評価するための道具」ではありません。テスティング・エフェクトが示す通り、テストそのものが強力な学習促進手段であり、「受けて終わり」の研修を「身につく研修」に変える仕組みです。

📌 本記事のポイント

1. テストは評価ではなく学習そのもの。複数のメタ分析で「復習より記憶が定着する」ことが実証されている
2. カークパトリックモデルのレベル2(学習)を確実にカバーすることが、レベル3(行動変容)への第一歩
3. 学習目標のタイプ(暗記・ルール適用・態度など)に合わせてテスト形式を設計する
4. テストブループリント(出題設計図)で全体バランスを可視化し、良問チェックリスト+パイロットテストで品質を担保する
5. 分散テスト(研修直後→1〜2週間後→1〜3ヶ月後)の3回実施で、記憶の定着効果が飛躍的に向上する
6. 即時フィードバックが鍵。日本企業の10年間・7,000名の実証研究で最も効果が大きいことが確認されている
7. 最新研究(2024年)により、理解度が高い受講者ほど自律的に学びを業務に活かすことが明らかになっている
8. オンラインテストの不正対策は3段階で強度を使い分け、受験者体験とのバランスを取る
9. 組織導入は「1研修でパイロット→成果を可視化して社内説得→対象拡大・仕組み化」の3ステップで進める
10. テスト結果を上司と共有する際は「ラベリングしすぎない」。育成の起点として活用する
11. 年次のテストデータ蓄積で、人的資本開示のアウトカム指標として活用できる

理解度テストは、大がかりなシステム導入や外部コンサルの契約がなくても、明日からでも始められる施策です。第6章のロードマップに沿って、まずは次回の研修で「10問の選択式テスト+即時フィードバック」を試してみてください。受講者の反応と、テスト結果が浮き彫りにする「研修の弱点」に、きっと新しい発見があるはずです。

最後に、この記事を書いた動機についてお伝えさせてください。研修が「やりっぱなし」になっている現場を、筆者はこれまで数多く見てきました。企業側は「研修に効果があるのかよくわからない」、受講者側は「なぜこの研修をやるのかわからない」「仕事の時間が減るからやめてほしい」——双方が不満を抱えたまま、惰性で続いている研修が少なくありません。本記事が、そうした状況を少しでも変えるきっかけになれば幸いです。テストという仕組みを入れるだけで、企業は「投資の効果」を可視化でき、受講者は「なぜ学ぶのか」「自分がどこまで理解できているか」を実感できるようになります。研修が、やる側にも受ける側にも意味のあるものに変わる——その第一歩を、ぜひ踏み出してみてください。

参考文献

和文論文(J-STAGE公開・無料閲覧可能)

No. 論文タイトル 掲載誌
1 企業内研修における研修改善の長期的実践と授業理解度に対する効果の評価(佐々裕美・向後千春) 日本教育工学会論文誌 45(2), 185-194, 2021
2 企業内技術研修における研修転移意志への影響要因と自律的な研修転移の促進に関する検討(佐々裕美・向後千春) 日本教育工学会論文誌 48(2), 381-390, 2024
3 能力・態度における研修効果に影響を与える要因とその関連性(小薗修・大内章子) 日本労務学会誌 17(1), 50-68, 2016
4 eラーニングに関する実践的研究の進展と課題(向後千春) 教育心理学年報 53, 156-165, 2014
5 インストラクショナルデザインによる企業での学習支援(鈴木克明ほか) デザイン学会研究紀要 4, 75-84, 2004
6 高等教育におけるe-Learningの効果に関するメタ分析(冨永敦子ほか) 日本教育工学会論文誌 32(4), 353-364, 2009
7 教育設計についての三つの第一原理の誕生をめぐって(鈴木克明・根本淳子) 教育システム情報学会誌 28(2), 168-176, 2011
8 インストラクショナルデザイン ―学びの「効果・効率・魅力」の向上を目指した技法―(鈴木克明) 通信ソサイエティマガジン(B-plus) 13(2), 110-117, 2019

欧文論文

No. 研究 掲載誌
9 Roediger, H. L. & Karpicke, J. D. (2006). The power of testing memory: Basic research and implications for educational practice. Perspectives on Psychological Science, 1(3), 181-210
10 Rowland, C. A. (2014). The effect of testing versus restudy on retention: A meta-analytic review. Psychological Bulletin, 140(6), 1432-1463
11 Yang, C. et al. (2021). Testing (quizzing) boosts classroom learning: A systematic and meta-analytic review. Psychological Bulletin, 147(4), 399-435
12 Pan, S. C. & Rickard, T. C. (2018). Transfer of test-enhanced learning. Psychological Bulletin, 144(7), 710-756
13 Latimier, A. et al. (2021). A meta-analytic review of the benefit of spacing out retrieval practice episodes on retention. Educational Psychology Review, 33, 959-987

調査レポート・書籍

No. 資料名 内容
14 EdWorks「社会人の学びに関する意識調査」(2023年4月) 受講者の79%が「研修内容を覚えていない」
15 EdWorks「研修効果に関する調査」(2023年9月) 研修の学びを業務で活用できたのは31%
16 HR総研「新入社員研修に関するアンケート調査」(2020年) 効果測定のKPI「設定していない」が6割
17 矢野経済研究所「企業向け研修サービス市場に関する調査」(2023年) 市場規模5,370億円(前年比3.1%増)
18 産労総合研究所「教育研修費用の実態調査」(2023年) 教育研修費の今後「増加」見込みが62.8%
19 鈴木克明(2015)『研修設計マニュアル 人材育成のためのインストラクショナルデザイン』北大路書房 ガニェの学習成果5分類と「整合性」の原則、学習目標タイプ別の評価方法など、企業研修へのID適用を体系的に解説
20 Kirkpatrick, J. D. & Kirkpatrick, W. K. (2016). Kirkpatrick’s Four Levels of Training Evaluation. ATD Press. 新カークパトリックモデル(The New World Kirkpatrick Model)の原典。レベル4→1の逆算設計を提唱
21 Wick, C. et al. (2015). The Six Disciplines of Breakthrough Learning, 3rd ed. Wiley. 研修転移を実現する6Dsフレームワーク。GEクロトンビルの事例を含む43の実践事例を収録

研修後の理解度テスト、始めてみませんか?

ラクテスは、研修後の理解度テストに必要な機能をワンストップで提供するオンラインテスト作成・管理ツールです。

こんな課題をお持ちの企業様からご相談いただいています

  • 「研修はやっているが、効果を客観的に測る仕組みがない」
  • 「テストの採点・集計に手間がかかりすぎている」
  • 「分散テスト(複数回テスト)を効率的に運用したい」
  • 「テスト結果を人的資本開示のアウトカム指標に活用したい」

ラクテスでできること

  • 選択式・記述式・ケース問題など多様な出題形式に対応
  • 自動採点・リアルタイム集計で即時フィードバックを実現
  • 受験者別の弱点分析・カテゴリ別スコアの可視化
  • 設問プールの蓄積と再利用でテスト作成を効率化
  • テスト問題の作成代行・専門家監修にも対応

「まずは話を聞いてみたい」だけでもお気軽にどうぞ。貴社の研修体系に合わせた最適な進め方をご提案いたします。

なお、ラクテスを運営するサイトエンジン株式会社では、理解度テストの設計・運用だけでなく、企業向け研修の実施オリジナル研修の企画開発・制作代行も行っています。「自社の業務に合った研修を一から作りたい」「研修の設計から効果測定までを一貫して任せたい」といったご要望にもお応えできますので、あわせてご相談ください。

ラクテスのサービスを見る テスト作成代行について相談する

※ 本記事の内容は2026年2月時点の公開情報および学術論文に基づいています。

page top