「テスト・検定」タグアーカイブ

「テスト・スタンダード」

日本テスト学会がとりまとめた「テスト基準」の詳しい解説と、関係者によるQ&A集です。企業の人事担当者なども含め、さまざまなテスト、人事測定に関わる関係者に広く読んでもらいたいような基本書なのですが…。

書籍「テスト・スタンダード」概観
「テスト・スタンダード -日本のテストの将来に向けて」
【日本テスト学会(編)、2007年、金子書房】

■テスト基準の詳細な説明
日本テスト学会というところが「テスト基準」をとりまとめ2006年に基本条項を公開したことを、以前の記事「テストの開発、実施、利用、管理にかかわる基準」で触れました。当時開発中だった「基本条項の解説」(ガイドライン)は2007年9月に公開されています。「基準」そのものも微調整され「ver1.1」となったようです。

本書は、その「基本条項の解説」本文(140ページほど)と、関連する「Q&A」(60ページ強)および「用語解説」(12ページ)をまとめて1冊にした本です。「テストの科学」という本を以前当サイトで紹介しましたが、本書もこの本と同様、さまざまなテスト関係者にとって基本書の一つと位置づけられるかもしれません。

なお「基本条項の解説」部分は、同学会のWebページでも公開されています。ただしダウンロードできるのは“印刷不可能”なpdfファイルです。

「Q&A」は、テスト基準をみて多方面からいろいろ出てくるであろう質問を37件とりあげ、それらに対する考え方、技術的な手法、現実的な対処法などをまとめています。同学会会長の池田央氏やテスト基準作成委員会委員長の繁桝算男氏ほか、この分野で著名な方々が丁寧に答えておられます。

■テストで数字化することに対する本質的な不審?
学校の入学試験・アチーブメントテストから、あまたある検定試験・資格試験、企業で行われる人事測定・心理測定、組織診断のための調査ツールなど、人や集団を測定するためにさまざまなテストがあります。なかには“深い考えがなくなんとなく開発した”だけのテストが多数あると思われますが、見識のないテストに対して「基準」は一種の“駄目出し”をしている側面があります。本書の解説やQ&Aが書かれた背景を深読みすると、「基準」に示されているさまざまな考え方や条件が、日本のテスト開発・利用の現場で“戸惑い”のような感覚をもって受け取られているのではないかとも思われます。

この“戸惑い”は、大きく2種に分類できそうです。1つは(主に客観式テストの)数値解析にまつわる技術的な方法論に関すること。たとえば「素点を標準化された尺度得点に置きかえるにはどうすればよいのか」「テストの信頼性はどうやって計算したらよいのか」といったあたりで、どうしても数値解析の専門知識が必要になってきます。

もう一つの“戸惑い”は、客観テスト(または評価結果の数値化、または主観評価のための前提条件)に対する根本的な疑念のようなものでしょうか。もちろんこの「基準」で説明されているテストには、多枝選択式のような客観式テストだけでなく、論文や面接試験のような主観的評定を伴わざるを得ないテストも含まれます。しかしそうした主観的評定を伴うテストにおいても、テスト開発や評価の考え方は客観式テストと共通する条件設定などが多々あるはずで、「基準」にその考え方が示されています。

しかし、なぜか現実には、日常的にテスト開発・実施に携わっている方々からも、なかなかこうした基本的な考え方について理解が得られない場面があります。たとえば「人間を数字で判定してはいけない」とか「多元的に要素が合わさったテスト問題こそ良問だ」といった“見識”を持つこと自体はよいのですが、その一見正論と思える“見識”が、本来あるべきテスト(測定)の前提条件を歪めてしまう例が多々あるわけです。

本書の副題「日本のテストの将来に向けて」に、「何とかして現状を変えたい」という関係者の意気込みが垣間見られます。でも一方で、本書の価格は4000円とちょっとお高め。「基準の説明」が(印刷できないとはいえ)Web公開されていることを考えると、ほんの70ページ強のQ&Aと用語解説の情報(+「基準の解説」の印刷代?)に、それだけの対価を払うことになります。

本当は広くさまざまな読者を獲得したいのでしょうが、出版社からするととても“広さ”(部数)は期待できず、「バリバリの専門書」として売らざるを得ない。そんな苦しい事情が価格から想像されます。それだけ、世間のテスト関係者の問題意識は喚起されていない(?) のかもしれません。

「ストレス測定法」

ストレス測定に関して本格的に学びたい人向けの専門書をご紹介します。前回の記事「身体を測る 09-ストレスの強さを測る」つながりです。

ストレス測定法・表紙
「ストレス測定法 ― 心身の健康と心理社会的ストレス」
【Sheldon Cohen、Ronald C. Kessler、Lynn Underwood Gordon(編著)、小杉正太郎(監訳)、1999年、川島書店】

■深く研究したい人向けの入門書
原題は”Measuring – Stress A guide for Health and Social Scientists”(1995年刊)。

〔目次〕
第1部 ストレスの概念化・ストレスと疾患との関係
第1章 疾患研究におけるストレス測定方略
第2部 環境的視点
第2章 チェックリスト法を用いたストレスフル・ライフイベントの測定
第3章 インタビューによるストレスフル・ライフイベントの測定
第4章 日常的なイベントの測定
第5章 慢性ストレッサーの測定
第3部 心理学的視点
第6章 ストレスアプレイザルの測定
第7章 感情反応の測定
第4部 生物学的視点
第8章 ストレスホルモンの測定
第9章 心臓血管系の反応の測定
第10章 免疫応答の測定
付録1 本書で言及されている尺度
付録2 わが国で開発、翻訳、発表されている尺度

目次をみるだけでも「読みこなすには気合がいりそう」と思いますが、まあ専門書(しかも翻訳物)ですので仕方がありません。

■測定の理論的背景
本書では、ストレスを測るための理論的な大枠として次のようなモデルが示されています(第1章 図1.1 を思いっきり簡略化したもの)。

(1) 外部・環境から刺激が加わる

(2) 刺激をどの程度敏感に受け取り、受け流すか

(3) 身体や心に隠し切れない影響が現れる

このそれぞれの段階で、ストレス測定が考えられるということになります。

■環境面、心理面、身体面からの視点
(1)ストレスをもたらす要因ごとに影響力を測定
外部・環境から刺激が加わると考え、それぞれの影響度を測定します。例えば、次のような事柄について一般的にどのくらい強いストレスをもたらすかを尺度化しておくわけです。

・人生のイベント:「引っ越し」「昇進・降格」「勤める会社の倒産」「定年退職」「離婚」「配偶者の死」…
・日常的な事象:「仕事で叱責を受けた(褒められた)」「運動した(しなかった)」「天気が悪い(良い)」…
・慢性的なストレス要因:「常に締め切りに追われている」「仕事に飽きてしまった」「同僚とそりが合わない」…

(2)対象者ごとに、ストレスから受ける強さを評価する
同じストレス要因(刺激)であっても、人によってその受け止め方の度合(自覚的または無自覚的な評価…「アプレイザル」と呼んでいる)は大きく異なり、それによって生じるストレスの強さに大きな差が出てくるとしています。そこで、各人にとってのアプレイザルを測定しようということです。

アプレイザルの測定は、例えば「次に挙げる事柄を-3点(非常に強い否定的なインパクトがある)~0点(特にインパクトなし)~+3点(非常に強い肯定的なインパクトがある)の間でチェックしてください」とかいう質問を対象者に投げかけて、その答から行うことになります。

その結果、もともとのストレス要因が持つストレスレベル((1)で測定した値)と、その人が受けるストレス(アプレイザルの値)を足したものが総合ストレスレベルになる、といった説明がされています。

(3)身体や行動への反応、疾患の様子など、現象からストレスの強さを測定する
これが、前回の記事で触れた「唾液からストレスレベルを客観的に測る」とか「自律神経系のデータからストレスレベルを判定する」といった方法です。ストレスマーカーとなる物質(主としてホルモン)は多数あるものの、測定値の解釈にはかなり注意が必要であることなどが説明されています。

■実用サービスの可能性
この本の原著が出たのがすでに10年以上前。その後実証的な研究が盛んに進められている(らしい)ことから、もしかしたら近い将来には、物理的なストレス測定手段が今よりずっと多数開発されているかもしれません。それを期待させるような、研究領域の豊かさを感じることができます。

個人的に面白かったのは、第7章で「感情の測定」「気分の測定」なんてものにも言及しているところでしょうか。感情を計量的にとらえることの難しさや限界などもふまえたうえで、その可能性や考え方の枠を示しています。面白いテーマですが、さすがに専門的すぎて、私には本当のところよくわかりませんが…。

素人考えですが、現代のコンピュータを利用したパターンマッチングの技術の発展とあいまって、意外に高度な仕組みが実現できていくのかもしれません。いかがわしいビジネスとしてではなく、かといって過剰に大げさ(高価すぎたり、専門家でしか扱えなかったり)でもない機器やサービスが、これからビジネスとして成り立つ余地があるように思われます。

身体を測る 09-ストレスの強さを測る

人の「ストレス」は、物理的な方法と心理テスト的な方法という異なる側面から測ることができ、それぞれ長所短所があります。

ストレス
〔ストレスの種類と測り方〕

■精神状態を物理的に測る
多くの場合、「人の身体的な特性」や「身体的能力」は物理的に測るのが適当である一方、「精神的な特性」は心理テスト(質問法)のように少し主観的要素の入った測定にならざるを得ないのが普通です。たとえば体脂肪率は、本人にたんに質問したところであまり正確な答えは期待できませんが、体重と身体の電気抵抗を物理的に測定することで割り出すことができます(BIA法の場合)。逆に計算能力とかは、物理的に身体のどこかを測ったところでたぶんあまり意味がありませんが、計算テストをすればかなり正確にその能力を測定できます。

人の感情や精神的状態についてはどうかとなると、基本的には心理テストによる測定のほうが向いていると思われますが、同時に、感情などが身体に及ぼす影響をうまく見極めることで測定できることがあります。昔からある「ウソ発見器」などまさにその部類でしょう。コンピュータによるパターン認識技術が発展した現代では、人の発する声から自動的にその人の感情を判断するシステムなども実用化しています。

ただ、ウソ発見器はモノによっては信頼性が低いとか、かりに信頼性が期待できるものであっても被験者がウソ発見器を騙す術を身につけていることがあるとか、問題が残ります。また、感情判断などでは、研究レベルでかなり高い技術があっても手に入れるのが高価だったり、測定条件が限定されていて実用上の制限があったりと、手軽に利用できるまで至っているものは少ないでしょう。

そんななかで少し面白い位置づけにある(実用化まで進んでいる)と思われるのが「ストレス」の測定です。ストレスの強さを身体の物理的状態から割り出す技術が結構進んできています。

■唾液からストレスの強さがわかる
たとえば「COCORO METER」(ニプロ)は、大学の研究室と共同で開発したストレス測定器です。製品化、それも普及型まで至ったものとして一部で注目されているようです。舌の裏にアイスクリームの棒のような薄い測定用チップをあてて唾液を採取し、そこから唾液アミラーゼを計測。アミラーゼの量からストレスの強さを測定します。2万円強で本体を手に入れることができる手軽な機械なので、ストレスの簡易判定に向いているようです。

参考:生体測定 製品・サービス一覧

唾液からストレスの強さを測定する方法は、アミラーゼがストレスの強さと強い相関関係があることが科学的に確かめられていることから可能になっているわけです。こうしたストレスの証拠となる物質(ストレス・マーカーと呼ばれる)としては、唾液から検出されるアミラーゼのほか、コルチゾール(唾液や尿、血漿から検出)、アドレナリン(血漿から検出)など何種類かあります。

自律神経(交感神経、副交感神経)の強さを体組成計と同様の方法で測定し、そこからストレス状態を判断する手法を応用した装置もいくつか実用化されています。「身体を測る 08-心拍はゆらぐ」でも触れましたが、心拍変動からストレス測定につなげることも可能です。
(念のため…。世の中にたくさんあるストレス測定器と称するものには、少しいかがわしいというか、どこまで信頼できるものか疑わしいものもあるようなのでご注意を)。

■身体測定と心理測定の両面から判断
ストレスの測定は、職場などで行う心理テストでも、古くから1要素としてとりいれられています。たとえば質問紙に次のような項目が数多く並べられていて、それにYes/Noで答えたりします。

・あなたは仕事をしているとき、時間内に処理しきれないほどの負担をよく感じますか?
・あなたは最近、仕事で気が張り詰めていることがしばしばありますか?
・あなたは自分のペースで仕事のやり方を決めることができていますか?

これらの回答の結果からストレスの度合いを判断できるとされています。性格判断のための心理テストと組み合わせて、職場内の適切な人員配置などに生かしている実例は多数あります。

まあ、たとえば上に挙げた心理テストの類については、毎日必死に働いているビジネスパーソンの場合「Yes」ばかりついてしまうのが当たり前だったりもします(上の例で言えば3つ目は「No」)。心理テストによるストレス測定は、その職場環境とか、被験者の年齢やプロフィルとかも考慮に入れなければなりません。

そして心理テスト、質問紙を通じた測定法の場合、主観的な要素が必ず入ってくることは避けられません。客観性という意味では
1. ストレス・マーカーによる測定
2. 心拍、自律神経系の測定からの類推
3. 心理テスト
の順に落ちていくといえます。

また、時間的に変化するストレスの強さを随時測定できるという意味では、
1. 心拍、自律神経系の測定からの類推
2. ストレス・マーカーによる測定
3. 心理テスト
の順に有効だといえそうです。

ストレスそのものがおそらく1次元で測定できるものではなく、心理的ストレス、身体的ストレス、その他(職場環境、対人関係など)から多面的に分析されなければならないものだと思われます。多面的な分析につながるという意味では、たぶん
1. 心理テスト
が優れているといえそうです。もしくはそれに代わる判断ステップが必要となるでしょう。

■心理測定につながる可能性と問題点
少なくとも1種類の物理的測定は純粋な測定でしかなく、評価(イバリュエーション)はおろか、アセスメントとしても不十分なのかもしれません。見方を変えると、心理面と物理面という異なる側面からの測定が実用化していることで、それだけ多面的なストレス・アセスメントができうるといえるのでしょう。

なお、個人がストレスを測定したいというとき、それ自体が時には非常に主観的な意図 ―― たとえば「自分が苦しく思っていることをたんに誰かに認めてもらいたい」ためにストレス測定したいと考えること ―― もあることでしょう。そんな人にとっては、ある意味で高い客観性と信頼性は求められません。この場合「自分の思ったような結果が出てくれる、なんらかの納得できるストレスの存在証明」があればよいわけで、正しい測定値が出るかどうかは二の次の話かもしれません。

ストレスに限らず、性格、行動力、コンピテンシー測定など、人の心と関わり始めたときに同様の問題が必ずでてきます。このあたりが、心理測定に関連した、大変に難しい問題点といえます。

▽追加記事:
「ストレス測定法」

「ビジネス能力検定1級テキスト」

「マネジメントの基本」という副題がついています。単なる検定試験用の教科書ではなく、いくつか実践的に役立つ内容が盛り込まれています。

Bken1級テキスト
「ビジネス能力検定1級テキスト2007年版 マネジメントの基本」
【財団法人専修学校教育振興会(監)、2007年、日本能率協会マネジメントセンター刊】

■問題解決法、コーチング、交渉術、財務計画書…
ビジネス能力検定(略して「B ken」。1級、2級、3級)は、もうすでに結構長い間行われている検定試験です。毎年この試験用の教科書が各級別に発行されていますが、2006年に大改定がありました。当社では、1級テキストの一部について少しだけお手伝いさせていただきました(内容の大半は別の方が執筆されています)。

〔目次〕
第1編 マネジメントの基本とビジネス技法
1 課題解決と知的技法
2 情報力と提案力
3 キャリアマネジメント
第2編 組織とリーダーシップ
4 職場を変革するリーダーシップ
5 ビジネス交渉術
6 活力ある組織の運営
第3編 事業プランニング
7 マーケティングと経営戦略
8 事業推進のための財務
9 経済・経営の一般知識

目次にあるようにカバーしている分野は広範囲ですが、実践的な情報や事例および今日的な話題がいくつか盛り込まれています。たとえば、コーチングの進め方、外部との交渉術、目標管理制度、ビジネス法務、内部統制システムの仕組み、ビジネスプランや財務計画書の作り方など、入門的な内容とはいえ、多くの一般ビジネスパーソンに役立つところがあるでしょう。

■ドキュメンテーションのイロハから、体系だった提案書まで
以前の記事(書評)「RFP入門 ― はじめての提案依頼書」で、ビジネス・ドキュメントの題材が実践面で役立つことに触れました。本書では、提案依頼書より多くの人が作成に携わるであろう「提案書」について、8ページほど使って構成例が解説されています。冒頭の写真がその一部です(小さくて読めないと思いますが…)。

このテキストシリーズは、1級から3級までこうしたビジネス・ドキュメントの実例が示されていることが一つの特徴といえるかもしれません。文書作りの“イロハ”である定型的文書から、級が上がる順に複雑で非定型的な文書へとステップアップしていくことになります。

・3級テキスト
(社内向)業務日報、議事録、通知書、報告書
(社外向)請求書、業務依頼書、照会書、挨拶状、招待状、礼状、年賀状
・2級テキスト
(社内向)議事録、報告書
(社内外向)企画書
(社外向)督促状、詫び状、謝絶状、見舞状
・1級テキスト
(社内外向)提案書

かなり長い間ビジネスの世界にいても、日々の業務は意外と限られた範囲にとどまっていて、あらためてこうした文書作成に直面すると戸惑ってしまう経験が誰にもあるものです。文書の書き方は組織や環境によって“流儀”が大きく異なるものなので、文書例によっては「ずいぶん古臭い書き方だ」とかいろいろ感じる部分もあるかもしれません。でも、文例集とは違った意味で役立つ書物になっているように思われます。

テストの開発、実施、利用、管理にかかわる基準

そもそも「人を測定するためのテスト」とはどのようなもので、どのように行われるべきものなのでしょうか。「テスト基準」なるものが2006年4月に公開されていますので、興味がある方はぜひ読んでみて下さい。

「テストの開発、実施、利用、管理にかかわる基準」
日本テスト学会 http://www.jartest.jp/ から入って http://www.jartest.jp/testsite/testkijyun/testkijyun3.htm
直接テスト実施にかかわりがなくても、人事管理関連の仕事をされている方には基礎知識として役に立つでしょう。「基準」というくらいですから、考え方や手順を用語の定義をはっきりさせながら構造的にきっちりと表現しているのですが、ここではできるだけ「基準」に示されたとおりの用語を使いながらも、少し簡略化した書き方でアウトラインをご紹介します。

fig02.gif

■テストの開発から実施すべての流れ
そもそもテストとは何かというと、「能力,学力,性格,行動などの個人や集団の特性を測定するための用具」(0.2節)です。本blogの視点で言うと、アセスメント(人事測定)に欠かせないツールと位置づけられます。

テストが現実に役立つものとなるためには、受検者質問項目に応えた回答から直接得点化された素点を、意味ある数値である尺度得点に変換するプロセスすべてについて考えなければなりません。たんに「それらしきテスト問題を作ればよい」というものではないのです。

開発する者としては、次の流れを確実に視野に入れることが必要です。

●基本設計
●測定内容の定義
●テスト形式(質問形式、回答形式)の設計
●採点手続の設計
●尺度の構成、標準化、共通尺度化
●尺度得点の信頼性と妥当性の確認
●メンテナンス、改訂

利用者や実施者としては、次のような流れを踏まえていなければなりません。
●テストの選択
●テスト実施の準備、受検者への説明
●実施および受検にかかわるさまざまな配慮
●採点
●結果の分析、解釈、検証
●受検者への結果報告
●記録の保管と再利用

これらほとんどの要素について、項目別にそれぞれ2~3行の短い記述ですが、考え方の基本となる事柄がまとめられています。また、コンピュータを利用したテストのあり方についても少し触れられています。「基準」から導かれる詳細な「ガイドライン」は、現在開発中のようです。

■実際の企業の現場では
実際のビジネス・人事政策の現場では、こんな理想的な準備はなかなかできないのが現実です。多くの場合は“走りながら考える体制”をとらざるを得ないことが多く、しかも走ってしまった方向からやり直しがきかずに、仕方なく荒野を走り続けなければならないといったことも起こります。

その過程で、前回の記事でも書いたような「日本の企業社会では本能的に受け入れがたいもの」にもぶつかります。たとえば、わざわざ複雑な要素を欲張って取り込もうとする思惑が測定の切り口を鈍らせたり、独特なテスト問題作りに精を出しすぎて尺度の共通化を難しくしたりします。

特にビジネス系の各種アセスメント・テスト、アチーブメント・テストがうまく機能しないことがある原因の一つは、やはりこの「テスト基準」に示されたような長期的なテストのあり方が必ずしも十分に社会に認識されていない点にあるのでは…。

だからこそ、こうした「テスト基準」が社会に浸透することで、企業の人事政策でももう少し客観的な測定論、測定技術に目が向けられることを期待したいと考えていますが、いかがなものでしょう。

■測定技術はまだ向上できる
この基準を作成、発表した日本テスト学会の理事長は、前回ご紹介した書籍「テストの科学」の著者でもある池田央氏です。

また、今回の「テスト基準」や日本テスト学会と直接関係ない追加情報ですが、比較的最近の池田先生の興味深いインタビューが次にあります。

「NAPE(全米学力調査)に学ぶ学力調査の技術」
(ベネッセ教育情報サイト BERD No.3(2006年3月発刊)
BERD http://benesse.jp/berd/center/open/berd/index.html から入って
バックナンバーのNo.4、http://benesse.jp/berd/center/open/berd/2006/03/pdf/03berd_05.pdf
副題に「測定技術の進歩が未来の学力を提起する」とあるように、人の特性を測定する「テスト」の過去、現在、未来について、わかりやすいインタビューとしてまとまっています。サイトの性格上、主に学校教育を想定した議論のようですが、社会人の能力測定についても相当に当てはまる考え方だと思われます。ご参考まで。