全国学力テストと他の調査(PISA、NAEPなど)との違い

 全国学力テストと、全米学力テスト(The National Assessment of Educational Program,NAEP)やOECDPISA調査との違いは、調査手続きの厳密さと、調査結果の信頼性の高さ、裏付けとなっている理論の確かさの違いにあると思う。前者と後者の違いは非常に大きい。
 まず、OECDPISA調査がどのような調査手続きを踏んでいるか。また、調査結果の信頼性を高めるためにどのような事を行っているか。どういう理論的裏付けがあるかについては、ぜひ、『[asin:432406749X:title]』『[asin:4324075719:title]』などを読んで確認していただきたい。
 全米学力調査(NAEP)については、『指導と評価』3月号村木英治「アメリカの学力調査NAEP」や、ネットで読めるものとしては、ベネッセの『BERD』NO.04 2006年の池田央「 NAEP(全米学力調査)に学ぶ学力調査の技術」があるので確認していただきたい。
 先日実施された全国学力テストは、全国的な学力調査の実施方法等に関する専門家検討会議が検討を開始して、実施まで短い期間しかなかった。しかし、PISAや全米学力調査などの先行事例について、専門家検討会議の議事を読んでもきちんと調査し、議論したとは到底思えない。
 先行事例があるなら、きちんと調査し、参考にできるところと、そうでないところなどについてきちんと議論すべきだ。そういうことも十分に行われないまま、悉皆調査でというような調査方法等が拙速に決定されるのは間違っている。
 池田央氏は、

 私はよく、「意味のある調査」と「ナンセンスな調査」という風に分けて呼ぶのですが、「意味のある調査」とは、例えば、ある問題の正答率が高かった、または低かったかが分かるだけでなく、なぜそうなのかを推察できるような質問も同時に組み込まれた調査です。つまり、原因の推定可能なデータが集められるように工夫された質問が組まれている調査こそ、意味のある調査なのです。それに対して「ナンセンスな調査」というのは(今の日本の多くの調査がそうではないかと思うのですが)、得られた結果の原因を、現場の先生の経験による勘や、評論家の意見や判断に基づいて後から憶測するしか方法がないような調査のことです。

と述べている。今回実施された全国学力テストは、「意味のある調査」に近いものであるとしても、それで十分であるとは思わない。
 また、池田氏は、

 経済指標なしに経済政策の立案と決定はあり得ません。定量的な統計指標に基づくからこそ、経済の現状について正確な認識と把握ができるのであり、そこから改革の施策が生まれます。そのことは、教育政策でも同様のはずです。
 ところが、金額という単位に置き換えて計数化され、明確な指標が定まりやすい経済に比べて、教育では計数化できる明確な指標が定まりにくい。そこで教育統計で取り上げられるデータの多くは、学校数や学生数、教員数といった計数可能な数量に限定されています。しかしこれでは教育の現状を正確に認識し、把握したことにはなりません。知りたいのは、学力水準や教育到達度を示す統計指標です。果たしてこの数十年間で日本人の基礎学力は上昇しているのか、低下しているのか、上昇しているとしたらどの面で、低下しているとしたらどの面なのか。それを把握できる全国的資料は、現在のところ、ほとんどありません。現状を正確に知ることなく、どうして未来へ向けての改革の議論ができるのでしょうか。確かに、学力や体力、興味・関心を含む生徒の行動様式といった教育情報は、体力テストにおける100m走のタイムのように明確な測定単位で計量できるケースは稀です。その大半は、測定者が意図的に作成した変数や指標に基づいた尺度によって測定されます。その尺度は無数にあり得るので、結果として現れた一つの数値を唯一絶対的な学力として権威付けるわけにはいきません。
 NAEPが参考になるのは、こうした限界を踏まえているがゆえに、全国(あるいは州)を代表できるように厳密な手続きで抽出したサンプルに対し、できるだけ多くの代表的課題を調査実施することによって、効率的に正確な全体像を把握しようと努めている点です。そのために採用している前述のBIBスパイラルやIRTのような高度の測定技術と理論は日本でも導入を考えてしかるべきでしょう。
 また、結果の数値を示されただけでは、その調査がいったい何を測定したことになるのか、意味が分かりません。数値の出された過程がブラックボックスに入り、解釈に必要な手続きが不明だからです。教育の分野に限らず、統計を使うときに危険なのは、得てして、調査項目の設定過程、サンプリングの方法や実施結果、処理手続きなどのプロセスが隠されたまま、数値だけが独り歩きしてしまうことです。どのような調査も完全ではありません。したがって、そのプロセスを明示し、統計数値の見方、限界範囲、他の類似情報との比較可能性などが明らかになって初めて、その統計数値の示唆する意味を理解できるのです。この点でもNAEPの透明性と公開性の高さは注目に値します。もちろん、公開性と同時に、特定個人や学校単位の成績にアクセスできないプライバシー保護の仕組みも参考にすべきなのはいうまでもありません。

ということも述べている。
 今後、全国学力テストが継続的に行われるとしたら、PISAや全米学力調査のように調査手続きの厳密化など調査結果への信頼性を高めることが必要だ。そういうものを志向しないならば、全国学力テストの意味はない。
 専門家の検討開始から実施まで短期間であり、ここで指摘したようなことを十分に検討したり取り入れたりすることは困難であったと言われるかもしれない。しかし、そうであっても先行事例などについてきちんと議論するということもなく、実施に踏み切っている。その拙速さを考えれば批判せざる得ないと考えている。
 また、専門家の検討会議は今議論を中断している。議論は中断せずに、継続的な課題などについて議論を進めていても良いのではないか。
 やってみなければ分からないということで、多額の予算と多大な労力をつぎ込んでいいとは思わない。多額の予算と多大な労力に見合うようなものをきちんと検討し提案することは当然のことだと思う。そういうことをしていない今回の全国学力テストの実施は、拙速な行為であり、それは批判されるべきものだと思う。