こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

外国語教育研究に「統計ソフトR」を使おう!(その1)

以下の内容は、別に外国語教育研究に限ったことではなくて、社会学や心理学など人文社会学系もろもろに関係しますが、主たるオーディエンスを私の知人(英語教育系多い)に設定しましたので、以上の様なタイトルになりました。それ以外の専門の方は適時翻訳しながらお読み頂ければと思います。


外国語教育研究において統計学の知見を利用した計量研究が用いられて久しいですが、他の分野(経済学、社会学、心理学)に比べると必ずしもその質が高まっているとは言えません(国内外問わず、です)。


その原因の一つに、高価な統計パッケージ(統計解析用ソフト)があるのではないか、と大胆にも恐れ多い「仮説」(のようなもの)を提示してこの記事を書く次第です。


その仮説とは概略つぎのよなものです:

  • SPSSをはじめとして、市販の統計パッケージは(なぜか)非常に高価である。なかなか院生や学部生が個人的に購入できるものではない。いきおい、学生は、大学や研究室が所有するパッケージを使わざるを得ない。すると、物理的・時間的に制約が生じ、十分な時間的・精神的余裕が確保できない。そのため、初歩的なミスを犯す危険性は増大する。また、試行錯誤の時間が少ないので、「常識の範囲内」の結果しか導き出せない。


もしかすると誤解している人も多そうですが、計量研究は、データをとったらそれを機械的に当初の仮説に当てはめて、仮説を検証してそれでお終い.....といったタイプの研究ではありません。たしかに、計量研究の場合、いったんデータをとってしまったら分析段階でできることは限られてしまいますが、「限られる」からと言って「単一の方法でやればよい」ことは意味しません。むしろ限られたオプションのなかで、いかに統計学的な信頼性が高く、オリジナリティがあり、そして何より、理論的・認識論的に見て妥当性が高い結果を導き出すかが計量研究の腕の見せ所であり、そのために試行錯誤を繰り返すことが決定的に重要なのです。


ですので、「個人所有を阻むような高価なソフトは、学生の『試行錯誤』の機会を奪い、よって研究の質は落ちる」というのが上記の仮説です。ここでは、この仮説がとりあえず「真」であるとして(え!)、ではどうしたらこの状況が克服できるかを考えましょう。


結論から言うと、「無料の統計ソフトを使えばいい」ということになります。ここではR*1紹介します。フリーの統計パッケージは数多く存在しますが、そのなかでも最強のものがこのRだからです。


なお、外国語教育系の研究者や院生の方々すべてが「Rを使うべき」だなどというつもりはありません。後述するとおり、Rは、コマンドラインで行うというソフトの特性や、ハウツー系の教科書が相対的に少ないという点を考えると、若干(けっこう?)取っつきにくいところがあり、習熟に多少時間が必要です。したがって、すでに他の統計パッケージ(例えばSPSS)を完璧に使いこなしており、特に不満も感じていない人が、あらためて、Rを学び直すのは費用対効果の面から言ってあまり意味がないと言えるでしょう。したがって、Rを習熟することのメリットの多少は人によりけりですが、少なくとも次の様な方々には多大な利益をもたらします。すなわち

  • 経済的余裕がない人
  • 最先端の分析をしたい人
  • PCが不安定になるほど大量のデータセットを分析する人

です。以下に、独断と偏見が混じったフローチャートを提示しますので参考にして下さい。



以下、上記のフローチャートにしたがって解説をします。


...「その2」につづく...

*1:そのまま「あーる」と読みます。日本の研究者の間では、「LHH」(♪ドミミ)というイントネーションで発音されることが多いようです。