非常勤「社会調査」第3回

今回は、出席者の「身長」をネタに、平均とか標準偏差とか偏差値とかの話をしました。



まずは、各人に自分の身長を順番に言ってもらい、なにがわかるか、と聞きました。当然、全員の身長を聞いただけでは覚えていられないので、なにがわかるかとかいう以前に、他の人は何cmだったっけということになって聞き直さないといけなくなります。ここで、データは分析する以前に、「書かないといけない」こと、それから一覧できるように「集めないといけない」ことを強調しました。馬鹿みたいな話ですが、これは非常に重要なことだと思います。

次に、集まったデータの性質を分析していきます。ここで平均とか偏差とか分散とか標準偏差とか標準得点とか偏差値とかを出していくわけですが、ただ定義式を教えて計算してみましょう、では何も理解できないので、順番に値を出していくことで、一歩一歩分析を進めていくさまを体感してもらうことを目指しました。
もう一つ重要なのは、データをばらばらのままにしておくのではなく、集めることによって、そこに部分と全体という関係が生まれることです。つまり、各ケースがそれぞれ部分であり、ケースの分布が全体です。身長の話でいうと、各人の身長が部分であり、身長の分布が全体です。
そして、様々な値を計算する際には、それが部分(ケース)の性質なのか、全体(分布)の性質なのかを確認しながらやるのが大切です。

さて、各人の身長を書き出してもらいました(ちなみに出席者は4人です!)。低い順に、

153.4cm,154.0cm,156.8cm,164.0cm

でした。〈低い順に並べる〉というのも重要な操作ですね。これらはもちろん、各ケースの性質、部分の性質です。



上に並べた身長の値を眺めてみるだけで、ケースの分布、つまり全体についてもいくつかのことが分かります。

最小値は153.4cm,
最大値は164.0cm,
最大と最小の間が10.6cm,
160cm未満が4分の3,・・・

などなど、いろんなことがわかります。
そのなかでも、ちょっと手間をかけて計算してやらないと分からないのが、平均です。平均は、全部足して人数で割ってやれば出ますね。

153.4 + 154.0 + 156.8 + 164.0 = 628.2cm
628.2 ÷ 4 = 157.05cm

4人の平均は157.05cmでした。



平均身長がわかったところで、次に気になるのは、自分の身長は平均からどのくらい離れているのかってことですよね。これを偏差といいます。どっちからどっちを引いてもいいですが、ここでは各ケースごとに自分の身長から平均身長を引いてみましょう。

-3.65cm,-3.05cm,-0.25cm,+6.95cm

マイナスが付いているのは平均より低いということ、プラスは高いということです。この偏差という値は、各ケースの性質、つまり部分の性質ですね。ただ、平均という分布全体の性質が出たからこそ、この偏差が計算できたということ、これは重要な事実です。



さて次に気になるのは、各人は平均どのくらい平均身長から離れているかってことです。各人の平均からの差、つまり偏差はもうわかっているので、これを全部足して人数で割れば、平均偏差が出ますね。というわけで計算してみます。

(-3.65) + (-3.05) + (-0.25) + 6.95 = 0cm
0 ÷ 4 = 0cm

この人たちの身長は、平均身長から平均0cm離れているという結論が出ました。たしかに計算ではそうなりますが、これは変ですよね。平均身長と同じ身長の人はいないのに、平均0cm離れているというのはこれは変です。すぐわかるように、これはマイナスが付いているから起こることです。でも最初に知りたかった、全員では平均どのくらい平均身長から離れているかっていうときの「離れている」というのは、高い低いどっち方向に離れているかは考えていなかったはずです。というわけで、この最初の発想を活かすためには、プラスマイナスの違いを無くさないといけません。つまりマイナスをとるんですね。絶対値をつけるといってもいいです。そのうえで全部足して人数で割りましょう。

3.65 + 3.05 + 0.25 + 6.95 = 13.9cm
13.9 ÷ 4 = 3.475cm

というわけで、この4人は自分たちの平均身長から平均3.475cm離れているということが分かりました。これが平均偏差です。これは分布全体の性質ですね。



ところがこの平均偏差は、平均からの偏差が平均どのくらいか、という問いに対する回答としては自然なのですが、あまり使われることがありません。その代りに使われるのが標準偏差です。
平均偏差を出すときには、偏差についているマイナスを消すために絶対値をとりました。これに対して標準偏差を出すときには、いったん2乗することによってマイナスを消します。負の数は2乗すると正になりますからね。
そうやって偏差を2乗して、それからその平均を出します。つまり、偏差の2乗を全部足して人数で割るわけです。

(3.65)2 + (3.05)2 + (0.25)2 + (6.95)2 = 70.99cm2
70.99 ÷ 4 = 17.75cm2

こうやって出した、偏差の2乗の平均のことを分散といいます。これはすごく重要な、つまりさらに使える数値なのですが、今日の話では通過点です。さてこの分散は、偏差の2乗の平均でした。偏差の単位はcmですから、偏差の2乗になると単位はcm2です。つまり面積みたいになっちゃってます。身長の話ですから、ずっと長さの話をしていたのに、急に面積が出てきたらわけわかりませんよね。どこの面積やねんと。
なので、cm2をcmに直すために、平方根をとります。分散にルートをつけるわけですね。

17.75 = 4.21cm

これが標準偏差です。偏差をいったん2乗してやって、それの平均をとってから平方根でもどしてやると。これも、平均や平均偏差と同じで、分布全体の性質です。



先に、分布全体の性質としての平均身長を出すことで、それと各人の身長を引き算して各人の偏差が出ました。
さて上で、また新しく分布全体の性質として標準偏差というものが出たわけですから、これと各人の性質である偏差を組み合わせて新しい数値が出ないでしょうか。こんな聞き方をするときは必ず答えはイエスですね。出るのです。それが標準得点というものです。
各人の偏差は単位がcmでした。「俺、平均より3cmも低かったわー」とかいえますね。ところで、講義のときにはセクハラになったらいかんと思って聞かなかったのですが、身長と一緒に体重も聞くことが(デリカシーのない、あるいは失うもののない教師には)できたかもしれません。聞いたとしたら体重は単位がkgですね。体重についても身長のときと同じやり方で、平均とか偏差が出せます。単位はkgです。「うわっ、平均より2kg重いやんけ!」とか叫んだりできるわけです。
さて、「平均より3cm低い」ということと、「平均より2kg重い」ということ。この二つの情報は、このままではそれ以上の情報を与えてくれません。単位が違うからです。そこで単位を消します。われわれはすでに標準偏差という数値を持っています。この標準偏差で、各人の偏差を割るのです。

-3.65cm ÷ 4.21cm = -0.87
-3.05cm ÷ 4.21cm = -0.72
-0.25cm ÷ 4.21cm = -0.06
+6.95cm ÷ 4.21cm = +1.65

偏差のcmを、標準偏差のcmで割っているので、計算結果は単位がなくなるわけです。これが標準得点です。標準偏差というのは平均身長から(日常言語的な意味で)平均何cmくらい離れているかということでしたから、自分の離れ方は高い低いどっちの方向にその何倍かを表したのが標準得点なわけですね。身長の標準得点が-0.87だというのは、平均身長よりも、標準偏差4.21cmの0.87倍低いということを意味しているのです。体重の方でも同じようにして標準得点を出せば、身長のそれと比較して何か言うことができるようになりますね。
この標準得点は、各人(各ケース)の性質、部分の性質です。



実は上の標準得点というのは、すでにみなさんにはお馴染みの数値なのです。高校まで何かと耳にまとわりつくあの偏差値です(大学に入るとびっくりするくらい耳にしなくなりますが)。偏差値というのは(「偏差」とごっちゃになりそうな、ものすごく紛らわしいネーミングですが)、標準得点を10倍して50底上げしたものにすぎません。実際上の出席者たちの偏差値を計算してみますとこうなります。

(-0.87) × 10 + 50 = 41.3
(-0.72) × 10 + 50 = 42.8
(-0.06) × 10 + 50 = 49.4
(+1.65) × 10 + 50 = 66.5

みなさんお馴染みの範囲に数字が来たのではないでしょうか。いうまでもなく、偏差値もまた、各ケースの性質です。
偏差値が50の人は、標準得点が0の人ですね。標準得点は各人の偏差を標準偏差で割ったものですから、標準得点が0ということは偏差が0ということです。偏差というのは平均値からの差ですから、それが0ということは平均値と同じということですね。つまり平均値をとる人は偏差値50です。
では偏差値が1増えるということはどういうことでしょうか。これは標準得点が0.1増えるということですね((x + 0.1) × 10 + 50 = (10x + 50) + 1)。これはその人の偏差が、標準偏差の1割増しになるということです。まああんまりいろいろいうとややこしくなるのでこのくらいで。



まとめると、まず各人の身長(ケースの性質)があり、その平均(分布の性質)を出すことで、それとの差として各人の偏差(ケースの性質)が出て、それの(日常言語的な意味での)平均を標準偏差(分布の性質)として出すことで、それとの比として各人の標準得点・偏差値(ケースの性質)が出たと、まあこういうわけでした。ちゃんちゃん。

若桑みどり『お姫様とジェンダー』

非常勤の行き帰りで。まあ一言でいうと駄本。なんで学生のレポートをいちいち読まされないかんのかとか、家父長制とか男性中心なんとかとかの概念があまりにも紋切り型で無内容とか、アニメである必然性がないとか、アニメの中でも何でディズニー?とか、章ごとの(=作品ごとの)論点の違いが何もないとか、単なる自分の大学の宣伝じゃねーか、といったことはさておいたとしても。
自分の教えた学生をほめたいという気持ちはよく分かる。私も、このブログの人文総合演習の記録では、たぶん他の人がみたら気持ち悪いと思うくらいほめている。ただそれは実際にほめられるような努力をしたからで、また一年生という条件下で私の期待を上回るような〈形式的な〉成果を出したからだ。形式的な成果というのは、要するに、自分にとっても発見で、対象文献を読んできた他の出席者にとっても発見であるようなこと(つまり文献を読んだだけではわからないようなこと)を報告しろ、という要求にこたえたということだが、もちろんそれがこの世界にとって新しい知の生産という意味での真の発見である必然性はないし、実際にそこまでの報告はない(演習では、そういう真の発見こそが学者の仕事であり、大学生の仕事はその「真似事」をすることだと繰り返し言っている)。だからそこはほめないし、本にして世界に発信するなんて考えもつかない。恥ずかしい思いをするのは学生自身だろう。
他方、学生をほめるということは、教えた自分を自慢するということでもある。私が演習のエントリを書いているのも、基本的には自慢である(自分の報告について世界に発信されることで学生が自覚を高めるのではないかという気持ちも多少ある)。この本の著者も、自分のジェンダー教育のおかげで、こんなにジェンダーコンシャスな学生が育ちましたよすごいでしょ、と自慢しているわけだ。
正直言うと、本書のもとになった講義は80年代に行われたのかと思った。実際は2001年度だったのだが、それくらい、学生の感想は古臭い紋切り型に満ちている。著者が講義でどんなことを言ったのかが大体透けて見える。私なら、こんな陳腐なレポートを延々読まされたら辟易するだろう(実際本書を読んで辟易した)。なんでこんなんで自慢できるのかと思う。自分の劣化コピーを生みだしてうれしいか? (そういうレポートを読まされるくらい苦痛なことはない、という主旨のことを上野先生がよく言っていたが、ほんとにそうだと私も思う。)
むかついて言葉があらくなってきたのでもうやめよう・・・あ、でもあと一つだけ。本書で著者は、若い女の子はディズニー映画というかお姫様話の刷り込みのせいで、白馬の王子様を待つだけの人間になってしまっている(が、自分の講義で目が覚めてよかった)と書いているけど、それ本気? 21世紀だぞ? だめ押しにもう一つ、学生は教員の価値観を察知してそれに合致するようなレポートを書くものだ(ダメな学生ほどそうだ)、という可能性は考慮したのかと。