ひきこもり疫学調査

「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)についてのメモを、過去の日記で書いたものといっしょに2004-04-07の日記にしました。今回あらたに書いた部分は id:matuwa:20040407#p5 から最後まで。

記述内容のまちがいに気づかれた方、コメント等でお教えください。

ひきこもり疫学調査についての個人的メモ

  1. 研究要旨からわかること id:matuwa:20040407#p2
  2. 対象者本人のひきこもり経験 id:matuwa:20040407#p3
  3. 対象者の子のひきこもり状態 id:matuwa:20040407#p4
  4. 母集団と標本 id:matuwa:20040407#p5
  5. 調査結果についての注意点(1) id:matuwa:20040407#p6
  6. 調査結果についての注意点(2) id:matuwa:20040407#p7
  7. まとめ id:matuwa:20040407#p8 ←面倒な方は、ここだけお読みください

1.研究要旨からわかること

『「心の健康問題と対策基盤の実態に関する研究」分担報告書』には、ひきこもりに関する報告がいくつか含まれています*1。そのなかでも、とくに「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)がおもしろそうです。おもしろそうだけど、分析結果の表やグラフが一切なく文章を読まないと内容がわからないという、ものぐさなわたしにとって非常に面倒くさい報告書でもあります。

「地域疫学調査による「ひきこもり」実態調査」について、報告書のはじめにある「研究要旨」からわかることを、いくつか抜き出してみます。

  • 平成14年度に「ひきこもり」経験に関する面接調査を実施
  • 調査対象は岡山県・鹿児島県・長崎県の20歳以上の一般住民から無作為抽出された1646人(協力率56.4%)
  • 20〜40歳台の690人のうち9人が過去に「ひきこもり」経験あり
  • 「ひきこもり」状態の子がいた世帯は、全1646世帯中14世帯(0.85%)
  • この0.85%を全国総世帯数にかけると41万世帯になる
  • この41万世帯は、ひきこもり「ライフタイム経験率」の下限値と考えるのが妥当

「研究要旨」しか読んでいませんが、やっぱり一番ひっかかるのは「全国で41万世帯」の妥当性です。この妥当性を検討するためにも、面倒でもちょっとずつ本文を読みすすめながら、この疫学調査についてまとめてみましょう。

*1:調査対象者向けの「こころの健康に関する疫学調査の実施方法に関する研究」を読めば、この調査研究の概要をつかむことができます。たとえば、この調査が WHO の World Mental Health(WMH)プロジェクトの一環であること、WMH 日本調査の研究事務局が国立精神・神経センター精神保健研究所の精神保健計画部にあることなどがわかります。

2.対象者本人のひきこもり経験

「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)の調査対象者は、岡山県・鹿児島県・長崎県の20歳以上の一般住民から無作為抽出された1646人です。とりあえず、この調査における「ひきこもり」の定義を質問文で確認し、その質問文に関連した調査結果をみることにします。

まず、対象者本人のひきこもり経験について。つぎのような質問文です。

これまでに、仕事や学校にゆかず、かつ家族以外の人との交流をほとんどせずに、6ヶ月以上続けて自宅にひきこもっていた時期がありましたか。(時々買い物などにでることはかまわないとする)

この質問文から「仕事や学校にゆかず、かつ家族以外の人との交流をほとんどせずに、6ヶ月以上続けて自宅にひきこもってい」る状態として「ひきこもり」が定義されていることがわかります。

ひきこもり経験については、20歳台から40歳台の690人の対象者にだけ質問しています。その690人のうちひきこもり経験ありは9人(1.30%)でした。

その9人について、性別、ひきこもり開始年齢、ひきこもり期間などを表にしてみました。

ひきこもり経験者の性別 人数
男性 8人
女性 1人
──男性のほうがおおいのは予想どおりでしょうか。

ひきこもり開始年齢 人数
10-14歳 2人
15-19歳 3人
20-24歳 1人
25-29歳 1人
40-44歳 1人
不明 1人
──40歳台の1人は数年前に職を失ったことによるひきこもり事例であり、「この例はいわゆる思春期青年期のひきこもりとは質を異にする可能性がある」と報告書では説明されています。

ひきこもり期間 人数
6ヶ月 2人
8ヶ月 1人
1年 3人
2年 1人
2年半 1人
不明 1人
──ひきこもり期間が8ヶ月の1人が、さきほどの失業による40歳台のひきこもり事例にあたります。

3.対象者の子のひきこもり状態

つぎに「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)からわかった、調査対象者の子どものひきこもり状態について確認します。質問文はつぎのとおり。

あなたの子供のうちで、現在、仕事も学校もゆかず、かつ家族以外の人と交流せず、6ヶ月以上自宅にひきこもっているお子さんがいますか。

この質問にたいして、現在「ひきこもり」といえる状態にある子どもがいると回答したのは14人でした。ひきこもり状態にある子の年齢についても表にしてみました。

ひきこもり状態にある子の年齢 人数
15-19歳 1人
20-24歳 2人
25-29歳 3人
30-34歳 2人
45-49歳 1人
不明 5人
──報告書では、子どもの年齢「不明」の5人について親の年齢から子の年齢を推測しています。その推測結果をふまえて「14人中20歳台までが8人、30歳台以上が6人となる」という結論をだしています。

さて、ここまで表にあげたような調査結果からどんなことがわかるでしょうか。報告書では、対象者本人のひきこもり経験の調査結果と対象者の子どものひきこもり状態の調査結果を比較して、つぎのように考察しています。

過去の経験としてのひきこもりの問題が起こる年齢層としては、10歳台から20歳台が多かったが、現在「ひきこもり」状態にある子どもでは、それ以上の年齢層においてもひきもりといえるような状態を示しているものが少ないとは言えない。

30歳をこえてもひきこもり状態をしめす例がふえている、つまり「ひきこもりの長期化」といえるような事態がおこっているのではないか、このように考察しているわけですね。

この調査は岡山県・鹿児島県・長崎県の1646人を対象にしたものでした。では、この考察も調査対象となった1646人についてしかあてはまらないのでしょうか。いいえ、報告書を書いた研究者はそのようにかんがえていません。報告書に「全国の『ひきこもり』のいる総世帯数」といった言葉がみられることからもわかるように、この研究者は岡山・鹿児島・長崎の1646人を対象にした調査にもとづいて全国レベルのお話をしています。

では、この「全国レベルのお話」にどれくらいの根拠があるのでしょうか。

4.母集団と標本

疫学調査をはじめとする「調査」の目的とはなんでしょうか。調査ではデータを取りあつかいます。そしてデータを取る目的は、そのデータが出てきたもとの集団について推測するためという場合がおおい。統計学では、この目的を強調するために、推測をしたいモノの集まりを母集団、母集団の推測をするために母集団から取り出されるいくつかのモノを標本(サンプル)といいます。

標本から母集団について推測するためには、標本は母集団からランダムに取り出さないといけません。「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)の「研究要旨」のなかに「調査対象は岡山、鹿児島、長崎3県で20歳以上の一般住民から無作為抽出された1646人」という表現がありますが、これを「母集団、ランダム、標本」という用語をつかって言いかえると……、

  • 「岡山、鹿児島、長崎3県で20歳以上の一般住民から」=母集団から
  • 「無作為抽出された」=ランダムに取り出された
  • 「1646人」=標本

このようになります。つまり調査対象は「母集団からランダムに取り出された標本」だということです。このように標本が無作為抽出によって母集団から取り出されているので、「地域疫学調査による『ひきこもり』の実態調査」では標本から母集団について推測することが可能です。

わたしが気になっているのは、この「地域疫学調査による『ひきこもり』の実態調査」の結果からみちびきだされた「全国で41万世帯にひきこもりが存在する」という全国レベルの結論の妥当性でした。調査の報告書を読んで、この全国レベルの結論について注意すべき点が2点あるのではないかと感じています。これらの注意点について、標本から母集団について推測するプロセスを具体的に確認しながら説明していきます。

なお、この調査では「対象者本人のひきこもり経験」と「対象者の子どものひきこもり状態」のふたつが質問がありますが、標本から母集団を推測するための統計的方法は共通しているので、ここでは「対象者の子どものひきこもり状態」の調査結果だけ取りあげることにします。

5.調査結果についての注意点(1)

「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)で、ひきこもり状態の子をもつ調査対象者は1646人中14人であることは、さきに確認したとおりです。この調査結果について、報告書では、対象者個人ではなく「世帯」を対象とした調査と解釈しています。この解釈の根拠はふたつの事実です。

  1. ひきこもり状態の子ありの全例で、そのような状態の子は1人だけ
  2. 調査対象数は調査対象世帯数と同数

これらを根拠にして、さきほどの「ひきこもり状態の子をもつ調査対象者は1646人中14人である」という調査結果を、

1646世帯中14世帯にこのような問題をもつ子ども〔=ひきこもり状態の子〕が存在するといってよいだろう

と報告書では読みかえているわけです。

このようにして「ひきこもり状態の子が存在する世帯は、1646世帯のうち14世帯」という調査結果が得られました。この結果は、母集団から取り出された1646世帯、つまり母集団の一部である標本のデータからわかった調査結果です。ただし、ここで注意しなければならないのは、この1646世帯という標本は母集団からランダムに取り出された標本だったことです。ランダムに取り出された標本では、その標本のデータから母集団について推測することが可能です。では、どんなふうに推測するのでしょうか。

とりあえず簡単な計算をしてみましょう。1646世帯の標本のうち14世帯にひきこもり状態の子が存在するのですから、14を1646で割ると「14÷1646=0.0085」ということで、標本における「ひきこもり状態の子がいる世帯の比率」は0.0085(0.85%)になります。このとき母集団における「ひきこもり状態の子がいる世帯の比率」も0.0085(0.85%)であると推測するのは妥当なかんがえかたです。報告書でも0.85%という率が採用されているのは、このような標本から母集団への推測がおこなわれているからです。

報告書では、この0.85%を平成14年度の日本の総世帯数にかけることで約41万世帯という数字をみちびきだして、ここから「全国で約41万世帯にひきこもりが存在する」という結論につなげています。しかしここで注意するべきことは、

  • この疫学調査の母集団は、全国の成人ではない

という点です。

標本を取り出した母集団は「岡山、鹿児島、長崎3県で20歳以上の一般住民」でした。この事実を厳密にとらえるならば、標本からわかった「ひきこもり状態の子がいる世帯は0.85%である」という調査結果は、いくら統計的方法で推測をおこなっても、その調査結果は「岡山、鹿児島、長崎3県で20歳以上の一般住民」という母集団にしか妥当しない。つまり「岡山、鹿児島、長崎3県で20歳以上の一般住民」という母集団からランダムに取り出された標本にもとづいて全国レベルの結論をみちびきだすことは──統計的方法を厳密に適応するならば──根拠のない想像にすぎない、ということになります。

もちろん報告書の執筆者も、このような統計学の初歩的な問題点に気づいているはずです。そのような問題点に気づいているからこそ、報告書の「D. 考察」で「本調査の問題点」として「調査地域が西日本に偏っており、また大都市部が含まれていないこと」をあげているわけです。そして、このように調査の標本に大都市部の居住者がふくまれていないこと、そして調査の協力率が56.4%だったことから「今回の推定値は、実際の値より低めに出ている可能性が考えられる」と考察しています。つまり、実際には全国で約41万《よりもさらに多くの》世帯にひきこもりが存在するのではないか、このように報告書は主張しているわけです。

6.調査結果についての注意点(2)

さて「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)について、もうひとつの注意点も説明しておきます。

さきほど、標本における「ひきこもり状態の子がいる世帯の比率は0.0085(0.85%)」というデータから、母集団における「ひきこもり状態の子がいる世帯の比率は0.0085(0.85%)」であると推測しました。しかしながら、標本の世帯比率=0.0085というひとつの値だけで母集団における世帯比率のような値を推定する場合、母集団についての推定値が完全に正しいことを期待するのは無理があります。そのような推定は、母集団における真の世帯比率はこの推定値の近くの値である、このような意味で理解したほうが実際的です。そのような標本から母集団への推測方法を、統計学では区間推定とよびます。

区間推定では、標本から区間を計算して「母集団に関する真の値はこの区間のなかにある」というような推測をおこないます。この報告書でも区間推定がおこなわれています。たとえば、母集団における「ひきこもり状態の子がいる世帯」の割合についての区間推定の結果について、報告書ではつぎのように表記しています。

0.85%(95%信頼区間 0.41%〜1.29%)

まず最初の「0.85%」は、さきほど説明したように、標本における「ひきこもり状態の子がいる世帯率=0.85%」から推測した、母集団における「ひきこもり状態の子がいる世帯率」の推定値です*1

それでは「95%信頼区間 0.41%〜1.29%」はどういう意味でしょうか。これは、95%の確率で、母集団における「ひきこもり状態の子がいる世帯の割合」が0.41%〜1.29%という区間のなかに含まれる、という意味です。標本からわかった世帯率=0.85%という値だけで母集団に関する真の値を推測するのは無理がある。そこで区間推定をおこなったところ、母集団における世帯率が0.41%〜1.29%という区間に含まれる確率が95%だとわかった、ということです。また、この信頼区間(0.41%〜1.29%)のちょうど中間地点に推定値(0.85%)があることから、推定値の近くにある値として母集団における真の世帯率が推定されていることが確認できます*2

日本の総世帯数に0.85%をかけた「約41万世帯」という数字を紹介しましたが、この日本全国のひきこもり状態の子が存在する世帯の数についても報告書では区間推定をおこなっています。その推定結果として、

95%信頼区間は概ね20万〜63万となる

このように報告されています。

この区間推定の結果から注意しなければならないことは、

  • 全国でひきこもりの子がいる世帯数の推定には、かなり誤差が含まれている

という点だとおもいます。ひきこもりの子がいる世帯数は全国でおよそ20万〜63万世帯、このようにおよそ43万世帯の誤差がこの推定では考慮されているのです。

この疫学調査の調査結果としては、「全国で約41万世帯」あるいは「全国で約41万世帯以上」という数字がひとり歩きしてしまいがちですし、報告書も「約41万世帯」という数字を前面に出している印象をうけます。しかし、この区間推定の結果によれば、全国でひきこもりの子が存在する世帯は41万世帯よりも少数の20万世帯であってもおかしくないわけです(もちろん、41万世帯よりも多い63万世帯かもしれない)。さらに、もう一度くりかえすならば、この調査の母集団は日本の全成人ではないので、このような全国レベルの世帯のお話には厳密な意味での統計学的な根拠が欠けていることも注意しておかなければならないでしょう。

*1:このようなひとつの値だけによる推定は、区間推定に対して点推定とよばれています。

*2:区間推定の計算は、ちょっと複雑なので注にしておきます。標本比率:p、標本数:n のとき、真の母集団比率は95%の確率でp \pm 1.96\sqrt{p(1 - p)/n} の中にあります。今回の「ひきこもりの子が存在する世帯率」の場合、p=0.0085、n=1646なので、これらの値を代入すると 0.0085 \pm 1.96\sqrt{0.0085(1 - 0.0085)/1646}、これを計算すれば95%信頼区間が「0.0041〜0.0129」になることが確認できます。この計算式をみれば、信頼区間の真ん中が点推定値であることがわかります。

7.まとめ

「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)の調査結果について注意すべきことは、以下の2点です。

  1. この調査の母集団は全国の成人ではありません。だから「全国で約41万世帯以上にひきこもりの子が存在する」という調査結果は、厳密にいうと統計学的根拠が欠けています。この調査結果には研究者の想像による推論が含まれていることを理解しておきましょう。
  2. 区間推定によれば「全国でひきこもりの子がいる世帯数は、およそ20万〜63万世帯(95%信頼区間)」と報告されています。このように世帯数の推定ではかなりの誤差が実際は考慮されていることを理解しておきましょう。

これら注意すべき点「1.」と「2.」について、個人的な意見を述べておきます。

まず「1.」について。これは、たとえ統計学的に無意味な主張であっても、その主張が学問的に無意味であるとはかぎらない、そんな事実をおしえてくれます。つまり、すくなくとも疫学(公衆衛生学?)の分野では、全国レベルの母集団からランダムに取り出された標本でなくとも、その標本から全国レベルのお話を展開することが慣習的に許されているのだろうなあ、ということです(そのような標本の限界を研究者は自覚し、その限界について最低限の説明が必要なのでしょうが)。

そして「2.」について。たとえば、テレビの視聴率は、母集団からランダムに取り出された標本から推測されています。しかし「○○という番組の視聴率は10%でした」という調査結果は新聞・雑誌などに掲載されているけれども、「○○という番組の視聴率の95%信頼区間は7.6%〜12.4%でした」という区間推定の結果を目にすることがない。区間推定の結果を見たり聞いたりすることがないため、わたしたちは調査の誤差について意識することがほとんどありません。だから、ひきこもりに関する疫学調査でも「20万〜63万世帯」という区間推定の結果でなく「41万世帯」という数字のみがひとり歩きするのは仕方がないかなあ、と感じています。

「地域疫学調査による「ひきこもり」の実態調査」が、ひきこもりに関する貴重な調査であることは、まちがいありません。では、どんな点に注意して報告書を読めば、その貴重な調査結果についての理解をふかめることができるだろうか……こんな個人的な試行錯誤の結果をメモとして公開してみました。