Hatena::ブログ(Diary)

remcat: 研究資料集 RSSフィード Twitter

2016-03-31 図解:「妊娠のしやすさ」をめぐるデータ・ロンダリングの過程

【解題】高校保健副教材「妊娠しやすさ」グラフの適切さ検証: 人口学データ研究史を精査

2016年3月30日 東北大学から下記論文に関するプレスリリースを発表

田中重人 (2016)「「妊娠・出産に関する正しい知識」が意味するもの: プロパガンダのための科学?」『生活経済政策』230: 13-18.
http://tsigeto.info/16a

以下、内容について解題。最初にポイントをならべておくと、つぎのとおり:

  • 「妊娠のしやすさ」グラフの原典は早婚女性限定の「受胎確率」の変化を推定したもので、結婚からの時間経過による性行動変化と加齢の効果を混同している
  • 論文出版の翌年(1979年)にすでに批判があり、それへの反論はおこなわれていない
  • 「22歳ピーク」は原典のグラフにはなかったものであり、その後(1989年以降)のグラフ操作で作られた
  • 副教材公表当初の改竄グラフは吉村泰典内閣官房参与が作成したもの
  • 訂正後も、原典を不正確に写した別論文からの曾孫引きで不正確

問題の所在

高校保健副教材「妊娠しやすさ」グラフの適切さ検証
人口学データ研究史を精査

東北大学大学院文学研究科の田中重人准教授は、2015年の高校保健副教材 (文部科学省作成) の「妊娠のしやすさと年齢」グラフに関し、その元データを掲載した1978年の論文(1) とそれを引用した文献を網羅的に調べました。その結果、このデータは早婚の女性に限定して推定したものであり、結婚からの時間経過による性行動変化と加齢の効果とを混同している との専門家からの批判がある(2) こと、この批判への反論や再検証はないまま放置されてきたことがわかりました。また、副教材グラフは、原典の論文ではなく、それを不正確に写した別の論文からの曾孫引きであるために本来の値からはずれた曲線になっており、原典には存在しない「22歳がピーク」という印象 を作り出しています。このようなグラフを学校教材に採用するのは不適切と田中准教授は指摘しています。

この研究成果は『生活経済政策』230号に掲載されました。


〔強調とリンクは引用時に付加したもの。以下同様。〕

http://www.tohoku.ac.jp/japanese/2016/03/press20160330-02.html

この「妊娠のしやすさと年齢」グラフ問題というのは、2015年8月に文部科学省が出した副教材に変なグラフが載っていたというもの:

【背景】
高校保健副教材『健康な生活を送るために (高校生用)』改訂版 は、妊娠・出産に関する医学的・科学的知識をはじめて盛り込んだものとされ、2015年8月に公表されました。この教材には、「妊娠のしやすさと年齢」の関係を示すものとして、22歳をピークとして急激に下降するグラフが掲載されていました。これは1998年の論文からの引用とされていましたが、出典表示が不正確 であるうえに、曲線が改竄されていた ことが判明し、文部科学省は、年齢による変化がより緩やかなグラフに差し替えました。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

当初のグラフと差し替え後のグラフはそれぞれつぎのもの:
f:id:remcat:20160201171332p:image
http://web.archive.org/web/20150822025627/http://www.mext.go.jp/component/a_menu/education/detail/__icsFiles/afieldfile/2015/08/17/1360938_09.pdf

f:id:remcat:20160201171333p:image
http://www.mext.go.jp/component/a_menu/education/detail/__icsFiles/afieldfile/2015/09/30/1360938_09.pdf

この対応に対しては、差し替え後のグラフも不適切だとの指摘(毎日新聞2015年9月2日) があります。これに対し、日本生殖医学会は、このグラフは「長年用いられてきたグラフで」「適切である」とする 理事長コメント (2015年9月7日) を出しています。しかしこの議論は、グラフに批判的に言及した2次資料(3)(4) の断片的な説明しか参照しておらず、 原典資料 に基づいた議論はおこなわれてきませんでした。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

ちょっと信じがたい話だが、学会理事長名で「本会としてもこのグラフを推奨する」と主張したコメント で、そのグラフを導いた論拠となる論文を参照していないのである。文中に出てくる O'Connor et al. (1998) や Wood (1989) は批判すべき先行研究に言及する際にグラフを載せているだけで、データの性質と計算方法がわかるような説明はない。要するに、日本生殖医学会は、グラフの根拠を何も示さずに正当性だけ主張して、それが通ると考えたらしい。(この理事長コメントの問題点はほかにも山ほどあるのだが、今は省略。)

また、このグラフについては、内閣官房参与が副教材用に提供したものであること、同人が ウェブサイトや講演資料で使用 していたこと、日本産科婦人科学会などの学術団体が内閣府に「学校教育における健康教育の改善に関する要望書」を共同提出した際の参考資料に含まれていたこと (日本家族計画協会『家族と健康』732号) がわかっています。しかし具体的な作製過程について、同人は「誰が作製したのか分からないが、産婦人科では長年広く使われてきたグラフだった」と語ったと報じられており (毎日新聞2015年8月26日)、経緯は不明なままでした。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

ここで「このグラフ」というのは、 副教材に当初載った改竄グラフ のこと。「内閣官房参与」というのは、吉村泰典・慶應義塾大学名誉教授 (日本産科婦人科学会元理事長、日本生殖医学会元理事長、吉村やすのり生命の環境研究所 所長) のこと。問題の「妊娠のしやすさ」改竄グラフは、これまでに5点見つかっているが、それらすべてに吉村氏がかかわっている。特に、自身が所長をつとめる「吉村やすのり生命の環境研究所」サイトに載せた記事では、「22歳時の妊孕力を1.0とすると、30歳歳では0.6を切り」などと、改竄グラフ以上に数値の落ち込みを誇張した説明文つきである。これらの記事は、現在でも修正されることなくそのまま掲載されている。

本来なら、日本産科婦人科学会、日本生殖医学会等が調査委員会を設定し、また改竄グラフを教材を載せてしまった内閣府・文部科学省も責任の所在をきちんと追及すべきところであったはずだが、そうしたことは一切なされていない。有村内閣府特命担当大臣 (当時) は 2015年10月2日の記者会見 で「なぜこうなってしまったのかの経過を、私自身がやはり責任を痛感しておりますので、しっかりと御本人〔吉村氏〕から聞いて、そして陳謝を御本人もされていました」と述べている。しかし、そこで聞き取ったという「なぜこうなってしまったのかの経過」は、現在に至るまで公表されていない。

原典 (Bendel and Hua 1978) は何を推定したのか

【研究の内容】
田中准教授は、このグラフの元データ (図1) を算出した 1978年の人口学論文(1) と、 それを引用した文献23本 を網羅的に調べました。その結果、このデータの25歳以上の部分は、20代前半までに結婚した早婚女性に限定しての推定であるため、結婚からの時間経過による性行動変化を反映している可能性が高いことがわかりました。一般に、結婚から時間がたつにつれ、夫婦間の性交渉は不活発になります。このため、ある特定の年齢のときに子供ができる確率は、早く結婚した夫婦のほうが、遅く結婚した夫婦より低いのです。したがって、 早婚女性だけの分析では、加齢による受胎確率の低下を実態よりも大きく見積ってしまう ことになります。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

f:id:remcat:20160309184317p:image

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

図1に書き込んであるように、この原典 (Bendel and Hua 1978) は、台湾における1960年代の調査による結婚−妊娠間隔 (Jain 1969) と北米ハテライト (宗教的な理由から避妊と人工妊娠中絶を拒否してきたキリスト教フッター派の人々) の1950-60年代の年齢別出生率 (Sheps 1965) を主なデータとしている。台湾データの20-24歳の平均値を1.0とおいて、それを基準に、10代 (台湾) と25-47歳 (ハテライト) の1か月あたり受胎確率 (fecundability) を求めている。なお、この論文は Jean-Pierre Bendel と Chang-i Hua の連名であるが、Bendel が Carnegie-Mellon 大学に提出した博士論文 (Bendel 1978) にほぼおなじ内容のモデル推定が載っていることから、モデル構築と推定は Bendel 単独でおこなったものと考えてよいのではないかと思う。

24歳までの台湾データを利用した fecundability の求めかたについては d:id:remcat:20150915 を参照されたい。

25歳以降がハテライトの年齢別婚姻内出生率 (age-specific marital fertility rate: ASMFR) を利用した推計であるが、これはつぎの式によっている。

f:id:remcat:20160331153632p:image
Bendel and Hua (1978) p. 215 式 (11)。 赤線は引用時に付加したもの。〕

式 (11) 左辺の F が ASMFR であり、これが積分をふくむ右辺の式で求められることになる。この右辺の分母の中に入っている ρ*i が女性i の基準年齢 (20-24歳) 時の受胎確率で、ベータ分布にしたがうと仮定されている。その前にかかっている q というのが、年齢の効果を表す係数であり、最終的にこれを求めたいわけである。その他の記号の意味はつぎのとおり:

f:id:remcat:20160331153630p:image
Bendel and Hua (1978) p. 214。〕

問題は、これだけ未知パラメータがあるのにハテライトのデータからは F だけしかわからないというところ。当然この式はそのままでは解けない。そこで、強引にさまざまな制約を置き、(ハテライト以外の) さまざまな集団についての既存のデータから、パラメータの値を適当に代入していく。たとえば流産の確率 (式11では Q2) について、Bendel and Hua (1978: Table B.3) は年齢による影響はあまり受けないという理屈を立てて、年齢による増加があまりない数値を代入している。今日では、流産は加齢とともに急速に確率が上がるという説明が一般的で、吉村泰典氏も日本生殖医学会もふだんそう主張している (これが正しいのかどうかは私は判断できない) のだが、そういうのとは全然ちがう数値である。


さて、この式 (11) のFすなわち年齢別婚姻内出生率 (ASMFR) はハテライトのデータからえられるわけだが、ここでなぜか Bendel and Hua (1978) は、20代前半までに結婚した女性のデータだけに限定するのである。

f:id:remcat:20160331153631p:image
Bendel and Hua (1978) p. 220 Table B.1。赤線は引用時に付加したもの。〕

赤線部は「結婚時に25歳以下」ということなのだが、これは書きまちがいで、「結婚時に24歳以下」のはず。というのは、データ元である Sheps (1965: 68) の Table 2 は下記のようになっていて、Bendel and Hua (1978) はこの赤枠内の数値を使っているからである。(25歳時出生率のデータだけは、結婚時20歳未満だった女性のみ。それ以外は、結婚時に20歳未満だった女性と20-24歳だった女性の2列分を足して2で割っている。)

f:id:remcat:20160331153633p:image
Sheps (1965) p. 68 Table 2。赤線は引用時に付加したもの。〕

こうして求めた値は年齢ごとに不規則に上下するので、それを平滑化して「Smoothed ASMFR」(Bendel and Hua (1978: 220) Table B.1 の右側の列) を求め、それを先にみた式 (11) の F の値として使っている。

なぜ25歳以上で結婚した女性のデータを使わなかったかについて Bendel and Hua (1978) は何も述べていない (この論文は総じてそういう傾向があって、何をやったかは数式から正確にわかるのに、なぜそうしたかがわからないデータ操作が多い)。ともかく、この操作の結果として、年齢が上がるにしたがって新婚の人がいなくなり、結婚から長い年数が経過した人が増えていくデータを使っていることになる。(現代でもそうであるが) 新婚直後がいちばん夫婦仲がよく、時間がたつにつれて仲が悪くなったり疎遠になったりするので、性行動もそれにしたがって変化する。実際、データ元の Sheps (1965) の Table 2 (上記) やその前の Table 1 はあきらかにその傾向を示しており、Sheps 自身も論文中でそのことを指摘している。Bendel and Hua (1978) 推定の25歳以上の部分は、結婚からの年数経過による性行動の不活発化という要因の影響を受けているのであり、加齢による受胎確率の低下を過大に推定していることになる。

この問題点は、論文出版の翌年に専門家によって指摘されていました(2) が、それに対する反論や再検証はおこなわれていません。また、このデータ推定の過程には、ほかにも種々の問題がありますが、それらについては妥当性のチェックすらない状態です。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

当然のことながら、そんなことは専門家が読めばすぐわかるわけである。Bendel and Hua 論文出版の翌年 (1979年) には William H. James (1979) が Sheps (1965) を引いて上記とおなじことを指摘 し、40歳までの受胎確率低下の主要因は性交頻度の低下じゃないの、と書いている。下記の Wood (1989) なども基本的にこれと同じラインに乗った批判を展開している (ただし Sheps (1965) の元データには触れていない)。

でどうなったかというと、Bendel and Hua (1978) はその後ほとんど引用されていないのである。各種データベースで探せる引用文献は23本しかない。それらのほとんどは、先行研究のひとつとして簡単に紹介しているだけ。結果として、推定方法とデータ処理のさまざまな問題がほとんど検討されないまま放置されている。この時点で、学界内で批判にさらされて生き残った研究成果といえるようなものでないことはあきらかなのであって、高校生に限らず、一般向けに「科学的な知識」として紹介していいものではなかろう。

グラフがどのように改変されてきたか

しかも、教材のグラフは、この原典ではなく、それを加工して批判的に引用した 1989年の論文(3) のグラフを写した 1998年の論文(4) からの曾孫引きによるものです。 コピーされるたびに曲線が変形 してきた結果、このグラフは原典の推定値にほとんど重ならず、 本来データ上の根拠がない「22歳がピーク」という印象 を作り出しています (図2)。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

O'Connor et al. (1998) までに曲線が変形されていく過程は d:id:remcat:20150915 にまとめてあるので、そちらを参照されたい。どこまで意図的なのかはわからないのだが、どの段階でも、グラフが正確に写されてはいないのである。さらに、今回の問題が発覚して文部科学省が副教材の正誤表をつくったあとの段階で、また写しまちがい (というか横軸の目盛りの打ちまちがい) によるずれが発生している。なんで正確に写せないのだろうか。Bendel and Hua (1978) の表には小数第2位までの精度の数値が載っているのだから、そこから曲線を描きなおせばいいだけなのだが。

f:id:remcat:20160309184318p:image

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

ともかく、「女性の妊娠のしやすさは22歳がピーク」という今回流布してしまった言説には データ上の根拠は何もない ということを強調しておきたい。

以上のように、妥当性に問題がある人口学研究の推定値を不正確に写したグラフをさらに改竄して、22歳をピークに急激に低下していく印象を与えるグラフを、産婦人科・生殖医学の専門家が作り、政府に売り込んで高校生向け教材に載せた (図3)、というのが今回の事件の経過です。田中准教授は、このほかに、教材公表当初のグラフは内閣官房参与が自ら作成した、と本人が認めていた (市民団体の質問への回答 2015年12月) ことも指摘しています。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

吉村内閣官房参与の「市民団体の質問への回答」というのは、高校保健・副教材の使用中止・回収を求める会による「高校保健・副教材作製に関わった関連専門団体および有識者への質問状と回答」 のこと。この回答のなかで、吉村氏は、副教材に当初掲載されたグラフについて「当該グラフは当方が内閣府に提供したもの」と答えている。また 毎日新聞2015年8月25日の記事 に関して、「訂正後のグラフは、生殖医療関係の研究会や講演会などで使われていました。当初のグラフは当方の手違いにより誤ったグラフとなってしまい、大変申し訳ないと感じている」と答えている。つまり、22歳をピークに直線的に妊娠のしやすさが低下していく「当初のグラフ」は、それ以前から使われていたようなものではなく、吉村氏が作ったものだというのである。ちなみに、その「当初のグラフ」とは、本来は1歳刻みのプロットであった曲線から7つの点だけを抽出し、うち3つを内側に動かしてほぼ直線上にならべた というものであった。どのような「手違い」でこんなことが生じうるのか、ぜひ実演していただきたいものである。

図解:「妊娠のしやすさ」をめぐるデータ・ロンダリングの過程

結局、一連の事件の大雑把な見取り図は次のような感じになる。

f:id:remcat:20160309184319p:image

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

プレスリリース本文の最後は次のようになっている。これについては解説は不要であろう。

データ改竄は専門家の提供する「科学的知識」への信頼を揺るがします。それに加え、問題のあるデータを無批判に利用してきたこと、不正確な引用を繰り返してきたこと、そして原典資料と研究史のチェックを怠ってきたことは、この研究分野における根深い問題があることを示唆しています。

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

【文献】
(1) JP Bendel, C Hua (1978) "An estimate of the natural fecundability ratio curve." Social biology. 25(3): 210-227.
(2) WH James (1979) "The causes of the decline in fecundability with age." Social biology, 26(4): 330-334.
(3) JW Wood (1989) "Fecundity and natural fertility in humans." Oxford reviews of reproductive biology, 11: 61-109.
(4) KA O'Connor, DJ Holman, JW Wood (1998) "Declining fecundity and ovarian ageing in natural fertility populations." Maturitas, 30(2): 127-136.

http://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20160330_02web.pdf

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証