Hatena::ブログ(Diary)

remcat: 研究資料集 RSSフィード Twitter

2015-09-15 年齢−受胎確率曲線の文献間のちがいについて

「妊娠のしやすさ」改竄グラフに関連して、Bendel and Hua (1978: 216) の Fig 1 と Wood (1989: 77) の Fig 2.7 のちがいについて質問を受けたので、解説します。

問題の背景については、つぎの記事を参照:
http://synodos.jp/education/15125
http://www.academia.edu/15455914
http://d.hatena.ne.jp/remcat/20150904
http://d.hatena.ne.jp/remcat/20150823

関連する文献一覧

Bendel and Hua (1978) は何を計算したのか

Bendel and Hua (1978) が推計した fecundability (論文中では q という変数であらわされる) の図は、下記のようなものです。

  • 左側の4つの黒丸が、台湾の結婚−妊娠間隔のデータ (Jain 1969) から推計した16-19歳の値
  • 20-24の部分が黒い横棒になっているのは、この年齢範囲の fecundability の平均値 (台湾のデータ (Jain 1969) から推計) を1とおいたことを表す
  • 25-47歳の白い正方形は、北米ハテライトの、25歳までに結婚した人に限定した既婚者の年齢別出生率 (Sheps 1965) について、20-24歳の平均値 (=0.567) を1とおいた時の相対的な値
  • 25-47歳の黒い正方形は、この年齢別出生率にいろいろな仮定をおいた統計モデルをあてはめて導出したfedundability (やはり20-24歳時の値が1になるように調整)

なお、一目でわかるとおり、横軸の「50」の位置は相当右側にずれています。

Bendel and Hua (1978: 216) Fig 1 http://doi.org/10.1080/19485565.1978.9988340
f:id:remcat:20150915124506p:image

16-19歳についてqを導出する部分の重要なところを抜き出すと、以下のような感じです:

Bendel and Hua (1978: 212) http://doi.org/10.1080/19485565.1978.9988340
f:id:remcat:20150915124509p:image

Mt は年齢tで結婚してから妊娠するまでの月数の標本平均、M* は ( M20, M21, M22, M23, M24 ) の (各年齢の女性人数で重みづけした) 平均です。M* を Jain (1969) から求めてみると6.57、M16からM19はそれぞれつぎの Table 1 のようになっていました。

Bendel and Hua (1978: 213) http://doi.org/10.1080/19485565.1978.9988340
f:id:remcat:20150915124508p:image

Fecundability というのは1月間に受胎する確率のことです。受胎までに平均6.57月かかったとすると、1月あたりの受胎確率は 1/6.57 = 0.152 となります。上の Table 1 では、この値を1と考えたときの相対的な値が q = M*/Mt として計算されています:

16歳のとき: 6.57/11.7 = 0.56
17歳のとき: 6.57/10.4 = 0.63
18歳のとき: 6.57/ 9.2 = 0.72
19歳のとき: 6.57/ 8.7 = 0.76
(20-24歳): 6.57/6.57 = 1.00


25歳以降については、北米ハテライトについて Sheps (1965) が報告した婚姻内出生率 (ASMFR) をもとにした複雑な推計になっていますが、結局は、上記の M* (=6.57) をそのまま20-24歳の値として採用して (Bendel and Hua 1978: 215, 223-224)、q を求めています。
結果は下記のとおり:

Bendel and Hua (1978: 216) Table 2 http://doi.org/10.1080/19485565.1978.9988340
f:id:remcat:20150915124507p:image

これらの値が、Fig 1 にプロットされているわけです。

Wood (1989: 77) Fig 2.7

さて、以上の Bendel and Hua (1978) の計算結果を使ってグラフを描きなおしたのが Wood (1989: 77) の Fig 2.7 ということになるのですが、いったいどこがどう描きなおされているのでしょうか?

Wood (1989: 77) Fig 2.7
f:id:remcat:20150824180545j:image

Wood (1989) Fig 2.7 についての説明は、図のすぐ下の4行の注釈と、その下の本文 (8行目まで) しかありません。本文に書いてあることからわかるのは、

  • 25歳までは "estimates of fecundability are based strictly on the first birth interval" であるが、
  • それ以降は "estimated indirectly from birth intervals of all orders" である、

ということだけです。そこから推測するしかありません。

Bendel and Hua (1978) の推計では、台湾の Jain (1969) のデータから、結婚から第一妊娠までの間隔を直接測定していました。一方、北米ハテライトの Sheps (1965) のデータは、出生順位にかかわりなく、出生率から間接的に妊娠の間隔を推計していました。これらのことから、Wood (1989) がやったことは、Bendel and Hua (1978) が16-19歳についてしか推計しなかった台湾データの q を、20-25歳についても推計しなおしたということではないか、と見当がつきます。

実は、Jain (1969: 79) Table 3 まで戻ると、20-25歳の女性についても、結婚から出生までの間隔 (M) の値が得られます。

Jain (1969: 79) Table 3 http://doi.org/10.1080/00324728.1969.10406029
f:id:remcat:20150915124505p:image

これらの値を、Bendel and Hua (1978) にならって q = M*/Mt の式に代入すると、つぎの結果になります。

20歳のとき: 6.57/7.2 = 0.913
21歳のとき: 6.57/6.4 = 1.027
22歳のとき: 6.57/6.4 = 1.027
23歳のとき: 6.57/6.0 = 1.095
24歳のとき: 6.57/5.3 = 1.240
25歳のとき: 6.57/6.4 = 1.027

Bendel and Hua (1978) が計算した q にこの結果を追加してグラフを作成し、Bendel and Hua (1978: 216) Fig 1 に重ねたのがつぎの図です。もともと Fig 1 にあったデータについては、(あたりまえですが) ほぼ重なっています。

Bendel and Hua (1978: 216) Fig 1 に Jain (1969: 79) Table 3 から計算した 20-25歳の値を追加したもの
f:id:remcat:20150915165349p:image

×印が、追加した20-25歳のデータです。24歳まで増加して1.24に達し、25歳で1.027まで急降下するという極端な変動をみせています。なお、Jain (1969: 79) Table 3 からわかるとおり、24歳女性は72人、25歳女性は62人しかいないデータであることに注意。

これをどう Wood (1989) があつかったかというと……

Wood (1989: 77) Fig 2.7 に Bendel and Hua (1978: 216) Fig 1 と Jain (1969) の20-25歳データを重ねたグラフ
f:id:remcat:20150915165350p:image

この図をみるに、

  • Bendel and Hua (1978: 216) が一律 q=1 とした年齢範囲 (20-24歳) のうち、20歳については Jain (1969) から計算できる値に近い点を採用
  • 22歳については q=1 とする
  • 16-19歳および25-47歳については、Bendel and Hua (1978: 216) の q 推計値をそのまま採用

ということだったのではないかという気がします。(つまり、Jain (1969) の元データからは結局20歳の1点しか使わず、21歳、23歳、24歳は飛ばして直線で結んでいる。)

Wood (1994: 322) Fig 7.5

これと見た目のよく似た図が Wood (1994) の本に出てくるわけですが、Wood (1989) から作成したとは書いてありません (巻末の文献一覧には Wood (1989) は出てきます)。

Wood (1994: 322) Fig 7.5 https://books.google.co.jp/books?id=I0_SrDBNy24C&pg=PA322
f:id:remcat:20150915125627p:image

Wood (1998: 77) のFig 2.7 とみくらべると、曲線が滑らかになっている感じですね。
なお、318頁の注7に、Wood (1989: 77) に出ていたのと同様の注釈があります:

Wood (1994: 318) Note 7 https://books.google.co.jp/books?id=I0_SrDBNy24C&pg=PA318
f:id:remcat:20150915125626p:image

これを、上記の Bendel and Hua (1978: 216) プラス Jain (1969) の20-25歳データに重ねてみると、つぎのような感じです。

Wood (1994: 322) Fig 7.5 に Bendel and Hua (1978: 216) Fig 1 と Jain (1969) の20-25歳データを重ねたグラフ
f:id:remcat:20150915165348p:image

Wood (1998: 77) Fig 2.7 とおなじ点を結んでつくられたとみてよさそうです。

O'Connor et al. (1998: 131) Fig 3

O'Connor et al. (1998: 131) Fig 3 は、Wood (1989) から "Redrawn" した、とあります。

O'Connor et al. (1998: 131) Fig 3 http://doi.org/10.1016/S0378-5122(98)00068-1
f:id:remcat:20150904063808p:image

これに先ほどまでと同様、Bendel and Hua (1978: 216) プラス Jain (1969) の20-25歳データに重ねたのがつぎの図:

O'Connor et al. (1998: 131) Fig 3 に Bendel and Hua (1978: 216) Fig 1 と Jain (1969) の20-25歳データを重ねたグラフ
f:id:remcat:20150915165351p:image

これはかなりずれています。特に

  • 22-25歳の間がほぼ平坦
  • 25-32歳あたりが Bendel and Hua (1978: 216) の推定値よりかなり上方にある

の2点は重要な相違でしょう。この相違がどこからきたかはよくわかりません。(なお、Wood (1994: 322) Fig 7.5 と O'Connor et al. (1998: 131) Fig 3 がずれていることについては、すでに https://twitter.com/ottwo/status/635438913495011328 で2015-08-23に指摘されていました。)

全部重ねてみると

Wood (1989, 1994) と O'Connor et al. (1998) の3枚のグラフに、Bendel and Hua (1978: 216) プラス Jain (1969) の20-25歳データを全部重ねてみると、つぎのような感じです:

f:id:remcat:20150915165347p:image

Wood (1989, 1994) はほぼ重なり、Bendel and Hua (1978) による推計データの値がほとんどそれらに近い位置にあるのにくらべ、O'Connor et al. (1998) のグラフはかなりはずれていることがわかります。