マラソンの最適ペース配分

ラソンの本当のスタートは30kmから。正念場は35km以降。
これがフルマラソンの実感です。
スタート直後は元気でも、25kmあたりから次の1kmがやたらと遠くなってきて、30kmから先は足が上がらなくなる。
35kmから先は、もう泣きそう。。。とにかく、後に行けば行くほど辛くなる。
それを見越して、マラソンでは後半にいかに体力を残しておくか、ペース配分がとても重要になります。
たとえば目標タイム4時間だったなら、平均して 5km あたり 28分ちょっとで走ればよい、という勘定になるのですが、
実際には後半にペースが落ちてくるので、最初はもっと早くなければ目標タイムに達しないでしょう。
後半のペースダウンまで考慮に入れて、いったいどの位で走れば目標タイムに到達できるのか。
それを知るのに、うってつけのデータがあります。
先日行われた、東京マラソン2013の、約3万5千人のラップタイムです。

東京マラソンの 5kmごとの通過タイムは、各ランナーごとにネット上に公開されています。
例えば、1位 キメット デニス のタイムは以下にあります。
>> http://p.tokyo42195.org/numberfile/1.html
これらのページを読み取って、各ランナーのペース配分を調べてみました。

まず、完走した全ランナーのゴールタイムは、こんな風になっていました。

このグラフは、ゴールタイム別に人数を数え上げたヒストグラムです。
(ゴールタイムは、nettime = スタートの遅れ時間を差し引いた実質的な走行時間となっています)
横軸は、0を2時間として、1目盛りが10分間隔です。例えば目盛り7は 3:00〜3:10 を表しています。
青が男子、オレンジが女子。
人数はそれぞれ、
 男子 : 27824 人
 女子 : 7004 人
 合計 : 34828 人
  ・完走していなかった(ゴールタイムの無かった)データは除外
  ・一部のランナーにはnettimeが無かったので除外(たぶん計測もれ)
  ・車イス部門は除外
  ・ネットから読み取れなかったデータがある

グラフを見ると、男子のピークは大きく2つあることが分かります。
1つ目のピークは 4:00〜4:10 の領域、2つ目は 4:50〜5:00 です。
女子の方は、男子に比べるとやや右側(遅い側)にまとまっています。
また、女子のトップランナーは女子の平均から見れば大きく突出している、と言えます。(左側のしっぽが長い)
女子のトップは2時間1桁台(目盛りの1番目)ですが、それに続く目盛りの2番目、3番目は0人でした。
(男子のトップグループは、目盛りを追うごとに一律に増えています。)
男子の平均は 4:36:40 、
女子の平均は 5:03:57 、
全体の平均は 4:42:10 でした。

さて、ペース配分についてですが、今回は「平均速度」「ペースの落ち方」という2つの数値で考えてみました。

このグラフは、私自身の通過タイムです。
横軸が時間(秒)、縦軸が距離(Km)、5kmごとの通過タイムと、ゴールタイムがプロットされています。
グラフ中の青い線は、通過タイムに直線をあてはめたものです。
一方、赤い線は、通過タイムに二次曲線をあてはめたものです。
二次曲線というのは、一次の項が「平均速度」を、二次の項が「ペースの落ち方」を表します。

  (距離) = (平均速度) x (時間) + (ペースの落ち方) x (時間)^2

つまり、「ペースの落ち方が一定である」としてあてはめたのが、赤い曲線です。
こうして見ると、赤い曲線は実データにほぼぴったり一致していることが分かるでしょう。

二次曲線への当てはめは、R言語を用いました。
以下のようにして計算します。

# group1に距離データ(Km)を入力
> group1 <- c( 0.0, 5.0, 10.0, 15.0, 20.0, 25.0, 30.0, 35.0, 40.0, 42.195 )
# group2にタイムデータ(秒)を入力
> group2 <- c( 0.0, 1551.0, 3047.0, 4570.0, 6156.0, 7774.0, 9534.0, 11430.0, 13478.0, 14387.0 )


# まず、直線へのあてはめを行ってみる
> result1 <- nls( group1 ~ A*group2, start=c(A=0), trace=T)
6880.418 : 0
9.775715 : 0.00304483


# 次に、二次曲線へのあてはめを行ってみる
> result2 <- nls( group1 ~ A*group2 + B*group2^2, start=c(A=0, B=0), trace=T)
6880.418 : 0 0
0.3064999 : 3.485183e-03 -3.787300e-08


# グラフに表示する
> plot( group2, group1 )
> lines( group2, fitted(result1), col="blue")
> lines( group2, fitted(result2), col="red")



3万5千人ものデータの中には、極めて一定ペースで「まっすぐに走る人」たちがいました。
例えばこのランナー、まるで機械で測ったようにイーブンペースです。

このデータに二次曲線を当てはめようとすると、二次の項「ペースの落ち方」が小さすぎて計算エラーになってしまいます。

> group1 <- c( 0.0, 5.0, 10.0, 15.0, 20.0, 25.0, 30.0, 35.0, 40.0, 42.195 )
> group2 <- c(0.0, 1476.0, 2940.0, 4392.0, 5852.0, 7316.0, 8800.0, 10265.0, 11738.0, 12361.0)
> result2 <- nls( group1 ~ A*group2 + B*group2^2, start=c(A=0, B=0), trace=T)
6880.418 : 0 0
0.008521979 : 3.414125e-03 -2.830771e-10
0.008521979 : 3.414125e-03 -2.830773e-10
以下にエラー nls(group1 ~ A * group2 + B * group2^2, start = c(A = 0, B = 0), :
step 因子 0.000488281 は 0.000976562 の 'minFactor' 以下に縮小しまし

こういった場合には、二次曲線ではなく、単純に直線を当てはめました。(二次の項=0とした)
ちなみに、上の例は 32bit版R言語だとエラーになりますが、64bit版R言語だとエラーになりません。
こんなところに精度の差が出るのですね。

こうして計算した3万5千人の「平均速度」と「ペースの落ち方」をまとめたのが、下のグラフです。
まずは「平均速度」。

平均速度は、中心が左側(遅い側)に寄っていて、右側(早い側)に裾野が広がっている分布となりました。
一部のトップランナーが群を抜いて突出している、ということです。
理屈で言えば、この(平均速度のグラフ形状)=(ゴールタイムのグラフ形状) になってもよさそうですが、
見たところ必ずしも一致してはいません。
ということは、次の「ペースの落ち方」が影響しているわけです。

ペースの落ち方は、ほぼ左右対称のきれいな分布にまとまりました。
左右の細長い裾野は、稀に極端にペースが落ちる人と、反対にペースが上がる人も居る、ということを示しています。

ペースの落ち方の、中央部を拡大したグラフ。
黒い線を入れたところが、ペース落ち0のライン。
この線より右側が後半にペースアップした人、左側がペースダウンした人、ということです。

ペース配分の傾向は、トップランナーと遅い人で差があるのでしょうか。
「平均速度」と「ペースの落ち方」を、ゴールタイム階層別に集計してみました。
以下のグラフは、ランナーをゴールタイム30分区切りで階層に分けて、
各々の階層について「平均速度」と「ペースの落ち方」の平均をとったものです。
まず「平均速度」から。

当然ながら、速い方が平均速度が高い。(グラフは反比例の曲線に乗っている)

重要なのは「ペースの落ち方」のグラフです。

まず意外だったのが、ペースの落ち方が最も激しいのは、2:00〜2:30 のトップランナーグループだったということです。
(グラフの下になるほど落ち方が激しい。)
たぶん、トップランナーは本当にのるかそるかの勝負をしていて、
わずかの不調で急激にペースダウンしてしまうのではないでしょうか。
最もイーブンペースに近かったのが 3:00〜3:30 のグループ。
それよりも早くても、遅くても、落ち方は大きくなる傾向が見られます。

以上の落ち方の傾向から、私は次のように考えました。
「3:00まではペース配分を均等に近づけることによってタイムアップが狙える。
 そこから先は、危険を冒してオーバーペースに挑まないと速くなれない。」

3:00までは、速くなるほどペース配分が均等に近づく傾向があります。
つまり目標タイム3:00まではイーブンペースを意図した方が良い、というわけです。
3:00よりも速くなると、ペース配分に失敗して途中で失速するランナーが目立つようになります。
つまり、3:00以内のランナーは「健康マラソン」ではなく「勝負マラソン」を走っているというわけです。

ペース落ち方の傾向を探るべく、[ゴールタイムxペースの落ち方]の散布図を男女別に描いてみました。


上が男子、下が女子。
点の塊が、左側に向けて「ラッパ型に開いている」ことが見てとれるでしょう。
どうやら上位ほど落ち方の開きが激しい、つまり「勝負傾向」があるようです。
ゴールタイムと落ち方の間に、あまり明確な依存性は見られません。
上位ほど、ややイーブンに近いかな、といった程度です。
相関係数をとると、男子:-0.08, 女子:-0.19と、ほぼ無相関といった値です。)

さて、当初の目的であった、マラソンの最適ペース配分ですが、
上の「ペースの落ち方」に基づいて、次の2種類を掲げておきます。

【1】平均ペース
東京マラソン全体での「ペースの落ち方」の平均は、ほぼ -2.00E-08 でした。
この平均の落ち方に基づいて作成したのが、以下の表です。

この表によれば、
・目標タイム3:00なら、最初の 5kmを 20分で、
・目標タイム4:00なら、最初の 5kmを 26分で、
・目標タイム5:00なら、最初の 5kmを 31分で、
走るのが平均的なペースだということです。

【2】イーブンペース
最も「ペースの落ち方」が少なかった、3:00〜3:30 のグループの値は、ほぼ -1.50E-08 でした。
この「目指すべきイーブンペース」に基づいて作成したのが、以下の表です。

目標タイム3:00といったベテランは、こちらのイーブンペースを目標にすべきでしょう。

【1】平均ペースをグラフにすると、こんな風になります。

体感的には、後半でものすごくペースダウンしているように感じられるのですが、
実際グラフにすると、ほんのり上向きカーブ、といった程度なのですね。