バックアップ世代の数え方

しばらく休んでしまいました。1週間ぶりのストレージブログです。
前回のバックアップエンジニアの基礎知識に続いて、第2弾としてバックアップ世代の考え方をまとめてみたいと思います。


バックアップを取得するときにバックアップを取りたいデータの容量も重要です。元のデータが何GB、何TBあるのかで様々な方法が考えられ、保存先のメディアも考えなければなりません。しかし、本当に重要なのはそのデータを何日分保存するのか、言い換えれば、何日前までの状態に戻せば良いのかということです。


毎日更新が入るようなデータであれば2,3日分バックアップを取れば十分でしょう。1週間前のデータを取っておいても毎日更新がかかっているようなデータであれば1週間前のデータを戻すことのほうが、手間になるかもしれないですし、ビジネスのリアルタイム性が失われるかもしれません。

逆に、毎週末にバッチジョブが流れることでデータの更新がかかり、前月のデータと比較しないといけないようなデータ、例えば毎月末の決算データなどは毎週更新がかかり前の月のデータが必要ということは、最低でも5週間分の週末データが必要になります。


世代の考え方ですが、1世代という言い方をした場合、実はバックアップを保存するために必要な容量は2世代分必要なのです。バックアップ取得中のことを考えてください。バックアップは指定された場所にデータが取得されます。1世代の容量しかない場合は、同じ場所に上書きされます。もし、バックアップ取得中に不具合が発生してしまったら、元のデータは残っていません。上書きされるということは不具合が発生するまでの間はデータが上書きされてます。中途半端な上書きがあるような状態で、元のデータが残っているはずがありません。この状態を防止するために1世代といっても前回正常取得されたデータは残しておきたいという思いから、1世代分データを保存する容量に余裕を持つことが重要です。

1世代 → 元データ量x2倍
2世代 → 元データ量x3倍 ・・・

という計算をして、それぞれの世代分バックアップを残すために必要な保存先容量を計算するようにしてください。