障害対策とバックアップ 
お初にお目にかかります、姜子牙です。お仕事はインフラ運用が主体です。
周りは開発系の方ばっかりなのでやや内容が異色になりますがご容赦ください。
プログラムは組めますが最近はバッチの作成だったり、Excelのマクロに生かされてたりします。
サーバを運用していると常識的に取得するバックアップですが、実はただ取るだけじゃバックアップとして役割を果たさないことがあります。以下に大きく原因別として二つに分けて書いていきたいと思います。
まず一つ目は物理障害、具体的にはサーバ本体に関わる障害対策です。最近ではRAID1によるミラーリングも普及しているため、HDDの障害の発生頻度は低くなりましたが、サーバ機器そのものが動かなくなることはあるため、その際にはバックアップデータが必要になります。
ここで必要になるのは「サーバの機器の外にデータを持ち出すバックアップをする」になります。DATであったり外付けのディスクであったり、別のサーバにだったりします。
仮に機器が動かなくなったとしても、システムの設定や随時更新されるデータなどを機器の外に持ち出しておくことで、機器からデータが取り出せなくなってもサーバを復旧することができます。
二つ目は論理障害、機器は正常でもデータが壊れてしまう場合です。この場合、時間が経つと壊れたデータをバックアップしていくことになるため、もし1日分しかバックアップデータを持たないとしたら、二日経った時点論理障害をバックアップで復旧することはできなくなります。
ここで必要になるのは「古いバックアップを取っておくこと」になります。単純にデータが壊れる直前のデータまで戻してしまうのです。但し、どこまで古いデータを持っておくかは決めておく必要があります。たくさん持てば持つほどディスク容量を圧迫しますし、少なければ役に立たなくなってしまうかもしれません。この辺りは正解のない問題になります。
そして最後に、どちらの場合においても「バックアップデータからリカバリできること」が重要です。データだけ取り出したけど元に戻せないでは本末転倒です。できることならシステムが運用開始される前にバックアップからリカバリする試験をして、いざという時に手際良く対応できるようにしておくことが大切です。