ブログ

AWS運用でDR対策を考える!いつかの“万が一”に“今”備える!

どうも、地震に人一倍敏感な小心者です。

東日本大震災から10年が経った2021年3月。いつまた同じ災害が起きるのか毎日ビビリながら防災グッズを準備してなんとか日常生活の対策を行っている人間です。

自然災害は日常生活だけでなく、もちろん企業の事業維持にも多大な影響を与えます。しかし、自然災害は予期せず訪れるものです。「南海トラフ地震はこれから30年以内に発生する確率が80%という予測がされている」という情報も飛び交っています。

まさに「待ったなし」の状況とも言える今、これまでコストと手間がかかるためDR対策になかなか本腰を入れて手を付けることができなかった方々に、検討の第一歩になる情報をお届けしたいと思います!

BCP対策していますか?DR対策とどうちがうの?

昨今よく耳にする「BCP対策」や「DR対策」というワード。
各業種では、どれくらいBCP対策を検討しているのでしょうか?

次の表をご覧ください。

業種別事業継続計画(BCP)の策定状況

出典:令和元年度企業の事業継続及び防災の取組に関する実態調査

上記の表の結果を見ると、ばらつきはありますが、BCP対策を策定している業種は年々増加しているようです。

4月で年度が変わり、今後の事業方針を社内で検討したり、話を詰めたりする機会も増えるのではないでしょうか? では、いま一度 BCP・DR 関連用語の再確認をここでしてみましょう。

◯ BCP(Business Continuity Plan:事業継続計画)

企業が大規模な自然災害や大事故、感染症、テロなどの緊急事態に直面した際にも重要な事業をストップさせない、またはストップしたとしても被害を最小限に抑え、可能な限り短い時間で復旧させるための方針、体制、手順などをあらかじめ定めておくことを指します。

◯ DR(Disaster Recovery:災害復旧)

予期せぬ自然災害や人的災害でシステムが壊滅的な状況になった際の復旧・修復、その災害に備えたシステムや体制を指します。BCP対策の中の一つが、DR対策であり企業のシステム面の復旧にフォーカスした対策となります。

ではDR対策を考える上で、可用性の指標となる下記3点をついでに覚えてしまいましょう。
社内で検討する大変重要な指標です。

◯ RPO(Recovery Point Objective:目標復旧時点)

災害によってデータが破損した場合に、いつの時点のデータを復旧させれば企業運営を滞らせずに維持できるかという指標です。バックアップの頻度をどれくらいにするかという目安も考慮すべき重要なポイントです。

◯ RTO(Recovery Time Objective:目標復旧時間)

破損したデータをバックアップデータで復旧させる場合、いつまでに復旧させるかという指標です。例えば1時間以内に復旧させて企業運営を再開させるという「時間」の指標を決めます。ダウンタイムを少しでも短くすることで、企業運営を滞りなく維持させる可用性を高められます。

◯ RLO(Recovery Level Objective:目標復旧レベル)

RTO で定めた時間内に、段階的に「いつまでに」「どこまで復旧させるか」というステップを取り決めたステップ毎のレベルを指します。RTO と RLO は、セットで検討する必要があります。

AWS運用でDR対策をスタートするなら?

「スタートしたいけど、社内で議題に挙げるにしても、まず壁にぶち当たる」というお話を弊社もお客様からよく伺います。

BCP/DR対策に取り組もうとした際、ハードルとして一般的に挙げられるのが次のような課題です。

  • 巨額のインフラ投資
  • 平常時にも巨額なランニングコスト
  • 運用業務に貴重な人材リソースが奪われる
  • モチベーション  etc...

対策が重要なのはわかってはいるが、日々の業務に追われてそこまで手が回らないという方も多いのではないでしょうか。

そこで!AWS運用で実現するDR対策を考えてみよう!

クラウドサービスであるAWSはインターネットに接続できればいつでもどこでも、サーバ、ストレージ、データベースなどの必要なサービスを利用することができます。

極めて堅牢で高い可用性を持つグローバルでセキュアなインフラは数多くの第三者認証機関の認証を取得し続けており、自社が自然災害やテロなどで被害に遭っても、クラウド上のデータが消失したり提供されるサービスが停止する可能性は極めて低いため、DR対策として有効です。

また、課題に挙がるコスト面でも初期投資が不要で、使った分だけ支払う従量課金形態のため、設備維持コストを最小化することができます。

AWSを活用したBCP/DR対策 - 3つのポイント -

◯ 可用性レベルを決めておく

復旧時に発生し得るコストを最低限に抑えるため、システムやサービス毎に RPO と RTO を考え、可用性レベルを決定する。

◯ DRを考慮した設計

データの復旧のみを実現する「データバックアップ」から、ほぼリアルタイムでレプリカ(複製)を作成する「データレプリケーション」、継続的可用性を実現する「ホットスタンバイ」まで、システムやサービス毎の可用性レベルに合わせて設計することが大切です。システム復旧に掛かる時間をいかに最短にするかを考え、どんな構成で障害時に備えるかを社内で検討することが大切です。

上記の図を例にとると、「バックアップ・リストア」の方は、同リージョン内でバックアップをとっており、そのリージョン内でサーバに障害が発生した場合、別リージョンでサーバを設置して、バックアップをレプリケーションし、サーバにリストアするという流れになります。そのため、復旧までの時間がかかります。しかし他の構成に比べてコストも安く、RTO に余裕がある場合は、この構成でも良いでしょう。

また、「マルチサイト(ホットスタンバイ)」の場合は、正常時にアクティブになっているサーバやDB(データベース)と同じスペックのものを別リージョンにスタンバイさせているため、データ復旧までに時間をかけられない場合はこちらの冗長構成がおすすめです。コストは約2倍ほどになるのはネックですが、ダウンタイムを少しでも短くしたい場合は検討されるのも良いでしょう。

◯ IT人材の確保

クラウドにも日々の設定や運用管理は必要です。社内に運用担当者がいない場合は、IT人材を外部から確保するか、もしくは自社にて担当者をアサインして育成を進めなければなりません。外部人材の確保でお困りの際は弊社までお気軽にご相談ください。

オンプレサーバのDR対策ってどうすればいいの?

オンプレサーバだけの運用の場合、バックアップをとっていたとしても、自社が災害に見舞われた際には稼働サーバもバックアップも同時に被害に遭ってしまい、復旧することが困難になる可能性が高いです。

そのため地理的に離れた場所にデータセンターを別に設ける企業もいらっしゃいますが、巨額のコストと時間、手間がかかるため、なかなか手が出せないことが多いでしょう。

そこで手軽に始める方法として、2通りの方法をご紹介します。

◯ オンプレサーバ × AWSのハイブリッド型

オンプレサーバが災害に見舞われた時に備えて、予めAWS環境に S3 を設置し、バックアップを取る方法です。従業員の方が自宅からリモートワークをされている場合、リモートデスクトップ接続で自社のオンプレサーバにアクセスをしてお仕事をされると思います。

しかしその普段アクセスしている自社のオンプレサーバに障害が発生した場合、アクセスできずにお仕事が中断してしまう可能性が大です。このハイブリッド型はそうした非常時に、S3 に保存されているバックアップデータを、予め設置しておいた EC2(オンプレサーバが正常時は停止)に復旧させることができるので、オンプレサーバーに障害が発生しても従業員の方はインターネット経由でAWS環境にアクセスし、通常業務に戻ることができます。

また、下図のようなVPN経由のバックアップ方法だとよりセキュアな接続になりますので、セキュリティの面でも安心です。

◯ オンプレサーバ × Storage Gateway

最近弊社にも「オンプレサーバからのバックアップをとるのに手軽な方法ないかな〜」というご相談が増えております。そこでご紹介したいサービスとして、「Amazon Storage Gateway」をご紹介させていただきます。

Storage Gateway なら、インターネット経由で NFS(ファイル管理システム)を使って、S3 にデータのバックアップを取ってくれます。

S3 は安価で耐久性のあるストレージで、高い堅牢性を誇り、バージョニングをすることで過去の世代のバックアップにバージョンを戻すことができたり、ライフサイクルポリシーで指定日数を過ぎたデータを自動的に削除したり、より低コストで長期バックアップに長けている S3 Glacier にアーカイブすることができます。

AWS運用のDR対策で障害に備える

AWSを利用してDR対策を考えるなら、もうひとつ併せて考えておきたいのが、別リージョンでのバックアップやホットスタンバイです。

2章でもちらっと記載いたしましたが、この春、日本で2番目となるリージョン「大阪リージョン」が新たに開設されました。これまで東京リージョンでマルチアベイラビリティゾーン(AZ)の冗長構成をとっていた企業様が多くおられましたが、これからは日本国内でマルチリージョンを完結できるため、「もっとDR対策をしたいけれど海外のリージョンにサーバやデータを置くのは不安」と思っておられた企業様にとっては朗報ですね。

東京リージョンと大阪リージョンでマルチリージョン構成をとることで、大地震などで万が一、東京リージョンの4つのデータセンターで障害が発生した場合にも対応できるレベルにまで、可用性を高めることが可能となります。

下図は大阪リージョンにレプリケーションをした場合の例ですが、大阪リージョンに何をどれくらいのスペックで用意しておくかで RTO や RPO 、コストが変わってきます。ぜひ一覧表で各構成のメリット・デメリットを比較し、みなさんの企業のシステムならどれが最適か検討してみてください。

AWS運用でDR対策を考える!(まとめ)

AWSでできるDR対策について、最後までご覧頂きありがとうございました。

企業が事業を維持していく上で、社内のシステム環境やデータのバックアップ、復旧方法について「最善の備え」をとることが重要となっている昨今。しかし、コストの管理や担当者の教育、ルールの整備など検討することは沢山あります。

ですが、備えあれば患いなしです。少しずつDR対策と向き合ってみてはいかがでしょうか?

本ブログをご覧頂き、「AWSでDR対策の着手に一歩踏み出してみよう!」と思われた方がいらっしゃいましたら、弊社までお気軽にお問い合わせくださいませ。

元記事発行日: 2021年06月30日、最終更新日: 2021年06月30日