ブログ

AWS の S3 Glacier を改めて整理してみる

みなさんは、いざという時の備えは十分にされていますでしょうか。

災害対策など非常事態への備えを考えるとき、一人ひとりの生命や生活を守ることももちろん重要ですが、企業においては会社の資産を守ることもまた重要な取り組みです。

今回はそんな“もしもの時”のための保存領域 Amazon S3 Glacier について、改めて整理しながらご紹介したいと思います。 

AWS | Amazon S3 Glacier とは

Amazon S3 Glacier は、AWS が提供する長期データ保存のためのクラウドストレージサービスです。つまり、S3 の親戚という認識でよいかと思います。

Amazon S3 Glacier は、コスト効率よく大規模なデータを保存できるように設計されており、頻繁にアクセスしないアーカイブデータの保存に最適です。スタンダードな S3 との大きな違いとしては、かなり低価格なストレージ料金となっている点です。また、アクセスが必要になった場合、取り出す必要がありますが、スタンダードな S3 と異なり、取り出しオプションが複数あるのもAmazon S3 Glacier の特徴になります。

そのため、法的に保持する必要があるデータや、ビジネスのバックアップとしてのデータアーカイブに利用されています。長期間にわたり保存する必要があるが、頻繁にアクセスすることがないデータに最適なサービスとなっています。

AWS | Amazon S3 Glacier の歴史

Amazon S3 Glacier について改めて注目してみると、「前から S3 って名前の頭についてたっけ?」だとか、いつの間にかオプションが増えていて、「こんなに種類あったっけ?」と思ったり、気になることがちらほら。どうやら私の記憶にある Glacier から、また変わっているようです。

改めて Glacier の歴史について調査してみたところ、細かいアップデートも数多くあり、全部記載すると膨大な量になってしまうので、ここではサービス名に影響があったところを抜粋して説明させていただきます。

Amazon S3 Glacier は2012年に最初に「Amazon Glacier」として発表されました。Glacier の始まりはそんなに前からなんですね。やはり、初期は「S3」がサービス名に入っていませんでした。

参考: Amazon Glacier: Archival Storage for One Penny Per GB Per Month | AWS News Blog

2018年に「Amazon Glacier」から「Amazon S3 Glacier」に名前が変更になっています。S3 という名前をいただいたようです。(盃でも交わしたんでしょうか・・・)

参考: AWS Storage Update: Amazon S3 & Amazon S3 Glacier Launch Announcements for Archival Workloads | AWS Architecture Blog

Amazon S3 Glacier となった翌年の2019年に、Glacier Deep Archive の提供が始まっています。

参考: 新しい Amazon S3 ストレージクラス – Glacier Deep Archive | Amazon Web Services ブログ

それから現在(執筆時点2024年10月)と同じ提供方法になったのが2021年で、Amazon S3 Glacier Instant Retrieval という新しいストレージクラスが発表され、その影響により、元の Amazon S3 Glacier は、S3 Glacier Flexible Retrieval と改名されたようです。

元々の Glacier は、時が経つ毎にことに名前がどんどん長くなるという宿命を受けたわけですね。また、Glacier 自体も細分化されていったので、私の記憶は正しかったようです。

参考: 新しい Amazon S3 Glacier Instant Retrieval ストレージクラスを発表 - ミリ秒単位で取り出し可能な最低コストのアーカイブストレージ

AWS | Amazon S3 Glacier の種類と特徴

それでは歴史を振り返ったところで、それぞれの種類と特徴を整理していきます。

S3 Glacier Instant Retrieval

Glacier ストレージクラスの中では、一番スタンダードな S3 に近い立ち位置になり、Gialcier の中では一番料金が高くなります。その代わり、Glacier の中では一番アクセス速度が早く、即時アクセス(ミリ秒単位)が可能になります。

アクセス頻度が月1回程度のファイルを目安にしていただけるとよいかもしれません。

S3 Glacier Flexible Retrieval(旧 S3 Glacier)

Glacier といえば、一旦この S3 Glacier Flexible Retrieval を基準に考えると良いでしょう。また、過去に S3 Glacier と言われていたものが、この S3 Glacier Flexible Retrieval になります。

Flexible(柔軟)という言葉からもデータ取り出しの柔軟性を提供しており、標準と言われるデフォルトで通常 3〜5 時間以内、オプションの高速で通常 1〜5 分以内、大容量で通常 5~12 時間以内で取り出しが可能です。当然といえば当然ですが、早く取り出したければ追加費用が発生し、遅くても良ければ、費用は安くなることになります。

メディアアーカイブやバックアップデータのような、年に数回程度、いざという時に取り出す可能性があるファイルを目安にしていただけるとよいかもしれません。

S3 Glacier Deep Archive

S3 Glacier Deep Archive は、言葉のイメージ通り、奥深くに保存し、最も低コストであり、データの取り出しに最も時間がかかる Glacier になります。データの取り出し時間は、標準で12時間以内で、オプションの大容量では48時間以内になり、コストは標準よりも安くなります。Flexible Retrieval と違い、迅速取り出しがないので注意が必要です。そのため、年に1回あるかないか程度のアクセス頻度を目安にしていただけるとよいかもしれません。

AWS | Amazon S3 Glacier のユースケース

前章で説明した Amazon S3 Glacier ストレージクラスを利用する際の、それぞれのユースケースを説明します。

S3 Glacier Instant Retrieval

  • 医療データの保存:
    X線やMRI画像など、頻繁にアクセスする可能性がある医療データ。
  • 分析データ:
    必要に応じてすぐにアクセスできるようにしたい大規模なデータセット。
  • メディアファイル:
    高品質の動画や画像など、定期的に使用する可能性があり、迅速にアクセスする必要があるメディアファイル。

S3 Glacier Flexible Retrieval(旧 S3 Glacier)

  • メディアアーカイブ:
    撮影された動画やテレビ番組の元データなど、時折アクセスが必要なデジタルコンテンツ。
  • 定期的なバックアップデータ:
    数ヶ月ごとにアクセスする可能性がある企業の定期バックアップデータやデジタルアーカイブ。
  • コンプライアンス用のデータ保存:
    法規制に基づき定期的に監査される必要があるが、頻繁にはアクセスしない金融データやログファイル。

S3 Glacier Deep Archive

  • 法規制に基づくデータ保存:
    法的に10年やそれ以上の保存が義務付けられている医療記録、財務データ、契約書類など。
  • 歴史的なアーカイブ:
    大学や研究機関が所有する膨大な研究データや書籍、過去の研究結果の保存。
  • 企業のデジタルバックアップ:
    非常に稀にしかアクセスしないデータのバックアップや、大規模なプロジェクトのデータ保存。

皆様の身近にも同じようなユースケースがないか改めて確認してみてください。

AWS | Amazon S3 Glacier の注意点

Amazon S3 Glacier の良いところばかりを説明しましたが、利用するうえで特に注意していただきたいことが2点あります。

① データの最小サイズの制限

それぞれのストレージクラスに最小サイズ(メタデータ付与)があります。

  • S3 Glacier Instant Retrieval : 128 KB
  • S3 Glacier Flexible Retrieval : 40 KB
  • S3 Glacier Deep Archive : 40 KB

これらを見て、「だから何だよ」って話になるかと思いますが、ここには大きな落とし穴があります。例えば、100GBの容量を S3 Glacier Flexible Retrieval に保存するとします。その場合、気にするのはファイル数とそれぞれのファイル容量です。100GBのファイル一つであれば、たかだか40KBとなりますが、これが、1ファイル10KBが1000万数あるとした場合、あら不思議、100GBの容量が400GBになってしまうんですね。

つまり、小さなファイルをたくさん入れてしまうと逆に高くつく可能性があるので注意が必要です。

② 最小保存期間

それぞれのストレージクラスに最小保存期間があります。

  • S3 Glacier Instant Retrieval : 90 日
  • S3 Glacier Flexible Retrieval : 90 日
  • S3 Glacier Deep Archive : 180 日

この最小保存期間よりも前に削除してしまうと追加費用が発生してしまうので、保存する期間はある程度長く考えておく必要があります。

まとめ

いかがでしょうか。Amazon S3 Glacier は、基本的にはアーカイブデータを保存するのに適しており、ニーズによって、オプションやストレージクラスを検討することができます。ただ一方で保存したいファイルの容量や数を考慮せずに利用してしまうと逆に高く付いてしまうことがありますので、ファイルの容量や数、また保存期間や取り出し要件を考慮して、ご利用いただければと思います。

元記事発行日: 2024年10月01日、最終更新日: 2024年10月01日