Amazon AWS S3 まとめ

Amazon AWS S3 を使用すれば、RAIDを組む必要もないし、データが損失確率はほぼゼロ(0%)だという話を聞いて、早速Amazon AWS S3について調べてみたが。。。
想像以上だったのでまとめてみた。

 

 

 

 

99.999999999%の堅牢性(ナインイレブン)

99.99999999999%。

この数字は、1年間にデータが損失しない確率である。

 

Amazonのサイトを確認しても確かに99.999999999%と書いてある。

(自分で入力していても間違えそうだ)

https://aws.amazon.com/jp/s3/details/

ws000000

 

具体的に計算してみる。

たとえば、100個のデータがあったとして、99%の堅牢性があるとすると、1年後には99個のデータが正常に残っているということになる。

計算式は、100×0.01=1となる。

この1が、1年後に損失するデータの数だ。

 

 

これをAmazon AWS S3に当てはめてみる。

まずは、ファイルが100万個あるとする。

1年間でデータが損失しない確率が99.999999999%なので、

逆に損失する確率は、0.000000001%になる。

 

桁を間違えないように、念のため計算してみる。

99.999999999+0.000000001=100

 

ちゃんと100になったことを、「アクセサリ」-「電卓」で計算して確認した(笑)

 

100万個のデータがあったとして、1つのデータが損失する確率は

1,000,000×0.000000001×0.01=0.00001

※0.01を掛けたのは、%から変換したため。

 

よく分からないが、0.00001ということは、10万年運用すると1個のデータが損失する可能性があるということか。

サッスーの計算が正しければ(というか、計算の概念があっていれば)、よく分からないけどデータは損失しないということなんだね。

これはすごい。

 

データが欠けないんだから、RAIDの必要はない。

定期的にヒューマンエラー用のデータバックアップを取ればいいだけだ。

(このバックアップは、データ損失を防ぐためではなく、「あ!大事なExcelファイルを間違って消しちゃった!」とかいう人のためのバックアップである)

 

 




 

2拠点でデータが損失しても復元可能

これも考えてみればすごい話だ。

言葉を変えれば、2拠点のデータセンター(アメリカ、ヨーロッパなど)が戦争や天災で崩壊しても、データには全く影響ありませんよ、ということか。

いきなり2拠点が崩壊するなんて核戦争くらいしか思いつかないが。

まあ、そうなったら「私のExcelファイルがなくなっちゃった~」って騒ぐどころじゃないけど。

 

RAIDに例えてみると(この例えが適切なのかどうなのかは分からないけど)、2拠点でデータが損失しても復元可能というのは、かなり手の込んでいる構成であることがわかる。

 

RAID5でディスクを構成している企業は多いだろうが、RAID5の場合のディスク耐障害性は1本である。

つまりRAID5の場合、ディスクが1本壊れても問題ない。

しかし2本壊れたらアウト、ということである。

 

このディスク耐障害性は、ディスクの本数は関係ない。

だからディスク3本でRAID5を組んでいようが、ディスク10本でRAID5を組んでいようが、ディスク耐障害性は1本である。

ややこしいが、データは各ディスクのパリティが保証するが、パリティ自体は冗長化していないからである。

 

複数ディスクが壊れてもデータが損失しないというのは、RAIDならばRAID6とか、RAID10とかRAID50に相当する。

 

実際にAmazon AWS S3がどのように構成されているのかは内部の人間じゃないので分からないが、しつこいくらいに冗長化している構成だなということが分かる。

RAID5の構成のようにパリティを分散してパリティをミラーリングしているのか、それとも単純に正・副の二重化ではなく、正・副・副の三重化をしているのか。

 

 

個人的な感想

結論を言えば、数万年使い続けてても数万年前に作ったExcelファイルにはちゃんとデータが残っている可能性があるということだ。

 

ちなみにサッスーは外付けHDDでデータを保存しているが、1~2年後に「そういえば、あのデータもう1回みたいな」と思って外付けHDDをパソコンに挿すが・・・

起動しない!壊れている!

思い出のデータとか大切な資料とか、もういいよ!って諦めてしまう(笑)

 

※「外付けHDDにバックアップしています」なんていう人は定期的にチェックしないと、いざというときに復元できない可能性があるので注意。

 

疑問、ずっとS3にデータを乗っけていたら借金地獄になるか?

「じゃあ、今後S3に思い出の写真とかデータとかアップロードすれば、人類が存在する限りほぼ永遠に無くならないよね?」

と誰しもが考えると思う。

しかし、だからと言ってポンポンどうでもいいデータをアップロードすると、とんでもない請求額がAmazonから来る羽目に!?

 

ひょっとしたらAmazon S3は使えるかもしれないし、費用対効果を考えたら割に合わないかもしれない。

(どうでもいいようなExcelファイルや写真のために毎月数万円取られたらたまったものじゃないし)

 

Amazon AWS S3 には3種類のサービスがあった

実はAmazon AWS S3には3種類のサービスがある。

 

1.標準

2.標準 – 低頻度アクセス(標準 – IA)

3.Amazon Glacier

 

である。

この3つとも99.99999999999%の堅牢性のようだから、データ損失に関しては3つとも安心である。

違いは、「レスポンス」である。

たとえば、リアルタイムで頻繁に書き換えられるデータや、たまに見る程度のデータや、zipで固めたバックアップで障害がなければもう見ることのないデータがあると思うが、使い方によって3種類のサービスを使い分けるのである。

 

もちろん、標準が一番高い。

価格表は以下になる。(2017年1月現在)

 

ws0000201

 




 

 

スタンダード(標準)とGlacierストレージの価格差は5分の1だ。

個人で使う分には、レスポンスなんてどうでもいいので(笑)、一見格安そうに見えるGlacier ストレージに興味が湧いてきた。

 

早速計算してみよう。

 

サッスーの場合は、正直言って重要なデータなんてないので、とりあえず写真とか過去のテキストファイルやExcelファイルなどで100GB程度使いたいとする。

なにをどうやっても50TB/月にはならないから、1GBあたり$0.005になる。

 

100GBだと、

100GB×$0.005=$5

 

トランプ相場で若干円安になっているので1ドル=117円(2017年1月9日現在)

 

5×117=585円 1ヶ月約585円

 

ん~。微妙だな(笑)

ちなみに、費用はこれだけではなく、「データ転送による料金」と「リクエスト数による料金」もある。

 

これらはちょっと複雑な要件なので、以下のシンプルな環境でやってみたとする。

ws000021

 

データ転送による料金は、S3にアップロードする場合は無料。

ダウンロードする時に課金される。

 

 

上記の使い方だと、以下の表が当てはまる。

https://aws.amazon.com/jp/s3/pricing/

ws000022

この表を見ると、最初の1GBまでは無料になってしまうので(笑)、設定を変えて、100GBのデータをアップロードして月に2GB程度ダウンロードして使うとすると、

2GB×$0.140=$0.28

$0.28×117円=32.76円

1ヶ月のデータ転送量は約33円である。

 

 

他にも「リクエスト料金表」があるが、この場合は自分1人しか使わないので、たいしてリスエストもない。

だから計算しない。

 

https://aws.amazon.com/jp/s3/pricing/

ws000023

 

サッスーが想定した構成だと、毎月約600円程度かかるか。

 

個人的に使う分には、Google Driveでもいいような気がするな(笑)

 

ちなみに、Google Driveの場合

ws000024

 

 




 

 

無料で15GB提供。

月100GBまでなら250円か。

個人使用ならGoogle Driveの方が良かった。

 

AWS新規利用登録で最初の1年間のみS3が5GBまで無料で使える!

AWSへの新規登録(クレジットカードの登録も含む)で、最初の1年のみS3が5GBまで使用できるそうだ。

 

しかし、これは危険だ。

もし忘れてしまったら、しかも5年くらい忘れてしまったら、とんでもないことになりそうだ(笑)

だからこんな初年度1年のサービスはないものと思わないといけない。

 

結論

結論から言うと、個人的な利用ならS3に大切なデータを載せておいても、まずデータの損失はないし完全保証に近いと思う。

しかも、知らず知らずのうちに借金地獄になることもなさそう。

(1年で1万円も行かないんじゃないの?)

だからいいと思うが、サッスー的には個人利用のような重要度が低いものなら、複雑なAWS Amazon S3を恐々利用するより、単純明快なGoogle Driveでいいと思う。

 

 

 

コメントを残す

メールアドレスが公開されることはありません。