忙しい?じゃあこれだけ読んどこう
- 大規模投資信託にも組み入れられている銘柄: NetflixはAWSに依存している
- Netflixはこれをリスクとして認知していて、日々の防災訓練: カオスエンジニアリングを行っている
- この取り組みが功を奏し、AWSの障害影響を最小限に抑えることが出来ている
米ハイテク株: GAFAM に次ぐ企業として名高いNetflix (NASDAQ: NFLX) 。
人気の投資信託である インベスコQQQ や SPDR® S&P 500® ETF に組み入れられており、一般投資家がこういったものを通して気軽に投資できる銘柄の一つです。
今回はこの「Netflixが抱える事業リスク」について見ていきます。
Netflixは世界中に巨大な動画配信基盤を持っています。その大多数を 「AWS (Amazon Web Service) 上で動作させている」と、2019年度の年次報告書 に記載しています。同時に「これは他のクラウドプロバイダーに切り替えることが容易ではないことを意味する」とも記載していて、これを事業運営におけるリスクとして扱っています。
AWSの障害はそこそこの頻度で発生しています。
- AWS、東京リージョンで障害 段階的に復旧 「PayPay」「Zaif」など影響受ける【追記あり】
- AWS東京リージョンで4月20日夜に大規模障害か、複数のオンラインサービスに影響
- AWSのデータセンター、電力障害で一時混乱
こういった大規模障害が発生した場合、Netflixも比較的大きなダメージを追う可能性があるように見えます。
しかし複数のクラウドを組み合わせることによって更に対障害性の向上を狙うマルチクラウド環境を構築するほどには至っていない、とも言えます。
メインビジネスが動画配信なだけに、万が一AWSで大規模な障害が発生した場合に事業が総崩れしうることを考えると、リスクを許容し過ぎなのでは…?と思ってしまいます。
調べてみると Netflixでは「カオスエンジニアリング」に日々取り組んでいる ようです。
このカオスエンジニアリングとは、本番環境の機器やネットワークなどの構成要素を前触れなく遮断したり、機能不全に陥らせたりした後、元に戻すような機構を「あえて」取り入れ、障害発生に備えることを指します。
「不意に一瞬システムを壊すやんちゃなやつ」を取り入れる、ということです。なかなかパワフル。

# THE NETFLIX TECH BLOGより引用
車で例えると一瞬エンジンを故障させてみたり、ハンドルを少し効かなくしてみたり…
少しオーバーな例ですが、仮にこういったことが日常的に起きる車に乗っていたら「エンジンが故障したらこのランプが点灯するから、すぐハザードランプをつけて路肩に停車するようにしよう」だとか「ハンドルの効きが変わっても良いように、ゆっくり走るようにしよう」などを考えますし、日々の準備や心構えも変わりますよね。(はよ車買い替えろや、という話は置いておいて)
つまりカオスエンジニアリングを取り入れることにより、本番環境における障害発生時のシステムの挙動や、障害発生時の運用フローの有効性を確認できる、というわけです。Netflixの自動防災訓練システム、とでも言いましょうか。
ちなみにこのNetflixの防災訓練システムは思った以上にやんちゃで「ある地域内のシステムを一度にすべて機能不全にする」ようなこともしてしまいます。
実際にこんなこと起きるの?やりすぎじゃない?とも思ってしまいますが、実際にAWSでは 2015-09-20 に特定のデータベースのサービスが特定の地域で一気に使えなくなってしまった という障害が発生しました。
このときNetflixでもアラートを検知していましたが、日々の「やんちゃなやつ」による訓練のおかげで実際の影響は軽微なものだった、とのことです。
ではまた。