運用監視
システムの安定化とセキュリティの確保のためには、システムの運用監視が重要です。
ここでは、アプリケーションだけでなく、クラウドプロバイダー側で発生した問題をいち早く把握する方法を理解することも必要になります。
デザイン パターン詳細
Google Cloud サービスの状況把握
システムで問題が発生した場合、Google Cloud のサービスで問題が発生していないかを確認します。Google Cloud ステータス ダッシュボードには、Google Cloud サービスの現在の可用性が表示されます。ステータスはページ上で確認でき、サービスに関するニュースがあるたびに更新される RSS フィードも購読できます。
システムの監視
Google Cloud 上のシステムの監視には、Cloud Operations サービスを利用することが効果的です。もちろん、Google Cloud に対応した従来の運用監視製品を利用することも可能です。 Cloud Operations は、下記のようなサービスが含まれます。
Cloud Logging
Google Cloud サービスやアプリケーションのログを取得、分析できます。Cloud Monitoring
クラウドで実行されるアプリケーションのパフォーマンス、稼働時期案、動作状況を把握することができます。指標やイベントを収集し、チャートやダッシュボードで可視化したり、アラートを設定したりすることができます。Cloud Trace
分散トレースシステムであり、アプリケーションからレイテンシ データを収集し、パフォーマンス定価の原因追跡に活用できます。Cloud Debugger
実行中のアプリケーションの状態を、リアルタイムで調査できるデバッグの機能を提供します。Cloud Profiler
アプリケーションから CPU 使用率やメモリ割り当てなどの情報を収集するオーバーヘッドの少ないプロファイラです。最もリソースを消費しているコード部分を識別したり、パフォーマンスの特徴を把握したりできます。
Compute Engine 上で動作するアプリケーションの場合、Logging エージェントをインストールして、Cloud Logging に自動的にログを転送できます。Cloud Logging はオンプレミスで実行されるアプリケーションなど、任意のソースからのログの書き込みに使用できる API も提供します。これにより、ログの一元管理が可能です。
システムの安定した運用を行うためには、ログとして取得されるイベントに逐次対応するだけでなく、パフォーマンスや稼働時間などのシステムの稼働状況を収集してモニタリングすることも重要です。Cloud Monitoring を使用すると、アプリケーションとインフラストラクチャのイベント、指標、メタデータを取り込み、ダッシュボード、チャート、アラートで、さまざまな視点から可視化することができます。カスタム指標を定義し、予期しないトレンドを検知して早期に対応したり、アプリケーションが求められる SLA を満たしているか追跡したりすることができます。