最終更新日:2024-05-10
アプリケーションのスムーズな運用を目指してAWS監視の導入を検討している方へ。王道のAWS CloudWatchの情報はもちろん、そのほかのAWS監視ツールの選定ポイントやおすすめツールを紹介します。
AWS向け監視ツールとは、Amazon Web Services上で稼働するサービスや仮想サーバーを監視するツールです。インスタンスの状態やCPU・メモリ・ディスクのリソース、システムログなどを監視するために使われます。これらを監視することで、異常検知からの早期復旧や、システム障害の予防、リソース計画の策定などが可能に。
AWS監視ツールには、AWSから提供されている「CloudWatch」と、市販されている従来型のシステム監視ツール、そしてオープンソースの監視ツールがあります。
まずは、「CloudWatch」でできることから見ていきましょう。
AWS監視ツールをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
“AWS監視ツール”の 一括資料ダウンロードする(無料)
AWSを監視する場合、まず選択肢となるのが「AWS CloudWatch」の利用です。AWS CloudWatchはAWSの各種リソースを監視するサービスで、構築作業不要で利用開始できます。料金は従量課金制で基本料金無料のため、安価で使えるというメリットも。またSaaSとして提供されているので、監視サーバーの準備も必要ありません。
各サービスにエージェントをインストールすると、AWSのリソースやアプリケーション、サービスのログをほぼリアルタイムで収集して保存できます。取得したログはコンソール上で閲覧及び検索できるほか、特定文字列でアラートを上げることも可能です。一定期間が経過したログについては、ログローテションやAmazon S3のストレージサービスに移動することができます。更に、CloudWatch Logs Insightsという拡張機能を使えば、高度なログ分析にも対応可能です。
メトリクスとは一定の時間ごとに取得したパフォーマンスに関わるデータセットのことで、EC2やS3、DynamoDBなどのサービスから収集したデータの集まりです。データの中にはCPU使用率やメモリ使用率、データ転送量、ディスク容量などの情報が保存されており、リスト表示やグラフ化などに活用できます。
メトリクスで取得できる統計情報には以下のようなものがあります。
Minimum(最小値) | 指定された期間に認められた最小値 |
Maximum(最大値) | 指定された期間に認められた最大値 |
Sum(合計値) | 該当するメトリクスで加算されたすべての合計値 |
Average(平均値) | 指定した期間の平均値 |
SampleCount(カウント数) | 統計計算で使用するデータポイントの数 |
pNN.NN(パーセンタイル) | データセットにおける値の相対的な位置。メトリクスデータの分布がわかりやすくなる |
このほかに、トリミングした範囲内の平均や割合などの情報も取得可能です。取得したメトリクスは検知レベルの設定にも使え、異常発生時のアラート表示に役立てられます。
また、メトリクスでは取得の解像度(集計期間)も設定可能です。標準では1分間隔でデータが取得されますが、1秒、5秒、10秒間隔といった高解像度でのリソース監視も行えます。ただし、追加費用なしで取得できる範囲は標準解像度までで、高解像度の場合は別途費用が発生します。また解像度にはそれぞれ保存期間が決められていて、その期間を超えるとデータの解像度は徐々に粗くなる仕組みです。また、集計期間ごとに存在するメトリクスの値をデータポイントと呼びます。
メトリクスの保存期間は以下のとおりです。
60秒未満のデータポイント | 3時間 |
60秒(1分)のデータポイント | 15日間 |
300秒(5分)のデータポイント | 63日間 |
3600秒(1時間)の期間のデータポイント | 455日(15カ月) |
取得したログやメトリクスが特定の閾値を超えた場合にアラートを上げる機能です。機械学習を用いた異常検出にも対応しており、Eメールやチャットツールなど様々なサードパーティアプリケーションと連携して、通知することができます。たとえば、CPU使用率や空き容量、パフォーマンスなどに問題が発生した場合などにリアルタイムで通知を受け取ることが可能です。
メトリクスの状態変化、もしくはAPIのイベントをトリガーとしてアクションを実行できる機能です。たとえば特定ユーザーがコンソールにサインインした場合にメールで通知したり、障害検出時にAutoScalingアクションを発動させたりといった設定が行えます。状態変化だけでなく、イベントをスケジューリングして実行させることも可能です。
このように、AWS CloudWatchにはAWSサービスを統合管理するための様々な機能が備わっています。しかし、AzureやGCPなどAWS以外のサービスや自社サーバーについては、AWS CloudWatchで監視することはできません。また、AWS CloudWatchに習熟していない場合は、うまく使いこなせないことも。
次項では、AWS CloudWatch以外の監視ツールについて見ていきましょう。
ここではAWS CloudWatch以外の監視ツールについてタイプ別に紹介します。
SaaS型は自社で監視サーバーやシステムを構築する必要がないため、手軽に運用をはじめられるのがメリット。月額または年額のライセンス費用が発生しますが、インフラ及び管理に関わるコストはほぼ不要です。SaaS型の監視対象はクラウドサービスが前提と思われがちですが、ツールによってはオンプレミスの社内システムやインフラ環境を監視できるものもあります。
オンプレ型は監視用サーバーを自社で構築する方法です。インフラの環境上SaaSを利用できない場合や、大規模な環境下でネットワークに負荷をかけずに構築したい場合に向いています。ベンダーによる有償版ツールでは初期設定が自動化されるなど、導入の手間を大幅に削減できるのも魅力。また、サポート体制もツールによって異なるため、運用担当者のスキルや経験値を加味したツール選択が重要です。
オープンソースの最大のメリットは無料で使える点です。オンプレ型同様に監視用サーバーを準備する必要がありますが、監視対象に合わせて設定を細かくカスタマイズできます。インフラの環境を問わず、オンプレミスからクラウドサーバーまで一元的に監視することも可能です。拡張性が高い反面、監視対象や環境の変化に応じて手動で設定し直す必要があるため、知識のある人材を確保しないといけないうえ、運用の手間も発生します。
AWS CloudWatch以外の監視ツールについては、「ネットワーク監視ツール比較15選。無料も含めてタイプ別に紹介」で詳しくご紹介しています。
続いて、AWS監視ツールの導入にあたって留意しておきたい4つの比較ポイントを見ていきましょう。
AWSのサービスや機能をどこまでカバーできるかは重要なポイントです。たとえば「Site24x7」という監視ツールでは、EC2、S3、EBS、RDS、Lambda、DynamoDBなど、25種類以上のAWSサービスに対応しています。
また、APIが充実した「Datadog」なら、70以上のAWSサービスからメトリクスやタグをワンクリックで取得できます。情報を取得する際は、Polling型(問い合わせ型)とPush型(通知型)の違いがあるので注意しましょう。
AWS以外のクラウドサービスと連携してまとめて管理できるかを確認しておくのも重要です。AzureやGCP、Docker(コンテナサービス)といった主要サービスに対応できると便利でしょう。
たとえば、「Mackerel」はAzure、Google Cloudに対応。「srest」では、Datadog、PagerDuty、Sentryといったインフラ系サービスに対応しています。
複数の環境を一元管理できれば、一つひとつを個別に監視する手間が省け、運用コストを大きく軽減できます。理想を言えば、オンプレミスを含めたハイブリッド環境を統合的に監視できるツールがおすすめです。
監視テンプレートとは、APIやトリガー、グラフなど各設定項目を一つにまとめた監視用の設定を指します。AWSをはじめとしたクラウドサーバーやネットワーク機器など、監視対象に合わせたテンプレートを利用することで簡単に運用が始められます。たとえば「Datadog」では600種類以上のインテグレーション(テンプレート)が用意されており、すべてのシステムやアプリケーション、サービスを横断して監視が行なえます。
アプリケーション性能監視(APM)とは、利用者側の視点からアプリケーションの性能(パフォーマンス)を監視できる機能です。
AWS上で動作するアプリケーションの処理速度の低下や異常を検知したい場合に有効です。たとえば、「site24x7」であれば、「PHP APM」「Java APM」「Ruby APM」「.Net APM」という監視機能を持ち、パフォーマンスの低下をトランザクションレベルや分単位間隔で検知することができます。iOS/Androidのモバイルアプリに対しても、パフォーマンスをメトリクスで監視可能です。
主なSaaS型AWS監視ツールを5つ紹介します。
“AWS監視ツール”の 一括資料ダウンロードする(無料)
(出所:Site24x7公式Webサイト)
世界累計13,000以上のユーザーが利用する、インストール不要のフルスタック監視ツール。クラウドからサインアップするだけですぐにはじめられ、AWSやAzure、GCPの監視を一画面で管理できる。Webサイト監視やサーバー監視、ログ監視、アプリケーション性能監視、クラウド監視、ネットワーク監視など幅広い監視機能を備えながら、低価格な料金体系を実現。
更に、リアルユーザーモニタリング(RUM)機能では、ユーザー視点での満足度をApdexスコアで確認できる。AWSのCloudWatch APIのI設定も簡単に行え、EC2、S3、RDSをはじめとした25種類以上のAWSサービスの監視に対応。
(出所:Mackerel公式Webサイト)
オンプレミスやマルチクラウドなど様々な環境に対応した、国産のサーバー監視ツール。利用中のクラウドまたはオンプレミスサーバーに監視エージェントをインストールするだけで、すぐに利用開始できる。シンプルなUIと「サービス」「ロール」の概念を用いることで、直感的な操作性を実現。AWSやAzure、Google Cloudなどに対応しており、マネージドサービスの管理・監視も行える。
分散トレーシングサービスVaxilaにも対応し、複雑なサービスの調査・観測もサポート。複数のメトリックから得られた値で将来の予測値を計算したり、機械学習を使って過去の傾向から異常を検知したりといった、高度なメトリック監視機能も備えている。
(出所:srest公式Webサイト)
AWSやDatadog、PagerDuty、Sentryなど各サービスのイベントログ・コストを一元的に可視化できる監視サービス。アカウントを切り替えることなく、ダッシュボード上で収集したログやコスト情報を一覧表示。特定のサービスで発生したアラート数やヘルスイベント/異常イベントの絞り込みに対応し、サマリーデータのチェックもスムーズ。日付指定やフィルタ機能を利用して過去に発生したイベントログの横断検索もできるため、別プロダクトの脆弱性分析などにも活用できる。
異常の検知時にEメールやSlackなどのコミュニケーションツールに通知を自動送信できるアラート機能も搭載。ダッシュボード上では、一定期間に繰り返し発生したアラート情報の把握、プロバイダーやプロダクトを軸とした年間・月間・日別のレポート作成にも対応。異常ステータスの早期発見と適切な対応をサポートする。
(出所:Datadog公式Webサイト)
AWSやAzureなどのパブリッククラウドやオンプレミス環境など、様々なプラットフォームで稼働できる監視ツール。他社サービスとの連携を容易にするインテグレーションは600以上あり、AWSサービスのメトリクスやタグもワンクリックで取得可能だ。インフラストラクチャーやアプリケーション、ログ、ユーザーエクスペリエンスなどすべての監視項目をひとつのダッシュボードに集約できるという特徴も。
アプリケーション監視ではパフォーマンスだけでなく、トラブルシューティング、最適化まで対応。アラート機能では、タグと機械学習によって誤検知を排除できる。
(出所:Dynatrace公式Webサイト)
大規模構成のクラウドインフラからアプリケーション、エンドユーザーまで一気通貫でモニタリングできる監視ツール。AWSのアドバンストテクノロジーパートナーとして、広範なサービスを包括的にサポートできるのが特徴だ。完全に自動化されたAIエンジンによって監視を行い、AIがわずか数ミリ秒で問題を分析し、問題の根本原因を特定してくれる。Amazon CloudWatchの監視項目に加え、OSリソース情報やサービス、ユーザーレスポンスなども一元管理できるため、すべての依存関係をリアルタイムで監視することができる(※データ収集モジュールOneAgentのインストールが必要)。
(出所:Sumo Logic公式Webサイト)
オンプレミスサーバーやインフラ環境、各種クラウドサービスのログを収集・可視化できる監視ツール。あらかじめ用意されたダッシュボードのテンプレートを用いることで、すぐに監視をはじめられるのが特徴だ。AWS監視では、EC2やECS、RDSなどあらゆるサービスのログとメトリクスをリアルタイムで取得。更に、機械学習機能においてはログのグループ化やパターン分析をすばやく行い、出現頻度の低いログも抽出できるため、ダウンタイムを減らして、問題解決までの時間を短縮できる。ログの取得量に応じて料金が設定されるが、ログが急増した場合でもサービスは稼働し続ける仕組みだ。
主なオンプレ型AWS監視ツールを3つ紹介します。
“AWS監視ツール”の 一括資料ダウンロードする(無料)
(出所:LogicMonitor公式Webサイト)
AWSやAzure、GCPなどのパブリッククラウドやオンプレミス環境だけでなく、混在するハイブリッド環境を含めたIT資産を一元的に管理できるIT統合監視プラットフォーム。独自に最適化された監視用テンプレート「LogicModule」が2,000種類以上用意されており、運用設計やカスタマイズはほぼ不要となる。
AlOpsと呼ばれるAI機能では、過去データをもとにした障害予兆検知が行えるほか、トポロジー・マッピングを活用したアラートの大幅削減、利用状況の将来予測などにも対応。また、日本語対応による平日24時間のオンラインチャットやサポートガイドによる技術情報の公開など、テクニカルサポートも充実している。
(出所:パトロールクラリス公式Webサイト)
オンプレミスやパブリッククラウド、仮想環境などのサーバーだけでなく、ネットワークやストレージ機器を含めて統合的に監視できるツール。最大の特徴は、エージェントのインストールが不要なため導入や運用の手間を軽減できる点だ。純国産で完全に日本語化されたGUIのため、マニュアルなしで運用できるのも大きなメリットといえる。
1バイトにこだわった高性能監視エンジンを搭載しているので、監視中でも管理画面のパフォーマンスには影響しない仕組みだ。高度な監視機能によって無駄なアラート発生も制御し、柔軟な検出条件や通知条件などを設定できる。また、監視停止・実行スケジュールの設定も可能だ。
柔軟なライセンス体系がとられており、監視機能の設定数に応じた料金なので無駄なコストをかけずに済む。
(出所:X-MON公式Webサイト)
サーバーやクラウド、社内LAN、ネットワーク機器などの一括監視ができる、オープンソースソフトウェアをベースとして開発された監視ツール。ハードウェアの死活状態やHTTP・SMTPのサービス状態、CPU・メモリなどのリソース状態の監視だけでなく、ログ情報やTrap、機器の構成情報のデータを集約できる。通知手段は自動音声やメール、チャット、ブラウザ、警告灯の点灯などに対応しており、安定的な運用を実現。
障害を検知した際には、エスカレーション機能によってWebサービスの再起動を実行するなど、自動復旧にも対応できるのが特徴だ。また、様々なAPIとの連携が可能なため、オリジナルのWebサイトから監視結果の取得や設定変更が行える。
主な無料のオープンソースAWS監視ツールを2つ紹介します。
(出所:Zabbix公式Webサイト)
世界で最も人気のあるオープンソース統合監視ソリューションのひとつで、サーバーからネットワーク機器、アプリケーションに至るまで、オールインワンで監視できるソフトウェア。オープンソースでありながら有償ツールと同等の機能性と拡張性を備えており、数万デバイスの監視にも対応可能だ。
一方、豊富な機能で自由度が高く設定項目が多岐に渡るため、高いスキルが必要とされる。またAWSを含めた各種クラウドサービスの仕様変更が発生した際は、それらに合わせたスクリプトの改修も必要。運用コストを軽減するには、最適な運用設計とテンプレートの活用が鍵となる。
(出所:Nagios公式Webサイト)
統合監視ソフトウェアの中でも長い歴史を持つ、システムとネットワークの稼働状態を監視するソフトウェア。本体とプラグイン、アドオンプログラムの3つで構成され、実際の監視はプラグインが行う仕組みだ。基本機能としては、サーバーにPINGを飛ばして行う「死活チェック」と、サーバーにアクセスして監視する「アクティブ・チェック」の2つのみ。ただしプラグインの追加によって様々な監視が行えるため、機能性としては有償ソフトに匹敵する。なお、プラグインは利用者が独自に開発することができる。
大規模システムの監視に適している有料版「Nagios XI」も。
近年、AWSサービスは世界中に広がり、多くの企業で利用が進んでいます。しかし、AWSを活用したサービスをビジネスとして展開する場合、安定稼働させるためのサーバー監視は必須事項です。
手軽に監視を始めるなら「AWS CloudWatch」がおすすめですが、企業が所有するオンプレミス環境やほかのクラウドサービスを含めての一括監視を実現するなら、別の監視ツールが適している場合もあります。本記事でご紹介している、タイプごとのメリットや比較ポイントを参考にしてみてください。
AWS監視ツールには対象範囲や機能など様々な特徴があるので、自社の環境に適したAWS監視ツールをきちんと選ぶことが重要です。
AWS監視ツールをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
“AWS監視ツール”の 一括資料ダウンロードする(無料)
株式会社はてな
株式会社はてなが提供する日本製のSaaS型サーバー監視サービス。直感的なUIとユーザー数に制限のない料金プランで、システムの運用・監視にチームで取り組む文化作り...
株式会社メタップスホールディングス
AWSやクラウド監視ツールのインフラログやコストを横断的に収集・可視化し、一元的な管理を実現。インフラログやコスト、タスク管理まで統合したダッシュボードにより、...
SaaSpresto株式会社
エージェントレスのIT統合監視システムです。ハイブリッド環境のIT資産やシステムを一元監視し、標準テンプレートによる導入工数削減や、AIOps機能によるアラート...
パトロールクラリス(PATROL CLARICE)|インタビュー掲載
株式会社コムスクエア
大規模データセンターをはじめ4,000社以上の導入実績をもつ、純国産のエージェントレス型サーバー・ネットワーク統合監視・運用自動化ツールです。 オンプレミス・...
<重要なお知らせ> サイトリニューアルに伴い、初回ログインにはパスワードの再設定が必要です。
アスピックご利用のメールアドレスを入力ください。
パスワード再発行手続きのメールをお送りします。
パスワード再設定依頼の自動メールを送信しました。
メール文のURLより、パスワード再登録のお手続きをお願いします。
ご入力いただいたメールアドレスに誤りがあった場合がございます。
お手数おかけしますが、再度ご入力をお試しください。
ご登録いただいているメールアドレスにダウンロードURLをお送りしています。ご確認ください。
サービスの導入検討状況を教えて下さい。
本資料に含まれる企業(社)よりご案内を差し上げる場合があります。