- AWSにおける可観測性(Observability)
- 可観測性とは?
- システムの動作状況を把握できている状態
- システム運用において、判断に必要な情報が取得的ている状態
- ログ
- メトリクス
- トレース
- サービス間のトランザクションを処理全体で把握できる
- どのコンポーネントで遅延しているか、エラーが発生しているか把握可能になる
- 可観測性とは?
- CloudWatch
- Dashboards
- ダッシュボードでクロスアカウントクロスリージョンの情報を集約
- X-Ray
- トレース取得
- サービスマップから運用・エラーの状況が分かる
- マイクロサービスのトラブルシューティング
- ServiceLens
- X-Rayと連携
- サービスマップに遅延やエラーの情報も表示
- ログやメトリクスも単一ツールから確認可能
- Synthetics
- 外形監視
- EventBridge
- イベントベース・タイムベース
- Metrics
- Metrics Stream
- Kinesis Data Firehose
- Alarms
- メトリクスに応じたアクションの実行
- Metrics Stream
- Metrics Explorer
- タグベースの可視化
- Logs
- LogsInsights
- クエリ可能
- ログの可視化
- 構造化ログによるメトリクス
- Container Insights
- Contributor Insights
- Lambda拡張機能によるメトリクス
- Lambda Insights
- アプリケーションコンポーネントのメトリクス
- Application Insights
- LogsInsights
- RUM
- Real-User Monitoring
- ウェブアプリのモニタリング
- モニタリングに必要なこと
- 各ページのヘッダーにJavaScriptスニペット追加
- このスニペットは、ユーザーがページをアクセスする際に実行され、データをRUMに送信する
- リアルユーザーのパフォーマンスをモニタし、ブラウザ・デバイスの種類、物理的ロケーション、NW接続性の問題などを把握
- ダッシュボードでページ読み込み順序やJavaScript、レスポンスのエラーなどの情報を可視化
- 同じ問題の影響下にあるセッション数を提示するため、改修の優先順位をつけられる
- ServiceLens、X-Rayと組み合わせることで、クライアント・サーバサイドの相関関係トレースも可能
- Evidently
- RUMと統合
- A/Bテストやフィーチャーフラグでどちらの選択肢が望ましいか検証する際に、ユーザーの挙動をモニタリングするサービス
- トラフィックをコントロールするスケジュール機能や、問題発生時のロールバックするアラーム機能を備える
- CloudWatch エージェント
- ログのフィルタ式をサポートしているため、指定した条件を満たすログのみを収集可能
- Logs APIサービスクォータに近づいた時、アラームを通知可能
- Dashboards
- オープンソース・SaaS
- AWS Distro for OpenTelemetry
- メトリクスやトレースを監視ソリューションに送信できる
- AWSコンテナとLambdaコンソールからワンクリックでデプロイと設定が可能
- Amazon Managed Service for Prometheus(AMP)
- PromQL(クエリ言語)を利用してAWS・オンプレのコンテナワークロードを監視
- 自動的にスケーリング
- AZをまたいだレプリケーション
- IAMによるアクセス制御
- PrivateLinkによるセキュアなアクセス
- サービス検出・メトリック収集にAWS Distro for OpenTelemetryが利用可能
- Amazon Managed Grafanaとの連携によりリッチな可視化も
- Amazon Managed Grafana
- 複数のデータソースからメトリックやログを視覚化
- AWSSSOと統合しており、ユーザごとにアクセスできるダッシュボードとデータソースにシームレスなアクセスが可能
- AWSアカウントとリソースの検出機能
- AWS Distro for OpenTelemetry
- DevOps全体に広がる可観測性と機械学習活用
- 開発運用に
- Amazon CodeGuru
- セキュリティの脆弱性を検出し、コードレビューを自動化
- CodeGuru Reviewer Secrets Detector
- 機密情報の埋め込みを検知
- Amazon DevOps Guru
- アプリケーションの運用上の問題点や改善ポイントを指摘
- Amazon CloudWatch anomaly detection
- メトリクスの期待値をモデル作成し、アラームに活用
- Amazon CodeGuru
- 開発運用に
AWS Summit Online – セッション「AWS の Observability(可観測性)の全体像〜 Amazon CloudWatch とオープンソースの活用〜(AWS-21)」を視聴した際の覚書

この記事は約3分で読めます。