オブザーバビリティ(可観測性)
概要
オブザーバビリティ(Observability, 可観測性)は、システムの外部から得られる出力(テレメトリ)だけを見て、内部で何が起きているかを把握できる度合い を指します。マイクロサービスや分散システムでは、事前に想定していなかった問題(unknown unknowns)を調査できることが重要になります。
3本柱(テレメトリの種類)
| 種類 | 内容 |
|---|---|
| メトリクス(Metrics) | 数値の時系列(CPU使用率、レイテンシ、エラー率など) |
| ログ(Logs) | 個々のイベントの記録 |
| トレース(Traces) | リクエストが複数サービスをまたぐ経路と所要時間 |
これらを統一的に扱う標準が OpenTelemetry です。
監視(Monitoring)との違い
- 監視:既知の問題を、事前に決めた指標で検知する
- オブザーバビリティ:未知の問題も、収集したテレメトリを掘り下げて調査できる
設計・運用との関係
- クラウドアプリケーション設計原則 の「運用を見据えて設計する」を実現する手段
- システムパフォーマンス の性能分析・ボトルネック特定の基盤
- AIエージェント の本番運用監視(Palantir AIP の可観測性ツールなど)