[Wiki] [一覧]

システムパフォーマンス

概要

システムパフォーマンスは、OS・ハードウェア・アプリケーションを含むシステム全体の性能を分析・改善する分野です。書籍『詳解 システム・パフォーマンス 第2版』(Brendan Gregg “Systems Performance”)は、CPU・メモリ・ディスク・ネットワークなどを横断的に扱い、推測ではなく計測に基づく 方法論を体系化しています。

計測に基づく方法論

USE メソッド

リソースごとに次の3つを確認する、ボトルネック特定の代表的手法:

その他、ワークロード分析やドリルダウン分析などの方法論がある。

対象となるリソース

リソース主な観点
CPU使用率、ランキュー、コンテキストスイッチ
メモリ使用量、ページング、スワップ
ディスク I/OIOPS、レイテンシ、スループット
ネットワーク帯域、レイテンシ、再送

応用例:LLM 推論のスループット(Daily フィード)

GPU 上の 大規模言語モデル 推論サービングも、飽和・スケジューリングを扱う性能問題です。

関連トピックとの接続

関連ページ

参考資料