skillup

技術ブログ

サーバー・ネットワーク

システム監視の基礎

投稿日:

システム監視のルールがほとんどないので、ちょっと勉強中です。

危険率の判定

今まで一番知りたかったことがこれなんですね。例えばシステムに負荷がかかっている場合、どのパラメーターがどれくらいの数値だったら、というのがあまりわかっていませんでした。

ただ技術書にも「アプリケーションの処理速度とリソースの使用率の関係を論理的に分析することは簡単なことではない」と書かれています。

そこで手法としては下記のような対策が取られることが多いようです。

  1. バッチの処理時間やWebアプリケーションの平均応答時間などアプリケーションの処理速度の指標となるデータを決めて継続的にデータを収集する
  2. 指標のデータに顕著な変化が現れたときに、リソース使用状況のほうに、対応する変化が表れていないか確認する

例 あるアプリケーションの応答時間が3秒以上かかるときはCPUが80%以上を超えているときが多い。

参考文献

プロのためのLinuxシステム構築・運用技術

-サーバー・ネットワーク
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Terraform入門(シンプルなEC2の構築)

前回の記事でcloudformationとterraformの比較や紹介をしましたが、terraformがとっつきやすかったため、簡単なサンプルとメモを。 Contents1 インストール2 実行手順 …

no image

pythonのアップグレードに関して

pythonのアップグレードに関して。 python2.6だとpipがインストールされていないのですが、入れようとしてハマったのでメモ。 一般的なインストール方法ですが、下記のようになります。 [cr …

no image

ロードアベレージ監視シェルスクリプト

ロードアベレージの監視シェルスクリプトについて Contents1 使用コマンド1.1 uptime1.2 /proc/cpuinfo1.3 bc2 ソース3 他参考リンク 使用コマンド uptime …

no image

Dockerfileでのコンテナ作成

dockerは通常はimageを取得し、コンテナを起動した後、自分独自にライブラリなどをインストールし、出来たものをcommitしますが、Dockerfileをつかえばこの一連の操作をファイルに記録し …

no image

ポート解放(CentOS7)

新サーバー構築をしていたときにwebサーバーとしてnginxを立てましたが、外部から接続ができません。 500エラーすら吐かれず、ログも残っていません。 こんな時はホスト自体にアクセスが届いていない可 …