skillup

技術ブログ

サーバー・ネットワーク

障害調査フロー

投稿日:

実務でサーバーの障害が発生した時のフローなどをメモしおこうかと。

行ってしまうと「ログに始まり、ログにおわる」といった感じでしょうか。

サーバーエンジニアの方の作業をみてたんですが、基本的にはプログラムの不具合の調査と一緒でとにかく徹底してログを見ていくのが大事なようです。

そこでおかしいものをみたら対象を絞り込んでいくという感じです。探偵の操作に近いかんじでしょうか。

/var/log/message システム関連のログはディフォルトでまずここにはかれます。

障害発生時の時間帯を特定し、その時間帯で何が起きたかを調査していくことになります。普段見慣れないような記述などがあればそこに問題が起こっているかとおもいます。

さらに詳細な情報は以下のリンクを参考に。

参考リンク

http://www.infraeye.com/study/linuxz46.html

https://thinkit.co.jp/article/711/1

使えるunixコマンド

view ファイスパス(例 /var/log/message)

書き込み権限無しで、ファイルを開くコマンドのようです。viの書き込み禁止モードのようです。

http://www.itsenka.com/contents/development/unix-linux/view.html

/var/log/lastlog ログインの情報などはここにはかれます。

不審なログイン(主に不正なログイン)に対しての調査をするときに役立ちます。

ただし、ファイルは直接みてもあまり情報がわかるようにはなっていないので、以下のようなコマンドを使います。

last

実際にログインに成功したユーザーの記録が見れます。

lastb

ログインに失敗したユーザーの記録が見れます。

lastlog

全ユーザーの最終ログイン日時が見れます。引数の指定などで~日前や特定のユーザーだけなどを行うこともできます。

http://itpro.nikkeibp.co.jp/article/COLUMN/20060227/230808/?rt=nocnt

全体的なコマンドの紹介は下記リンクを。

http://takuya-1st.hatenablog.jp/entry/20100917/1284734237

-サーバー・ネットワーク
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

キャッシュについて(主にmemcachedを中心に)

Webサービスのパフォーマンス向上で目に見えて効果があることの一つがDBへのアクセス回数を減らすことです。 それはSQLを発行する回数を少なくするなど、普段からのプログラムの書き方ももちろん大事なので …

no image

メールの文字化け対策

メールの文字コードに関して、色々ごまかしながらやってましたが真面目に取り組む必要があり、ここでメモ。 Contents1 前提条件2 ヘッダー部分3 メール本文3.1 Content-Transfer …

no image

サーバーの過負荷の発見 メモリ使用率の調査&抽出、置換(awk,sed)コマンドについて

前回、サーバーの負荷調査について記事を書いたので、それに関するスクリプトを。 Contents1 仕様2 ソース3 解説3.1 freeコマンド3.2 awk3.3 sed 仕様 日付とメモリ使用率、 …

no image

nginxインストール(サブディレクトリでcakePHPを使いたいとき)

以前nginxのインストールを行いましたが、理解が浅かったようで今回すげーはまりました(汗) ガチンコ塾でもいっていますが、覚え始めの時はコピペでもいいですが(最初から100%の理解は非現実的)、慣れ …

no image

pidファイルに関して

サーバー上であるサービスを動いている(と思っている)時にstopしようとしたらpidファイルがありませんと怒られました。 pidファイルってよく聞くけどわかっていなかったのでこれを機にメモ。 Linu …