skillup

技術ブログ

サーバー・ネットワーク

障害調査フロー

投稿日:2017年2月1日 更新日:

実務でサーバーの障害が発生した時のフローなどをメモしおこうかと。

行ってしまうと「ログに始まり、ログにおわる」といった感じでしょうか。

サーバーエンジニアの方の作業をみてたんですが、基本的にはプログラムの不具合の調査と一緒でとにかく徹底してログを見ていくのが大事なようです。

そこでおかしいものをみたら対象を絞り込んでいくという感じです。探偵の操作に近いかんじでしょうか。

/var/log/message

システム関連のログはディフォルトでまずここにはかれます。

障害発生時の時間帯を特定し、その時間帯で何が起きたかを調査していくことになります。普段見慣れないような記述などがあればそこに問題が起こっているかとおもいます。

さらに詳細な情報は以下のリンクを参考に。

参考リンク

Linux – /var/log/messages

impress 必読!ログファイルとディレクトリ

使えるunixコマンド

view ファイスパス(例 /var/log/message )

書き込み権限無しで、ファイルを開くコマンドのようです。viの書き込み禁止モードのようです。

IT専科 view

/var/log/lastlog

ログインの情報などはここにはかれます。

不審なログイン(主に不正なログイン)に対しての調査をするときに役立ちます。

ただし、ファイルは直接みてもあまり情報がわかるようにはなっていないので、以下のようなコマンドを使います。

last

実際にログインに成功したユーザーの記録が見れます。

lastb

ログインに失敗したユーザーの記録が見れます。

lastlog

全ユーザーの最終ログイン日時が見れます。引数の指定などで~日前や特定のユーザーだけなどを行うこともできます。

日経 XTECH 【 lastlog 】 ユーザーが最後にログインした日付を表示する

全体的なコマンドの紹介は下記リンクを。

Unixユーザーのログイン記録を調べて、不正アクセスがないか確認する。

-サーバー・ネットワーク
-

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

no image

pidファイルに関して

サーバー上であるサービスを動いている(と思っている)時にstopしようとしたらpidファイルがありませんと怒られました。 pidファイルってよく聞くけどわかっていなかったのでこれを機にメモ。 Linu …

no image

Dockerfileでのコンテナ作成

dockerは通常はimageを取得し、コンテナを起動した後、自分独自にライブラリなどをインストールし、出来たものをcommitしますが、Dockerfileをつかえばこの一連の操作をファイルに記録し …

no image

ネットワーク基礎 OSI参照モデルなど

ここ↓でネットワークの基礎についてかいてあるので定期的に勉強しようと思っています。 3分間 NetWorking Contents1 スニーカーネットからリソース共有2 LANとWAN3 OSI参照モ …

no image

Git+SSH鍵認証

鍵認証をともなったgitのpushやpullについて。 中央リポジトリに公開鍵がおいてあり、リモートリポジトリに秘密鍵を配置します。 ステップとしては以下の2ステップになります。実行時ユーザーのディレ …

no image

ansible rolesなど

ansibleはある程度ファイルが肥大化してくると、管理するのが大変になります。 一般的にはプログラムのようにある程度のまとまりにわけてそれを読み込むということになります。 ある程度のまとまりのことを …

アーカイブ