ちょっと最近、残念なシステム障害の対応現場を見る機会があったので、「障害対応はこうあるべき?」っていう個人的メモを。
障害発生!さぁどうする?
障害が発生するとSEさんってすぐに端末にかじりついて、ログ解析やプロセスの再起動などの作業に夢中になったりしません?(もちろん自分も経験あり)
障害の内容を把握する、システムの早い復旧を行うのはSEの大切な仕事なんで否定はしないですけどね。
実は、大多数の人にとって障害の原因なんて、SE本人が考えるほど意外なほどどうでもいいことです。(障害復旧後に作成する報告書なんて誰も見てなかったりして)
まずはアナウンス
大切なのは、障害のアウトラインが分かった段階で、外に向かって情報提供してあげることかもしれません。
- 被害の範囲(FAX受注は問題ないが、Web受注は使えませんとか)
- 被害の重大度(午前中に入力した伝票が全て消えましたとか。そりゃ大変だ)
- 復旧までの見込時間(あと30分でWeb閲覧はできるけど、メール復旧までは1時間かかるとか)
その時「JVMのGCか…」とか意味不明な専門用語使っちゃダメですよ(^^;
少なくとも何も情報がないと、システムを使ってるオペレータはシステムを使っていいんだか悪いんだか分からない。
もっと大きなシステムになると、
- 「システム使えねぇ!」って問合せを受けるサポート窓口
- 顧客に対して、早くお詫び連絡をしたい営業
など、外に向かって告知をしなくてはいけない人達がとにかく情報を欲しているはず。
もしかするとそんな皆さんは少し怒ってるかもしれないけど、堂々と情報提供してみましょう。
障害対応に燃えろ!
普段は縁の下の力持ちとして、深夜や大型連休に人目につかず頑張っているSEさんですが、障害対応はそんなSEの一番の見せ場!(いや、そんな格好いいもんじゃないな…)
そんな時に、実際対応は誰かに任せて、全体的な状況を把握して的確に情報提供をしてあげられると「デキるSE」としておいしいとこ取り出来るチャンスですぞ。
これ普通の人にとっては「当たり前だ!」って思われるかもしれないんですが、草さえも食べない超草食系揃いのシステム屋さん達にとって、こういう外向きアクションは苦手なんですって…
わかってあげてくださいね(^^;
RSS配信中…ご利用のRSSリーダーにご登録お願いします。
»»トラックバックURL⇒ http://blog.itoy.jp/develop/restoration.html/trackback
»»RSSでこの記事のレスポンスをチェック
