インシデント管理に特化したツールの使い方に慣れれば、ルーチンワークのように作業をこなせるかも知れません。しかし、ITILにおけるインシデント管理の役割がよくわかっていないと、インシデント管理と関係ない案件が混ざっていても気づかないことがあり得ます。ここではインシデント管理の本質に立ち返ってみましょう。
1.インシデント管理とは
そもそもインシデント管理(Incident Manegemaent)とは 何かしらのトラブルが発生し、ユーザーのシステムなどに異常をきたし、正常に利用することができなくなった状態を回復させることであり、その原因を取り除き、再度システムが正常になるようにサポートします。
インシデントの意味は、「好ましくないできごと」となります。
IT用語としては「中断・損失・緊急事態など危険になりえる状況、その状態」とされています。
インシデント管理の目的は、システムを迅速に復旧、回復させ、ユーザーがすぐに業務を再開することができたり、中断していた時間をできるだけ短くすることです。
迅速に復旧することで、ビジネスへの影響を最小化させます。
インシデント管理の流れは
- インシデント発生、報告
- 発生日時、起こった状況を確認
- 迅速に解決できる対応策を考える
- 対応策を実施し、解決
- 復旧確認
インシデントの復旧後、いつ、どのようなインシデントが発生し、どう解決したか、対応したのか、記録を残しておくことで、似たようなインシデントが発生した時に、迅速で的確に対応することができます。
2.インシデント管理の手順とステップ
インシデント管理には、4つのプロセスがあります。
ここでは、それぞれに合わせて解説していきます。
インシデントの確認
インシデントが発生した場合、まずは確認作業を行います。
発生した問題、トラブルを正確に把握し、特定する必要性があります。
- 発生日時
- トラブルがあったサービスやシステムは何か
- 影響範囲はどこまでになるか
- 影響した場合どのようなことになるか
- 報告者
- 発見者
このような情報を正確に把握する必要性があります。
分類
次に分類を行います。
インシデントの分類は、特定したインシデントに対して有効な対応をするために大切ですので、しっかりと行いましょう。
重要度、緊急度、複雑度、影響範囲など細かに考えていきます。
これらから考え、優先順位を付けていくことが重要です。
解決策を実行
分類したインシデントに対して、迅速で有効な対応を行います。
この時、適切な担当者を割り当てることが大切です。
ユーザー担当者で対応できるのか、上位者へ引き継ぐ必要性があるのか、判断が必要になります。
そのためにも分類はとても重要だと言えるでしょう。
- 問題の分類と調査
- 一時的な回避策の実施
- 今後の解決策について問題管理へ引き継ぐ
- 進捗状況や担当者とのコミュニケーション
このようなことを行い、解決策を実行していきます。
対策手法やナレッジの共有
インシデント管理では対策方法は、迅速でありビジネスへの影響が少なくなるように求められます。
解決策が迅速で適切であれば、インシデントによって発生した問題やトラブルは確実に解消され、システムやサービスは通常どおりに戻ります。
ビジネスへの影響を最小限に抑えることが、ユーザーにとって重要なことです。
そのため、インシデントが解消されたあとはナレッジベースに情報を共有することが重要になります。
別のインシデントが発生した時に、ナレッジベースからの情報をもとにすることができるからです。
3.インシデント管理の目的
インシデント管理の目的は、インシデントが発生した時に迅速に状況を把握し、影響が少ないうちに復旧を目指すことです。
また復旧に必要な情報を一元管理することで、ユーザー担当者でも対応しやすくする目的もあります。
重要視される点は、迅速な対応が求められるため、どれだけ早くインシデントを解消できるかです。
そのため、24時間対応するケースも多くあります。
また、インシデント管理を行うことでメリットもあります。
ユーザー担当者は過去のナレッジベースを管理することで、スムーズに対応することができます。
それにより、無駄なエスカレーションをする必要性がなくなるでしょう。
マネージャーや管理者は、過去のインシデントの対応が蓄積されることで担当者レベルでも対応可能となり、ユーザー担当者に任せることができます。
そうすることで、問題管理のための分析に時間を使うことができます。
そして、ユーザーも安心してシステムを使うことができます。
4.インシデント管理ツールの種類
インシデント管理ツールは、インシデントが発生した箇所や問題の状況を、適切に管理したり、把握することができるツールです。それにより、迅速に状況を復旧させることができます。
インシデント管理機能には主に4種類があります。
- 問い合わせ機能
- プロジェクト管理機能
- メール管理機能
- チケット機能
問い合わせ管理機能
問い合わせ管理機能は、社外からの問い合わせの管理や分析などを行う機能です。
インシデントが発生した場合、電話やメール、チャット、SNSなど様々な形で問い合わせを受けるでしょう。
この機能があれば、すべての問い合わせ内容を一元管理でき、スムーズに対応できます。
担当者が問い合わせ内容を入力する必要性がないので、抜けや漏れなども防ぐことができます。
プロジェクト管理機能
プロジェクト管理機能は、プロジェクトのスケジュールやタスクの管理、案件の進捗状況などを共有することができ、発生するかもしれないインシデントの早期発見や予防になります。
確実な業務を行いたい場合は、通知機能をリマインドとして使用することがおすすめです。
決まったタスクが実行できたかなどを、全員で確認することができます。
メール管理機能
メール管理機能は、テキストベースの問い合わせ内容を、まとめて管理することができます。
担当者が交代する時に、コメント機能で注意喚起することもできるので、使い方次第ではトラブルを未然に防ぐことができます。
テキストベースなので誰が見ても分かりやすく、使いやすいというメリットがあります。
チケット管理機能
チケット管理機能には、インシデントの報告だけでなく、追跡を効率的にすることができます。
インシデントの報告が来ると関連するチケットが作成され、タスクの割り当てや進捗の追跡、タスクの管理などが行えます。
また、優先順位をつけることも可能です。
5.インシデント管理ツールの主な機能
一般的なインシデント管理ツールには、業務をスムーズに行うことができるための様々な機能があります。
社内外からの問い合わせを管理して、ユーザーの質問や問い合わせに効率的で正確に回答することができます。
- ナレッジベースの構築、管理
- 問い合わせ内容の一元管理
- 迅速な対応状況の表示
- 問い合わせ内容の自動振り分け
- テンプレートやチャット機能による回答補助
- 過去の質問事項の集計や分析
ナレッジベースで問い合わせの一元管理を行うことで、迅速な対応状況の把握や、過去に似たものがないかなどを判断して自動で振り分けることができます。
そのためにも、過去の情報の集計や分析が重要です。
また、自社内プロジェクトを管理する機能もあります。
- メンバーの権限管理
- 通知、リマインダー機能による情報共有、連絡漏れ防止
- スケジュールやタスクの進捗管理
- 全員の作業進捗状況を可視化できる
自社内での場合は、インシデントを未然に防ぐための予防策が多くあります。
またインシデントが発生した場合も、チーム全体で共有が可能です。
6.インシデント管理ツール導入によるメリット
インシデント管理ツールを導入することによって、問題の起こっている箇所や内容を迅速に把握し、その後の的確な対応をすることが容易になります。
業務効率がよくなるのと同時に、迅速で的確なインシデントの解決につながるので、ユーザーからの信頼や品質向上が実現できます。
- 現状の可視化
- 一元管理できる
- データ入力の手間を削減
- 過去データの蓄積、管理
- 管理フローの標準化
- プロジェクト管理の明確化
担当者が多くいる場合や、情報が複雑化している場合など、現状を把握することが困難な場合があります。
そんな時にインシデント管理ツールがあれば、情報を一元管理することで、現状の可視化ができます。
Excelなどの使用で情報を管理すると、情報が埋もれてしまったり、共有する時に時間がかかる、行き違いが発生する、記入ミスや漏れが出るなどが、発生するおそれがあります。
過去のデータ管理をすることは難しいことが多いため、専用ツールの使用が望ましいでしょう。
専用のツールを利用して、過去のデータに基づき、インシデントを分かりやすく分類することで、迅速で最適な解決をすることができます。
管理フローが標準化されることで、基準が明確になります。
担当者が交代した場合や、属人化した時の差を埋めることも可能です。
プロジェクト管理自体が明確になるので、担当者がはっきりするだけでなく、誰が何をしているのか、何をするのか、最終的にはどうなるのか、などゴールの明確化が期待できます。
7.インシデント管理ツールの失敗しない選び方
インシデント管理ツールでは、様々な種類や使い方があります。
どのような目的が一番必要なのか、どのような使い方を求めているのか、どんな問題を解決したいのかを明確にしましょう。
また、その目的を達成するために必要な機能がどんなものであり、それがどのツールに備わっているのか比較検討が必要です。
使いやすさ、サポート体制、価格なども判断材料として必要になります。
- インシデント関連の問い合わせ情報が集約されること
- 迅速に対応することができること
- 対応状況が可視化され、誰でも容易に確認できること
- 実績が豊富にあり、トラブルが少ないこと
など、このようなことをに注目してツールを選ぶ必要性があります。
現在は、SNSやメッセージアプリなどからも問い合わせが来ます。
電話やメール以外でも問い合わせが来た時にスムーズに対応できるか、実際に問い合わせがあった時、どのようになるのかなど確認しておきましょう。
社内で誰がそれを担当し、どのように使うのか、担当者が代わっても使用することができるのか、など自社特有の状況がある場合は、それも考慮に入れましょう。
可視化の状態については、ツールを選ぶ上で大事なポイントです。
インシデント管理の進捗状況が分かりにくいと、混乱を招いてしまいます。
実績が豊富で多くの企業に採用されているツールは、基本的な機能が使いやすく、問題やトラブルが少ないことをを示しています。
自社と同じ規模の会社がどのようなツールを使っているのか、検討材料にしてもよいでしょう。
インシデント管理ツールをより良く使うには
インシデント管理に特化したツールの使い方に慣れれば、ルーチンワークのように作業をこなせるかも知れません。しかし、ITILにおけるインシデント管理の役割がよくわかっていないと、インシデント管理と関係ない案件が混ざっていても気づかないことがあり得ます。ここではインシデント管理の本質に立ち返ってみましょう。Redmineのチケット管理機能は、まさにインシデント管理の役割を果たすのにぴったりだと言えます。
インシデント管理では、主に次の9つのプロセスを行います。
- インシデントの識別
- インシデントの記録
- インシデントのカテゴリ化
- インシデントの優先度付け
- インシデントの初期診断
- エスカレーション
- 調査と診断
- 解決と復旧
- インシデントのクローズ
すでにインシデント管理にRedmineを使っているのであれば、「なるほど、あの作業はITILのこのプロセスに該当するんだな」とピンと来るのではないかと思います。
ただ、ここで注意したいのは、インシデント管理の本質は“迅速に”対応することであって、問題の根本解決ではない、ということです。一時しのぎの暫定対応を行ってサービスを継続できるようにする、ビジネスへの影響を最小限に抑える。ここまでがインシデント管理の範疇です。
2016年10月に福岡で道路の大規模陥没事件が起こりましたが、迅速な工事によって1週間で使用できるようになりました。例えるなら、あの突貫工事がインシデント管理です。しかし、とりあえず道路を使えるようにするのが目的だったので、あの時点では問題のすべてが解決したわけではありませんでした。問題の根本原因を解決する、問題を恒久的に片付ける。これは「問題管理」の範疇になります。インシデント管理の範疇に収まらない問題は問題管理にエスカレーションされねばなりません。ここを勘違いすると、対応が中途半端になってしまい、クレームを付けられたりする恐れもあります。
次回は問題管理について詳しく見てみましょう。
「ITILにおける問題管理」の記事はこちら