インシデント管理とは?ITILに基づいた適切な運用方法、早期解決や再発防止のポイント

ITサービスを提供する際に参照すべきベストプラクティスとしてITILがあり、その一つとしてインシデント発生時に適切な対応を行うための「インシデント管理」というプロセスがあります。インシデントによる影響を抑えるため、ITシステム・サービスを運用する情報システム部門においてインシデント管理は非常に重要です。そこで本記事では、ITILインシデント管理のプロセスや課題、適切な運用方法をご紹介します。
お役立ち資料
法人PC運用の外部委託先選定時のポイントとは?
法人PC運用の
外部委託先選定時のポイントとは?
資料ダウンロード

ITILに基づいたインシデント管理とは

インシデント管理とは

インシデント管理とは、ITシステムやサービス上において、何らかのトラブルや事故によりユーザーに悪影響を及ぼしている状態が発生した際に、再び正常に利用できるようにするサポート体制のことです。

そもそもインシデント(incident)とは、事故(アクシデント)が発生する恐れのある事態のことを指します。
ITサービス運用においては、インシデントは「正常なITサービスの妨げになる事象」のことであり、企業内で起こり得るインシデントには主に以下のようなものが想定されます。

・サーバーのダウン
・ネットワークの障害
・データベースの障害
・セキュリティ侵害
・ソフトウェアのバグ

たとえば、メールが送信できない、いつも利用しているシステムにログインできないといったインシデントが発生した際に、原因究明と影響範囲を特定し、速やかな対処を行うことがインシデント管理として挙げられます。

特に、セキュリティに関するインシデントのことを「セキュリティインシデント」と呼びます。セキュリティインシデントについては以下で詳しく紹介しています。
セキュリティインシデントとは?種類や管理方法を解説

インシデント管理と似た意味の言葉に「問題管理」があります。インシデント管理は、サービス提供中に発生した問題や障害に対処するためのプロセスであるのに対し、問題管理は、再発防止や長期的な解決策の確立に焦点を当てたプロセスであるという点において、両者には違いがあります。

インシデントは常に発生する可能性があるため、企業はインシデント時に適切な対応が行えるように管理を行う必要があります。
そしてITサービスを提供するうえで、インシデント管理はITILに基づいて行うことが大切です。

ITILとは

ITIL(Information Technology Infrastructure Library)とは、ITサービスをマネジメント・提供する際に参照すべき事例をまとめたベストプラクティス集のことです。
ITIL上には、サービスライフサイクルと呼ばれる以下5つのカテゴリ分類があります。

・サービスストラテジ(ITサービスの戦略立案)
・サービスデザイン(ITサービスの設計・変更)
・サービストランジション(新たなITサービスの立ち上げや移行)
・サービスオペレーション(ITサービスの運用)
・継続的なサービス改善(フローの見直しやPDCAなど)

これらの要素を自社の状況に合わせて活用することで、適切かつ継続的なITサービスの提供を行うことができます。インシデント管理は、上記のうちサービスオペレーションに属する工程です。

なお、ITILと似た概念に、ITSMがあります。ITILとITSMの違いは以下で紹介しています。

ITILに基づいたインシデント管理の重要性

ITILにおけるインシデント管理は、インシデントによって生じうる業務への悪影響を可能な限り抑え、スピーディーにサービスを復旧することを目的としています。

また、ITILに準拠したインシデント管理は、インシデントの発生率低下につながります。そして、発生したインシデントの分析と対策をすることで、結果的にサービスの品質向上にも寄与します。

これらの目的を遂行するためには、誰がどのようにインシデントの発生を認識し、状況を把握するのか明確にしたうえで、解決策の検討・立案や実施、回復、さらに復旧後の振り返りまでを行うことが重要です。

ITILに基づくインシデント管理のプロセス

ITILに基づくインシデント管理は、以下の流れで実行します。

①:インシデントの検出・受付・起票

最初のプロセスは、インシデントの検出です。
主な検出方法としては、ユーザーからの問い合わせ、ツールを使ったシステムアラートがあります。迅速な対応のためには、ツールによる検出の自動化が効果的です。 検出したインシデントは管理者が受付し、発生日時や状況などの詳細を記録します。

②:インシデントの分類と優先度の策定

記録したインシデントを分類し、対応の優先順位を決定します。
分類に関しては、インシデントの種類、影響対象・範囲、緊急性、対応の難易度などを細分化することが重要です。それらの要素を踏まえ、適切な担当者に振り分けを行います。

③:インシデントの対応策の決定

担当者は、自社に蓄積された過去のインシデント事例を参照しながら解決に向けた対応策を決定します。
自社が解決に役立つ情報を持っておらず、対応に高度な知識が必要であれば、上位者に相談や指示を仰ぐ「エスカレーション」を行います。

④:インシデント解消と進捗管理

インシデント解消の際には、インシデント発生時からの経過時間、調査状況、報告のタイミングなどの進捗を管理することが重要です。
また、想定より解決に時間を要する場合には、一次対応の部門だけで解決を図るのではなく、他部門との連携や適切な対応ができる組織に対応を依頼することもあります。

⑤:インシデントのクローズ

インシデントが解決されたら、関係者に速やかに報告・周知します。場合によっては解決後のユーザーフォローや経過の確認なども必要です。
インシデントの再発や対応する必要がなくなればクローズとなり、自社のナレッジベースに記録します。

ITILインシデント管理における課題

上記のようなプロセスで行われるインシデント管理ですが、さまざまな課題があり、目的である業務への悪影響の抑制や、スピーディーなサービス復旧ができていない企業が少なくありません。
以下では、どのような課題があるのかをご紹介します。

「インシデント管理」のみで「問題管理」ができていない

インシデント管理は、迅速な業務復旧が最優先の目的であるため、暫定的な対応となりやすく、多くの企業では、インシデント解消後の根本的な原因の特定や解決が行われないことも珍しくありません。

問題管理をインシデント管理とは別に実施して根本的な原因の特定や恒久的な対応策を策定しないと、既知の原因によるインシデントの再発を防げず、インシデントによる悪影響を最小限に抑えることができません。

情報共有がなされていない

インシデント管理の過程で得られた情報が、適切に共有されず、断片化されることもよくある課題として挙げられます。また、進捗状況の把握やエスカレーションによる引継ぎが行われていないケースもあります。このような事態は、チーム間のコミュニケーション不足や情報の隠蔽、または適切なツールやプロセスの欠如によって引き起こされます。

これにより、同じ問題に対して複数の部門が重複作業を行ったり、誤解や混乱が生じたり、組織全体のパフォーマンスに悪影響を与える可能性があります。

業務プロセスが設定されていない

情報共有がなされていても、業務プロセスが設定されていなければ、過去事例の参照や適切な担当者の割り振りに余計な時間を費やすことになってしまいます。また、タスクの責任者や手順が不明確で意思決定や対応が遅れ、作業の品質や結果が一貫していないという問題につながります。

これにより、大幅な時間のロスやサービス品質の低下、顧客の損失といった不利益が発生する可能性があります。

ITILインシデント管理の適切な運用方法

ITILインシデント管理においては、以下3点を意識することで適切な運用を行うことができます。

インシデント管理だけではなく「問題管理」と「変更管理」まで実施

前述のとおり、インシデント管理においては速やかな対応が最優先とされるものの、スピード重視であるがゆえに根本原因の特定までは求められません。しかし、それだけでは再度同様のインシデントが発生する可能性があるため、「問題管理」まで実施する必要があります。問題管理においては時間をかけて原因を究明し、恒久的な対応策を実施できるようにすることが重要です。

また、インシデント発生時のリスクを認識し、その被害を最小限に控えるために「変更管理」を行うことも求められます。ITILにおける変更管理とは、ITシステム・サービスに影響を及ぼすIT関連のハードウェアやソフトウェア、さらに人員等の構成を変更・改善することです。OSのアップデートやセキュリティパッチの適用などが含まれます。

この作業を定期的に行い、変更履歴を残すことで、変更のプロセスを確認でき、実際にシステムの変更を伴うインシデントが発生した場合にも、想定外のリスクや混乱を起こさずに対応できるようになります

ナレッジベースの作成・管理

今後、同様のインシデントが発生した際に一次対応がスムーズに行えるよう、過去に発生したインシデントに関する情報を自社のナレッジベースに記録し、情報を管理できる仕組みづくりも重要です。 ナレッジベースの蓄積が増えれば、軽微なトラブルは一次対応で解決でき、スムーズな対処が行えます。

また、担当者によって対応が異なってしまう事態を避けられ、属人化の防止や対応品質の標準化にもつながります。

オペレーションルールの定義

インシデント処理に際してのエスカレーションや他の部門への引継ぎ、専門組織への依頼方法など、オペレーションのルールを定義しておくことも大切です。 オペレーションルールが定義されていることで、一次対応で解決できない場合に、どこにエスカレーションや引継ぎを行うべきか、またどのように伝達すべきか、といった点で迷いがなくなり、時間のロスが少なくなります。

ITILベースの運用管理を実現する「Wave PC Mate」

Wave PC Mate は、お客様のPCライフサイクルをワンストップにサポートを行うサービスです。 導入することで、IT資産と各種インシデント情報を一元的に統括・管理できるため、インシデントの解決率や業務効率を高められます。
ITILに準拠したサービス設計から「サービスサポート」、「サービスデリバリー」を提供可能であり、インシデント管理が適正に行えていない場合にも、お客様側にてインシデント管理の体制を整備する必要がありません

またPC運用管理、エンドユーザーサポート業務などPCに関わる一連の業務を一括でアウトソーシングすることで、本来取り組むべきIT推進の企画・立案業務に専念できます。

ITILベースの運用管理をするには?

以下資料では、PCに関わる一連の業務を一括アウトソーシングする際のポイントをご紹介しています。 PCをはじめとするIT資産に関するインシデント管理体制の構築を検討されている方はぜひご覧ください。

お役立ち資料
法人PC運用の外部委託先選定時のポイントとは?
法人PC運用の
外部委託先選定時のポイントとは?
資料ダウンロード
このコラムを書いたライター
Wave PC Mate 運営事務局
Wave PC Mate 運営事務局
Wave PC Mateは、NTTデータ ウェーブが提供するハードウェアの調達から導入、運用管理、撤去・廃棄までのPCライフサイクルマネジメントのトータルアウトソーシングサービスです。本サイトでは、法人企業のPC運用管理業務の課題解決に役立つ様々な情報をお届けします。