コラム
ITサービスマネジメントにおける問題管理とは? メリットや具体的なプロセスを解説
目次
-
ITサービスマネジメントにおいて欠かすことのできない管理業務の一つが「問題管理」です。インシデントが発生した際には、即座に復旧に向けた対応が求められますが、同じインシデントを繰り返さないためには、適切な問題管理の実施が不可欠です。
本記事では、ITサービスマネジメントにおける問題管理の概要やメリット、具体的なプロセス、さらに成果を出すためのポイントを解説します。問題管理を徹底することで、サービス品質の向上や自社の信頼性の強化につながります。ぜひ本記事を参考に、適切な問題管理の実践に取り組みましょう。
この記事で分かること
・ITサービスマネジメントにおける問題管理の概要
・問題管理に取り組むメリット
・問題管理の具体的なプロセス -
ITサービスマネジメントにおける問題管理とは?
ITサービスマネジメントにおける問題管理とは、インシデント(重大な事故に発展する可能性がある予期せぬ障害や事象)の根本原因を究明・分析し、再発防止を図るための管理プロセスのことです。これは、ITサービスマネジメントの中心的な役割を担う要素であり、欠かすことはできません。
インシデントに対して応急措置的な対応を行うのではなく、根本原因に基づいた適切な解決策を講じることで、将来的な問題の再発や新たな発生そのものを防ぐことを役割としています。インシデント管理との違い
問題管理と混同されがちなのが、インシデント管理です。
インシデント管理とは、ITサービスで発生した予期せぬインシデントに対し、応急措置を行ってサービスを早期に復旧させる取り組みです。一方問題管理は前述した通り、インシデントの根本原因を究明し発生の予防につなげます。
例えばサーバーがダウンした場合、再起動してサーバーを迅速に復旧させるのがインシデント管理です。対してサーバーダウンの原因を突き止め、バグの修正やオペレーションを改善し、同じ問題が発生しないように恒久的な対策を講じることが問題管理に該当します。
インシデント管理は、いち早くインシデントを解決して業務への支障を最低限にとどめ、できるだけ早くサービスを正常に再開することが目的です。これにより顧客満足度の低下を防ぎ、ビジネスの継続性を守ります。
一方問題管理は、根本原因の解決によってサービス品質を高め、安定提供を実現することで、より高い顧客満足度と長期的な信頼につなげることが目的です。 -
ITサービスマネジメントにおける問題管理のメリット
ITサービスマネジメントにおいて、問題管理を適切に行うと、どのようなメリットがあるのでしょうか。3つのメリットをご紹介します。
運用担当者の負荷が軽減される
運用担当者の負担を軽減できることは、問題管理を実施するメリットの一つです。
ITサービスでインシデントが発生すると、運用担当者は通常業務に加えてインシデントへの対応(インシデント管理)を行わなければなりません。そのためインシデントが発生すればするほど、担当者の負担は増大してしまいます。
しかし適切な問題管理を行い、インシデントの再発を防止できれば、対応にかかる手間や時間を抑えることが可能です。担当者はその分通常業務に専念できるようになり、生産性を高められます。またインシデント対応にかかるコストも大幅に削減できるでしょう。ユーザー満足度が向上する
問題管理を行うことは、ユーザー満足度の向上にも直結します。
障害やバグが絶対に発生しないということは難しいものの、サービスの質を保つためには有効な対策が求められます。同じインシデントが繰り返し発生し、長時間のサービス停止が続くなどの事態は、ユーザーの信頼や満足度を低下させる一因です。
問題管理を徹底すれば、障害そのものの発生頻度を減らすことができ、安定してサービスを提供できるようになります。また根本原因を突き止めて再発防止策を講じることで、たとえ過去に発生したインシデントが再発したとしても迅速かつ的確に対応できるようになるため、サービスの停止時間ダウンタイムを最小限に抑えられます。長期的なサービス品質の向上につながる
長期的なサービス品質の向上につながることも、問題管理を実施するメリットです。
問題管理では、再発防止に向けた恒久的な対策を実施するため、力を入れて取り組むほどインシデントの発生率を低減させられます。さらに担当者の生産性が上がるので、より良いサービスへと発展させることもできるでしょう。
また問題管理を継続的に実施することでナレッジが蓄積され、再発防止に向けた体系的な仕組みを構築できます。過去の事例から学ぶことで、サービスをさらに高品質なものへと進化させることが可能です。 -
問題管理の2つのアプローチ
問題管理のアプローチ方法には「リアクティブな問題管理」と「プロアクティブな問題管理」があります。それぞれどのようにアプローチするのかを詳しく見ていきましょう。
リアクティブな問題管理
リアクティブは「反応的な」という意味で、ビジネスにおいては問題が発生してから対応を取ることを指します。従って「リアクティブな問題管理」とは、発生したインシデントの根本原因を究明・分析し、再発防止を図るアプローチです。
例えば、サーバーがダウンするインシデントが発生したとします。原因を調査した結果、ハードウェア部品の劣化が根本的な要因であると分かった場合、その部品を交換した上で監視体制を強化し、再発を防ぐ取り組みが、リアクティブな問題管理です。プロアクティブな問題管理
プロアクティブは「先取りする」「積極的な」という意味で、ビジネスにおいては問題が発生する前に先を見越して行動することを指します。すなわち「プロアクティブな問題管理」とは、インシデント発生前に潜在的な問題を予測し、未然に防ぐアプローチです。
プロアクティブな問題管理を徹底するためには、継続的にログ分析を行い、発生し得る問題を予測して適切な対応を講じることが求められます。また過去に発生したインシデントの傾向を分析し、そこから見えてくる問題点に対して対策を講じることも効果的です。
例えばログ分析の結果、特定のサーバーでエラー率が少しずつ上昇していることが判明したとします。その場合、サーバーダウンの可能性を予測し、早めに部品を交換するのがプロアクティブな問題管理の一例です。
プロアクティブな問題管理を実施すれば、インシデントの発生件数を減らせるため、リアクティブな問題管理にかかる工数削減効果も期待できます。 -
ITサービスマネジメントにおける問題管理の具体的なプロセス
ITサービスマネジメントにおいて問題管理を実施する際、具体的にどのようなプロセスで進めていけば良いのでしょうか。問題管理のプロセスについて、順を追って解説します。
1.インシデントを認識し記録する
問題管理においてリアクティブな対応が必要になるのは、発生の根本原因が特定できないインシデントや、解決済みにもかかわらず再発してしまったインシデントです。このようなインシデントが発生したら、認識した時点でなるべく早く情報を記録しましょう。発生からすぐに情報を記録すれば、抜け漏れによる情報損失のリスクを軽減できるでしょう。
記録内容の一例は、以下の通りです。
・発生日時
・発見者
・発生している現象や影響
・暫定の影響範囲
・暫定の対応状況2.インシデントを分類して優先順位を付ける
次に記録した問題をサービスへの影響度や緊急度で分類し、優先順位を付けていきます。
サービスへの影響度は、問題がサービスにおよぼす被害の規模や範囲を踏まえて分類しましょう。例えば全社員が使用するメールサーバーがダウンした場合、影響度は「大」に分類します。一方、特定の端末で起こったエラーは「小」に分類できます。
緊急度は、その問題をどれだけ早く復旧させる必要があるかを重視して分類しましょう。例えば当日の決算報告で使用するシステムに障害が発生した場合の緊急度は「高」、来週まで使用しないテスト環境に障害が発生した場合は「低」と分類できます。
同時に複数の問題が起こっている場合は、この2つの視点を軸に優先順位を検討しましょう。3.暫定的な対策を講じる
問題の優先順位を付けたら、今発生しているインシデントに対して、応急措置的な対応を行いサービス復旧を目指します(インシデント管理)。
この時点では問題に対してまだ完全な解決策は見つかっていません。この段階で講じる措置は「ワークアラウンド(回避策)」と呼ばれ、インシデントが与えるサービスへの影響を抑える効果が期待できます。4.根本原因を調査する
暫定的な対策を講じてサービスが復旧したら、問題の根本原因特定に向けて詳細な調査を実施しましょう。
根本原因を見つけるためには、以下のような手法が用いられます。
・5why分析(なぜなぜ分析)
・フォールトツリー分析
・ログ分析
問題が発生した際、原因が一つであるケースはまれです。多くの場合、複数の要因が複雑に絡み合っているため、表面的な要因だけでなく、潜在的な要因にも目を向ける必要があります。
サービスへの影響度が大きい場合や緊急度が高い場合には、専門チームを結成して調査に当たることも検討しましょう。5.既知のエラーとして記録する
根本原因が判明しワークアラウンドが確立された問題は、既知のエラーとして記録を残しましょう。
対応した全ての問題を既知のエラーとして蓄積しておくことで、将来類似のインシデントが発生した際に迅速な対応が可能となり、早期のサービス復旧につながります。さらに、インシデントの予防策を検討する際にも、有益な情報となります。6.恒久的な対策を策定する
次に特定された根本原因に対して、恒久的な対策を策定しましょう。
根本原因に基づき、適切な解決策や再発防止策を検討します。この段階で策定する対策は、同一のインシデントを防止できるだけでなく、類似のインシデントにも幅広く適用できるものであることが望ましいです。7.ナレッジベースや業務マニュアルへ反映する
最後にインシデントの発生から解決策や予防策の策定に至るまでの一連のプロセスを、ドキュメントとしてまとめましょう。
作成したドキュメントは、ナレッジベースに反映させます。また今回発生した問題を踏まえて既存の業務フローを見直し、必要に応じて業務マニュアルも更新しましょう。
ここで紹介した問題管理のプロセスは主にリアクティブな問題管理に基づくものですが、ナレッジベースや業務マニュアルに反映しておくことで、プロアクティブな問題管理にもつなげることができます。
この一連のプロセスをへて、一つの問題がクローズとなります。 -
問題管理で成果を上げるためのポイント
問題管理で成果を上げるためには、重要なポイントを押さえて取り組むことが欠かせません。ここでは、問題管理を効果的に実施するための3つのポイントをご紹介します。
KPIを設定して改善効果を可視化する
問題管理で成果を上げるためには、KPI(重要達成度指標)を設定し、改善効果を可視化しましょう。改善効果が可視化されれば、その問題管理によってどこを目指せば良いのかがわかり、より成果として認識しやすくなります。問題管理で設定すべきKPIは問題の性質や状況などによって異なります。以下はその一例です。
・再発件数・再発率:再発したインシデントの数や割合
・インシデント発生件数:年・月単位でのインシデント発生数
・MTTR(平均復旧時間):インシデント発生からシステム復旧までの平均時間
・問題解決時間:問題の特定から解決するまでの平均時間
・恒久的対策の実装率:恒久的な対策まで到達できた割合
例えば再発件数や再発率をKPIにすれば、策定した恒久的な対策によって、どの程度の効果を得られているのかを見極めることができます。またインシデント発生件数をKPIにすれば、問題管理の実施によって、どの程度インシデントを抑制できているのかを把握できます。
企業やサービスによって、「エラーで動けない時間を短くしたい」「インシデントの発生を減らしたい」など、抱える課題はさまざまです。KPIを設定する際は、問題管理によってどのような課題を解決・改善したいかを考慮して決めましょう。オープンで責任を問わない雰囲気をつくる
問題管理で成果を上げるには、誰もが自由に発言でき、特定の人物に責任を追及しない雰囲気をつくることが重要です。これは特に根本原因の究明において、大きな意味を持ちます。
問題の根本原因を洗い出し、潜在的な要因まで把握するためには、チームメンバー全員がペナルティや報復を恐れることなく、事実をありのままに共有できる環境を整備しなければなりません。誰もが安心して発言できる環境になれば、根本原因をよりスムーズに特定できる可能性が高まります。
前述した通り、根本原因が一つに限られるケースはまれです。特定の人物に責任を問うような企業風土があると、他の要因を見落としてしまい、結果として再発につながる恐れもあります。ITSMツールを導入して記録・分析を効率化する
ITSM(ITサービスマネジメント)ツールを導入し、記録や分析のプロセスを効率化することも、問題管理で成果を上げるための重要なポイントです。
ITSMツールは、ITサービスを一元的に管理し、効率的な運用・管理・提供を支援する仕組みです。多くの場合、問題管理をはじめとした各種管理業務をサポートする機能が備えられています。これらを活用することで、インシデントの発生や問題の認識から、恒久的な解決策の策定・共有に至るまで、一連のプロセスを体系的に管理でき、問題ごとに進捗状況の「見える化」が可能です。
問題管理を行う方法には、Excelなどの表計算ソフトを活用する手段もあります。しかし、表計算ソフトはコストを抑えられる反面、導入から運用の仕組みを構築するまでに手間と時間がかかる上、複雑な問題の進捗管理には適していません。さらに、ITIL®(ITサービスマネジメントのベストプラクティス)に準じた運用を行うには、ITIL®を基準としてゼロから仕組みを構築する必要があります。
その点、ITSMツールはITIL®に準拠した製品も多く提供されており、導入後すぐにITIL®の基準に沿った運用が可能です。結果として、より効率的で精度の高い問題管理を目指せるでしょう。 -
まとめ
ITサービスマネジメントの中核を担う問題管理は、根本原因が不明なインシデントの原因を特定し、恒久的な解決策を講じることで、インシデントの発生を未然に防ぐために欠かせない取り組みです。問題管理を徹底すれば、運用担当者の負担軽減だけでなく、ユーザー満足度やサービス品質の向上も期待できます。本記事を参考に適切な問題管理を実践し、サービス品質や自社の生産性向上につなげましょう。
「SmartStage ServiceDesk」は、問題管理をはじめ、インシデント管理やサービス要求管理など8つの管理業務をサポートする機能を搭載したITSMツールです。ITIL®︎ベースのテンプレートを採用しており、大手企業のIT部門にも多数の導入実績があります。プログラミング不要で柔軟にカスタマイズできる点も特徴です。全機能をご利用いただける完全版トライアルも実施していますので、ぜひ一度お試しください。