#コラム

インシデントシステムとは?
障害ではないインシデント管理について

更新日:
  • ITシステムの運用は、今や企業などの活動を支える重要な要素となっていますが、システム運用においてはインシデントへの理解と適切な対応が必要です。しかし、「インシデント=障害」と混同して捉えている人も多いのが現状で、管理者はこの固定観念をなくす必要があります。

    本記事ではITシステム運用におけるインシデントについて詳しく解説し、解決までのフローやインシデント管理システム導入のメリットなどについて説明します。お役立てください。

  • そもそもインシデントとは

    システムの運用において、よくインシデントという言葉が使われます。まず、このインシデントとは何かについて説明しましょう。

    システム運用におけるインシデント

    インシデントは英語で「Incident」といい、「出来事」や「事件」などと訳されます。安全管理や保安業務などでは、「ゆくゆくは事故などが発生する恐れがある状態」という意味で使われます。ITシステム運用でも同様な意味で使われますが、同じITの現場でも「インシデント」の使い方が異なることを覚えておきましょう。

    国際標準化機構(ISO)と国際電気標準会議(IEC)が共同で策定した、情報セキュリティ管理の規格「ISO/IEC 27001」では、インシデントは予期しない一連の情報セキュリティ事象であって、事業運営や情報セキュリティを脅かす可能性が高いものと定義されています。
    また、「ISO/IEC 13335」では、事業活動や情報セキュリティを損ねる可能性のある、予期しないもしくは望んでいない事象とそれぞれ定義されています。

    情報システム運用分野では、「セキュリティに害を及ぼす可能性のあるトラブルや外部からの攻撃」という使われ方が一般的なのに対して、サービスマネジメントなどの現場では単に「調査が必要な予期しない事象」という意味で使われているのが特徴です。

    ITシステム運用におけるインシデントの例としては、次のようなものがあります。
    ・ITシステムにアクセスできない
    ・メールが送信できない
    ・アプリケーションを利用しようとすると「ライセンスが切れている」というエラーが出る
    ・プリンタが認識されない
    ・システムの画面が固まり、次の画面に移れない

    インシデントは「障害」ではない

    ITシステム管理では、突発的な障害に対応しなければならないことがありますが、インシデントは障害ではありません。よくインシデントと障害を混同して同じ意味で使うことがありますが、この2つの言葉の違いを理解することが重要です。

    インシデントは先にあげた例に見るように、「メールができない」「アプリが利用できない」「プリンタに接続できない」など、利用者にとって「したいことができない状態」のことです。これに対して、障害はインシデントを引き起こしている要因の一つです。したがって、トラブルが起きたときに利用者が望むのは、したいことができる状態への復旧です。

    担当者がインシデントと障害を混同していると、障害の究明や問題の除去に時間がかかったり、無駄な労力を注いでしまったりします。その結果、利用者がしたいことができない状態がいつまでも解消されないことになりかねません。

    インシデントが発生したときは、いかに素早く利用者がしたいことができる状態にシステムを復旧させることが大事です。デバイスの再起動や、代替機を提供したりなどの対応は障害への対応ではありませんが、インシデント管理では有効な取り組みになります。

  • インシデント管理のフローとは

    インシデント管理とは、インシデントの発生把握から元の状態に復旧するまでを管理することで、復旧までの応急処置も含まれます。言い換えれば、ユーザーのシステム利用を妨げている事象を取り除いて、システムを使用し続けられる状態にすることです。以下にインシデント管理の手順(フロー)を紹介します。

    1:受付と記録の実施

    インシデント管理の最初の手順は、受付と記録の実施です。インシデントが発生した場合、ユーザーからの問い合わせやアラートでインシデントの発生を確認し、そのインシデントの情報やユーザーからの問い合わせもすべて記録します。これは後で分析して、インシデント解決後のITサービスの品質向上に活用します。

    2:インシデントの分類・優先順位の設定

    インシデント管理の2番目の手順は、インシデントの分類・優先順位の設定です。分類方法は現場によって異なりますが、インシデントの情報を基にインシデントの種類、影響範囲、担当者、緊急性、対応方法、解決までの見込み時間、工数などを特定し分類したうえで優先順位を設定します。

    3:ファーストヘルプラインの解決

    インシデント管理の手順の3番目は、ファーストヘルプラインによる解決です。ファーストヘルプラインとは、対応手順が決まっている問い合わせなどや、障害対応履歴(ナレッジベース)を活用することで解決できそうなインシデントの基準のことです。

    手順2の分類から判断して、対応手順が決まっているインシデントは手順に従って処理し、過去に発生している既知のインシデントには障害対応履歴などを活用して対応します。これによって、迅速な対応が可能です。

    4:エスカレーションの解決

    インシデント管理の手順の4番目は、エスカレーションによる解決です。エスカレーションとは、あらかじめ決めてある基準やファーストヘルプラインでの解決が難しいインシデントについて、上位のシステムに対応を依頼することです。

    具体的には、より詳細な調査や正確な診断ができる専門性を持つ担当者やマネージャー、適切なスペシャリストに依頼して対応に当たります。

    5:インシデントの追跡・ライフサイクルの管理

    インシデント管理の手順の5番目は、インシデントの追跡・ライフサイクルの管理です。インシデントを管理する担当者は、インシデントの発生が分かってから問題が解決するまでの間、経過期間や状況の調査を行い、ユーザーへのアップデート状況を管理します。インシデントの解決が長引いた場合は、エスカレーションの必要性を検討しなければいけません。

    インシデントが解決したら、ユーザーや関係者に報告するとともに解決に至るまでの活動を記録し、過去の事例としてすぐに活用できるような状態で保存します。

  • インシデント管理のポイント

    インシデント管理で重要なのはインシデントの発生を把握した場合、システム利用者の立場に立って対応することです。利用者は今やりたいことができることを望んでいます。このため、インシデントと障害はイコールではないことを理解したうえで、障害は何かを追求するよりも、まず利用者がしたいことができる状態に早く戻す方法を考えることが大事です。

    インシデントの解決のためには、インシデント管理のフロー(手順)を確立しておくと、作業がスムーズになります。特に記録フォーマットを統一したり、過去のインシデントへの対処情報を整理したりすることが大切です。ナレッジの蓄積とスムーズで適切な活用がポイントといえるでしょう。

    また利用者は、システムの復旧がいつになるかわからないまま待たされるとフラストレーションが溜まります。そこで利用者のフラストレーションに配慮して、いつインシデントを解決できるかを利用者に伝えることが大切です。

  • インシデント管理の必要性とは

    インシデント管理がなぜ必要かといえば、以前に発生したインシデントの再発防止と、スムーズなシステム運用やITサービス提供のためです。

    インシデントには発生する要因があるので、その要因を取り除けば同じインシデントの再発を防止できます。大事なのは発生したインシデントと解決に至った経緯、状況を詳細に記録に残し、管理することです。解決した担当者の経験で終わればインシデント対応の属人化してしまいますが、その情報をうまく共有できれば、再発防止につながります。

    ITシステムやITサービスの利用者にとっては、それを利用できるのが当たり前ですが、インシデントが発生している間、利用者はシステムを利用できなくなります。このためインシデント管理を適切に行い、過去の対応履歴などを参照して迅速に復旧することが最も重要です。

  • インシデント管理システム・管理ツールを使うメリット

    インシデント管理システム・管理ツールは、インシデントの情報記録・共有に適したシステムです。進行管理のダッシュボード機能、メールの送信・チェックや承認フローの機能など、業務の可視化やフローの標準化など、多機能化が図られています。

    インシデント管理では、記録・対応など大量の業務が発生します。インシデント管理システム・管理ツールを利用すれば、インシデント管理を自動化し、対応のスピードアップや業務効率を上げられるメリットがあります。

  • インシデント管理システムの導入がインシデント管理の課題解決に有効

    インシデントは、セキュリティに悪影響を及ぼす恐れのあるトラブルや外からの攻撃のことですが、インシデント管理のフローを社員が理解・共有しておくことによって、速やかな対応が可能になり、スピーディに解決を図ることができます。

    しかしインシデント管理は運用が属人化する、ナレッジが蓄積できないなど情報共有が課題になりがちです。こうした問題を解決するには、インシデント管理システム・管理ツールの導入が効果的です。導入によって、適切な情報記録や共有が実現しやすくなります。

  • 監修者情報
    井上 誠
    株式会社クレオ
    2002年から、さまざまな業務システムSEとしてキャリアをスタートし、100社を超える企業システムの開発プロジェクトに携わる。数多くのIT部門を見てきた経験とITILやITサービス管理への高い知見を生かし、現在はITILエキスパートを取得し、クライアントの課題解決に日々尽力するITサービス管理のエキスパートとして活躍。
    2002年から、さまざまな業務システムSEとしてキャリアをスタートし、100社を超える企業システムの開発プロジェクトに携わる。数多くのIT部門を見てきた経験とITILやITサービス管理への高い知見を生かし、現在はITILエキスパートを取得し、クライアントの課題解決に日々尽力するITサービス管理のエキスパートとして活躍。
  • 執筆者情報
    SmartStage

    SmartStage編集部

    IT部門がビジネスクリエイティブ集団に生まれ変わるためのヒントやトレンド情報を発信していきます。