無視しても構わないアラートが業務を圧迫
少し前のことになりますが、「システムの運用及び維持管理コストは、総保有コストの7割を占める」という話がありました。扱うシステム数が増加したので、それだけ運用・維持のコストがかさむようになったからです。
一昔前は個別の業務を個別に最適化するためにシステムが作られていたので、運用の方法や手順がシステムごとにバラバラでした。このため、システム運用は人手に依存しなければ成り立たないものになっていました。
近年ではさらにIT全般の統制への対応も運用業務に追加されるようになり、さらに人手が必要になったので人件費が増え、運用コストが増大しました。しかも、人手がかかるということは、オペレーションミスも増えるということ。結果として、運用コストが増える上にサービス品質の低下を招くという悪循環が起こっていました。
考えてみれば、会社によっては多数の顧客のシステムを預かってサーバーの運用管理を行います。中には数百の顧客のシステムを預かる会社もあります。するとどうなるか。ハードウェアの障害やジョブの異常終了などで検知されるアラートの数だけでも数万、数十万に達することもあるのです。さらに問題なのは、アラートのすべてが重要なものではないということ。かつて野村総合研究所がアラートの内容を点検したところ、アラートの40%は無視しても構わない内容だったそうです。しかし、人手によるチェックでは、「アラートを無視する」ということもオペレートしなければならず、重要なアラートへの対応が遅れてしまうという問題も発生していました。統合運用管理ツールが発達したのは、こういった問題に対応するためでもあったのです。
例えば統合運用管理ツールを導入すれば、「監視」や「ジョブ」といった運用業務の自動化を実現することができます。オープンソースソフトウェアの場合は、コスト削減にも貢献できます。アラート内容の状態やレベルを分類して優先順位を付け、不要なものは破棄するという一連の作業を自動化してくれるツールも登場しています。業務が効率化され、管理者が本当に対応すべき事案のみに集中できるだけでなく、オペレーターが最小限で済むので、大幅なコスト削減も期待できます。