24時間365日の運用監視から解放 ~Zabbix活用~

Zabbix監視自動化で有人監視を撤廃し、運用コスト削減と効率化を実現

  • Zabbix
  • クラウド
  • サーバー
  • 監視

ご依頼の背景

Zabbix監視自動化で有人監視を撤廃し、運用コスト削減と効率化を実現

多くの業種様において監視サーバー(Zabbix)の運用が形骸化・属人化し、大きな課題となっております。また、24時間365日の有人監視にかかるコストと運用負荷も経営を圧迫されている事例も多いかと思います。弊社はZabbixの全面的な再構築と障害復旧の自動化を提案・実行。これにより、有人監視体制を完全に撤廃し、大幅なコスト削減と運用業務のDXを実現しました。

導入企業様

全国の行政機関に対し、専門的なITサービスを提供。国民の生活に不可欠な行政サービスの円滑な運営を、システムの力で支えているリーディングカンパニーです。

抱えていた課題

  1. 01

    形骸化した監視サーバー(Zabbix)と属人化した運用体制

    監視サーバーとしてZabbixを導入していたものの、長年にわたり設定がメンテナンスされておらず、その運用は形骸化していました。専門知識を持つ担当者も社内に不在で、設定ルールも統一されていなかったため、運用が属人化。障害発生時の迅速な対応や、新たな監視設定の追加・変更が非常に困難な状況でした。

  2. 02

    24時間365日の有人監視によるコストと運用負荷

    システムの安定稼働を維持するため、24時間365日の監視体制を外部の専門業者へ委託していました。しかし、この有人監視は多大なコストがかかるだけでなく、休日や夜間に障害が発生した際には、担当者へのエスカレーションや復旧対応依頼など、大きな運用負荷が生じていました。

導入ソリューション

ソリューションの特徴

Zabbix再構築と自動化による監視運用DX

お客様が抱える課題を根本から解決するため、多角的なソリューションを提供しました。
まず、Zabbixのバージョンアップを機に、既存のすべての監視設定を全面的に見直しました。将来の拡張性やメンテナンス性を考慮した新たな運用ルールを策定し、設定を標準化することで、属人化を解消し誰でも運用しやすい環境を再構築しました。あわせて、システムの死活監視間隔を短縮する改善を行い、障害検知までの時間を大幅に短縮しました。
最大の取り組みは、障害復旧の自動化です。Zabbixが障害を検知した際に、対象サーバーへリモートコマンドを自動実行し、サービス再起動などの復旧処理を無人で行う仕組みを構築しました。これにより、従来は外部委託していた24時間365日の有人監視を完全に撤廃することに成功しました。
さらに、お客様や営業担当者が各システムの稼働状況をリアルタイムで確認できるWebサイトを構築。障害情報や復旧見込みなどを集約して表示することで、本社への問い合わせ件数を削減しました。
また、サーバー切り替えで不要となった資産を再利用し、検証用の仮想基盤(Proxmox)を構築。開発・検証環境の構築を容易にし、チーム全体の生産性向上にも貢献しました。ドキュメント管理においても、従来のWord/Excel形式から検索性とメンテナンス性に優れたAsciidoc形式へ移行し、長期的な運用を見据えた改善を行っています。

ソリューション概要図
監視対象サーバー
Zabbix 監視サーバー
(障害検知)
稼働状況確認サイト
(お客様・営業)
自動復旧処理
(リモートコマンド実行)

監視・自動化・基盤構築に関する多様な技術

本プロジェクトでは、多岐にわたる技術を活用しました。
監視サーバーのコア技術としてZabbixの深い知識を基盤とし、サーバーOSであるLinuxおよびWindows Serverのスキルを駆使して構築を行いました。
障害復旧の自動化においては、PowerShellやbatといったスクリプト言語を用いてリモートコマンドを実装し、通知システムにはSMTPを利用しています。
システム稼働状況確認サイトの構築では、WebデータベースツールExmentをベースに、PHP/Javascript/htmlを用いて開発。
検証用仮想基盤の構築にはProxmoxを、ドキュメントの標準化にはAsciidocやGit、そして将来的にはCI/CDの導入も視野に入れています。

活用技術スタック
監視コア
  • Zabbix
  • Linux
  • Windows Server
自動化
  • PowerShell
  • bat
  • SMTP
Webサイト
  • Exment
  • PHP / JavaScript
  • HTML
仮想基盤
  • Proxmox
ドキュメント/CI/CD
  • Asciidoc
  • Git

導入効果

有人監視の完全撤廃による大幅なコスト削減と、属人化しない運用体制を実現

障害復旧の自動化により、これまで外部委託していた24時間365日の有人監視が不要となり、運用コストを大幅に削減。同時に、監視運用の属人化を解消し、問い合わせ対応の工数削減や開発効率の向上も実現しました。

  1. 01

    有人監視撤廃でコスト減

    最大の効果は、Zabbixによる障害検知と復旧の自動化を実現したことにより、24時間365日の有人監視体制を完全に撤廃できたことです。これにより、これまで外部委託にかかっていた多額のコストを削減することに成功しました。また、休日や深夜の障害発生時における精神的・時間的な運用負荷からも解放され、担当者はより創造的な業務に集中できる環境が整いました。

  2. 02

    属人化解消と運用効率化

    Zabbixの監視設定に明確なルールを設けて再構築したことで、担当者のスキルに依存しない安定した運用が可能になりました。また、手順書を検索性に優れたAsciidoc形式に統一したことや、誰でも手軽に検証環境を構築できる仮想基盤を用意したことで、業務の引き継ぎや情報共有がスムーズになり、チーム全体の業務効率が大幅に向上しました。

  3. 03

    問い合わせ削減と情報提供

    各システムの稼働状況を一覧できるWebサイトを構築したことで、エンドユーザーや営業担当者へリアルタイムな情報提供が可能になりました。障害の発生状況や復旧見込みを即座に共有できるため、これまで電話やメールで本社に寄せられていた多くの問い合わせが削減され、サポート担当者の工数削減と顧客満足度の向上に繋がりました。

担当者の声

エヌデーデー担当者からの声

お客様の表面的なご要望に応えるだけでなく、その背景にある本質的な課題は何かを常に考え、将来的な運用まで見据えた最適な提案を心がけました。今回の障害復旧自動化は、お客様の事業に直接的なコスト削減で貢献できると確信して進めたプロジェクトです。私たちが特に意識しているのは、お客様の担当者様が社内で高く評価されることです。それが私たちの提供価値の証明であり、真の顧客満足に繋がると信じています。今後もお客様のインフラ全体を支えるパートナーとして信頼いただけるよう、より高いレベルの提案を続けていきます。