通信障害の予測・被害を最小限に抑えるシステム構築。
ある国の機関が全国で20以上の主要拠点を持ち、ネットワーク機器やサーバの増減や変更が頻繁に行われています。そして、毎日大量のデータやり取りがあり、ネットワークやサーバの障害が発生した際に日常業務に多大な影響を与えてしまいます。被害を最小限に抑えるために障害監視と予測ができるシステムが必要不可欠なのです。
システム内容
- ネットワークとサーバー情報の一元管理
 - 全国のネットワークやサーバの情報を一元に管理し、階層構造と結点が分かる構成図の元となるデータを管理する機能を提供。
 - 監視機能
 - センターにZabbixサーバ、サーバにはZabbix-agentを導入し、リソース・死活監視を行う。
 - ネットワーク遅延と障害監視
 - 定間隔でネットワークのトラフィックをTCPのパケットレベルで捉え、そのデータをMQサーバに送り、MQサーバで情報の選別し、遅延の有無と障害の兆候をキャッチし、ほぼリアルタイムでの状況監視が可能、障害が発生したらエラーメールをすぐに発報。
 - 障害と遅延の予測
 - 蓄積した各種情報に対して機械学習を行い、障害発生の予測結果をアラートメールとして発信。
 
システム構成図

データの処理フロー
