9. Мониторинг и самовосстановление системы

9.1. Общие принципы

В системе FraudWall предусмотрена система непрерывного мониторинга и автоматического самовосстановления на основе программного обеспечения monit .

Система мониторинга осуществляет проверку работоспособности всех сервисов и процессов системы, а также общей загрузки памяти (как оперативной, так и виртуальной), места на жестком диске и загрузки процессора.

В случае обнаружения неработоспособности какого-либо сервиса за определенный промежуток времени, monit автоматически перезапускает отказавший сервис.

Если несколько перезапусков отказавшего сервиса не смогли устранить проблему, осуществляется автоматическая перезагрузка операционной системы.

При чрезмерной продолжительной общей загрузке процессорного времени, вызванной несколькими сервисами, перезагрузка операционной системы не осуществляется - периодически формируется только почтовое уведомление.

На каждое из событий системы мониторинга и самовосстановления формируется почтовое уведомление на e-mail всех пользователей WWW-интерфейса с ролью «Администратор».

Среднее время на самовосстановление отказавшего компонента составляет порядка 2 минут, а в сложных случаях (с перезагрузкой операционной системы) - порядка 15 минут.

Реализованный механизм мониторинга системы обеспечивает непрерывность процесса самовосстановления системы в режиме 24x7.