Tag Archives | работа

Мониторинг — потихоньку выкладываю сорсы.

Решил тут выложить сорсы класса alarm .

На подходе агент мониторинга в двух исполнениях (служба и приложение).

Ну и маленький дисклаймер, на будущее 🙂 :

Все что тут выложено по определению не содержит никаких Хау Ноу (или как оно там правильно ?) по этому копипаста не воспрещена 🙂 . Если обнаружили баги — сообщайте, поправлю.

Ты тот, кого ты ешь …

Как же меня достала наша конторская столовая !

А тут опросник приходит, на тему удовлетворенности копропротивным питанием. Тут регулярно всякий автоматический мусор приходит. Не выдержал.

Мониторинг за 4 раза :-) , агенты влияния.

Продолжение серии статей, рассказывающих о построении своими руками системы мониторинга рассчитанной на большой поток событий.

Схема хранения данных, выбор протокола, реализация агентов мониторинга.

В прошлой статье мы определили что такое система мониторинга и как она оценивается. В этот раз мы с вами попытаемся разобраться с архитектурой и реализовать агенты мониторинга для типовой (сферической в вакууме) инфраструктуры уровня крупного отдела некоей корпорации.

Continue Reading →

Мониторинг за 4 раза :-) , введение в мониторинг.

Quis custodiet ipsos custodes?

Это первая статья в серии, рассказывающей о построении своими руками системы мониторинга рассчитанной на большой поток событий.

Немного теории для начала

Согласно WIKI:

Мониторинг — процесс систематического или непрерывного сбора информации о параметрах сложного объекта или процесса.

В случае телекоммуникационного оборудования мониторинг представляет из себя некий набор мер и методик по выявлению неисправностей, нештатных ситуаций и изменения ключевых показателей сервиса.

Качество работы любой системы мониторинга определяется тремя основными показателями :

  • Максимальное время реакции — время необходимое системе на то чтобы распознать проблему и оповестить о ней оператора.
  • Вероятность ложного срабатывания. (Оповещение оператора о несуществующей или уже завершившейся проблеме)
  • Вероятность пропуска аварии. (Ситуация, при которой система не оповещает оператора о существующей проблеме)

Чем меньше время реакции — тем больше времени остается оператору на принятие решения и устранение проблемы. Два следующих показателя в принципе равнозначны, и хотя пропуск аварии на первый взгляд кажется более опасным, при большом потоке аварий ложное срабатывание вещь очень неприятная. Оператор тратит свое время на решение несуществующей проблемы, да и меры предпринимаемые для ее устранения с очень большой долей вероятности приводят к реальным сбоям.

Есть еще один, неофициальный показатель — степень доверия. Это то, на сколько доверяют системе мониторинга операторы. 🙂

Continue Reading →

Powered by WordPress. Designed by WooThemes