60·ИТ и разработка·Мессенджеры

Дежурный по алертам (on-call первой линии)

Гермес дежурит по алертам на первой линии: отсеивает шум, обогащает контекстом, выполняет типовые проверки и будит человека только по реальному. Меньше ложных подъёмов ночью и быстрее реакция на настоящее.

Как это происходит — процесс по шагам

1Алерт2Фильтр3Диагностика4Действие5Память

Схема запускается сама и идёт по кругу. Нажмите на любой шаг — чтобы остановиться и прочитать его подробнее.

Сколько это приносит — формула Q × P

Q — алерт/мес (атомарных единиц процесса). P — деньги на одной единице (снижение ошибок). Эффект = Q × P за месяц.

Вывод P: P = отсеянный ложный алерт + быстрее реакция × стоимость инцидента

Малая · до ~50 человек

100 × 250

25 тыс ₽/мес

Средняя · ~50–500 человек

900 × 380

342 тыс ₽/мес

Крупная · 500+ человек

7 000 × 520

3.6 млн ₽/мес

Спецификация сценария (по Вигерсу)

ID сценария
HERMES-UC-060
Название
Дежурный по алертам (on-call первой линии)
Действующее лицо
Дежурный инженер (on-call)
Заинтересованные стороны
  • Дежурный — меньше ложных подъёмов
  • Бизнес — быстрее реакция на реальные сбои
  • Команда — улучшение раннбуков
Предусловия
  • Подключён мониторинг и заданы раннбуки
  • Описаны правила автодействий и эскалации
Триггер
Сработал алерт мониторинга
Основной сценарий
  1. 1.Гермес отсеивает шум и флаппинг.
  2. 2.Прогоняет типовые проверки из раннбука (метрики, логи, статус).
  3. 3.Выполняет безопасное автодействие или будит дежурного с контекстом.
  4. 4.Запоминает инцидент для улучшения раннбуков.
Расширения и исключения
  • 1aИзвестный ложный алерт — подавляется с записью в лог.
  • 3aАвтопочинка не помогла/риск высок — немедленная эскалация человеку.
Постусловия
  • Реальные алерты отработаны или эскалированы
  • Ночной шум снижен
Бизнес-правила
  • Перечень разрешённых автодействий строго ограничен
  • При сомнении — эскалация, без рискованных операций
Частота
Круглосуточно, по потоку алертов
Допущения
  • Мониторинг и раннбуки доступны агенту

Операционная модель — стоимость владения за 3 года

Совокупная стоимость владения (TCO) за 36 месяцев против эффекта Q × P. Числа выше — по облачным ценам токенов OpenRouter (модель уровня сценария — DeepSeek V4 Flash), инференс учтён отдельной строкой. Инфраструктура и надзор делятся на все сценарии — здесь показана доля, относимая на этот; для одного отдельного сценария на своём сервере она была бы выше. Самообучение удешевляет токены по годам, эффект выходит на полную мощность не сразу. Лицензия Гермеса — 0 ₽ (MIT); self-hosting на своих весах меняет плату за токены на GPU и электричество. Числа — оценка для прикидки, не оферта.

Малая · до ~50 человек

TCO 3 года

98 тыс ₽

Эффект 3 года

825 тыс ₽

Чистыми

727 тыс ₽

ROI

8.5×

Окупаемость

2 мес

ГодЗатратыЭффектЧистыми
146 тыс ₽210 тыс ₽164 тыс ₽
226 тыс ₽300 тыс ₽274 тыс ₽
326 тыс ₽315 тыс ₽289 тыс ₽
Итого98 тыс ₽825 тыс ₽727 тыс ₽

Из чего складывается в месяц: инфраструктура 600 ₽ (доля общей установки) · инференс 5 ₽ · надзор 2 тыс ₽ (доля) · плюс внедрение 20 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Средняя · ~50–500 человек

TCO 3 года

299 тыс ₽

Эффект 3 года

11 млн ₽

Чистыми

11 млн ₽

ROI

37.7×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1137 тыс ₽2.9 млн ₽2.7 млн ₽
281 тыс ₽4.1 млн ₽4.0 млн ₽
381 тыс ₽4.3 млн ₽4.2 млн ₽
Итого299 тыс ₽11 млн ₽11 млн ₽

Из чего складывается в месяц: инфраструктура 2 тыс ₽ (доля общей установки) · инференс 48 ₽ · надзор 5 тыс ₽ (доля) · плюс внедрение 55 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Крупная · 500+ человек

TCO 3 года

816 тыс ₽

Эффект 3 года

120 млн ₽

Чистыми

119 млн ₽

ROI

147.3×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1352 тыс ₽31 млн ₽30 млн ₽
2232 тыс ₽44 млн ₽43 млн ₽
3231 тыс ₽46 млн ₽46 млн ₽
Итого816 тыс ₽120 млн ₽119 млн ₽

Из чего складывается в месяц: инфраструктура 5 тыс ₽ (доля общей установки) · инференс 370 ₽ · надзор 15 тыс ₽ (доля) · плюс внедрение 120 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.