Дежурный по алертам (on-call первой линии)
Гермес дежурит по алертам на первой линии: отсеивает шум, обогащает контекстом, выполняет типовые проверки и будит человека только по реальному. Меньше ложных подъёмов ночью и быстрее реакция на настоящее.
Как это происходит — процесс по шагам
Схема запускается сама и идёт по кругу. Нажмите на любой шаг — чтобы остановиться и прочитать его подробнее.
Сколько это приносит — формула Q × P
Q — алерт/мес (атомарных единиц процесса). P — деньги на одной единице (снижение ошибок). Эффект = Q × P за месяц.
Малая · до ~50 человек
100 × 250 ₽
25 тыс ₽/мес
Средняя · ~50–500 человек
900 × 380 ₽
342 тыс ₽/мес
Крупная · 500+ человек
7 000 × 520 ₽
3.6 млн ₽/мес
Спецификация сценария (по Вигерсу)
- ID сценария
- HERMES-UC-060
- Название
- Дежурный по алертам (on-call первой линии)
- Действующее лицо
- Дежурный инженер (on-call)
- Заинтересованные стороны
- Дежурный — меньше ложных подъёмов
- Бизнес — быстрее реакция на реальные сбои
- Команда — улучшение раннбуков
- Предусловия
- Подключён мониторинг и заданы раннбуки
- Описаны правила автодействий и эскалации
- Триггер
- Сработал алерт мониторинга
- Основной сценарий
- 1.Гермес отсеивает шум и флаппинг.
- 2.Прогоняет типовые проверки из раннбука (метрики, логи, статус).
- 3.Выполняет безопасное автодействие или будит дежурного с контекстом.
- 4.Запоминает инцидент для улучшения раннбуков.
- Расширения и исключения
- 1aИзвестный ложный алерт — подавляется с записью в лог.
- 3aАвтопочинка не помогла/риск высок — немедленная эскалация человеку.
- Постусловия
- Реальные алерты отработаны или эскалированы
- Ночной шум снижен
- Бизнес-правила
- Перечень разрешённых автодействий строго ограничен
- При сомнении — эскалация, без рискованных операций
- Частота
- Круглосуточно, по потоку алертов
- Допущения
- Мониторинг и раннбуки доступны агенту
Операционная модель — стоимость владения за 3 года
Совокупная стоимость владения (TCO) за 36 месяцев против эффекта Q × P. Числа выше — по облачным ценам токенов OpenRouter (модель уровня сценария — DeepSeek V4 Flash), инференс учтён отдельной строкой. Инфраструктура и надзор делятся на все сценарии — здесь показана доля, относимая на этот; для одного отдельного сценария на своём сервере она была бы выше. Самообучение удешевляет токены по годам, эффект выходит на полную мощность не сразу. Лицензия Гермеса — 0 ₽ (MIT); self-hosting на своих весах меняет плату за токены на GPU и электричество. Числа — оценка для прикидки, не оферта.
Малая · до ~50 человек
TCO 3 года
98 тыс ₽
Эффект 3 года
825 тыс ₽
Чистыми
727 тыс ₽
ROI
8.5×
Окупаемость
2 мес
| Год | Затраты | Эффект | Чистыми |
|---|---|---|---|
| 1 | 46 тыс ₽ | 210 тыс ₽ | 164 тыс ₽ |
| 2 | 26 тыс ₽ | 300 тыс ₽ | 274 тыс ₽ |
| 3 | 26 тыс ₽ | 315 тыс ₽ | 289 тыс ₽ |
| Итого | 98 тыс ₽ | 825 тыс ₽ | 727 тыс ₽ |
Из чего складывается в месяц: инфраструктура 600 ₽ (доля общей установки) · инференс 5 ₽ · надзор 2 тыс ₽ (доля) · плюс внедрение 20 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.
Средняя · ~50–500 человек
TCO 3 года
299 тыс ₽
Эффект 3 года
11 млн ₽
Чистыми
11 млн ₽
ROI
37.7×
Окупаемость
1 мес
| Год | Затраты | Эффект | Чистыми |
|---|---|---|---|
| 1 | 137 тыс ₽ | 2.9 млн ₽ | 2.7 млн ₽ |
| 2 | 81 тыс ₽ | 4.1 млн ₽ | 4.0 млн ₽ |
| 3 | 81 тыс ₽ | 4.3 млн ₽ | 4.2 млн ₽ |
| Итого | 299 тыс ₽ | 11 млн ₽ | 11 млн ₽ |
Из чего складывается в месяц: инфраструктура 2 тыс ₽ (доля общей установки) · инференс 48 ₽ · надзор 5 тыс ₽ (доля) · плюс внедрение 55 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.
Крупная · 500+ человек
TCO 3 года
816 тыс ₽
Эффект 3 года
120 млн ₽
Чистыми
119 млн ₽
ROI
147.3×
Окупаемость
1 мес
| Год | Затраты | Эффект | Чистыми |
|---|---|---|---|
| 1 | 352 тыс ₽ | 31 млн ₽ | 30 млн ₽ |
| 2 | 232 тыс ₽ | 44 млн ₽ | 43 млн ₽ |
| 3 | 231 тыс ₽ | 46 млн ₽ | 46 млн ₽ |
| Итого | 816 тыс ₽ | 120 млн ₽ | 119 млн ₽ |
Из чего складывается в месяц: инфраструктура 5 тыс ₽ (доля общей установки) · инференс 370 ₽ · надзор 15 тыс ₽ (доля) · плюс внедрение 120 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.