24·Поддержка·Память

Эскалация со сбором контекста для инженеров

Когда вопрос уходит на вторую линию, Гермес собирает за инженера весь контекст: что у клиента, шаги воспроизведения, логи, что уже пробовали. Инженер сразу решает, а не тратит полдня на сбор информации.

Как это происходит — процесс по шагам

1Эскалация2Сбор3Воспроизведение4Пакет5Память

Схема запускается сама и идёт по кругу. Нажмите на любой шаг — чтобы остановиться и прочитать его подробнее.

Сколько это приносит — формула Q × P

Q — эскалация/мес (атомарных единиц процесса). P — деньги на одной единице (экономия времени). Эффект = Q × P за месяц.

Вывод P: P = 20 мин ÷ 60 × ставку инженера, сэкономленных на разбор

Малая · до ~50 человек

60 × 250

15 тыс ₽/мес

Средняя · ~50–500 человек

500 × 320

160 тыс ₽/мес

Крупная · 500+ человек

4 000 × 400

1.6 млн ₽/мес

Спецификация сценария (по Вигерсу)

ID сценария
HERMES-UC-024
Название
Эскалация со сбором контекста для инженеров
Действующее лицо
Инженер поддержки (2-я линия)
Заинтересованные стороны
  • Инженер — экономия времени на сбор контекста
  • Клиент — быстрее решение сложного вопроса
  • Поддержка — чище эскалации
Предусловия
  • Доступ к системам с логами и данными клиента
  • Описан формат эскалационного кейса
Триггер
Тикет эскалирован на вторую линию
Основной сценарий
  1. 1.Гермес получает эскалированный тикет.
  2. 2.Собирает данные клиента, окружение, логи и историю обращений.
  3. 3.Описывает шаги воспроизведения и вероятные причины.
  4. 4.Передаёт инженеру структурированный кейс.
  5. 5.После решения сохраняет случай для базы знаний.
Расширения и исключения
  • 2aДанных недостаточно — агент сам запрашивает их у клиента до эскалации.
  • 3aПохожий случай уже решался — прикладывается прошлое решение.
Постусловия
  • Инженер получил полный контекст для решения
  • Решённый кейс пополнил базу знаний
Бизнес-правила
  • Доступ к логам/данным — по ролям и политике
  • Персональные данные обрабатываются в периметре
Частота
По каждой эскалации на 2-ю линию
Допущения
  • Системы с логами доступны агенту

Операционная модель — стоимость владения за 3 года

Совокупная стоимость владения (TCO) за 36 месяцев против эффекта Q × P. Числа выше — по облачным ценам токенов OpenRouter (модель уровня сценария — Claude Sonnet 4.6), инференс учтён отдельной строкой. Инфраструктура и надзор делятся на все сценарии — здесь показана доля, относимая на этот; для одного отдельного сценария на своём сервере она была бы выше. Самообучение удешевляет токены по годам, эффект выходит на полную мощность не сразу. Лицензия Гермеса — 0 ₽ (MIT); self-hosting на своих весах меняет плату за токены на GPU и электричество. Числа — оценка для прикидки, не оферта.

Малая · до ~50 человек

TCO 3 года

140 тыс ₽

Эффект 3 года

495 тыс ₽

Чистыми

355 тыс ₽

ROI

3.5×

Окупаемость

3 мес

ГодЗатратыЭффектЧистыми
162 тыс ₽126 тыс ₽64 тыс ₽
240 тыс ₽180 тыс ₽140 тыс ₽
338 тыс ₽189 тыс ₽151 тыс ₽
Итого140 тыс ₽495 тыс ₽355 тыс ₽

Из чего складывается в месяц: инфраструктура 600 ₽ (доля общей установки) · инференс 1 тыс ₽ · надзор 2 тыс ₽ (доля) · плюс внедрение 20 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Средняя · ~50–500 человек

TCO 3 года

652 тыс ₽

Эффект 3 года

5.3 млн ₽

Чистыми

4.6 млн ₽

ROI

8.1×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1272 тыс ₽1.3 млн ₽1.1 млн ₽
2197 тыс ₽1.9 млн ₽1.7 млн ₽
3184 тыс ₽2.0 млн ₽1.8 млн ₽
Итого652 тыс ₽5.3 млн ₽4.6 млн ₽

Из чего складывается в месяц: инфраструктура 2 тыс ₽ (доля общей установки) · инференс 11 тыс ₽ · надзор 5 тыс ₽ (доля) · плюс внедрение 55 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Крупная · 500+ человек

TCO 3 года

3.6 млн ₽

Эффект 3 года

53 млн ₽

Чистыми

49 млн ₽

ROI

14.5×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
11.4 млн ₽13 млн ₽12 млн ₽
21.2 млн ₽19 млн ₽18 млн ₽
31.0 млн ₽20 млн ₽19 млн ₽
Итого3.6 млн ₽53 млн ₽49 млн ₽

Из чего складывается в месяц: инфраструктура 5 тыс ₽ (доля общей установки) · инференс 88 тыс ₽ · надзор 17 тыс ₽ (доля) · плюс внедрение 120 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.