22·Поддержка·Навыки

Черновики ответов на типовые обращения

На типовые обращения Гермес готовит черновик ответа из базы знаний и контекста клиента — агенту остаётся проверить и отправить. Среднее время ответа падает в разы, а качество выравнивается по лучшему образцу.

Как это происходит — процесс по шагам

1Тикет2Контекст3Черновик4Проверка5Учёт

Схема запускается сама и идёт по кругу. Нажмите на любой шаг — чтобы остановиться и прочитать его подробнее.

Сколько это приносит — формула Q × P

Q — ответ/мес (атомарных единиц процесса). P — деньги на одной единице (экономия времени). Эффект = Q × P за месяц.

Вывод P: P = 9 мин ÷ 60 × 800 ₽/ч ≈ 120 ₽

Малая · до ~50 человек

400 × 110

44 тыс ₽/мес

Средняя · ~50–500 человек

3 500 × 130

455 тыс ₽/мес

Крупная · 500+ человек

28 000 × 150

4.2 млн ₽/мес

Спецификация сценария (по Вигерсу)

ID сценария
HERMES-UC-022
Название
Черновики ответов на типовые обращения
Действующее лицо
Агент поддержки
Заинтересованные стороны
  • Клиент — быстрый и точный ответ
  • Агент — меньше печатать одно и то же
  • Руководитель — ровное качество ответов
Предусловия
  • Есть база знаний и доступ к истории клиента
  • Заданы тон и стандарты ответов
Триггер
Поступил тикет по типовой теме
Основной сценарий
  1. 1.Гермес распознаёт тему обращения.
  2. 2.Подбирает релевантную статью базы знаний и историю клиента.
  3. 3.Составляет персонализированный черновик ответа.
  4. 4.Агент проверяет, при необходимости правит и отправляет.
  5. 5.Гермес учитывает правки для улучшения будущих черновиков.
Расширения и исключения
  • 2aНет подходящей статьи — агент отвечает сам, тема помечается для пополнения базы.
  • 3aНизкая уверенность — черновик помечается «требует внимания».
Постусловия
  • Ответ отправлен быстрее за счёт готового черновика
  • Накоплена обратная связь для качества
Бизнес-правила
  • Финальную отправку подтверждает агент
  • Ответы соответствуют стандартам и тону
Частота
Непрерывно, по типовым тикетам
Допущения
  • База знаний поддерживается в актуальном виде

Операционная модель — стоимость владения за 3 года

Совокупная стоимость владения (TCO) за 36 месяцев против эффекта Q × P. Числа выше — по облачным ценам токенов OpenRouter (модель уровня сценария — Gemini 3 Flash Preview), инференс учтён отдельной строкой. Инфраструктура и надзор делятся на все сценарии — здесь показана доля, относимая на этот; для одного отдельного сценария на своём сервере она была бы выше. Самообучение удешевляет токены по годам, эффект выходит на полную мощность не сразу. Лицензия Гермеса — 0 ₽ (MIT); self-hosting на своих весах меняет плату за токены на GPU и электричество. Числа — оценка для прикидки, не оферта.

Малая · до ~50 человек

TCO 3 года

128 тыс ₽

Эффект 3 года

1.5 млн ₽

Чистыми

1.3 млн ₽

ROI

11.4×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
157 тыс ₽370 тыс ₽313 тыс ₽
236 тыс ₽528 тыс ₽492 тыс ₽
335 тыс ₽554 тыс ₽519 тыс ₽
Итого128 тыс ₽1.5 млн ₽1.3 млн ₽

Из чего складывается в месяц: инфраструктура 600 ₽ (доля общей установки) · инференс 572 ₽ · надзор 2 тыс ₽ (доля) · плюс внедрение 20 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Средняя · ~50–500 человек

TCO 3 года

564 тыс ₽

Эффект 3 года

15 млн ₽

Чистыми

14 млн ₽

ROI

26.6×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1233 тыс ₽3.8 млн ₽3.6 млн ₽
2169 тыс ₽5.5 млн ₽5.3 млн ₽
3163 тыс ₽5.7 млн ₽5.6 млн ₽
Итого564 тыс ₽15 млн ₽14 млн ₽

Из чего складывается в месяц: инфраструктура 2 тыс ₽ (доля общей установки) · инференс 5 тыс ₽ · надзор 8 тыс ₽ (доля) · плюс внедрение 55 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Крупная · 500+ человек

TCO 3 года

2.9 млн ₽

Эффект 3 года

139 млн ₽

Чистыми

136 млн ₽

ROI

47.2×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
11.1 млн ₽35 млн ₽34 млн ₽
2930 тыс ₽50 млн ₽49 млн ₽
3882 тыс ₽53 млн ₽52 млн ₽
Итого2.9 млн ₽139 млн ₽136 млн ₽

Из чего складывается в месяц: инфраструктура 5 тыс ₽ (доля общей установки) · инференс 40 тыс ₽ · надзор 39 тыс ₽ (доля) · плюс внедрение 120 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.