23·Поддержка·Мессенджеры

Авто-ответ первой линии 24/7

Гермес держит первую линию 24/7: мгновенно отвечает на частые вопросы, решает простое сам и бесшовно передаёт сложное человеку с полным контекстом. Клиент получает ответ ночью и в пик, а команда разгружена от вала однотипного.

Как это происходит — процесс по шагам

1Обращение2Понимание3Решение4Передача5Учёт

Схема запускается сама и идёт по кругу. Нажмите на любой шаг — чтобы остановиться и прочитать его подробнее.

Сколько это приносит — формула Q × P

Q — обращение/мес (атомарных единиц процесса). P — деньги на одной единице (экономия времени). Эффект = Q × P за месяц.

Вывод P: P = закрытие без оператора × стоимость контакта

Малая · до ~50 человек

600 × 60

36 тыс ₽/мес

Средняя · ~50–500 человек

5 000 × 80

400 тыс ₽/мес

Крупная · 500+ человек

40 000 × 100

4.0 млн ₽/мес

Спецификация сценария (по Вигерсу)

ID сценария
HERMES-UC-023
Название
Авто-ответ первой линии 24/7
Действующее лицо
Клиент (агент поддержки — как сторона эскалации)
Заинтересованные стороны
  • Клиент — ответ круглосуточно и сразу
  • Поддержка — снят поток простых обращений
  • Бизнес — выше доступность без роста штата
Предусловия
  • Подключены каналы и база знаний
  • Описаны границы автономии и правила эскалации
Триггер
Клиент написал в поддержку
Основной сценарий
  1. 1.Гермес принимает обращение и определяет запрос.
  2. 2.Если вопрос в зоне автономии — отвечает или выполняет действие.
  3. 3.Если нет — эскалирует агенту, передавая полный контекст диалога.
  4. 4.Фиксирует исход и долю автономно решённых обращений.
Расширения и исключения
  • 2aНизкая уверенность в ответе — Гермес не «выдумывает», а сразу зовёт человека.
  • 2bЗапрос вне компетенции (юр./финансы) — маршрут на профильного специалиста.
Постусловия
  • Клиент получил ответ или эскалацию без задержки
  • Сложные случаи у человека с контекстом
Бизнес-правила
  • Границы автономии задаёт руководитель поддержки
  • При сомнении — эскалация, без выдумывания фактов
Частота
Круглосуточно, по каждому обращению
Допущения
  • Каналы и база знаний доступны

Операционная модель — стоимость владения за 3 года

Совокупная стоимость владения (TCO) за 36 месяцев против эффекта Q × P. Числа выше — по облачным ценам токенов OpenRouter (модель уровня сценария — DeepSeek V4 Flash), инференс учтён отдельной строкой. Инфраструктура и надзор делятся на все сценарии — здесь показана доля, относимая на этот; для одного отдельного сценария на своём сервере она была бы выше. Самообучение удешевляет токены по годам, эффект выходит на полную мощность не сразу. Лицензия Гермеса — 0 ₽ (MIT); self-hosting на своих весах меняет плату за токены на GPU и электричество. Числа — оценка для прикидки, не оферта.

Малая · до ~50 человек

TCO 3 года

107 тыс ₽

Эффект 3 года

1.2 млн ₽

Чистыми

1.1 млн ₽

ROI

11.1×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
149 тыс ₽302 тыс ₽253 тыс ₽
229 тыс ₽432 тыс ₽403 тыс ₽
329 тыс ₽454 тыс ₽425 тыс ₽
Итого107 тыс ₽1.2 млн ₽1.1 млн ₽

Из чего складывается в месяц: инфраструктура 600 ₽ (доля общей установки) · инференс 32 ₽ · надзор 2 тыс ₽ (доля) · плюс внедрение 20 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Средняя · ~50–500 человек

TCO 3 года

380 тыс ₽

Эффект 3 года

13 млн ₽

Чистыми

13 млн ₽

ROI

34.7×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1164 тыс ₽3.4 млн ₽3.2 млн ₽
2108 тыс ₽4.8 млн ₽4.7 млн ₽
3108 тыс ₽5.0 млн ₽4.9 млн ₽
Итого380 тыс ₽13 млн ₽13 млн ₽

Из чего складывается в месяц: инфраструктура 2 тыс ₽ (доля общей установки) · инференс 264 ₽ · надзор 7 тыс ₽ (доля) · плюс внедрение 55 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.

Крупная · 500+ человек

TCO 3 года

1.5 млн ₽

Эффект 3 года

132 млн ₽

Чистыми

131 млн ₽

ROI

90.2×

Окупаемость

1 мес

ГодЗатратыЭффектЧистыми
1571 тыс ₽34 млн ₽33 млн ₽
2448 тыс ₽48 млн ₽48 млн ₽
3445 тыс ₽50 млн ₽50 млн ₽
Итого1.5 млн ₽132 млн ₽131 млн ₽

Из чего складывается в месяц: инфраструктура 5 тыс ₽ (доля общей установки) · инференс 2 тыс ₽ · надзор 31 тыс ₽ (доля) · плюс внедрение 120 тыс ₽ разово · лицензия ПО 0 ₽ (MIT). Оценка.