218 lines
No EOL
15 KiB
Text
218 lines
No EOL
15 KiB
Text
Базовая инфраструктура (через Dockge/docker-compose)
|
||
|
||
Cтек сервисов:
|
||
Postgres → основная БД.
|
||
MinIO → S3-хранилище для файлов.
|
||
Metabase → визуализация/аналитика.
|
||
Ollama → локальные LLM-модели (LLM-движок).
|
||
RabbitMQ → очередь задач.
|
||
NocoDB → low-code UI к базе.
|
||
Nginx Proxy Manager (NPM) → проксирование и домены с SSL.
|
||
UI (Next.js) → интерфейс для админки/авторизации.
|
||
|
||
Все сервисы описаны в compose.yaml с restart: unless-stopped, так что они поднимаются сами после старта docker-демона.
|
||
WSL Ubuntu server поднимается после включения ПК через планировщик задач.
|
||
|
||
UI (Next.js) — авторизация и защита
|
||
Next.js 15 + TypeScript + Tailwind.
|
||
Credentials provider (логин/пароль из Postgres).
|
||
|
||
|
||
План разработки
|
||
Этап 1. Каркас данных и ingestion (MVP-поток)
|
||
|
||
Задачи
|
||
|
||
Схема БД (минимум):
|
||
channels (id, type: asterisk|mobile|tg|wa|web, status, meta)
|
||
contacts (id, phone/email/username, source, last_seen)
|
||
interactions (id, channel_id, contact_id, started_at, ended_at, status: new|in_progress|done|lost, assignee, tags[])
|
||
calls (id, interaction_id, direction, asterisk_uniqueid, mobile_device_id?, cdr_json, recording_uri, duration_sec)
|
||
transcripts (id, call_id, lang, text, segments_json, qa_scores_json)
|
||
sales_1c (id, external_id, doc_date, amount, items_json, contact_key)
|
||
match_sales (interaction_id, sale_id, match_score, method, note)
|
||
events_audit (id, actor, action, resource, diff, ts)
|
||
|
||
API (FastAPI) — первый набор эндпоинтов:
|
||
/ingest/asterisk/cdr (POST) — приём CDR/AMI событий (или периодическая выгрузка CDR через скрипт).
|
||
/ingest/call-recording (S3 PUT webhook или локальный uploader) — складировать в MinIO и возвращать recording_uri.
|
||
/ingest/1c/upload (CSV) — загрузка отчёта продаж.
|
||
/interactions (GET/POST/PATCH) — базовый CRUD.
|
||
/calls/:id/transcribe (POST) — постановка в очередь на транскрипцию.
|
||
/config/* — чтение/запись настроек (через таблицу settings, с аудитом).
|
||
|
||
Воркеры (ASR, синхронизация):
|
||
asr_worker: берёт задачи из Rabbit → качает запись из MinIO → транскрибирует (Whisper-cpp/ffmpeg) → пишет в transcripts.
|
||
sales_linker: после каждого нового interaction/call и после загрузки 1С прогоняет matching (по телефону, времени, сумме) → создаёт/обновляет match_sales.
|
||
|
||
UI (Next.js):
|
||
|
||
Страницы:
|
||
/calls — список (фильтры: дата, длительность, статус ASR).
|
||
/calls/[id] — карточка звонка (аудио-плеер из MinIO, транскрипт, авто-теги).
|
||
/review — очередь «недозакрытых» обращений (status != done).
|
||
/settings — форма с настройками (Asterisk, MinIO, 1С, ASR, фичфлаги) → работает с API /config.
|
||
Результат/критерии
|
||
|
||
Звонок из Asterisk превращается в запись в БД + файл в MinIO + транскрипт в transcripts.
|
||
|
||
CSV из 1С грузится → sales_1c заполнена → есть связи match_sales.
|
||
UI показывает звонки, транскрипцию, статус обработки; настройки меняются без config.yaml.
|
||
Metabase: 2 дашборда — «Воронка обращений» и «Утечки (lost vs sold)».
|
||
|
||
Этап 2. Мобильные SIM (минимально жизнеспособно)
|
||
|
||
Задачи
|
||
|
||
Android-клиент (реалистично; iOS ограничена):
|
||
Запрос READ_CALL_LOG (или интеграция с системным журналом) + отправка метаданных вызовов (вход/выход, номер, длительность) → в API /ingest/mobile/call.
|
||
|
||
Опционально запись аудио: для Android 10+ нужно Legal/Accessibility подход (не всегда возможно). Если запись нельзя — хотя бы журнал + обязательный «после-звонка» чек-лист (кнопки «лид создан/закрыт/отложен»).
|
||
|
||
Личный ключ сотрудника в приложении: device_id → users_devices.
|
||
|
||
Сопоставление с контактами/интеракциями: номер → contacts → interactions/calls с channel=mobile.
|
||
Результат
|
||
|
||
Хоть и без аудио, но все мобильные звонки попадают в систему как факт обращения (время, номер, длительность, менеджер).
|
||
|
||
На дашбордах видно долю мобильных, их исход, и их вклад в утечки.
|
||
|
||
Комментарий: iOS практически не даёт доступ к журналу/записи. Рассматриваем workaround: «после-звонка» форма в приложении + привязка по пушам/уведомлениям. Для малого объёма звонков у вас это ок.
|
||
|
||
Этап 3. Речевая аналитика и «умные» теги
|
||
|
||
Задачи
|
||
ASR улучшение:
|
||
Whisper-cpp «medium» RU или WhisperX (если GPU тянет) + VAD.
|
||
Выход: segments_json (таймкоды).
|
||
|
||
LLM-разметка (Ollama → llama3:8b/qwen):
|
||
Суммаризация, субъективные метрики (вежливость, конфликт), детект intent (цель клиента), авто-теги (товары/услуги), выявление upsell-возможностей.
|
||
Складировать в transcripts.qa_scores_json и interactions.tags.
|
||
|
||
UI:
|
||
На /calls/[id] — боковые метрики (авто-теги, intent, рекомендации).
|
||
На /review — фильтры по тегам/рискам («эскалация», «повторный звонок», «нет ответа»).
|
||
Результат
|
||
|
||
Каждому звонку автоприсваиваются теги/инсайты. Видно, что упустили/что продали.
|
||
|
||
Этап 4. 1С интеграция (операционализация)
|
||
|
||
Задачи
|
||
Cron-интеграция (в отдельном контейнере scheduler):
|
||
Раз в день: GET/PUT отчёта 1С (или SFTP/почта) → /ingest/1c/upload.
|
||
Логи: в events_audit.
|
||
|
||
Правила матчинга (настраиваемые в /settings):
|
||
окно времени (±N дней),
|
||
mapping полей телефона/контакта,
|
||
веса для match_score.
|
||
|
||
Отчёт «реализация vs обращения» в Metabase:
|
||
|
||
матрица: канал × статус × реализация.
|
||
Результат
|
||
Автосверка обращений и реальных продаж. Видно потери >45% на уровне фактов.
|
||
|
||
|
||
Этап 5. База знаний и эксперт-контур (LLM-ассистент)
|
||
|
||
1.3. Разработка ИИ-Агента (V1):
|
||
Создание основного скрипта knowledge_base_agent.py.
|
||
Агент отслеживает появление новых, неизученных автомобилей/товаров в транскрипциях.
|
||
При обнаружении новой сущности, агент использует google_web_search и web_fetch для поиска информации о совместимости в интернете.
|
||
На основе найденной информации агент формирует структурированный "факт" и кладет его в таблицу compatibility_suggestions на проверку. Для извлечения используется "few-shot" промптинг к локальной модели Llama 3.
|
||
1.4. Реализация интерфейса валидации ("Человек в цикле"):
|
||
Создание простого веб-интерфейса (например, на Flask/FastAPI) или даже CLI-скрипта, где эксперт видит предложенные агентом факты.
|
||
Функционал: [Одобрить] (факт переносится в compatibility_facts), [Отклонить] (факт удаляется), [Редактировать] (эксперт вносит правки и одобряет).
|
||
Результат Фазы 1: Рабочий прототип, где ИИ помогает человеку наполнять базу знаний, экономя время на поиске. Начинается сбор качественного датасета для дообучения.
|
||
|
||
Фаза 2: Дообучение модели и повышение автономии (после сбора ~1000+ примеров)
|
||
|
||
2.1. Подготовка датасета: Накопленные и выверенные на Фазе 1 данные преобразуются в формат, пригодный для дообучения.
|
||
2.2. Процесс Fine-tuning: С использованием фреймворков Hugging Face (transformers, peft, trl) производится дообучение (LoRA) модели Llama3:8b-instruct на собранном датасете.
|
||
2.3. Развертывание кастомной модели: Дообученная модель (autoxpert-v1) конвертируется и развертывается через Ollama, заменяя собой базовую модель.
|
||
Результат Фазы 2: Значительно более точный и автономный агент, который делает меньше ошибок и требует меньше правок. Качество его предложений резко возрастает.
|
||
|
||
Фаза 3: Полная интеграция в бизнес-процессы
|
||
|
||
3.1. Интеграция БЗ в основной конвейер: Модификация скрипта analyze.py. Теперь он после транскрибации обращается к таблице compatibility_facts и правилам допродаж.
|
||
3.2. Генерация рекомендаций: Скрипт сравнивает диалог менеджера с возможностями из БЗ и формирует список упущенных возможностей и рекомендаций.
|
||
3.3. Обновление отчетов: daily_insights.py и render_dashboard.py дорабатываются для включения нового блока "Рекомендации по продажам" в ежедневные отчеты и HTML-дашборд.
|
||
Результат Фазы 3: Полноценная система, которая автоматически анализирует звонки и предоставляет конкретные рекомендации для роста продаж и улучшения сервиса, интегрированная в ваш текущий рабочий процесс.
|
||
|
||
|
||
Задачи
|
||
Хранилище знаний:
|
||
kb_docs (id, source: web|internal|manual, title, content, meta, tags, updated_at)
|
||
b_vectors (doc_id, chunk, embedding) — можно pgvector/Chroma.
|
||
kb_cases (принятые экспертами вопросы/ответы/решения).
|
||
|
||
Пайплайн пополнения:
|
||
Импорт каталога авто/оборудования (официальные источники, YAML/CSV).
|
||
Импорт внутренних регламентов/кейсов.
|
||
(Опционально) web-scrape производителей (этично и с кэшем).
|
||
|
||
Чат для установщиков/менеджеров:
|
||
/qa — RAG: поиск по kb_vectors + ответ LLM + источники.
|
||
|
||
Кнопка «Отправить на ревью эксперту» → kb_cases (статус pending → approved).
|
||
|
||
Результат
|
||
Рабочий ассистент-эксперт: отвечает по автоэлектронике и ассортименту, срастается с вашей базой.
|
||
|
||
Этап 6. UI-настройки и анти-саботаж
|
||
|
||
Задачи
|
||
/settings:
|
||
|
||
Вкладки: Интеграции (Asterisk, 1С, MinIO), ASR/LLM, Правила матчинга, Фичфлаги.
|
||
Валидация + тест соединения (ping к Asterisk, S3 put/get).
|
||
|
||
Роли:
|
||
admin, expert, reviewer, user (менеджер).
|
||
RBAC в UI и API.
|
||
|
||
Протоколирование:
|
||
Любая правка настроек → в events_audit.
|
||
|
||
Метки невыполненных действий менеджера (например, пропущенный callback) → в interactions.
|
||
Результат
|
||
|
||
Все настройки меняются из UI; есть история; права разграничены; виден саботаж как факт.
|
||
|
||
Этап 7. Дашборды контроля (Metabase + алерты)
|
||
|
||
Задачи
|
||
|
||
Метрики:
|
||
Утечки: % обращений без статуса «done» и без матчинга с 1С.
|
||
SLA звонка: среднее время ответа/перезвона.
|
||
Инсайты ASR/LLM: топ-причины отказов, частота «нет товара», частота upsell-окна.
|
||
|
||
Алерты:
|
||
Порог очереди ASR (настройка в settings.alerts.thresholds).
|
||
Пики пропущенных/коротких звонков.
|
||
|
||
Результат
|
||
Регулярные отчёты + e-mail/Telegram-уведомления о провалах/рисках.
|
||
|
||
Технические детали и стандарты
|
||
|
||
API: FastAPI, CORS только на ui.домен. Swagger для эндпоинтов.
|
||
|
||
Файлы: все записи/CSV → MinIO (S3) с логикой TTL/retention.
|
||
|
||
Очереди: RabbitMQ (prefetch, dead-letter для падений ASR).
|
||
|
||
ASR: для вашей нагрузки (≤30 звонков/день) хватит CPU Whisper-cpp; при апгрейде GPU — WhisperX.
|
||
|
||
LLM: Ollama локально (llama3:8b/qwen) для тэггинга/саммаризации; RAG для Q&A.
|
||
|
||
Безопасность: секреты в secrets (шифрование/переменные окружения), роль-бэйзд доступ, аудит. NPM — закрыть админку наружу по IP/паролю.
|
||
|
||
Резервные копии: pg_dump по крону + минус-диффы MinIO; хранение на отдельном диске/облаке.
|
||
|
||
Развёртывание: все сервисы в одном compose.yaml, у ui — build: ./ui, restart: unless-stopped. Прокси через NPM на домены. |