Базовая инфраструктура (через Dockge/docker-compose)

Cтек сервисов:
Postgres → основная БД.
MinIO → S3-хранилище для файлов.
Metabase → визуализация/аналитика.
Ollama → локальные LLM-модели (LLM-движок).
RabbitMQ → очередь задач.
NocoDB → low-code UI к базе.
Nginx Proxy Manager (NPM) → проксирование и домены с SSL.
UI (Next.js) → интерфейс для админки/авторизации.

Все сервисы описаны в compose.yaml с restart: unless-stopped, так что они поднимаются сами после старта docker-демона.
WSL Ubuntu server поднимается после включения ПК через планировщик задач. 

UI (Next.js) — авторизация и защита
Next.js 15 + TypeScript + Tailwind.
Credentials provider (логин/пароль из Postgres).


План разработки 
Этап 1. Каркас данных и ingestion (MVP-поток)

Задачи

Схема БД (минимум):
channels (id, type: asterisk|mobile|tg|wa|web, status, meta)
contacts (id, phone/email/username, source, last_seen)
interactions (id, channel_id, contact_id, started_at, ended_at, status: new|in_progress|done|lost, assignee, tags[])
calls (id, interaction_id, direction, asterisk_uniqueid, mobile_device_id?, cdr_json, recording_uri, duration_sec)
transcripts (id, call_id, lang, text, segments_json, qa_scores_json)
sales_1c (id, external_id, doc_date, amount, items_json, contact_key)
match_sales (interaction_id, sale_id, match_score, method, note)
events_audit (id, actor, action, resource, diff, ts)

API (FastAPI) — первый набор эндпоинтов:
/ingest/asterisk/cdr (POST) — приём CDR/AMI событий (или периодическая выгрузка CDR через скрипт).
/ingest/call-recording (S3 PUT webhook или локальный uploader) — складировать в MinIO и возвращать recording_uri.
/ingest/1c/upload (CSV) — загрузка отчёта продаж.
/interactions (GET/POST/PATCH) — базовый CRUD.
/calls/:id/transcribe (POST) — постановка в очередь на транскрипцию.
/config/* — чтение/запись настроек (через таблицу settings, с аудитом).

Воркеры (ASR, синхронизация):
asr_worker: берёт задачи из Rabbit → качает запись из MinIO → транскрибирует (Whisper-cpp/ffmpeg) → пишет в transcripts.
sales_linker: после каждого нового interaction/call и после загрузки 1С прогоняет matching (по телефону, времени, сумме) → создаёт/обновляет match_sales.

UI (Next.js):

Страницы:
/calls — список (фильтры: дата, длительность, статус ASR).
/calls/[id] — карточка звонка (аудио-плеер из MinIO, транскрипт, авто-теги).
/review — очередь «недозакрытых» обращений (status != done).
/settings — форма с настройками (Asterisk, MinIO, 1С, ASR, фичфлаги) → работает с API /config.
Результат/критерии

Звонок из Asterisk превращается в запись в БД + файл в MinIO + транскрипт в transcripts.

CSV из 1С грузится → sales_1c заполнена → есть связи match_sales.
UI показывает звонки, транскрипцию, статус обработки; настройки меняются без config.yaml.
Metabase: 2 дашборда — «Воронка обращений» и «Утечки (lost vs sold)».

Этап 2. Мобильные SIM (минимально жизнеспособно)

Задачи

Android-клиент (реалистично; iOS ограничена):
Запрос READ_CALL_LOG (или интеграция с системным журналом) + отправка метаданных вызовов (вход/выход, номер, длительность) → в API /ingest/mobile/call.

Опционально запись аудио: для Android 10+ нужно Legal/Accessibility подход (не всегда возможно). Если запись нельзя — хотя бы журнал + обязательный «после-звонка» чек-лист (кнопки «лид создан/закрыт/отложен»).

Личный ключ сотрудника в приложении: device_id → users_devices.

Сопоставление с контактами/интеракциями: номер → contacts → interactions/calls с channel=mobile.
Результат

Хоть и без аудио, но все мобильные звонки попадают в систему как факт обращения (время, номер, длительность, менеджер).

На дашбордах видно долю мобильных, их исход, и их вклад в утечки.

Комментарий: iOS практически не даёт доступ к журналу/записи. Рассматриваем workaround: «после-звонка» форма в приложении + привязка по пушам/уведомлениям. Для малого объёма звонков у вас это ок.

Этап 3. Речевая аналитика и «умные» теги

Задачи
ASR улучшение:
Whisper-cpp «medium» RU или WhisperX (если GPU тянет) + VAD.
Выход: segments_json (таймкоды).

LLM-разметка (Ollama → llama3:8b/qwen):
Суммаризация, субъективные метрики (вежливость, конфликт), детект intent (цель клиента), авто-теги (товары/услуги), выявление upsell-возможностей.
Складировать в transcripts.qa_scores_json и interactions.tags.

UI:
На /calls/[id] — боковые метрики (авто-теги, intent, рекомендации).
На /review — фильтры по тегам/рискам («эскалация», «повторный звонок», «нет ответа»).
Результат

Каждому звонку автоприсваиваются теги/инсайты. Видно, что упустили/что продали.

Этап 4. 1С интеграция (операционализация)

Задачи
Cron-интеграция (в отдельном контейнере scheduler):
Раз в день: GET/PUT отчёта 1С (или SFTP/почта) → /ingest/1c/upload.
Логи: в events_audit.

Правила матчинга (настраиваемые в /settings):
окно времени (±N дней),
mapping полей телефона/контакта,
веса для match_score.

Отчёт «реализация vs обращения» в Metabase:

матрица: канал × статус × реализация.
Результат
Автосверка обращений и реальных продаж. Видно потери >45% на уровне фактов.


Этап 5. База знаний и эксперт-контур (LLM-ассистент)

1.3. Разработка ИИ-Агента (V1):
Создание основного скрипта knowledge_base_agent.py.
Агент отслеживает появление новых, неизученных автомобилей/товаров в транскрипциях.
При обнаружении новой сущности, агент использует google_web_search и web_fetch для поиска информации о совместимости в интернете.
На основе найденной информации агент формирует структурированный "факт" и кладет его в таблицу compatibility_suggestions на проверку. Для извлечения используется "few-shot" промптинг к локальной модели Llama 3.
1.4. Реализация интерфейса валидации ("Человек в цикле"):
Создание простого веб-интерфейса (например, на Flask/FastAPI) или даже CLI-скрипта, где эксперт видит предложенные агентом факты.
Функционал: [Одобрить] (факт переносится в compatibility_facts), [Отклонить] (факт удаляется), [Редактировать] (эксперт вносит правки и одобряет).
Результат Фазы 1: Рабочий прототип, где ИИ помогает человеку наполнять базу знаний, экономя время на поиске. Начинается сбор качественного датасета для дообучения.

Фаза 2: Дообучение модели и повышение автономии (после сбора ~1000+ примеров)

2.1. Подготовка датасета: Накопленные и выверенные на Фазе 1 данные преобразуются в формат, пригодный для дообучения.
2.2. Процесс Fine-tuning: С использованием фреймворков Hugging Face (transformers, peft, trl) производится дообучение (LoRA) модели Llama3:8b-instruct на собранном датасете.
2.3. Развертывание кастомной модели: Дообученная модель (autoxpert-v1) конвертируется и развертывается через Ollama, заменяя собой базовую модель.
Результат Фазы 2: Значительно более точный и автономный агент, который делает меньше ошибок и требует меньше правок. Качество его предложений резко возрастает.

Фаза 3: Полная интеграция в бизнес-процессы 

3.1. Интеграция БЗ в основной конвейер: Модификация скрипта analyze.py. Теперь он после транскрибации обращается к таблице compatibility_facts и правилам допродаж.
3.2. Генерация рекомендаций: Скрипт сравнивает диалог менеджера с возможностями из БЗ и формирует список упущенных возможностей и рекомендаций.
3.3. Обновление отчетов: daily_insights.py и render_dashboard.py дорабатываются для включения нового блока "Рекомендации по продажам" в ежедневные отчеты и HTML-дашборд.
Результат Фазы 3: Полноценная система, которая автоматически анализирует звонки и предоставляет конкретные рекомендации для роста продаж и улучшения сервиса, интегрированная в ваш текущий рабочий процесс.


Задачи
Хранилище знаний:
kb_docs (id, source: web|internal|manual, title, content, meta, tags, updated_at)
b_vectors (doc_id, chunk, embedding) — можно pgvector/Chroma.
kb_cases (принятые экспертами вопросы/ответы/решения).

Пайплайн пополнения:
Импорт каталога авто/оборудования (официальные источники, YAML/CSV).
Импорт внутренних регламентов/кейсов.
(Опционально) web-scrape производителей (этично и с кэшем).

Чат для установщиков/менеджеров:
/qa — RAG: поиск по kb_vectors + ответ LLM + источники.

Кнопка «Отправить на ревью эксперту» → kb_cases (статус pending → approved).

Результат
Рабочий ассистент-эксперт: отвечает по автоэлектронике и ассортименту, срастается с вашей базой.

Этап 6. UI-настройки и анти-саботаж

Задачи
/settings:

Вкладки: Интеграции (Asterisk, 1С, MinIO), ASR/LLM, Правила матчинга, Фичфлаги.
Валидация + тест соединения (ping к Asterisk, S3 put/get).

Роли:
admin, expert, reviewer, user (менеджер).
RBAC в UI и API.

Протоколирование:
Любая правка настроек → в events_audit.

Метки невыполненных действий менеджера (например, пропущенный callback) → в interactions.
Результат

Все настройки меняются из UI; есть история; права разграничены; виден саботаж как факт.

Этап 7. Дашборды контроля (Metabase + алерты)

Задачи

Метрики:
Утечки: % обращений без статуса «done» и без матчинга с 1С.
SLA звонка: среднее время ответа/перезвона.
Инсайты ASR/LLM: топ-причины отказов, частота «нет товара», частота upsell-окна.

Алерты:
Порог очереди ASR (настройка в settings.alerts.thresholds).
Пики пропущенных/коротких звонков.

Результат
Регулярные отчёты + e-mail/Telegram-уведомления о провалах/рисках.

Технические детали и стандарты

API: FastAPI, CORS только на ui.домен. Swagger для эндпоинтов.

Файлы: все записи/CSV → MinIO (S3) с логикой TTL/retention.

Очереди: RabbitMQ (prefetch, dead-letter для падений ASR).

ASR: для вашей нагрузки (≤30 звонков/день) хватит CPU Whisper-cpp; при апгрейде GPU — WhisperX.

LLM: Ollama локально (llama3:8b/qwen) для тэггинга/саммаризации; RAG для Q&A.

Безопасность: секреты в secrets (шифрование/переменные окружения), роль-бэйзд доступ, аудит. NPM — закрыть админку наружу по IP/паролю.

Резервные копии: pg_dump по крону + минус-диффы MinIO; хранение на отдельном диске/облаке.

Развёртывание: все сервисы в одном compose.yaml, у ui — build: ./ui, restart: unless-stopped. Прокси через NPM на домены.