Обновить plan/readme
This commit is contained in:
parent
fa5d7501c2
commit
ca7d315a3c
1 changed files with 27 additions and 2 deletions
29
plan/readme
29
plan/readme
|
|
@ -8,9 +8,10 @@ Ollama → локальные LLM-модели (LLM-движок).
|
|||
RabbitMQ → очередь задач.
|
||||
NocoDB → low-code UI к базе.
|
||||
Nginx Proxy Manager (NPM) → проксирование и домены с SSL.
|
||||
UI (Next.js) → наш интерфейс для админки/авторизации.
|
||||
UI (Next.js) → интерфейс для админки/авторизации.
|
||||
|
||||
Все сервисы описаны в compose.yaml с restart: unless-stopped, так что они поднимаются сами после старта docker-демона.
|
||||
WSL Ubuntu server поднимается после включения ПК через планировщик задач.
|
||||
|
||||
UI (Next.js) — авторизация и защита
|
||||
Next.js 15 + TypeScript + Tailwind.
|
||||
|
|
@ -118,8 +119,32 @@ mapping полей телефона/контакта,
|
|||
|
||||
Этап 5. База знаний и эксперт-контур (LLM-ассистент)
|
||||
|
||||
Задачи
|
||||
1.3. Разработка ИИ-Агента (V1):
|
||||
Создание основного скрипта knowledge_base_agent.py.
|
||||
Агент отслеживает появление новых, неизученных автомобилей/товаров в транскрипциях.
|
||||
При обнаружении новой сущности, агент использует google_web_search и web_fetch для поиска информации о совместимости в интернете.
|
||||
На основе найденной информации агент формирует структурированный "факт" и кладет его в таблицу compatibility_suggestions на проверку. Для извлечения используется "few-shot" промптинг к локальной модели Llama 3.
|
||||
1.4. Реализация интерфейса валидации ("Человек в цикле"):
|
||||
Создание простого веб-интерфейса (например, на Flask/FastAPI) или даже CLI-скрипта, где эксперт видит предложенные агентом факты.
|
||||
Функционал: [Одобрить] (факт переносится в compatibility_facts), [Отклонить] (факт удаляется), [Редактировать] (эксперт вносит правки и одобряет).
|
||||
Результат Фазы 1: Рабочий прототип, где ИИ помогает человеку наполнять базу знаний, экономя время на поиске. Начинается сбор качественного датасета для дообучения.
|
||||
|
||||
Фаза 2: Дообучение модели и повышение автономии (после сбора ~1000+ примеров)
|
||||
|
||||
2.1. Подготовка датасета: Накопленные и выверенные на Фазе 1 данные преобразуются в формат, пригодный для дообучения.
|
||||
2.2. Процесс Fine-tuning: С использованием фреймворков Hugging Face (transformers, peft, trl) производится дообучение (LoRA) модели Llama3:8b-instruct на собранном датасете.
|
||||
2.3. Развертывание кастомной модели: Дообученная модель (autoxpert-v1) конвертируется и развертывается через Ollama, заменяя собой базовую модель.
|
||||
Результат Фазы 2: Значительно более точный и автономный агент, который делает меньше ошибок и требует меньше правок. Качество его предложений резко возрастает.
|
||||
|
||||
Фаза 3: Полная интеграция в бизнес-процессы
|
||||
|
||||
3.1. Интеграция БЗ в основной конвейер: Модификация скрипта analyze.py. Теперь он после транскрибации обращается к таблице compatibility_facts и правилам допродаж.
|
||||
3.2. Генерация рекомендаций: Скрипт сравнивает диалог менеджера с возможностями из БЗ и формирует список упущенных возможностей и рекомендаций.
|
||||
3.3. Обновление отчетов: daily_insights.py и render_dashboard.py дорабатываются для включения нового блока "Рекомендации по продажам" в ежедневные отчеты и HTML-дашборд.
|
||||
Результат Фазы 3: Полноценная система, которая автоматически анализирует звонки и предоставляет конкретные рекомендации для роста продаж и улучшения сервиса, интегрированная в ваш текущий рабочий процесс.
|
||||
|
||||
|
||||
Задачи
|
||||
Хранилище знаний:
|
||||
kb_docs (id, source: web|internal|manual, title, content, meta, tags, updated_at)
|
||||
b_vectors (doc_id, chunk, embedding) — можно pgvector/Chroma.
|
||||
|
|
|
|||
Loading…
Add table
Add a link
Reference in a new issue