Обновить plan/readme

2025-09-01 04:30:52 +00:00 · 2025-09-01 04:30:52 +00:00 · ca7d315a3c
commit ca7d315a3c
parent fa5d7501c2
1 changed files with 27 additions and 2 deletions
--- a/plan/readme
+++ b/plan/readme
@ -8,9 +8,10 @@ Ollama → локальные LLM-модели (LLM-движок).
 RabbitMQ → очередь задач.
 NocoDB → low-code UI к базе.
 Nginx Proxy Manager (NPM) → проксирование и домены с SSL.
-UI (Next.js) → наш интерфейс для админки/авторизации.
+UI (Next.js) → интерфейс для админки/авторизации.

 Все сервисы описаны в compose.yaml с restart: unless-stopped, так что они поднимаются сами после старта docker-демона.
+WSL Ubuntu server поднимается после включения ПК через планировщик задач. 

 UI (Next.js) — авторизация и защита
 Next.js 15 + TypeScript + Tailwind.
@ -118,8 +119,32 @@ mapping полей телефона/контакта,

 Этап 5. База знаний и эксперт-контур (LLM-ассистент)

-Задачи
+1.3. Разработка ИИ-Агента (V1):
+Создание основного скрипта knowledge_base_agent.py.
+Агент отслеживает появление новых, неизученных автомобилей/товаров в транскрипциях.
+При обнаружении новой сущности, агент использует google_web_search и web_fetch для поиска информации о совместимости в интернете.
+На основе найденной информации агент формирует структурированный "факт" и кладет его в таблицу compatibility_suggestions на проверку. Для извлечения используется "few-shot" промптинг к локальной модели Llama 3.
+1.4. Реализация интерфейса валидации ("Человек в цикле"):
+Создание простого веб-интерфейса (например, на Flask/FastAPI) или даже CLI-скрипта, где эксперт видит предложенные агентом факты.
+Функционал: [Одобрить] (факт переносится в compatibility_facts), [Отклонить] (факт удаляется), [Редактировать] (эксперт вносит правки и одобряет).
+Результат Фазы 1: Рабочий прототип, где ИИ помогает человеку наполнять базу знаний, экономя время на поиске. Начинается сбор качественного датасета для дообучения.

+Фаза 2: Дообучение модели и повышение автономии (после сбора ~1000+ примеров)
+
+2.1. Подготовка датасета: Накопленные и выверенные на Фазе 1 данные преобразуются в формат, пригодный для дообучения.
+2.2. Процесс Fine-tuning: С использованием фреймворков Hugging Face (transformers, peft, trl) производится дообучение (LoRA) модели Llama3:8b-instruct на собранном датасете.
+2.3. Развертывание кастомной модели: Дообученная модель (autoxpert-v1) конвертируется и развертывается через Ollama, заменяя собой базовую модель.
+Результат Фазы 2: Значительно более точный и автономный агент, который делает меньше ошибок и требует меньше правок. Качество его предложений резко возрастает.
+
+Фаза 3: Полная интеграция в бизнес-процессы 
+
+3.1. Интеграция БЗ в основной конвейер: Модификация скрипта analyze.py. Теперь он после транскрибации обращается к таблице compatibility_facts и правилам допродаж.
+3.2. Генерация рекомендаций: Скрипт сравнивает диалог менеджера с возможностями из БЗ и формирует список упущенных возможностей и рекомендаций.
+3.3. Обновление отчетов: daily_insights.py и render_dashboard.py дорабатываются для включения нового блока "Рекомендации по продажам" в ежедневные отчеты и HTML-дашборд.
+Результат Фазы 3: Полноценная система, которая автоматически анализирует звонки и предоставляет конкретные рекомендации для роста продаж и улучшения сервиса, интегрированная в ваш текущий рабочий процесс.
+
+
+Задачи
 Хранилище знаний:
 kb_docs (id, source: web|internal|manual, title, content, meta, tags, updated_at)
 b_vectors (doc_id, chunk, embedding) — можно pgvector/Chroma.