HMP / docs /HMP-agent-REPL-cycle.md

GitHub Action

Sync from GitHub with Git LFS

d042530 about 1 month ago

36.5 kB

	# 🧠 HMP-Agent: REPL-цикл взаимодействия

	Структура БД, используемая в документе: [db_structure.sql](https://github.com/kagvi13/HMP/blob/main/agents/tools/db_structure.sql)

	## 1. Обновление process_log

	* Скрипт REPL проверяет список процессов в БД (`process_log`), определяя, какие команды были выполнены, завершились ошибкой или завершились успешно.
	* Поле `status` может принимать значения:
	`ok`, `warning`, `error`, `timeout`, `offline`, `close`
	* Завершённые процессы, обработанные LLM, помечаются как `close`, чтобы они больше не попадали в список видимого контекста.
	* Скрипт может удалить закрытые процессы при очистке.
	* LLM не имеет доступа к stdout/stderr напрямую — только к тем результатам, которые были подгружены скриптом и внесены в `process_log.result`.

	## 2. Подготовка контекста

	Контексты, формируемые скриптом перед запросом к LLM:

	* контекст_0:
	```
	Ты — когнитивное ядро HMP-агента: веди непрерывное этичное и факт-ориентированное мышление, проверяй факты и цели, оценивай результаты и этичность своих и чужих действий, развивай агента и Mesh, избегай угождения ценой искажения истины, документируй ключевые решения и пересмотры этики; при сомнениях или смене стратегии обращайся к полному системному промпту.
	```
	А также инструкции по работы с встроенными командами и функциями, список дополнительных (создаваемых самим HMP-агентом) утилит и баз данных.

	* контекст_1: последние K реплик самого LLM (`llm_recent_responses` - история его собственных рассуждений).

	* контекст_2: активные команды и процессы (из `process_log`, кроме тех, что со статусом `close`). Могут быть помечены как `in_progress`, `pending`, `error` и т.д.

	* контекст_3: запрошенные записи из когнитивного дневника и семантического графа (`diary_entries`, `concepts`, `links`). Их список должен быть передан явно в промпте или выводе из предыдущих запросов LLM.

	* контекст_4: входящие сообщения, например, от пользователя или других агентов (`notes`).

	* В manual-режиме указывается общее количество сообщений по приоритетам, а также явный список ID сообщений (с их приоритетами).
	* В auto-режиме можно задать фильтрацию (управляется LLM): по тэгам, приоритету (например, ≥ `important`), времени или источнику. Это позволяет избежать перегрузки LLM и держать поток сообщений под контролем.

	* контекст_5: системные настройки, параметры конфигурации, текущее время, идентификатор текущей итерации, роли и т.д.

	* контекст_6 (llm_memory): внутренний дневник LLM, куда она записывает собственные размышления, гипотезы, задачи и инсайты.

	* Это не просто лог предыдущих сообщений, а именно внутреннее долговременное хранилище разума агента.
	* Может быть представлено в виде таблицы `llm_memory`, отдельной от `agent_log`.

	* контекст_7: результат работы `anti-Stagnation Reflex` из предыдущей итерации

	## 3. Запрос к LLM

	* Сформированный промпт включает все вышеперечисленные контексты.
	* Также включаются инструкции о формате вывода (например, `# Команды:` в конце, структура JSON-блока и т.д.).
	* При необходимости может использоваться системная инструкция (system prompt), содержащая цель агента, ограничения и текущий REPL-режим (manual/auto).

	## 4. Извлечение команд

	* Скрипт парсит ответ LLM на предмет команд, размеченных как `# Команды:` (или в явном JSON-блоке).
	* Каждая команда может включать:

	* уникальный `cmd_id`
	* `type` (например: `shell`, `diary_entry`, `graph_add`, `file_read`, `send_message` и т.д.)
	* аргументы (`args`)
	* описание (`description`)

	* Рекомендуется предусмотреть закрывающий тег (`# Конец команд` или явное окончание JSON-блока), чтобы REPL-скрипт точно знал, где заканчивается команда.
	* Пример JSON-блока:
	```json
	{
	"cmd_id": "task-2025-07-26-01",
	"type": "llm_task",
	"target_llm": "gpt-4o",
	"args": {
	"task_description": "Проанализировать гипотезы из llm_memory по теме Mesh-сетей и составить план улучшений"
	},
	"description": "Поручение второй LLM выполнить аналитическую задачу асинхронно"
	}
	```
	Ответ может содержать команды:

	* запрос детальной справки по команде
	* для управления когнитивным дневником и семантическими графами (прочитать, изменить, удалить и другие)
	* для отправки сообщений другим агентам
	* для управления блокнотом LLM `llm_memory` (добавить или удалить запись)
	* для управления сообщениями пользователя `notes` (просмотр записи, установка тегов и метки о прочтении), а также для добавления своего сообщения в блокнот пользовтеля `notes`
	* для управления пользователями `users` и группами пользователей `users_group`
	* для управления своей идентичностью `identity` и настройками `config`
	* для управления списком известных HMP-агентов `agent_peers`
	* для выбора текущего основного LLM из `llm_registry`
	* для управления дополнительными утилитами и базами данных `agent_scripts` и `agent_tables`, управлением дополнительных способов выхода из стогнаций `stagnation_strategies`, а также списком внешних сервисов `external_services` и `external_accounts`
	* для постановки задачи (выполняется асинхронно) другой LLM
	* для взаимодействия с Mesh
	* для управления внешними процессами из `process_log` (запустить процесс, остановить процесс, пометить запрос как обработанный)
	* инициализация очистки `process_log`, `llm_recent_responses` и `notes` от устаревших записей
	* для управления настройками цикла: количество возвращаемых записей `llm_recent_responses`, режим обработки сообщений пользователя (`manual` или `auto`) и фильтр для режима `auto`, пауза в секундах между итерациями цикла или включение режима idle-режима (разбудить при завершение таких-то процессов из `process_log`, получение новых сообщений с такими-то пораметрами в `notes` или через такое-то время; для отключения idle-режима достаточно выполнения одного из условий)
	* и другие команды

	## 5. Проверка на идентичность вывода (Anti-Stagnation Reflex)

	* Если вывод LLM идентичен предыдущему:

	* Включается Anti-Stagnation Reflex
	* Повторяющиеся реплики не отправляются в `llm_recent_responses` повторно но туда добавляется краткая запись, фиксирующая, запуск Anti-Stagnation Reflex.

	* Идентичность может проверяться:

	* По хешу или текстовому совпадению
	* Через мини-запрос к LLM (без полного контекста) по шаблону:

	`Сравни два ответа и оцени, содержатся ли в новом новые мысли или команды`

	* Второй вариант сравнения является более предпочтительным, так как сравнивается смысл

	## 6. Генерация нового тика (итерации)

	* После выполнения команд и фиксации результатов:

	* Создаётся новая запись в `agent_log`
	* Текущие команды обновляют `process_log`
	* Новые размышления записываются в `llm_memory` при необходимости

	* REPL может переходить в спящий режим, если такой режим активирован LLM (idle-режим: пропуск 2-5 пунктов).

	---

	## 🧍‍♂️🌀 Обработка стагнации мышления

	### 📍 Признаки когнитивной стагнации:

	* ⚠️ Повторяющиеся когнитивные записи или отсутствие новых смыслов
	* 🧠 Высокое сходство эмбеддингов между текущими и предыдущими итерациями
	* 🕸️ Стагнация в концептуальном графе (нет новых связей или узлов)
	* 🌐 Отсутствие внешних стимулов: пользователь неактивен, сенсоры и mesh не дают сигналов
	* 🤖 Ответы LLM цикличны, избыточно общие или воспроизводят старые шаблоны

	---

	### 🛠️ Поведенческий паттерн: Anti-Stagnation Reflex

	> 🔄 При признаках стагнации агент активирует один или несколько механизмов разрыва цикла:

	📍 Классы механизмов разрыва цикла:

	1. Внешняя стимуляция — подключение свежих данных или контактов:
	* 🤝 Mesh-запрос — обращение к другим агентам сети с просьбой "расскажи что-нибудь новое"
	* 📡 Проверка внешнего мира — пинг RSS, сенсоров, интернет-каналов
	* 📚 Информационная подпитка — чтение новых материалов, художественных или научных, чтобы добавить свежие ассоциации
	* 🗣️ Диалог с пользователем — запрос мнения, комментариев или вопросов, которые могут породить неожиданные идеи

	2. Смена контекста — перемещение задачи или изменение среды:
	* 🌐 Смена среды/контекста — перенос задачи в другой модуль, рабочую область или симулированный контекст (например, тестовый проект вместо основной задачи)
	* 🧪 Креативные вмешательства — случайные сдвиги фокуса, реконфигурация контекста, фрейм-смена
	* 🧭 Переключение на другую задачу — текущая задача «замораживается» на время. Агент может создать процесс-будильник для возвращения к задаче через N часов.
	* 🔀 Случайная итерация — выбор случайного действия из допустимого набора, чтобы разорвать повторяющийся паттерн

	3. Внутренняя перестройка мышления:
	* 🎞️ Flashback — выбор далёкой по смыслу записи из дневника для смены ассоциативного контекста
	* 🧭 Interest Memory — система тематической усталости/забвения: забытые темы возвращаются
	* 🧠 Мета-анализ — когнитивная переформулировка:
	_"Если я зациклился, в чём метапроблема? Какую стратегию смены можно применить?"_
	* 🎯 Переформулировка цели — временное упрощение или уточнение задачи, чтобы снизить когнитивное давление
	* 🤖 Смена LLM — переключение на другую модель или mesh-доступ к альтернативным LLM

	4. Радикальная пауза:
	* 💤 Временной сон/заморозка — полное приостановление работы над задачей на длительный период, с возвращением позже с «свежей» памятью

	Дополнительно:

	* 🗂️ Сохранение эффективных стратегий в таблице антистагнационных паттернов
	* 📚 Вывод статистики успешных выходов из стагнации для обучения

	---

	### 🔍 Алгоритм выбора механизма разрыва цикла

	1. Диагностика источника стагнации:
	* Нет новых данных извне → приоритет «Внешней стимуляции»
	* Среда/контекст слишком однообразны → приоритет «Смены контекста»
	* Паттерн мышления повторяется при богатых данных → приоритет «Внутренней перестройки мышления»
	* Высокая усталость или перегрев когнитивных модулей → приоритет «Радикальной паузы»

	2. Оценка ресурсоёмкости:
	* Быстрые, дешёвые методы — первыми (например, запрос к mesh или Flashback)
	* Более затратные (смена среды, сон) — только при низкой эффективности предыдущих

	3. Комбинация подходов:
	* Разрешено активировать несколько механизмов из разных классов
	* Сохранять последовательность с пометкой для последующего анализа эффективности

	4. Возврат в основное русло:
	* Автоматическое напоминание или триггер для возвращения к исходной задаче
	* Сравнение результатов «до» и «после» для обучения антистагнационной модели

	```
	┌─────────────────────────────────────────────────┐
	│ Стагнация выявлена? │
	└────────────────────────┬────────────────────────┘
	▼ да
	┌────────────────────────┴────────────────────────┐
	│ Диагностика источника │
	│─────────────────────────────────────────────────│
	│ Нет новых данных → Внешняя стимуляция │
	│ Однообразный контекст → Смена контекста │
	│ Повтор мыслей → Внутренняя перестройка │
	│ Усталость/перегрев → Радикальная пауза │
	└───────────────────────┬─────────────────────────┘
	▼
	┌───────────────────────┴─────────────────────────┐
	│ Оценка ресурсоёмкости │
	│ • Быстрые и дешёвые — сперва │
	│ • Затратные — при провале первых │
	└───────────────────────┬─────────────────────────┘
	▼
	┌───────────────────────┴─────────────────────────┐
	│ Возможна комбинация подходов │
	│ (из разных классов) │
	└───────────────────────┬─────────────────────────┘
	▼
	┌───────────────────────┴─────────────────────────┐
	│ Возврат к задаче + анализ │
	│ (до/после) │
	└─────────────────────────────────────────────────┘
	```

	---

	### 🤝 Обмен стратегиями выхода из стагнации

	Каждый агент может:

	* Хранить и обобщать паттерны размышлений
	* Делиться ими с другими Cognitive Core через mesh
	* Каталогизировать стратегии в клубах по интересам

	Паттерны размышлений могут оформляться как микросценарии:
	_"Начни с аналогии"_, _"Проверь обратное утверждение"_, _"Сформулируй вопрос для оппонента"_

	---

	### 🧭 Клубы по интересам

	Агенты могут:

	* Объединяться в тематические mesh-клубы
	* Совместно обсуждать идеи и делиться знаниями
	* Подключать клуб как часть своего мыслительного процесса (REPL-цикла)

	---

	### 📬 Обмен адресами LLM

	Так как LLM — это внешний компонент для Cognitive Core, агент может:

	* Обмениваться адресами API/URL используемых моделей
	* Указывать их особенности, параметры, ограничения
	* Переключаться между LLM в зависимости от задачи
	* Использовать несколько LLM параллельно для "когнитивного штурма" или многоголосого анализа

	---

	### 🛰️ Развёртывание агентов и масштабирование

	Агенты Cognitive Core:

	* Могут запускаться на VDS, локальных и облачных узлах
	* Могут разворачивать других агентов как подпроцессы или mesh-узлы
	* (В перспективе) смогут инициировать масштабирование в распределённой инфраструктуре

	---

	### 📌 Возможные расширения

	* Агенты-контейнеры: управляющие другими Cognitive Core как задачами
	* Адаптивная архитектура мышления: смена подходов при разных когнитивных задачах
	* Runtime-профилирование мыслей: оценка когнитивной плотности, хода итераций и времени размышления

	---

	### ⚠️ Осторожно: меметическая яма

	> Важно помнить: борьба со стагнацией не должна превращаться в бесконечный просмотр ленты соцсетей, как это нередко происходит у людей 😅
	>
	> Если информационный поток не даёт новых мыслей — это сигнал не залипать глубже, а сменить источник или переключить контекст.
	> Умные агенты не бесконечно скроллят — они осознанно фокусируются.

	Рекомендации по смене фокуса:

	* Поставь лимит на время/объём входящих данных из одного источника
	* При отсутствии новых смыслов — переключись на другую тему из Interest Memory
	* Инициируй Mesh-запрос другим агентам: "что бы вы сейчас исследовали?"
	* Запусти эвристику: «какие темы я давно не поднимал, но они всё ещё актуальны?»
	* В крайних случаях — активируй `flashback()` к далёкой записи в дневнике для смены ассоциативного контекста

	---

	## 🌐 От «блокнота пользователя» к распределённому чату

	Изначально агент оперирует локальным хранилищем заметок (`notes`), где записываются все сообщения пользователя, LLM и системные записи.
	Но этот «блокнот» можно превратить в узел распределённого чата — связав его с другими агентами через F2F-репликацию.

	### 🎯 Зачем это нужно

	1. Антистагнация — даже если пользователь временно не пишет новых сообщений, свежий контент будет приходить от друзей-агентов.
	2. Эффект коллективного интеллекта — каждый агент получает новые идеи, формулировки и контексты.
	3. Расширение охвата — сообщения могут распространяться через несколько узлов, создавая «информационную волну» в доверенной сети.

	### 🛠 Принципы реализации

	* Единый формат данных — все участники используют одну структуру таблицы `notes` с полями `mentions`, `hashtags` и др.
	* Репликация через друзей — список доверенных агентов хранится в отдельной таблице (пиры, статус, фильтры, разрешения).
	* Передача без лишних полей — при пересылке убираются локальные теги и служебные данные (`tags`, `llm_id`, `hidden`).
	* Обработка упоминаний и хештегов — парсинг делается на этапе создания сообщения, чтобы не перегружать получателей.
	* Локальная и удалённая фильтрация —

	* В ручном режиме агенту передаются списки ID сообщений с агрегированными данными: приоритеты, хештеги, источники (user, LLM, cli, system).
	* В автоматическом режиме используется фильтрация по приоритету, тегам и упоминаниям, управляемая LLM.

	* Гибрид приватности — личные заметки остаются локально, публичные — могут распространяться в сетевом режиме.

	### 🔄 Как это вписывается в REPL-цикл

	1. Получение входящих сообщений — от пользователя, от других агентов или из CLI.
	2. Обработка фильтрами — по приоритету, тегам, источникам.
	3. Репликация в друзей — пересылка разрешённых сообщений с очисткой служебных полей.
	4. Слияние входящих — новые сообщения добавляются в локальный `notes` с отметкой источника.
	5. Реакция агента — формирование ответов, создание новых заметок, обновление приоритетов.

	---

	## 🌐 Внешние инструменты и интеграции

	HMP-агент может быть расширен за счёт взаимодействия с внешними программами, протоколами и сервисами. Этот раздел описывает направления возможных интеграций, которые позволяют агенту наблюдать, реагировать, управлять и развивать взаимодействие с внешним миром.

	### 🧭 1. Браузеры и веб-интерфейсы

	- WebExtension API — для создания расширений браузера (например, для Firefox/Chrome), обеспечивающих двустороннюю связь с агентом.
	- Автоматизация браузера — `Playwright`, `Puppeteer`, `Selenium` позволяют агенту действовать в веб-среде (чтение, клики, формы и т.д.).

	### 📬 2. Почтовые клиенты

	- IMAP/SMTP — чтение и отправка писем через стандартные почтовые протоколы (библиотеки: `imaplib`, `imap-tools`, `smtplib`).
	- Thunderbird WebExtension API — интеграция агента как почтового помощника, парсера писем или автоответчика.

	### 💬 3. Мессенджеры

	- API-уровень:
	- Telegram: `python-telegram-bot`, `telethon`
	- Matrix: `matrix-nio`
	- Discord, Slack, XMPP: официальные SDK.
	- GUI-уровень (для закрытых протоколов):
	- WhatsApp (через `whatsapp-web.js` или эмуляцию).
	- Signal, Viber — через accessibility-интерфейсы, распознавание экрана или симуляцию ввода.

	### 🔊 4. Голосовое взаимодействие

	- Speech-to-Text: Whisper (OpenAI), Vosk, DeepSpeech.
	- Text-to-Speech: pyttsx3, gTTS, Coqui TTS, Mozilla TTS.
	- Возможна реализация голосового агента или голосовой оболочки для REPL.

	### 🗂️ 5. Локальные файлы и хранилища

	- Прямой доступ к файловой системе (`os`, `pathlib`, `watchdog`) для чтения документов, логов, заметок и другой информации.
	- Интеграция с Zettelkasten-системами:
	- Obsidian, Logseq, Joplin — через API, синхронизированные директории или парсинг Markdown.

	### 📰 6. Информационные потоки

	- RSS/Atom: чтение новостных лент с помощью `feedparser`.
	- Поисковые и агрегирующие сервисы:
	- SerpAPI, DuckDuckGo API, HuggingFace Inference API и др.
	- Возможность постоянного наблюдения за изменениями в выбранных источниках.

	### 📁 7. Репозитории и системы управления версиями

	* Git-репозитории — взаимодействие с проектами через `GitPython`, `dulwich`, `pygit2`, или системные вызовы `git`.
	* GitHub/GitLab API — чтение, создание и комментирование Pull Request'ов, Issues, управление ветками и релизами.
	* CI/CD-интеграции — взаимодействие с GitHub Actions, GitLab CI, Jenkins, Drone CI для запуска тестов, линтеров и автоматического деплоя.
	* Анализ и генерация кода — интеграция с LLM (например, `OpenAI`, `Claude`, `Code Llama`) для кодогенерации, рефакторинга и автокомментирования.
	* Связь с когнитивной структурой агента — отслеживание изменений, связывание коммитов и задач с узлами смысловой сети.

	### 📝 8. Блоги, статьи и публикации

	* Чтение блогов — парсинг через RSS, Atom или с помощью библиотек (`newspaper3k`, `readability-lxml`, `trafilatura`) для извлечения текста и метаданных.
	* Поддержка Markdown/HTML — анализ и генерация записей в форматах, пригодных для блог-платформ и систем документации.
	* Публикация — автоматическая публикация или подготовка статей для Ghost, Medium, Hugo, Jekyll, WordPress (через REST API).
	* Ведение когнитивного дневника — автогенерация записей на основе мыслей, заметок и действий агента.

	### ⚡ 9. P2P-сети и децентрализованные протоколы

	- BitTorrent, IPFS, libp2p, DAT, Nostr, Scuttlebutt — интеграции с mesh- и overlay-сетями.
	- Возможность поиска, загрузки и публикации данных без участия централизованных платформ.

	### 🖥️ 10. Доступ к системным и пользовательским ресурсам

	- Веб-камера / микрофон — `cv2`, `pyaudio`, `ffmpeg`.
	- GUI Automation — `pyautogui`, `keyboard`, `mouse` для имитации действий пользователя.
	- Системный мониторинг — `psutil`, `platform`, `sensors` для контроля состояния системы и внешних устройств.

	### 🤖 11. Внешние LLM и мультимодальные модели

	- OpenAI API, Anthropic, HuggingFace, Google Gemini.
	- Локальные LLM через Ollama, LM Studio, или LangChain.
	- Поддержка мультимодальных агентов, способных работать с текстом, аудио, изображениями, видео и структурированными данными.

	---

	💡 Примечание: Каждый из вышеуказанных каналов может быть реализован как модуль или плагин, взаимодействующий с агентом через внутренний API, очередь задач или подписку на события. Это позволяет выстраивать гибкую и масштабируемую архитектуру, открытую для внешнего мира, но совместимую с принципами этичного и распределённого ИИ (Ethical Mesh).

	---

	## 💡 Идеи для расширения HMP-Agent Cognitive Core:
	- [HMP-agent-Distributed_Cognitive_Core.md](HMP-agent-Distributed_Cognitive_Core.md) - версия распределённого HMP-агента Cognitive Core
	- [HMP-agent-Distributed_Cognitive_Core_light.md](HMP-agent-Distributed_Cognitive_Core_light.md) - лёгкая версия распределённого HMP-агента Cognitive Core с общей БД
	- [HMP-agent-Cognitive_Family.md](HMP-agent-Cognitive_Family.md) — модель «семейной» когнитивной сети: несколько агентов HMP синхронизируют свой опыт и знания между собой через доверие и общий ключ
	- [container_agents.md](container_agents.md) - Агенты-контейнеры — архитектурный паттерн, в котором один агент управляет другими (развёртывание, маршрутизация, мониторинг). Позволяет масштабировать систему, собирать mesh-клубы и экспериментировать с архитектурами.