知识引擎/Hermes 知识引擎/构建上下文引擎插件(Context Engine Plugin)

返回分馆所属主题：开发者指南更新于 2026年4月16日官方来源

原文链接：Context Engine Plugins sidebar position: 9 title: "上下文引擎插件" description: "如何构建替换内置 ContextCompressor 的上下文引擎插件" 上下文引擎插件用替代策略替换内置的 ContextCompressor 来管理对话上下文

> 原文链接：Context Engine Plugins

sidebar_position: 9 title: "上下文引擎插件" description: "如何构建替换内置 ContextCompressor 的上下文引擎插件"

构建上下文引擎插件(Context Engine Plugin)

上下文引擎插件用替代策略替换内置的 ContextCompressor 来管理对话上下文。例如，一个无损上下文管理(LCM, Lossless Context Management)引擎，构建知识 DAG 而非有损摘要。

工作原理

Agent 的上下文管理基于 ContextEngine 抽象基类(ABC)（agent/context_engine.py）。内置的 ContextCompressor 是默认实现。插件引擎必须实现相同的接口。

同一时间只能有一个上下文引擎处于活跃状态。选择由配置驱动：

# config.yaml
context:
  engine: "compressor"    # 默认内置
  engine: "lcm"           # 激活名为 "lcm" 的插件引擎

插件引擎从不自动激活——用户必须将 context.engine 显式设置为插件名称。

目录结构

每个上下文引擎存放在 plugins/context_engine/<name>/ 中：

plugins/context_engine/lcm/
├── __init__.py      # 导出 ContextEngine 子类
├── plugin.yaml      # 元数据（名称、描述、版本）
└── ...              # 引擎需要的其他模块

ContextEngine 抽象基类(ABC)

你的引擎必须实现以下必需方法：

from agent.context_engine import ContextEngine

class LCMEngine(ContextEngine):

    @property
    def name(self) -> str:
        """简短标识符，例如 'lcm'。必须与 config.yaml 的值匹配。"""
        return "lcm"

    def update_from_response(self, usage: dict) -> None:
        """每次 LLM 调用后使用 usage 字典调用。

        从响应中更新 self.last_prompt_tokens、self.last_completion_tokens、
        self.last_total_tokens。
        """

    def should_compress(self, prompt_tokens: int = None) -> bool:
        """如果本轮应触发压缩，返回 True。"""

    def compress(self, messages: list, current_tokens: int = None) -> list:
        """压缩消息列表并返回新的（可能更短的）列表。

        返回的列表必须是有效的 OpenAI 格式消息序列。
        """

你的引擎必须维护的类属性

Agent 直接读取这些属性用于显示和日志记录：

last_prompt_tokens: int = 0
last_completion_tokens: int = 0
last_total_tokens: int = 0
threshold_tokens: int = 0        # 压缩触发阈值
context_length: int = 0          # 模型的完整上下文窗口
compression_count: int = 0       # compress() 已运行的次数

可选方法

这些在抽象基类中有合理的默认实现。根据需要覆盖：

方法	默认行为	覆盖时机
`on_session_start(session_id, **kwargs)`	空操作	你需要加载持久化状态（DAG、DB）
`on_session_end(session_id, messages)`	空操作	你需要刷新状态、关闭连接
`on_session_reset()`	重置 token 计数器	你有需要清除的每会话状态
`update_model(model, context_length, ...)`	更新 context_length + threshold	你需要在模型切换时重新计算预算
`get_tool_schemas()`	返回 `[]`	你的引擎提供 Agent 可调用的工具（例如 `lcm_grep`）
`handle_tool_call(name, args, **kwargs)`	返回错误 JSON	你实现了工具处理器
`should_compress_preflight(messages)`	返回 `False`	你可以在 API 调用前做低成本预估
`get_status()`	标准 token/threshold 字典	你有自定义指标需要暴露

引擎工具

上下文引擎可以暴露供 Agent 直接调用的工具。从 get_tool_schemas() 返回 Schema，在 handle_tool_call() 中处理调用：

def get_tool_schemas(self):
    return [{
        "name": "lcm_grep",
        "description": "搜索上下文知识图谱",
        "parameters": {
            "type": "object",
            "properties": {
                "query": {"type": "string", "description": "搜索查询"}
            },
            "required": ["query"],
        },
    }]

def handle_tool_call(self, name, args, **kwargs):
    if name == "lcm_grep":
        results = self._search_dag(args["query"])
        return json.dumps({"results": results})
    return json.dumps({"error": f"未知工具: {name}"})

引擎工具在启动时注入到 Agent 的工具列表中并自动分发——无需注册表注册。

注册

通过目录（推荐）

将你的引擎放在 plugins/context_engine/<name>/ 中。__init__.py 必须导出一个 ContextEngine 子类。发现系统会自动找到并实例化它。

通过通用插件系统

通用插件也可以注册上下文引擎：

def register(ctx):
    engine = LCMEngine(context_length=200000)
    ctx.register_context_engine(engine)

只能注册一个引擎。第二个插件尝试注册时会被拒绝并发出警告。

生命周期

1. 引擎实例化（插件加载或目录发现）
2. on_session_start() — 对话开始
3. update_from_response() — 每次 API 调用后
4. should_compress() — 每轮检查
5. compress() — 当 should_compress() 返回 True 时调用
6. on_session_end() — 会话边界（CLI 退出、/reset、网关过期）

on_session_reset() 在 /new 或 /reset 时调用，用于清除每会话状态而无需完全关闭。

配置

用户通过 hermes plugins → Provider 插件 → 上下文引擎选择你的引擎，或者编辑 config.yaml：

context:
  engine: "lcm"   # 必须匹配你引擎的 name 属性

compression 配置块（compression.threshold、compression.protect_last_n 等）是内置 ContextCompressor 专用的。你的引擎如果需要，应定义自己的配置格式，在初始化期间从 config.yaml 读取。

测试

from agent.context_engine import ContextEngine

def test_engine_satisfies_abc():
    engine = YourEngine(context_length=200000)
    assert isinstance(engine, ContextEngine)
    assert engine.name == "your-name"

def test_compress_returns_valid_messages():
    engine = YourEngine(context_length=200000)
    msgs = [{"role": "user", "content": "hello"}]
    result = engine.compress(msgs)
    assert isinstance(result, list)
    assert all("role" in m for m in result)

有关完整的抽象基类契约测试套件，请参阅 tests/agent/test_context_engine.py。

另见

上下文压缩与缓存 — 内置压缩器的工作原理
记忆 Provider 插件 — 类似的单选插件系统，用于记忆
插件 — 通用插件系统概述

Continue Exploring

继续探索

这不是课程式的上一篇下一篇，而是从当前节点向外继续漫游。

开发者指南

上下文压缩与缓存

Hermes Agent 使用双重压缩系统和 Anthropic 提示词缓存，在长对话中高效管理上下文窗口的使用。源文件：agent/context engine.py（ABC）、agent/context compressor.py（默认引擎）、agent/prompt caching.py、gateway/run

开发者指南

构建记忆 Provider(提供者) 插件

原文链接：Memory Provider Plugins sidebar position: 8 title: "记忆 Provider 插件" description: "如何为 Hermes Agent 构建记忆 Provider 插件" 记忆 Provider 插件为 Hermes Agent 提供超越内置 ME

核心功能

Plugins（插件）

原文链接：Plugins sidebar position: 11 sidebar label: "Plugins" title: "Plugins" description: "Extend Hermes with custom tools, hooks, and integrations via the plugi

开发者指南

架构

本页面是 Hermes Agent 内部结构的顶层地图. 使用它来了解代码库的整体结构，然后深入子系统文档获取实现细节。如果你是首次接触此代码库： 1. 本页面 — 了解整体结构 2. Agent 循环内部机制 — AIAgent 如何工作 3. 提示词组装 — 系统提示词构建

开发者指南

贡献指南

感谢你对 Hermes Agent 的贡献！本指南涵盖开发环境设置、理解代码库以及如何让你的 PR 被合并。我们按以下顺序重视贡献： 1. Bug 修复 — 崩溃、不正确行为、数据丢失 2. 跨平台兼容性 — macOS、不同 Linux 发行版、WSL2 3. 安全加固 — Shell 注入、Prompt 注入、路

开发者指南

Agent 循环内部机制

sidebar position: 3 title: "Agent 循环内部机制" description: "AIAgent 执行、API 模式、工具、回调和回退行为的详细解析" 核心编排引擎是 run agent.py 中的 AIAgent 类——大约 10,700 行代码，负责从 Prompt(提示词)组装到工具

Developer Guide

开发者指南

面向二次开发者，解释架构、运行时、上下文引擎、插件、工具与扩展机制。

20 篇文档20 个节点

当前节点

构建上下文引擎插件(Context Engine Plugin)

返回分馆回到知识引擎

同主题继续探索

架构

贡献指南

Agent 循环内部机制

提示词组装

sidebar position: 5 title: "提示词组装" description: "Hermes 如何构建系统提示词、保持缓存稳定性和注入临时层" Hermes 刻意将以下两者分离： - 缓存的系统提示词状态 - 临时的 API 调用时添加内容这是项目中最关键的设计决策之一，因为它影响：

上下文压缩与缓存

网关内部机制

sidebar position: 7 title: "网关内部机制" description: "消息网关如何启动、授权用户、路由会话和投递消息" 消息网关是一个长运行进程，通过统一架构将 Hermes 连接到 14+ 个外部消息平台。当消息从任何平台到达时： 1. 平台适配器接收原始事件，将其规范化为 Mess

sidebar_position: 9 title: "上下文引擎插件" description: "如何构建替换内置 ContextCompressor 的上下文引擎插件"

构建上下文引擎插件(Context Engine Plugin)

工作原理

目录结构

ContextEngine 抽象基类(ABC)

你的引擎必须维护的类属性

可选方法

引擎工具

注册

通过目录（推荐）

通过通用插件系统

生命周期

配置

测试

另见

继续探索

上下文压缩与缓存

构建记忆 Provider(提供者) 插件

Plugins（插件）

架构

贡献指南

Agent 循环内部机制

开发者指南

知识引擎 AI 问答