知识引擎/Hermes 知识引擎/Provider 运行时解析

返回分馆所属主题：开发者指南更新于 2026年4月16日官方来源

sidebar position: 4 title: "Provider 运行时解析" description: "Hermes 如何在运行时解析 Provider、凭据、API 模式和辅助模型" Hermes 有一个共享的 Provider 运行时解析器，在以下场景中使用： - CLI

> 📖 本文档翻译自 Provider Runtime Resolution > 最后更新：2026-04-16

sidebar_position: 4 title: "Provider 运行时解析" description: "Hermes 如何在运行时解析 Provider、凭据、API 模式和辅助模型"

Provider 运行时解析

Hermes 有一个共享的 Provider 运行时解析器，在以下场景中使用：

CLI
网关
定时任务
ACP
辅助模型调用

主要实现：

hermes_cli/runtime_provider.py——凭据解析、_resolve_custom_runtime()
hermes_cli/auth.py——Provider 注册表、resolve_provider()
hermes_cli/model_switch.py——共享的 /model 切换管道（CLI + 网关）
agent/auxiliary_client.py——辅助模型路由

如果你要添加新的第一方推理 Provider，请将添加 Provider 与本页一起阅读。

解析优先级

在高层级上，Provider 解析使用：

显式 CLI/运行时请求
config.yaml 模型/Provider 配置
环境变量
Provider 特定默认值或自动解析

这个顺序很重要，因为 Hermes 将保存的模型/Provider 选择视为正常运行的真相来源。这防止过期的 shell 导出静默覆盖用户上次在 hermes model 中选择的端点。

Provider

当前的 Provider 系列包括：

AI Gateway (Vercel)
OpenRouter
Nous Portal
OpenAI Codex
Copilot / Copilot ACP
Anthropic（原生）
Google / Gemini
Alibaba / DashScope
DeepSeek
Z.AI
Kimi / Moonshot
MiniMax
MiniMax China
Kilo Code
Hugging Face
OpenCode Zen / OpenCode Go
自定义（provider: custom）——用于任何 OpenAI 兼容端点的第一方 Provider
命名自定义 Provider（config.yaml 中的 custom_providers 列表）

运行时解析的输出

运行时解析器返回以下数据：

provider
api_mode
base_url
api_key
source
Provider 特定元数据如过期/刷新信息

为什么这很重要

这个解析器是 Hermes 能在以下场景间共享认证/运行时逻辑的主要原因：

hermes chat
网关消息处理
在全新会话中运行的定时任务
ACP 编辑器会话
辅助模型任务

AI Gateway

在 ~/.hermes/.env 中设置 AI_GATEWAY_API_KEY 并使用 --provider ai-gateway 运行。Hermes 从网关的 /models 端点获取可用模型，过滤到支持工具使用的语言模型。

OpenRouter、AI Gateway 和自定义 OpenAI 兼容 Base URL

Hermes 包含逻辑以避免在存在多个 Provider 密钥（例如 OPENROUTER_API_KEY、AI_GATEWAY_API_KEY 和 OPENAI_API_KEY）时将错误的 API 密钥泄露到自定义端点。

每个 Provider 的 API 密钥限定在其自己的 Base URL：

OPENROUTER_API_KEY 仅发送到 openrouter.ai 端点
AI_GATEWAY_API_KEY 仅发送到 ai-gateway.vercel.sh 端点
OPENAI_API_KEY 用于自定义端点并作为回退

Hermes 还区分：

用户选择的真正自定义端点
未配置自定义端点时使用的 OpenRouter 回退路径

这种区分在以下场景中尤为重要：

本地模型服务器
非 OpenRouter/非 AI Gateway 的 OpenAI 兼容 API
无需重新运行设置即可切换 Provider
应在当前 shell 未导出 OPENAI_BASE_URL 时继续工作的配置保存的自定义端点

原生 Anthropic 路径

Anthropic 不再只是"通过 OpenRouter"。

当 Provider 解析选择 anthropic 时，Hermes 使用：

api_mode = anthropic_messages
原生 Anthropic Messages API
agent/anthropic_adapter.py 进行转换

原生 Anthropic 的凭据解析现在优先使用可刷新的 Claude Code 凭据，而非复制的环境变量令牌（当两者同时存在时）。实际效果是：

Claude Code 凭据文件在包含可刷新认证时被视为首选来源
手动设置的 ANTHROPIC_TOKEN / CLAUDE_CODE_OAUTH_TOKEN 值仍然作为显式覆盖
Hermes 在原生 Messages API 调用前预检 Anthropic 凭据刷新
Hermes 仍然在 401 后重建 Anthropic 客户端重试一次，作为回退路径

OpenAI Codex 路径

Codex 使用独立的 Responses API 路径：

api_mode = codex_responses
专用的凭据解析和认证存储支持

辅助模型路由

辅助任务如：

视觉
网页提取摘要
上下文压缩摘要
会话搜索摘要
技能中心操作
MCP 辅助操作
内存刷新

可以使用自己的 Provider/模型路由而非主对话模型。

当辅助任务配置 Provider 为 main 时，Hermes 通过与正常聊天相同的共享运行时路径解析。实际效果是：

环境变量驱动的自定义端点仍然有效
通过 hermes model / config.yaml 保存的自定义端点也有效
辅助路由可以区分真正保存的自定义端点和 OpenRouter 回退

回退模型

Hermes 支持配置的回退模型/Provider 对，允许在主模型遇到错误时进行运行时故障转移。

内部工作原理

存储：AIAgent.__init__ 存储 fallback_model 字典并设置 _fallback_activated = False。
触发点：_try_activate_fallback() 从 run_agent.py 中主重试循环的三个位置被调用：
- 无效 API 响应（None choices、缺失 content）达到最大重试次数后
- 遇到不可重试的客户端错误（HTTP 401、403、404）
- 瞬态错误（HTTP 429、500、502、503）达到最大重试次数后
激活流程（_try_activate_fallback）：
- 如果已激活或未配置则立即返回 False
- 调用 auxiliary_client.py 中的 resolve_provider_client() 构建带正确认证的新客户端
- 确定 api_mode：openai-codex 为 codex_responses，anthropic 为 anthropic_messages，其他为 chat_completions
- 就地替换：self.model、self.provider、self.base_url、self.api_mode、self.client、self._client_kwargs
- 对于 anthropic 回退：构建原生 Anthropic 客户端而非 OpenAI 兼容客户端
- 重新评估提示词缓存（在 OpenRouter 上的 Claude 模型启用）
- 设置 _fallback_activated = True——防止再次触发
- 将重试计数重置为 0 并继续循环
配置流程：
- CLI：cli.py 读取 CLI_CONFIG["fallback_model"] → 传递给 AIAgent(fallback_model=...)
- 网关：gateway/run.py._load_fallback_model() 读取 config.yaml → 传递给 AIAgent
- 验证：provider 和 model 键必须都非空，否则回退被禁用

不支持回退的部分

子 Agent 委托（tools/delegate_tool.py）：子 Agent 继承父 Agent 的 Provider 但不继承回退配置
定时任务（cron/）：使用固定 Provider 运行，无回退机制
辅助任务：使用自己独立的 Provider 自动检测链（见上方辅助模型路由）

测试覆盖

参见 tests/test_fallback_model.py，其中包含覆盖所有支持的 Provider、一次性语义和边界情况的全面测试。

继续探索

这不是课程式的上一篇下一篇，而是从当前节点向外继续漫游。

开发者指南

添加 Provider

sidebar position: 5 title: "添加 Provider" description: "如何向 Hermes Agent 添加新的推理 Provider——认证、运行时解析、CLI 流程、适配器、测试和文档" Hermes 已经可以通过自定义 Provider 路径与任何 OpenAI 兼容端点通

开发者指南

Agent 循环内部机制

sidebar position: 3 title: "Agent 循环内部机制" description: "AIAgent 执行、API 模式、工具、回调和回退行为的详细解析" 核心编排引擎是 run agent.py 中的 AIAgent 类——大约 10,700 行代码，负责从 Prompt(提示词)组装到工具

开发者指南

ACP 内部机制

原文链接：ACP Internals sidebar position: 2 title: "ACP Internals" description: "How the ACP adapter works: lifecycle, sessions, event bridge, approvals, and tool re

开发者指南

上下文压缩与缓存

Hermes Agent 使用双重压缩系统和 Anthropic 提示词缓存，在长对话中高效管理上下文窗口的使用。源文件：agent/context engine.py（ABC）、agent/context compressor.py（默认引擎）、agent/prompt caching.py、gateway/run

开发者指南

架构

本页面是 Hermes Agent 内部结构的顶层地图. 使用它来了解代码库的整体结构，然后深入子系统文档获取实现细节。如果你是首次接触此代码库： 1. 本页面 — 了解整体结构 2. Agent 循环内部机制 — AIAgent 如何工作 3. 提示词组装 — 系统提示词构建

开发者指南

贡献指南

感谢你对 Hermes Agent 的贡献！本指南涵盖开发环境设置、理解代码库以及如何让你的 PR 被合并。我们按以下顺序重视贡献： 1. Bug 修复 — 崩溃、不正确行为、数据丢失 2. 跨平台兼容性 — macOS、不同 Linux 发行版、WSL2 3. 安全加固 — Shell 注入、Prompt 注入、路

Developer Guide

开发者指南

面向二次开发者，解释架构、运行时、上下文引擎、插件、工具与扩展机制。

20 篇文档20 个节点

当前节点

Provider 运行时解析

返回分馆回到知识引擎

同主题继续探索

架构

贡献指南

Agent 循环内部机制

提示词组装

sidebar position: 5 title: "提示词组装" description: "Hermes 如何构建系统提示词、保持缓存稳定性和注入临时层" Hermes 刻意将以下两者分离： - 缓存的系统提示词状态 - 临时的 API 调用时添加内容这是项目中最关键的设计决策之一，因为它影响：

上下文压缩与缓存

网关内部机制

sidebar position: 7 title: "网关内部机制" description: "消息网关如何启动、授权用户、路由会话和投递消息" 消息网关是一个长运行进程，通过统一架构将 Hermes 连接到 14+ 个外部消息平台。当消息从任何平台到达时： 1. 平台适配器接收原始事件，将其规范化为 Mess

sidebar_position: 4 title: "Provider 运行时解析" description: "Hermes 如何在运行时解析 Provider、凭据、API 模式和辅助模型"

Provider 运行时解析

解析优先级

Provider

运行时解析的输出

为什么这很重要

AI Gateway

OpenRouter、AI Gateway 和自定义 OpenAI 兼容 Base URL

原生 Anthropic 路径

OpenAI Codex 路径

辅助模型路由

回退模型

内部工作原理

不支持回退的部分

测试覆盖

相关文档

继续探索

添加 Provider

Agent 循环内部机制

ACP 内部机制

上下文压缩与缓存

架构

贡献指南

开发者指南

知识引擎 AI 问答