原文链接:https://hermes-agent.nousresearch.com/docs/reference/skills-hub 🍎 ✓ 内置 通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。 Apple🍎 macOS 🍎

> 原文链接:https://hermes-agent.nousresearch.com/docs/reference/skills-hub

技能市场

> 📖 本文档翻译自 Hermes Agent 官方文档 > 最后更新:2026-04-16

🍎

apple-notes

✓ 内置

通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。

Apple🍎 macOS

🍎

apple-reminders

✓ 内置

通过 remindctl CLI 管理 Apple 提醒事项(列表、添加、完成、删除)。

Apple🍎 macOS

🍎

findmy

✓ 内置

在 macOS 上通过 AppleScript 和屏幕截图访问 FindMy.app,追踪 Apple 设备和 AirTags。

Apple🍎 macOS

🍎

imessage

✓ 内置

在 macOS 上通过 imsg CLI 收发 iMessage/短信。

Apple🍎 macOS

🤖

claude-code

✓ 内置

将编码任务委派给 Claude Code(Anthropic 的 CLI 智能体)。用于构建功能、代码重构(Refactoring)、PR 审查和迭代式编码。需要安装 claude CLI。

AI 智能体

🤖

codex

✓ 内置

将编码任务委派给 OpenAI Codex CLI 智能体。用于构建功能、代码重构、PR 审查和批量 Issue 修复。需要安装 codex CLI 并拥有 git 仓库。

AI 智能体

🤖

hermes-agent

✓ 内置

Hermes Agent 使用与扩展的完整指南 — CLI 用法、安装设置、配置、生成(Spawn)额外智能体、网关平台(Gateway Platforms)、技能、语音、工具、配置文件(Profile)以及精简的贡献者参考。当帮助用户配置 Hermes、排查问题、生成智能体实例或进行代码贡献时加载此技能。

AI 智能体

🤖

opencode

✓ 内置

将编码任务委派给 OpenCode CLI 智能体,用于功能实现、代码重构、PR 审查和长时间自主会话。需要安装并认证 opencode CLI。

AI 智能体

🎨

architecture-diagram

✓ 内置

生成专业深色主题的系统架构图,输出为独立 HTML/SVG 文件。自包含输出,无外部依赖。基于 Cocoon AI 的 architecture-diagram-generator(MIT 协议)。

创意

🎨

ascii-art

✓ 内置

使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图片转 ASCII、远程 API(asciified、ascii.co.uk)以及 LLM 后备方案生成 ASCII 艺术作品。无需 API 密钥。

创意

🎨

ascii-video

✓ 内置

ASCII 艺术视频的生产流水线 — 支持任意格式输入。将视频/音频/图片/生成式输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图片序列)。涵盖:视频转 ASCII、音频响应式音乐可视化器、生成式 ASCII 艺术动画、混合视频+音频响应、文本/歌词叠加、实时终端渲染。当用户请求以下内容时使用:ASCII 视频、文本艺术视频、终端风格视频、字符艺术动画、复古文本可视化、ASCII 音频可视化器、将视频转换为 ASCII 艺术、矩阵风格特效,或任何动画 ASCII 输出。

创意

🎨

excalidraw

✓ 内置

使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件,用于架构图、流程图(Flowchart)、时序图(Sequence Diagram)、概念图等。文件可在 excalidraw.com 打开或上传以获取可分享链接。

创意

🎨

ideation

✓ 内置

通过创意约束生成项目灵感。当用户说"我想做点什么"、"给我一个项目想法"、"我好无聊"、"我该做什么"、"给我点灵感",或任何"我有工具但没有方向"的变体时使用。适用于代码、艺术、硬件、写作、工具以及任何可以制作的东西。

创意

🎨

manim-video

✓ 内置

使用 Manim Community Edition 的数学和技术动画生产流水线。创建 3Blue1Brown 风格的讲解视频、算法可视化(Algorithm Visualization)、公式推导、架构图和数据叙事。当用户请求以下内容时使用:动画讲解、数学动画、概念可视化、算法演示、技术讲解、3Blue1Brown 风格视频,或任何包含几何/数学内容的程序化动画。

创意

🎨

p5js

✓ 内置

使用 p5.js 的交互式和生成式视觉艺术生产流水线。创建基于浏览器的草图、生成式艺术(Generative Art)、数据可视化、交互体验、3D 场景、音频响应式视觉和动态图形 — 导出为 HTML、PNG、GIF、MP4 或 SVG。涵盖:2D/3D 渲染、噪声和粒子系统(Particle System)、流场(Flow Field)、着色器(GLSL)、像素操作、动态排版、WebGL 场景、音频分析、鼠标/键盘交互以及无头高分辨率导出。当用户请求以下内容时使用:p5.js 草图、创意编程、生成式艺术、交互式可视化、Canvas 动画、基于浏览器的视觉艺术、数据可视化、着色器特效或任何 p5.js 项目。

创意

🎨

✓ 内置

从真实网站提取的 54 套生产级设计系统(Design System)。加载模板即可生成与 Stripe、Linear、Vercel、Notion、Airbnb 等网站视觉风格一致的 HTML/CSS。每个模板包含颜色、排版(Typography)、组件、布局规则和即用 CSS 数值。

创意

🎨

songwriting-and-ai-music

✓ 内置

歌曲创作技巧、AI 音乐生成提示词(以 Suno 为主)、戏仿/改编技巧、语音技巧和经验总结。这些是工具和思路,而非规则。当艺术需要时,可以打破其中任何一条。

创意

🎮

minecraft-modpack-server

✓ 内置

从 CurseForge/Modrinth 服务器整合包 ZIP 文件搭建 Mod 版 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙、局域网配置、备份和启动脚本。

游戏

🎮

pokemon-player

✓ 内置

通过无头模拟器(Headless Emulation)自主游玩宝可梦游戏。启动游戏服务器、从内存读取结构化游戏状态、做出策略决策并发送按键输入 — 全部在终端中完成。

游戏

💻

codebase-inspection

✓ 内置

使用 pygount 检查和分析代码库(Codebase),进行代码行数(LOC)统计、语言占比分析和代码/注释比率计算。当被要求检查代码行数、仓库规模、语言组成或代码库统计信息时使用。

GitHub

💻

github-auth

✓ 内置

使用 git(通用可用)或 gh CLI 为智能体设置 GitHub 认证(Authentication)。涵盖 HTTPS 令牌、SSH 密钥、凭证助手(Credential Helper)和 gh auth — 带有自动检测流程以选择合适的方法。

GitHub

💻

github-code-review

✓ 内置

通过分析 git diff、在 PR 上留下行内评论来进行代码变更审查,执行全面的推送前审查。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。

GitHub

💻

github-issues

✓ 内置

创建、管理、分类和关闭 GitHub Issue。搜索现有 Issue、添加标签、分配人员并关联到 PR。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。

GitHub

💻

github-pr-workflow

✓ 内置

完整的 Pull Request 生命周期 — 创建分支、提交变更、发起 PR、监控 CI 状态、自动修复失败并合并。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。

GitHub

💻

github-repo-management

✓ 内置

克隆、创建、派生(Fork)、配置和管理 GitHub 仓库。管理远程仓库(Remote)、密钥(Secrets)、发布(Release)和工作流(Workflow)。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。

GitHub

🎵

✓ 内置

使用 curl 搜索和下载 Tenor 上的 GIF 图片。除 curl 和 jq 外无其他依赖。适用于查找表情 GIF、创建视觉内容和在聊天中发送 GIF。

媒体

🎵

heartmula

✓ 内置

设置和运行 HeartMuLa,一个开源音乐生成模型家族(类似 Suno)。通过歌词 + 标签生成完整歌曲,支持多语言。

媒体

🎵

songsee

✓ 内置

通过 CLI 从音频文件生成频谱图(Spectrogram)和音频特征可视化(梅尔频谱、色度特征、MFCC、速度图等)。适用于音频分析、音乐制作调试和可视化文档记录。

媒体

🎵

youtube-content

✓ 内置

获取 YouTube 视频字幕(Transcript)并将其转换为结构化内容(章节、摘要、推文串、博客文章)。当用户分享 YouTube URL 或视频链接、要求总结视频、请求字幕、或想从任何 YouTube 视频中提取和重新格式化内容时使用。

媒体

🧪

audiocraft-audio-generation

✓ 内置

用于音频生成的 PyTorch 库,包括文本到音乐(MusicGen)和文本到音效(AudioGen)。当需要从文本描述生成音乐、创建音效或执行旋律条件(Melody-conditioned)音乐生成时使用。

MLOps

🧪

axolotl

✓ 内置

使用 Axolotl 微调(Fine-tuning)LLM 的专家指南 — YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持。

MLOps

🧪

clip

✓ 内置

OpenAI 的连接视觉和语言的模型。支持零样本(Zero-shot)图像分类、图文匹配和跨模态检索(Cross-modal Retrieval)。在 4 亿图文对上训练。用于图像搜索、内容审核(Content Moderation)或无需微调的视觉-语言任务。最适合通用图像理解。

MLOps

🧪

dspy

✓ 内置

使用声明式编程(Declarative Programming)构建复杂 AI 系统,自动优化提示词,使用 DSPy 创建模块化 RAG 系统和智能体 — 斯坦福 NLP 的系统化语言模型编程框架。

MLOps

🧪

evaluating-llms-harness

✓ 内置

在 60+ 学术基准测试(Benchmark)(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上评估 LLM。当进行模型质量基准测试、比较模型、报告学术结果或跟踪训练进度时使用。EleutherAI、HuggingFace 和各大实验室使用的行业标准。支持 HuggingFace、vLLM、API。

MLOps

🧪

fine-tuning-with-trl

✓ 内置

使用 TRL 通过强化学习(Reinforcement Learning)微调 LLM — SFT 用于指令调优(Instruction Tuning)、DPO 用于偏好对齐(Preference Alignment)、PPO/GRPO 用于奖励优化以及奖励模型训练。当需要 RLHF、按偏好对齐模型或从人类反馈训练时使用。与 HuggingFace Transformers 配合使用。

MLOps

🧪

gguf-quantization

✓ 内置

GGUF 格式和 llama.cpp 量化(Quantization),用于高效的 CPU/GPU 推理(Inference)。当在消费级硬件、Apple Silicon 上部署模型,或需要 2-8 位灵活量化而无 GPU 要求时使用。

MLOps

🧪

grpo-rl-training

✓ 内置

使用 TRL 进行 GRPO/RL 微调的专家指南,用于推理和特定任务模型训练。

MLOps

🧪

guidance

✓ 内置

使用正则表达式(Regex)和文法(Grammar)控制 LLM 输出,保证生成有效的 JSON/XML/代码,强制结构化格式,并使用 Guidance 构建多步骤工作流 — 微软研究院的约束生成(Constrained Generation)框架。

MLOps

🧪

huggingface-hub

✓ 内置

Hugging Face Hub CLI (hf) — 搜索、下载和上传模型与数据集、管理仓库、使用 SQL 查询数据集、部署推理端点(Inference Endpoint)、管理 Spaces 和存储桶。

MLOps

🧪

llama-cpp

✓ 内置

在 CPU、Apple Silicon 和消费级 GPU 上运行 LLM 推理,无需 NVIDIA 硬件。用于边缘部署(Edge Deployment)、M1/M2/M3 Mac、AMD/Intel GPU 或 CUDA 不可用时。支持 GGUF 量化(1.5-8 位),减少内存占用,CPU 上相比 PyTorch 加速 4-10 倍。

MLOps

🧪

✓ 内置

用于运行 ML 工作负载的无服务器(Serverless)GPU 云平台。当需要按需 GPU 访问而无需基础设施管理、将 ML 模型部署为 API 或运行带自动扩展的批量任务时使用。

MLOps

🧪

obliteratus

✓ 内置

使用 OBLITERATUS 移除开源 LLM 的拒绝行为 — 机械式可解释性(Mechanistic Interpretability)技术(差值均值法 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同时剔除安全护栏。9 种 CLI 方法、28 个分析模块、5 个计算层级共 116 个模型预设、锦标赛评估和遥测驱动的推荐。当用户想要解除审查、移除 LLM 拒绝行为时使用。

MLOps

🧪

outlines

✓ 内置

在生成过程中保证有效的 JSON/XML/代码结构,使用 Pydantic 模型实现类型安全输出,支持本地模型(Transformers、vLLM),并使用 Outlines 最大化推理速度 — dottxt.ai 的结构化生成库。

MLOps

🧪

peft-fine-tuning

✓ 内置

使用 LoRA、QLoRA 和 25+ 方法对 LLM 进行参数高效微调(Parameter-efficient Fine-tuning)。当在有限 GPU 内存下微调大模型(7B-70B)、需要训练不到 1% 的参数且精度损失极小,或多适配器(Multi-adapter)服务时使用。HuggingFace 官方库,与 transformers 生态系统集成。

MLOps

🧪

pytorch-fsdp

✓ 内置

使用 PyTorch FSDP 进行全分片数据并行(Fully Sharded Data Parallel)训练的专家指南 — 参数分片、混合精度(Mixed Precision)、CPU 卸载、FSDP2。

MLOps

🧪

segment-anything-model

✓ 内置

具备零样本迁移(Zero-shot Transfer)能力的图像分割(Image Segmentation)基础模型。当需要使用点、框或掩码作为提示来分割图像中的任意对象,或自动生成图像中所有对象的掩码时使用。

MLOps

🧪

serving-llms-vllm

✓ 内置

使用 vLLM 的 PagedAttention 和连续批处理(Continuous Batching)高吞吐量地提供 LLM 服务。当部署生产级 LLM API、优化推理延迟/吞吐量或在有限 GPU 内存下服务模型时使用。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)和张量并行(Tensor Parallelism)。

MLOps

🧪

stable-diffusion-image-generation

✓ 内置

通过 HuggingFace Diffusers 使用 Stable Diffusion 模型进行最先进的文本到图像生成。当需要从文本提示词生成图像、执行图像到图像翻译(Image-to-image Translation)、图像修复(Inpainting)或构建自定义扩散流水线时使用。

MLOps

🧪

unsloth

✓ 内置

使用 Unsloth 进行快速微调的专家指南 — 训练速度提升 2-5 倍、内存减少 50-80%、LoRA/QLoRA 优化。

MLOps

🧪

weights-and-biases

✓ 内置

通过自动日志记录跟踪 ML 实验、实时可视化训练过程、使用 Sweeps 优化超参数(Hyperparameter),并通过 W&B 管理模型注册表 — 协作式 MLOps 平台。

MLOps

🧪

whisper

✓ 内置

OpenAI 的通用语音识别(Speech Recognition)模型。支持 99 种语言、转录(Transcription)、翻译为英语和语言识别。六种模型规模,从 tiny(3900 万参数)到 large(15.5 亿参数)。用于语音转文本、播客转录或多语言音频处理。最适合鲁棒的多语言自动语音识别(ASR)。

MLOps

google-workspace

✓ 内置

Hermes 的 Gmail、日历、云端硬盘、通讯录、表格和文档集成。使用 Hermes 管理的 OAuth2 设置,优先使用 Google Workspace CLI (gws) 以获得更广泛的 API 覆盖,否则回退到 Python 客户端库。

生产力

linear

✓ 内置

通过 GraphQL API 管理 Linear 的 Issue、项目和团队。创建、更新、搜索和组织 Issue。使用 API 密钥认证(无需 OAuth)。所有操作通过 curl 完成 — 无依赖。

生产力

nano-pdf

✓ 内置

使用 nano-pdf CLI 通过自然语言指令编辑 PDF。修改文本、修正拼写错误、更新标题,以及对特定页面进行内容更改,无需手动编辑。

生产力

notion

✓ 内置

Notion API,用于通过 curl 创建和管理页面、数据库和块。直接从终端搜索、创建、更新和查询 Notion 工作区。

生产力

ocr-and-documents

✓ 内置

从 PDF 和扫描文档中提取文本。对远程 URL 使用 web_extract,对本地文本型 PDF 使用 pymupdf,对 OCR/扫描文档使用 marker-pdf。DOCX 使用 python-docx,PPTX 参见 powerpoint 技能。

生产力

powerpoint

✓ 内置

当 .pptx 文件以任何方式涉及时(作为输入、输出或两者),均使用此技能。包括:创建幻灯片组、推介演示文稿或演示文稿;读取、解析或从任何 .pptx 文件中提取文本(即使提取的内容将用于其他用途,如电子邮件或摘要);编辑、修改或更新现有演示文稿;合并或拆分幻灯片文件;使用模板、布局、演讲者备注或评论。当用户提到"演示文稿"、"幻灯片"、"PPT"或引用 .pptx 文件名时触发,无论他们之后打算如何使用内容。只要 .pptx 文件需要被打开、创建或触碰,就使用此技能。

生产力

🔍

arxiv

✓ 内置

使用 arXiv 的免费 REST API 搜索和检索学术论文。无需 API 密钥。按关键词、作者、类别或 ID 搜索。可结合 web_extract 或 ocr-and-documents 技能阅读论文全文。

研究

🔍

blogwatcher

✓ 内置

使用 blogwatcher-cli 工具监控博客和 RSS/Atom 订阅源的更新。添加博客、扫描新文章、跟踪阅读状态并按类别筛选。

研究

🔍

llm-wiki

✓ 内置

Karpathy 的 LLM Wiki — 构建和维护持久的、相互关联的 Markdown 知识库(Knowledge Base)。导入信息源、查询已编译的知识并检查一致性。

研究

显示更多(剩余 587 个)

Continue Exploring

继续探索

这不是课程式的上一篇下一篇,而是从当前节点向外继续漫游。

参考

CLI 命令参考

本页介绍从终端运行的 命令行命令 。 聊天内斜杠命令请参见斜杠命令参考。 hermes [全局选项] <命令 [子命令/选项] hermes chat [options] 常用选项: 示例: hermes hermes chat -q "总结最新的 PR" hermes chat --provider openrout

参考

斜杠命令参考

原文链接:Slash Commands Reference Hermes 有两个斜杠命令(Slash Command)界面,均由 hermes cli/commands.py 中的中央 COMMAND REGISTRY 驱动: 交互式 CLI(命令行界面) 斜杠命令 — 由 cli.py 分发,支持从注册表自动补全

参考

配置文件命令参考

本页面涵盖所有与 Hermes 配置文件 相关的命令。通用 CLI 命令请参见 CLI 命令参考。 hermes profile <子命令 管理配置文件的顶级命令。不带子命令运行 hermes profile 会显示帮助。 hermes profile list 列出所有配置文件。当前活跃的配置文件用 标记。

参考

环境变量

原文链接:Environment Variables Reference 所有变量都放在 /.hermes/.env 文件中。你也可以通过 hermes config set VAR value 来设置。 变量 描述 --- --- OPENROUTER API KEY OpenRouter API 密钥(推荐,灵活性

参考

内置工具参考

原文链接:Built-in Tools Reference 本文档记录了 Hermes 工具注册表中的全部 47 个内置工具,按工具集(Toolset)分组。工具的可用性因平台、凭证和已启用的工具集而异。 快速统计: 10 个浏览器工具、4 个文件工具、10 个强化学习(RL)工具、4 个 Home Assistant

参考

工具集参考

工具集(Toolsets)是工具的命名捆绑包,控制 Agent 能做什么。它们是按平台、按会话或按任务配置工具可用性的主要机制。 每个工具恰好属于一个工具集。当你启用一个工具集时,该捆绑包中的所有工具都对 Agent 可用。工具集分为三类: 核心(Core) — 一组相关工具的逻辑分组(例如,file 捆绑了 read

Reference

参考

命令、配置、环境变量、技能目录与常见问题,适合作为索引与查阅入口。

11 篇文档11 个节点

当前节点

技能市场

同主题继续探索

CLI 命令参考

本页介绍从终端运行的 命令行命令 。 聊天内斜杠命令请参见斜杠命令参考。 hermes [全局选项] <命令 [子命令/选项] hermes chat [options] 常用选项: 示例: hermes hermes chat -q "总结最新的 PR" hermes chat --provider openrout

斜杠命令参考

原文链接:Slash Commands Reference Hermes 有两个斜杠命令(Slash Command)界面,均由 hermes cli/commands.py 中的中央 COMMAND REGISTRY 驱动: 交互式 CLI(命令行界面) 斜杠命令 — 由 cli.py 分发,支持从注册表自动补全

配置文件命令参考

本页面涵盖所有与 Hermes 配置文件 相关的命令。通用 CLI 命令请参见 CLI 命令参考。 hermes profile <子命令 管理配置文件的顶级命令。不带子命令运行 hermes profile 会显示帮助。 hermes profile list 列出所有配置文件。当前活跃的配置文件用 标记。

环境变量

原文链接:Environment Variables Reference 所有变量都放在 /.hermes/.env 文件中。你也可以通过 hermes config set VAR value 来设置。 变量 描述 --- --- OPENROUTER API KEY OpenRouter API 密钥(推荐,灵活性

内置工具参考

原文链接:Built-in Tools Reference 本文档记录了 Hermes 工具注册表中的全部 47 个内置工具,按工具集(Toolset)分组。工具的可用性因平台、凭证和已启用的工具集而异。 快速统计: 10 个浏览器工具、4 个文件工具、10 个强化学习(RL)工具、4 个 Home Assistant

工具集参考

工具集(Toolsets)是工具的命名捆绑包,控制 Agent 能做什么。它们是按平台、按会话或按任务配置工具可用性的主要机制。 每个工具恰好属于一个工具集。当你启用一个工具集时,该捆绑包中的所有工具都对 Agent 可用。工具集分为三类: 核心(Core) — 一组相关工具的逻辑分组(例如,file 捆绑了 read

相关节点

CLI 命令参考

本页介绍从终端运行的 命令行命令 。 聊天内斜杠命令请参见斜杠命令参考。 hermes [全局选项] <命令 [子命令/选项] hermes chat [options] 常用选项: 示例: hermes hermes chat -q "总结最新的 PR" hermes chat --provider openrout

斜杠命令参考

原文链接:Slash Commands Reference Hermes 有两个斜杠命令(Slash Command)界面,均由 hermes cli/commands.py 中的中央 COMMAND REGISTRY 驱动: 交互式 CLI(命令行界面) 斜杠命令 — 由 cli.py 分发,支持从注册表自动补全

配置文件命令参考

本页面涵盖所有与 Hermes 配置文件 相关的命令。通用 CLI 命令请参见 CLI 命令参考。 hermes profile <子命令 管理配置文件的顶级命令。不带子命令运行 hermes profile 会显示帮助。 hermes profile list 列出所有配置文件。当前活跃的配置文件用 标记。

环境变量

原文链接:Environment Variables Reference 所有变量都放在 /.hermes/.env 文件中。你也可以通过 hermes config set VAR value 来设置。 变量 描述 --- --- OPENROUTER API KEY OpenRouter API 密钥(推荐,灵活性

内置工具参考

原文链接:Built-in Tools Reference 本文档记录了 Hermes 工具注册表中的全部 47 个内置工具,按工具集(Toolset)分组。工具的可用性因平台、凭证和已启用的工具集而异。 快速统计: 10 个浏览器工具、4 个文件工具、10 个强化学习(RL)工具、4 个 Home Assistant

工具集参考

工具集(Toolsets)是工具的命名捆绑包,控制 Agent 能做什么。它们是按平台、按会话或按任务配置工具可用性的主要机制。 每个工具恰好属于一个工具集。当你启用一个工具集时,该捆绑包中的所有工具都对 Agent 可用。工具集分为三类: 核心(Core) — 一组相关工具的逻辑分组(例如,file 捆绑了 read