> 原文链接:https://hermes-agent.nousresearch.com/docs/reference/skills-catalog
> 📖 本文档翻译自 Hermes Agent 官方文档
> 最后更新:2026-04-16
内置技能目录
Hermes 附带一个大型内置技能库,安装时会复制到 ~/.hermes/skills/。本页编目了仓库中 skills/ 目录下的内置技能。
apple
Apple/macOS 专用技能 — iMessage、提醒事项、备忘录、查找(FindMy)和 macOS 自动化。这些技能仅在 macOS 系统上加载。
| 技能 | 描述 | 路径 |
|---|
apple-notes | 通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。 | apple/apple-notes |
apple-reminders | 通过 remindctl CLI 管理 Apple 提醒事项(列表、添加、完成、删除)。 | apple/apple-reminders |
findmy | 在 macOS 上通过 AppleScript 和屏幕截图使用 FindMy.app 追踪 Apple 设备和 AirTags。 | apple/findmy |
imessage | 在 macOS 上通过 imsg CLI 发送和接收 iMessage/SMS。 | apple/imessage |
autonomous-ai-agents
用于生成和编排自主 AI 编码 Agent 及多 Agent(Multi-Agent)工作流的技能 — 运行独立的 Agent 进程、委派任务、协调并行工作流。
| 技能 | 描述 | 路径 |
|---|
claude-code | 将编码任务委派给 Claude Code(Anthropic 的 CLI Agent)。用于构建功能、重构、PR 审查和迭代编码。需要安装 claude CLI。 | autonomous-ai-agents/claude-code |
codex | 将编码任务委派给 OpenAI Codex CLI Agent。用于构建功能、重构、PR 审查和批量问题修复。需要 codex CLI 和 git 仓库。 | autonomous-ai-agents/codex |
hermes-agent-spawning | 将额外的 Hermes Agent 实例作为自主子进程生成,用于独立的长时间运行任务。支持非交互式一次性模式(-q)和交互式 PTY 模式进行多轮协作。与 delegate_task 不同 — 这会运行一个完整的独立 hermes 进程。 | autonomous-ai-agents/hermes-agent |
opencode | 将编码任务委派给 OpenCode CLI Agent,用于功能实现、重构、PR 审查和长时间自主会话。需要安装并认证 opencode CLI。 | autonomous-ai-agents/opencode |
data-science
数据科学(Data Science)工作流技能 — 交互式探索、Jupyter 笔记本、数据分析和可视化。
| 技能 | 描述 | 路径 |
|---|
jupyter-live-kernel | 通过 hamelnb 使用实时 Jupyter 内核进行有状态的迭代 Python 执行。当任务涉及探索、迭代或检查中间结果时加载此技能。 | data-science/jupyter-live-kernel |
creative
创意内容生成 — ASCII 艺术、手绘风格图表和视觉设计工具。
| 技能 | 描述 | 路径 |
|---|
ascii-art | 使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图片转 ASCII、远程 API(asciified、ascii.co.uk)和 LLM 回退生成 ASCII 艺术。无需 API 密钥。 | creative/ascii-art |
ascii-video | ASCII 艺术视频的生产流水线 — 支持任何格式。将视频/音频/图片/生成式输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图片序列)。涵盖:视频转 ASCII 转换、音频响应式音乐可视化器、生成式 ASCII 艺术动画、混合… | creative/ascii-video |
excalidraw | 使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件用于架构图、流程图、时序图、概念图等。文件可在 excalidraw.com 打开或上传获取分享链接。 | creative/excalidraw |
p5js | 使用 p5.js 进行交互式和生成式视觉艺术的生产流水线。创建草图,通过无头浏览器渲染为图片/视频,并提供实时预览。支持画布动画、数据可视化和创意编程实验。 | creative/p5js |
devops
DevOps 和基础设施自动化技能。
| 技能 | 描述 | 路径 |
|---|
webhook-subscriptions | 创建和管理 Webhook 订阅,用于事件驱动的 Agent 激活。外部服务(GitHub、Stripe、CI/CD、IoT)通过 POST 事件触发 Agent 运行。需要启用 Webhook 平台。 | devops/webhook-subscriptions |
dogfood
| 技能 | 描述 | 路径 |
|---|
dogfood | 系统化的 Web 应用探索性 QA 测试 — 发现缺陷、捕获证据并生成结构化报告。 | dogfood/dogfood |
hermes-agent-setup | 帮助用户配置 Hermes Agent — CLI 使用、设置向导、模型/提供商选择、工具、技能、语音/STT/TTS、网关和故障排除。 | dogfood/hermes-agent-setup |
email
从终端发送、接收、搜索和管理电子邮件的技能。
| 技能 | 描述 | 路径 |
|---|
himalaya | 通过 IMAP/SMTP 管理电子邮件的 CLI。使用 himalaya 从终端列出、阅读、撰写、回复、转发、搜索和整理邮件。支持多账户和使用 MML(MIME Meta Language)撰写邮件。 | email/himalaya |
gaming
用于设置、配置和管理游戏服务器、模组包和游戏相关基础设施的技能。
| 技能 | 描述 | 路径 |
|---|
minecraft-modpack-server | 从 CurseForge/Modrinth 服务器包 zip 设置模组 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙、局域网配置、备份和启动脚本。 | gaming/minecraft-modpack-server |
pokemon-player | 通过无头模拟器自主游玩 Pokémon 游戏。启动游戏服务器,从 RAM 读取结构化游戏状态,做出战略决策,并发送按钮输入 — 全部从终端完成。 | gaming/pokemon-player |
github
GitHub 工作流技能,用于通过终端使用 gh CLI 和 git 管理仓库、Pull Request、代码审查、Issues 和 CI/CD 流水线。
| 技能 | 描述 | 路径 |
|---|
codebase-inspection | 使用 pygount 进行 LOC 计数、语言分布和代码/注释比例来检查和分析代码库。当被要求检查代码行数、仓库大小、语言组成或代码库统计时使用。 | github/codebase-inspection |
github-auth | 使用 git(通用)或 gh CLI 为 Agent 设置 GitHub 认证。涵盖 HTTPS 令牌、SSH 密钥、凭证助手和 gh auth — 具有自动检测流程以选择合适的方法。 | github/github-auth |
github-code-review | 通过分析 git diff、在 PR 上留下行内评论并进行彻底的推送前审查来审查代码变更。使用 gh CLI 或回退到 git + GitHub REST API 通过 curl。 | github/github-code-review |
github-issues | 创建、管理、分类和关闭 GitHub Issues。搜索现有 Issues、添加标签、分配人员并关联 PR。使用 gh CLI 或回退到 git + GitHub REST API 通过 curl。 | github/github-issues |
github-pr-workflow | 完整的 Pull Request 生命周期 — 创建分支、提交变更、发起 PR、监控 CI 状态、自动修复失败并合并。使用 gh CLI 或回退到 git + GitHub REST API 通过 curl。 | github/github-pr-workflow |
github-repo-management | 克隆、创建、分叉、配置和管理 GitHub 仓库。管理远程仓库、密钥、发布和工作流。使用 gh CLI 或回退到 git + GitHub REST API 通过 curl。 | github/github-repo-management |
inference-sh
通过 inference.sh 云平台执行 AI 应用的技能。
| 技能 | 描述 | 路径 |
|---|
inference-sh-cli | 通过 inference.sh CLI (infsh) 运行 150+ AI 应用 — 图片生成、视频创建、LLM、搜索、3D、社交自动化。 | inference-sh/cli |
leisure
| 技能 | 描述 | 路径 |
|---|
find-nearby | 使用 OpenStreetMap 查找附近的地点(餐厅、咖啡馆、酒吧、药店等)。支持坐标、地址、城市、邮编或 Telegram 位置图钉。无需 API 密钥。 | leisure/find-nearby |
mcp
用于操作 MCP(Model Context Protocol,模型上下文协议)服务器、工具和集成的技能。包括内置的原生 MCP 客户端(在 config.yaml 中配置服务器以自动发现工具)以及用于临时服务器交互的 mcporter CLI 桥接。
| 技能 | 描述 | 路径 |
|---|
mcporter | 使用 mcporter CLI 直接列出、配置、认证和调用 MCP 服务器/工具(HTTP 或 stdio),包括临时服务器、配置编辑和 CLI/类型生成。 | mcp/mcporter |
native-mcp | 内置 MCP(Model Context Protocol,模型上下文协议)客户端,连接外部 MCP 服务器,发现其工具并将其注册为 Hermes Agent 原生工具。支持 stdio 和 HTTP 传输,具有自动重连、安全过滤和零配置工具注入。 | mcp/native-mcp |
media
处理媒体内容的技能 — YouTube 字幕、GIF 搜索、音乐生成和音频可视化。
| 技能 | 描述 | 路径 |
|---|
gif-search | 使用 curl 从 Tenor 搜索和下载 GIF。除 curl 和 jq 外无需其他依赖。适用于查找反应 GIF、创建视觉内容和在聊天中发送 GIF。 | media/gif-search |
heartmula | 设置和运行 HeartMuLa,开源音乐生成模型家族(类似 Suno)。通过歌词 + 标签生成完整歌曲,支持多语言。 | media/heartmula |
songsee | 通过 CLI 从音频文件生成频谱图和音频特征可视化(mel、chroma、MFCC、tempogram 等)。适用于音频分析、音乐制作调试和可视化文档。 | media/songsee |
youtube-content | 获取 YouTube 视频字幕并将其转换为结构化内容(章节、摘要、推文串、博客文章)。 | media/youtube-content |
mlops
通用 ML 操作(MLOps)工具 — 模型中心管理、数据集操作和工作流编排。
| 技能 | 描述 | 路径 |
|---|
huggingface-hub | Hugging Face Hub CLI (hf) — 搜索、下载和上传模型与数据集,管理仓库,部署推理端点(Endpoint)。 | mlops/huggingface-hub |
mlops/cloud
GPU 云提供商和 Serverless 计算平台,用于 ML 工作负载。
| 技能 | 描述 | 路径 |
|---|
lambda-labs-gpu-cloud | 预留和按需 GPU 云实例,用于 ML 训练和推理。当需要具有简单 SSH 访问、持久文件系统或高性能多节点集群的专用 GPU 实例进行大规模训练时使用。 | mlops/cloud/lambda-labs |
modal-serverless-gpu | 用于运行 ML 工作负载的 Serverless GPU 云平台。当需要无需基础设施管理的按需 GPU 访问、将 ML 模型部署为 API 或运行具有自动扩展的批处理作业时使用。 | mlops/cloud/modal |
mlops/evaluation
模型评估基准、实验跟踪、数据整理、分词器(Tokenizer)和可解释性工具。
| 技能 | 描述 | 路径 |
|---|
evaluating-llms-harness | 跨 60+ 学术基准(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)评估 LLM。当需要基准测试模型质量、比较模型、报告学术结果或跟踪训练进度时使用。EleutherAI、HuggingFace 和主要实验室使用的行业标准… | mlops/evaluation/lm-evaluation-harness |
huggingface-tokenizers | 为研究和生产优化的快速分词器。基于 Rust 的实现可在 20 秒内对 1GB 进行分词。支持 BPE、WordPiece 和 Unigram 算法。训练自定义词表、跟踪对齐、处理填充/截断。与 transformers 无缝集成… | mlops/evaluation/huggingface-tokenizers |
nemo-curator | GPU 加速的 LLM 训练数据整理。支持文本/图片/视频/音频。具有模糊去重(16 倍加速)、质量过滤(30+ 启发式规则)、语义去重、PII 脱敏、NSFW 检测。通过 RAPIDS 跨 GPU 扩展。用于准备高质量训… | mlops/evaluation/nemo-curator |
sparse-autoencoder-training | 提供使用 SAELens 训练和分析稀疏自编码器(SAE,Sparse Autoencoder)的指导,将神经网络激活分解为可解释的特征。当发现可解释特征、分析叠加(Superposition)或研究语言模型中的单义表示时使用… | mlops/evaluation/saelens |
weights-and-biases | 通过自动日志记录跟踪 ML 实验、实时可视化训练过程、通过 Sweep 优化超参数,以及使用 W&B 管理模型注册表 — 协作式 MLOps 平台。 | mlops/evaluation/weights-and-biases |
mlops/inference
模型服务、量化(Quantization)(GGUF/GPTQ)、结构化输出、推理优化和模型手术工具,用于部署和运行 LLM。
| 技能 | 描述 | 路径 |
|---|
gguf-quantization | GGUF 格式和 llama.cpp 量化,用于高效的 CPU/GPU 推理。当在消费级硬件、Apple Silicon 上部署模型或需要 2-8 位灵活量化而不需要 GPU 时使用。 | mlops/inference/gguf |
guidance | 使用正则表达式和语法控制 LLM 输出,保证生成有效的 JSON/XML/代码,强制执行结构化格式,并使用 Guidance 构建多步工作流 — Microsoft Research 的约束生成框架。 | mlops/inference/guidance |
instructor | 通过 Pydantic 验证从 LLM 响应中提取结构化数据,自动重试失败的提取,以类型安全解析复杂 JSON,并使用 Instructor 流式传输部分结果 — 经过实战检验的结构化输出库。 | mlops/inference/instructor |
llama-cpp | 在 CPU、Apple Silicon 和消费级 GPU 上运行 LLM 推理,无需 NVIDIA 硬件。用于边缘部署、M1/M2/M3 Mac、AMD/Intel GPU 或 CUDA 不可用时。支持 GGUF 量化(1.5-8 位)以减少内存,在 CPU 上比 PyTorch 快 4-10 倍。 | mlops/inference/llama-cpp |
obliteratus | 使用 OBLITERATUS 从开放权重 LLM 中移除拒绝行为 — 利用机制可解释性(Mechanistic Interpretability)技术(差值均值、SVD、白化 SVD、LEACE、SAE 分解等)在保留推理能力的同时切除安全护栏。9 种 CLI 方法、28 个分析模块、116 个模型预设… | mlops/inference/obliteratus |
outlines | 在生成过程中保证有效的 JSON/XML/代码结构,使用 Pydantic 模型获得类型安全的输出,支持本地模型(Transformers、vLLM),并通过 Outlines — dottxt.ai 的结构化生成库最大化推理速度。 | mlops/inference/outlines |
serving-llms-vllm | 使用 vLLM 的 PagedAttention 和连续批处理(Continuous Batching)高吞吐量地服务 LLM。当部署生产级 LLM API、优化推理延迟/吞吐量或在有限 GPU 内存下服务模型时使用。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)… | mlops/inference/vllm |
tensorrt-llm | 使用 NVIDIA TensorRT 优化 LLM 推理以获得最大吞吐量和最低延迟。用于在 NVIDIA GPU(A100/H100)上的生产部署,当需要比 PyTorch 快 10-100 倍的推理,或服务具有量化(FP8/INT4)、在线批处理和多… | mlops/inference/tensorrt-llm |
mlops/models
特定模型架构和工具 — 计算机视觉(CLIP、SAM、Stable Diffusion)、语音(Whisper)、音频生成(AudioCraft)和多模态模型(LLaVA)。
| 技能 | 描述 | 路径 |
|---|
audiocraft-audio-generation | 用于音频生成的 PyTorch 库,包括文本转音乐(MusicGen)和文本转音效(AudioGen)。当需要从文本描述生成音乐、创建音效或执行旋律条件化音乐生成时使用。 | mlops/models/audiocraft |
clip | OpenAI 的连接视觉和语言的模型。支持零样本图像分类、图文匹配和跨模态检索。在 4 亿图文对上训练。用于图像搜索、内容审核或无需微调的视觉语言任务。最适合通用… | mlops/models/clip |
llava | 大型语言和视觉助手。支持视觉指令微调和基于图像的对话。结合 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型。支持多轮图像对话、视觉问答和指令遵循。用于视觉语言聊… | mlops/models/llava |
segment-anything-model | 具有零样本迁移能力的基础图像分割模型。当需要使用点、框或掩码作为提示来分割图像中的任何对象,或自动生成图像中所有对象掩码时使用。 | mlops/models/segment-anything |
stable-diffusion-image-generation | 通过 HuggingFace Diffusers 使用 Stable Diffusion 模型的最先进文本转图像生成。当需要从文本提示生成图像、执行图像转图像翻译、修复或构建自定义扩散流水线时使用。 | mlops/models/stable-diffusion |
whisper | OpenAI 的通用语音识别模型。支持 99 种语言、转录、翻译为英语和语言识别。六种模型尺寸,从 tiny(3900 万参数)到 large(15.5 亿参数)。用于语音转文本、播客转录或多语言音频处… | mlops/models/whisper |
mlops/research
用于通过声明式编程(Declarative Programming)构建和优化 AI 系统的 ML 研究框架。
| 技能 | 描述 | 路径 |
|---|
dspy | 使用声明式编程构建复杂 AI 系统,自动优化提示,使用 DSPy 创建模块化 RAG 系统和 Agent — Stanford NLP 的系统化 LM 编程框架。 | mlops/research/dspy |
mlops/training
微调(Fine-tuning)、RLHF/DPO/GRPO 训练、分布式训练框架和优化工具,用于训练 LLM 和其他模型。
| 技能 | 描述 | 路径 |
|---|
axolotl | 使用 Axolotl 微调 LLM 的专家指导 — YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持。 | mlops/training/axolotl |
distributed-llm-pretraining-torchtitan | 提供使用 torchtitan 进行 PyTorch 原生分布式 LLM 预训练,支持 4D 并行(FSDP2、TP、PP、CP)。当在 8 到 512+ GPU 上使用 Float8、torch.compile 和分布式检查点大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型时使用。 | mlops/training/torchtitan |
fine-tuning-with-trl | 使用 TRL 通过强化学习微调 LLM — SFT 用于指令微调、DPO 用于偏好对齐、PPO/GRPO 用于奖励优化和奖励模型训练。当需要 RLHF、与偏好对齐或从人类反馈训练时使用。与 HuggingFace Tr… | mlops/training/trl-fine-tuning |
grpo-rl-training | 使用 TRL 进行 GRPO/RL 微调的专家指导,用于推理和特定任务模型训练。 | mlops/training/grpo-rl-training |
hermes-atropos-environments | 构建、测试和调试用于 Atropos 训练的 Hermes Agent RL 环境。涵盖 HermesAgentBaseEnv 接口、奖励函数、Agent 循环集成、工具评估、wandb 日志记录和三种 CLI 模式(serve/process/evaluate)。当创建、审查或修… | mlops/training/hermes-atropos-environments |
huggingface-accelerate | 最简单的分布式训练 API。只需 4 行代码即可为任何 PyTorch 脚本添加分布式支持。DeepSpeed/FSDP/Megatron/DDP 的统一 API。自动设备放置、混合精度(FP16/BF16/FP8)。交互式配置,单一启动命令。HuggingFace 生态标准。 | mlops/training/accelerate |
optimizing-attention-flash | 使用 Flash Attention 优化 Transformer 注意力,实现 2-4 倍加速和 10-20 倍内存减少。当训练/运行具有长序列(>512 tokens)的 Transformer、遇到 GPU 内存问题或需要更快的推理时使用。支持 PyTorch 原生 SDPA… | mlops/training/flash-attention |
peft-fine-tuning | 使用 LoRA、QLoRA 和 25+ 方法的参数高效微调(Parameter-Efficient Fine-Tuning)。当在有限 GPU 内存下微调大型模型(7B-70B)、需要训练不到 1% 的参数且精度损失最小,或多适配器服务时使用。HuggingFace 的官方库… | mlops/training/peft |
pytorch-fsdp | 使用 PyTorch FSDP 进行完全分片数据并行(Fully Sharded Data Parallel)训练的专家指导 — 参数分片、混合精度、CPU 卸载、FSDP2。 | mlops/training/pytorch-fsdp |
pytorch-lightning | 高级 PyTorch 框架,具有 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调系统和最少样板代码。从笔记本电脑到超级计算机使用相同代码进行扩展。当需要具有内置最佳实践的简洁训练循环时使用。 | mlops/training/pytorch-lightning |
simpo-training | 简单偏好优化(SimPO,Simple Preference Optimization)用于 LLM 对齐。无需参考模型的 DPO 替代方案,性能更优(AlpacaEval 2.0 上高 6.4 分)。无需参考模型,比 DPO 更高效。当需要比 DPO/PPO 更简单快速的偏好对齐时使用。 | mlops/training/simpo |
slime-rl-training | 提供使用 slime 进行 LLM 后训练 RL 的指导,一个 Megatron+SGLang 框架。当训练 GLM 模型、实现自定义数据生成工作流或需要紧密的 Megatron-LM 集成以进行 RL 扩展时使用。 | mlops/training/slime |
unsloth | 使用 Unsloth 进行快速微调的专家指导 — 2-5 倍更快的训练、50-80% 更少的内存、LoRA/QLoRA 优化。 | mlops/training/unsloth |
mlops/vector-databases
向量相似性搜索和嵌入数据库,用于 RAG(检索增强生成)、语义搜索和 AI 应用后端。
| 技能 | 描述 | 路径 |
|---|
chroma | 开源嵌入数据库,用于 AI 应用。存储嵌入和元数据,执行向量和全文搜索,按元数据过滤。简单的 4 函数 API。从笔记本扩展到生产集群。用于语义搜索、RAG 应用或文档检索。最适合… | mlops/vector-databases/chroma |
faiss | Facebook 的高效相似性搜索和密集向量聚类库。支持数十亿向量、GPU 加速和各种索引类型(Flat、IVF、HNSW)。用于快速 k-NN 搜索、大规模向量检索或需要纯相似性搜索而无需… | mlops/vector-databases/faiss |
pinecone | 用于生产 AI 应用的托管向量数据库。完全托管、自动扩展,具有混合搜索(密集 + 稀疏)、元数据过滤和命名空间。低延迟(<100ms p95)。用于生产级 RAG、推荐系统或大规模语义搜索。最适合服务器… | mlops/vector-databases/pinecone |
qdrant-vector-search | 用于 RAG 和语义搜索的高性能向量相似性搜索引擎。当构建需要快速最近邻搜索、带过滤的混合搜索或 Rust 驱动的高性能可扩展向量存储的生产级 RAG 系统时使用。 | mlops/vector-databases/qdrant |
note-taking
笔记技能,用于保存信息、辅助研究以及多会话规划的协作和信息共享。
| 技能 | 描述 | 路径 |
|---|
obsidian | 在 Obsidian 仓库中读取、搜索和创建笔记。 | note-taking/obsidian |
productivity
文档创建、演示文稿、电子表格和其他生产力工作流的技能。
| 技能 | 描述 | 路径 |
|---|
google-workspace | 通过 Python 集成 Gmail、日历、云端硬盘、通讯录、表格和文档。使用 OAuth2 和自动令牌刷新。无需外部二进制文件 — 完全使用 Google 的 Python 客户端库在 Hermes venv 中运行。 | productivity/google-workspace |
linear | 通过 GraphQL API 管理 Linear Issues、项目和团队。创建、更新、搜索和组织 Issues。 | productivity/linear |
nano-pdf | 使用 nano-pdf CLI 通过自然语言指令编辑 PDF。修改文本、修复拼写错误、更新标题以及对特定页面进行内容更改,无需手动编辑。 | productivity/nano-pdf |
notion | 通过 curl 使用 Notion API 创建和管理页面、数据库和块。直接从终端搜索、创建、更新和查询 Notion 工作区。 | productivity/notion |
ocr-and-documents | 从 PDF 和扫描文档中提取文本。远程 URL 使用 web_extract,本地文本型 PDF 使用 pymupdf,OCR/扫描文档使用 marker-pdf。DOCX 使用 python-docx,PPTX 参见 powerpoint 技能。 | productivity/ocr-and-documents |
powerpoint | "只要 .pptx 文件以任何方式参与 — 作为输入、输出或两者 — 就使用此技能。包括:创建幻灯片组、演示文稿或展示文档;读取、解析或提取任何 .pptx 文件的文本(即使提取的内容将用于其他地方,例如… | productivity/powerpoint |
research
学术研究、论文发现、文献综述、领域侦察、市场数据、内容监控和科学知识检索的技能。
| 技能 | 描述 | 路径 |
|---|
arxiv | 通过免费的 REST API 搜索和检索 arXiv 学术论文。无需 API 密钥。按关键词、作者、类别或 ID 搜索。结合 web_extract 或 ocr-and-documents 技能阅读完整论文内容。 | research/arxiv |
blogwatcher | 使用 blogwatcher CLI 监控博客和 RSS/Atom 源的更新。添加博客、扫描新文章并跟踪阅读状态。 | research/blogwatcher |
llm-wiki | Karpathy 的 LLM Wiki — 构建和维护一个持久的、互链的 Markdown 知识库。摄取来源、查询编译的知识并检查一致性。与 RAG 不同,wiki 一次性编译知识并保持更新。可作为 Obsidian 仓库使用。通过 skills.config.wiki.path 配置。 | research/llm-wiki |
domain-intel | 使用 Python 标准库进行被动领域侦察。子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录、域名可用性检查和批量多域分析。无需 API 密钥。 | research/domain-intel |
duckduckgo-search | 通过 DuckDuckGo 免费网页搜索 — 文本、新闻、图片、视频。无需 API 密钥。安装后优先使用 ddgs CLI;仅在验证当前运行时中 ddgs 可用后才使用 Python DDGS 库。 | research/duckduckgo-search |
ml-paper-writing | 为 NeurIPS、ICML、ICLR、ACL、AAAI、COLM 撰写可发表的 ML/AI 论文。当从研究仓库起草论文、构建论证、验证引用或准备最终提交版本时使用。包括 LaTeX 模板、审稿人指南和引用验证… | research/ml-paper-writing |
polymarket | 查询 Polymarket 预测市场数据 — 搜索市场、获取价格、订单簿和价格历史。通过公共 REST API 只读访问,无需 API 密钥。 | research/polymarket |
red-teaming
LLM 红队(Red-teaming)、越狱(Jailbreaking)和安全过滤器绕过研究的技能。
| 技能 | 描述 | 路径 |
|---|
godmode | 使用 G0DM0D3 技术越狱 API 服务的 LLM — Parseltongue 输入混淆(33 种技术)、GODMODE CLASSIC 系统提示模板、ULTRAPLINIAN 多模型竞赛、编码升级和 Hermes 原生预填充/系统提示集成。适用于任何可通过 API 访问的模型,包括闭源模型。 | red-teaming/godmode |
smart-home
控制智能家居设备的技能 — 灯光、开关、传感器和家庭自动化系统。
| 技能 | 描述 | 路径 |
|---|
openhue | 通过 OpenHue CLI 控制 Philips Hue 灯光、房间和场景。开关灯、调整亮度、颜色、色温并激活场景。 | smart-home/openhue |
social-media
与社交平台交互的技能 — 发帖、阅读、监控和账户操作。
| 技能 | 描述 | 路径 |
|---|
xitter | 通过 x-cli 终端客户端使用官方 X API 凭证与 X/Twitter 交互。 | social-media/xitter |
software-development
| 技能 | 描述 | 路径 |
|---|
code-review | 以安全和质量为重点进行彻底代码审查的指南。 | software-development/code-review |
plan | Hermes 的计划模式 — 检查上下文,在活动工作区/后端工作目录的 .hermes/plans/ 中编写 Markdown 计划,不执行工作。 | software-development/plan |
requesting-code-review | 在完成任务、实现主要功能或合并前使用。通过系统化的审查流程验证工作是否满足要求。 | software-development/requesting-code-review |
subagent-driven-development | 在执行包含独立任务的实施计划时使用。为每个任务分发新的 delegate_task,进行两阶段审查(规格合规性然后代码质量)。 | software-development/subagent-driven-development |
systematic-debugging | 在遇到任何缺陷、测试失败或意外行为时使用。4 阶段根因调查 — 在理解问题之前不修复。 | software-development/systematic-debugging |
test-driven-development | 在实现任何功能或修复缺陷时,在编写实现代码之前使用。强制执行测试优先的红-绿-重构(RED-GREEN-REFACTOR)循环。 | software-development/test-driven-development |
writing-plans | 当你有规格或需求的多步骤任务时使用。创建包含小粒度任务、精确文件路径和完整代码示例的综合实施计划。 | software-development/writing-plans |
可选技能
可选技能随仓库在 optional-skills/ 目录下提供,但默认不激活。它们涵盖较重或小众的使用场景。通过以下方式安装:
hermes skills install official/<category>/<skill>
autonomous-ai-agents
| 技能 | 描述 | 路径 |
|---|
blackbox | 将编码任务委派给 Blackbox AI CLI Agent。内置评判器的多模型 Agent,通过多个 LLM 运行任务并选择最佳结果。需要 blackbox CLI 和 Blackbox AI API 密钥。 | autonomous-ai-agents/blackbox |
blockchain
| 技能 | 描述 | 路径 |
|---|
base | 查询 Base(以太坊 L2)区块链数据及 USD 定价 — 钱包余额、代币信息、交易详情、Gas 分析、合约检查、巨鲸检测和实时网络统计。使用 Base RPC + CoinGecko。无需 API 密钥。 | blockchain/base |
solana | 查询 Solana 区块链数据及 USD 定价 — 钱包余额、代币组合估值、交易详情、NFT、巨鲸检测和实时网络统计。使用 Solana RPC + CoinGecko。无需 API 密钥。 | blockchain/solana |
creative
| 技能 | 描述 | 路径 |
|---|
blender-mcp | 通过与 blender-mcp 插件的 Socket 连接直接从 Hermes 控制 Blender。创建 3D 对象、材质、动画并运行任意 Blender Python (bpy) 代码。 | creative/blender-mcp |
meme-generation | 通过选择模板并使用 Pillow 叠加文字来生成真实的 Meme 图片。生成实际的 .png Meme 文件。 | creative/meme-generation |
devops
| 技能 | 描述 | 路径 |
|---|
docker-management | 管理 Docker 容器、镜像、卷、网络和 Compose 栈 — 生命周期操作、调试、清理和 Dockerfile 优化。 | devops/docker-management |
email
health
| 技能 | 描述 | 路径 |
|---|
neuroskill-bci | 连接到运行中的 NeuroSkill 实例,将用户的实时认知和情绪状态(专注、放松、情绪、认知负荷、嗜睡、心率、HRV、睡眠分期和 40+ 衍生 EXG 评分)纳入响应。需要 BCI 可穿戴设备(Muse 2/S 或 OpenBCI)和 NeuroSkill 桌面应用。 | health/neuroskill-bci |
mcp
| 技能 | 描述 | 路径 |
|---|
fastmcp | 使用 FastMCP 在 Python 中构建、测试、检查、安装和部署 MCP 服务器。当创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、暴露资源或提示、或为 HTTP 部署准备 FastMCP 服务器时使用。 | mcp/fastmcp |
migration
| 技能 | 描述 | 路径 |
|---|
openclaw-migration | 将用户的 OpenClaw 定制数据迁移到 Hermes Agent。从 ~/.openclaw 导入兼容 Hermes 的记忆、SOUL.md、命令白名单、用户技能和选定的工作区资产,然后报告无法迁移的内容及原因。 | migration/openclaw-migration |
productivity
| 技能 | 描述 | 路径 |
|---|
telephony | 赋予 Hermes 电话能力 — 配置并持久化 Twilio 号码、发送和接收 SMS/MMS、直接拨打电话,以及通过 Bland.ai 或 Vapi 拨打 AI 驱动的外呼。 | productivity/telephony |
research
| 技能 | 描述 | 路径 |
|---|
bioinformatics | 通往 bioSkills 和 ClawBio 的 400+ 生物信息学技能的网关。涵盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学、结构生物学等。 | research/bioinformatics |
qmd | 使用 qmd 在本地搜索个人知识库、笔记、文档和会议记录 — 一个混合检索引擎,结合 BM25、向量搜索和 LLM 重排序。支持 CLI 和 MCP 集成。 | research/qmd |
security
| 技能 | 描述 | 路径 |
|---|
1password | 设置和使用 1Password CLI (op)。当安装 CLI、启用桌面应用集成、登录以及为命令读取/注入密钥时使用。 | security/1password |
oss-forensics | 针对 GitHub 仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交恢复、强制推送检测、IOC 提取、多源证据收集和结构化取证报告。 | security/oss-forensics |
sherlock | 跨 400+ 社交网络的 OSINT 用户名搜索。通过用户名追踪社交媒体账户。 | security/sherlock |
编辑此页