> 原文链接:https://hermes-agent.nousresearch.com/docs/reference/skills-hub
技能市场
> 📖 本文档翻译自 Hermes Agent 官方文档 > 最后更新:2026-04-16
🍎
apple-notes
✓ 内置
通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。
Apple🍎 macOS
🍎
apple-reminders
✓ 内置
通过 remindctl CLI 管理 Apple 提醒事项(列表、添加、完成、删除)。
Apple🍎 macOS
🍎
findmy
✓ 内置
在 macOS 上通过 AppleScript 和屏幕截图访问 FindMy.app,追踪 Apple 设备和 AirTags。
Apple🍎 macOS
🍎
imessage
✓ 内置
在 macOS 上通过 imsg CLI 收发 iMessage/短信。
Apple🍎 macOS
🤖
claude-code
✓ 内置
将编码任务委派给 Claude Code(Anthropic 的 CLI 智能体)。用于构建功能、代码重构(Refactoring)、PR 审查和迭代式编码。需要安装 claude CLI。
AI 智能体
🤖
codex
✓ 内置
将编码任务委派给 OpenAI Codex CLI 智能体。用于构建功能、代码重构、PR 审查和批量 Issue 修复。需要安装 codex CLI 并拥有 git 仓库。
AI 智能体
🤖
hermes-agent
✓ 内置
Hermes Agent 使用与扩展的完整指南 — CLI 用法、安装设置、配置、生成(Spawn)额外智能体、网关平台(Gateway Platforms)、技能、语音、工具、配置文件(Profile)以及精简的贡献者参考。当帮助用户配置 Hermes、排查问题、生成智能体实例或进行代码贡献时加载此技能。
AI 智能体
🤖
opencode
✓ 内置
将编码任务委派给 OpenCode CLI 智能体,用于功能实现、代码重构、PR 审查和长时间自主会话。需要安装并认证 opencode CLI。
AI 智能体
🎨
architecture-diagram
✓ 内置
生成专业深色主题的系统架构图,输出为独立 HTML/SVG 文件。自包含输出,无外部依赖。基于 Cocoon AI 的 architecture-diagram-generator(MIT 协议)。
创意
🎨
ascii-art
✓ 内置
使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图片转 ASCII、远程 API(asciified、ascii.co.uk)以及 LLM 后备方案生成 ASCII 艺术作品。无需 API 密钥。
创意
🎨
ascii-video
✓ 内置
ASCII 艺术视频的生产流水线 — 支持任意格式输入。将视频/音频/图片/生成式输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图片序列)。涵盖:视频转 ASCII、音频响应式音乐可视化器、生成式 ASCII 艺术动画、混合视频+音频响应、文本/歌词叠加、实时终端渲染。当用户请求以下内容时使用:ASCII 视频、文本艺术视频、终端风格视频、字符艺术动画、复古文本可视化、ASCII 音频可视化器、将视频转换为 ASCII 艺术、矩阵风格特效,或任何动画 ASCII 输出。
创意
🎨
excalidraw
✓ 内置
使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件,用于架构图、流程图(Flowchart)、时序图(Sequence Diagram)、概念图等。文件可在 excalidraw.com 打开或上传以获取可分享链接。
创意
🎨
ideation
✓ 内置
通过创意约束生成项目灵感。当用户说"我想做点什么"、"给我一个项目想法"、"我好无聊"、"我该做什么"、"给我点灵感",或任何"我有工具但没有方向"的变体时使用。适用于代码、艺术、硬件、写作、工具以及任何可以制作的东西。
创意
🎨
manim-video
✓ 内置
使用 Manim Community Edition 的数学和技术动画生产流水线。创建 3Blue1Brown 风格的讲解视频、算法可视化(Algorithm Visualization)、公式推导、架构图和数据叙事。当用户请求以下内容时使用:动画讲解、数学动画、概念可视化、算法演示、技术讲解、3Blue1Brown 风格视频,或任何包含几何/数学内容的程序化动画。
创意
🎨
p5js
✓ 内置
使用 p5.js 的交互式和生成式视觉艺术生产流水线。创建基于浏览器的草图、生成式艺术(Generative Art)、数据可视化、交互体验、3D 场景、音频响应式视觉和动态图形 — 导出为 HTML、PNG、GIF、MP4 或 SVG。涵盖:2D/3D 渲染、噪声和粒子系统(Particle System)、流场(Flow Field)、着色器(GLSL)、像素操作、动态排版、WebGL 场景、音频分析、鼠标/键盘交互以及无头高分辨率导出。当用户请求以下内容时使用:p5.js 草图、创意编程、生成式艺术、交互式可视化、Canvas 动画、基于浏览器的视觉艺术、数据可视化、着色器特效或任何 p5.js 项目。
创意
🎨
popular-web-designs
✓ 内置
从真实网站提取的 54 套生产级设计系统(Design System)。加载模板即可生成与 Stripe、Linear、Vercel、Notion、Airbnb 等网站视觉风格一致的 HTML/CSS。每个模板包含颜色、排版(Typography)、组件、布局规则和即用 CSS 数值。
创意
🎨
songwriting-and-ai-music
✓ 内置
歌曲创作技巧、AI 音乐生成提示词(以 Suno 为主)、戏仿/改编技巧、语音技巧和经验总结。这些是工具和思路,而非规则。当艺术需要时,可以打破其中任何一条。
创意
🎮
minecraft-modpack-server
✓ 内置
从 CurseForge/Modrinth 服务器整合包 ZIP 文件搭建 Mod 版 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙、局域网配置、备份和启动脚本。
游戏
🎮
pokemon-player
✓ 内置
通过无头模拟器(Headless Emulation)自主游玩宝可梦游戏。启动游戏服务器、从内存读取结构化游戏状态、做出策略决策并发送按键输入 — 全部在终端中完成。
游戏
💻
codebase-inspection
✓ 内置
使用 pygount 检查和分析代码库(Codebase),进行代码行数(LOC)统计、语言占比分析和代码/注释比率计算。当被要求检查代码行数、仓库规模、语言组成或代码库统计信息时使用。
GitHub
💻
github-auth
✓ 内置
使用 git(通用可用)或 gh CLI 为智能体设置 GitHub 认证(Authentication)。涵盖 HTTPS 令牌、SSH 密钥、凭证助手(Credential Helper)和 gh auth — 带有自动检测流程以选择合适的方法。
GitHub
💻
github-code-review
✓ 内置
通过分析 git diff、在 PR 上留下行内评论来进行代码变更审查,执行全面的推送前审查。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。
GitHub
💻
github-issues
✓ 内置
创建、管理、分类和关闭 GitHub Issue。搜索现有 Issue、添加标签、分配人员并关联到 PR。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。
GitHub
💻
github-pr-workflow
✓ 内置
完整的 Pull Request 生命周期 — 创建分支、提交变更、发起 PR、监控 CI 状态、自动修复失败并合并。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。
GitHub
💻
github-repo-management
✓ 内置
克隆、创建、派生(Fork)、配置和管理 GitHub 仓库。管理远程仓库(Remote)、密钥(Secrets)、发布(Release)和工作流(Workflow)。支持 gh CLI 或回退到 git + GitHub REST API(通过 curl)。
GitHub
🎵
gif-search
✓ 内置
使用 curl 搜索和下载 Tenor 上的 GIF 图片。除 curl 和 jq 外无其他依赖。适用于查找表情 GIF、创建视觉内容和在聊天中发送 GIF。
媒体
🎵
heartmula
✓ 内置
设置和运行 HeartMuLa,一个开源音乐生成模型家族(类似 Suno)。通过歌词 + 标签生成完整歌曲,支持多语言。
媒体
🎵
songsee
✓ 内置
通过 CLI 从音频文件生成频谱图(Spectrogram)和音频特征可视化(梅尔频谱、色度特征、MFCC、速度图等)。适用于音频分析、音乐制作调试和可视化文档记录。
媒体
🎵
youtube-content
✓ 内置
获取 YouTube 视频字幕(Transcript)并将其转换为结构化内容(章节、摘要、推文串、博客文章)。当用户分享 YouTube URL 或视频链接、要求总结视频、请求字幕、或想从任何 YouTube 视频中提取和重新格式化内容时使用。
媒体
🧪
audiocraft-audio-generation
✓ 内置
用于音频生成的 PyTorch 库,包括文本到音乐(MusicGen)和文本到音效(AudioGen)。当需要从文本描述生成音乐、创建音效或执行旋律条件(Melody-conditioned)音乐生成时使用。
MLOps
🧪
axolotl
✓ 内置
使用 Axolotl 微调(Fine-tuning)LLM 的专家指南 — YAML 配置、100+ 模型、LoRA/QLoRA、DPO/KTO/ORPO/GRPO、多模态支持。
MLOps
🧪
clip
✓ 内置
OpenAI 的连接视觉和语言的模型。支持零样本(Zero-shot)图像分类、图文匹配和跨模态检索(Cross-modal Retrieval)。在 4 亿图文对上训练。用于图像搜索、内容审核(Content Moderation)或无需微调的视觉-语言任务。最适合通用图像理解。
MLOps
🧪
dspy
✓ 内置
使用声明式编程(Declarative Programming)构建复杂 AI 系统,自动优化提示词,使用 DSPy 创建模块化 RAG 系统和智能体 — 斯坦福 NLP 的系统化语言模型编程框架。
MLOps
🧪
evaluating-llms-harness
✓ 内置
在 60+ 学术基准测试(Benchmark)(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag)上评估 LLM。当进行模型质量基准测试、比较模型、报告学术结果或跟踪训练进度时使用。EleutherAI、HuggingFace 和各大实验室使用的行业标准。支持 HuggingFace、vLLM、API。
MLOps
🧪
fine-tuning-with-trl
✓ 内置
使用 TRL 通过强化学习(Reinforcement Learning)微调 LLM — SFT 用于指令调优(Instruction Tuning)、DPO 用于偏好对齐(Preference Alignment)、PPO/GRPO 用于奖励优化以及奖励模型训练。当需要 RLHF、按偏好对齐模型或从人类反馈训练时使用。与 HuggingFace Transformers 配合使用。
MLOps
🧪
gguf-quantization
✓ 内置
GGUF 格式和 llama.cpp 量化(Quantization),用于高效的 CPU/GPU 推理(Inference)。当在消费级硬件、Apple Silicon 上部署模型,或需要 2-8 位灵活量化而无 GPU 要求时使用。
MLOps
🧪
grpo-rl-training
✓ 内置
使用 TRL 进行 GRPO/RL 微调的专家指南,用于推理和特定任务模型训练。
MLOps
🧪
guidance
✓ 内置
使用正则表达式(Regex)和文法(Grammar)控制 LLM 输出,保证生成有效的 JSON/XML/代码,强制结构化格式,并使用 Guidance 构建多步骤工作流 — 微软研究院的约束生成(Constrained Generation)框架。
MLOps
🧪
huggingface-hub
✓ 内置
Hugging Face Hub CLI (hf) — 搜索、下载和上传模型与数据集、管理仓库、使用 SQL 查询数据集、部署推理端点(Inference Endpoint)、管理 Spaces 和存储桶。
MLOps
🧪
llama-cpp
✓ 内置
在 CPU、Apple Silicon 和消费级 GPU 上运行 LLM 推理,无需 NVIDIA 硬件。用于边缘部署(Edge Deployment)、M1/M2/M3 Mac、AMD/Intel GPU 或 CUDA 不可用时。支持 GGUF 量化(1.5-8 位),减少内存占用,CPU 上相比 PyTorch 加速 4-10 倍。
MLOps
🧪
modal-serverless-gpu
✓ 内置
用于运行 ML 工作负载的无服务器(Serverless)GPU 云平台。当需要按需 GPU 访问而无需基础设施管理、将 ML 模型部署为 API 或运行带自动扩展的批量任务时使用。
MLOps
🧪
obliteratus
✓ 内置
使用 OBLITERATUS 移除开源 LLM 的拒绝行为 — 机械式可解释性(Mechanistic Interpretability)技术(差值均值法 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同时剔除安全护栏。9 种 CLI 方法、28 个分析模块、5 个计算层级共 116 个模型预设、锦标赛评估和遥测驱动的推荐。当用户想要解除审查、移除 LLM 拒绝行为时使用。
MLOps
🧪
outlines
✓ 内置
在生成过程中保证有效的 JSON/XML/代码结构,使用 Pydantic 模型实现类型安全输出,支持本地模型(Transformers、vLLM),并使用 Outlines 最大化推理速度 — dottxt.ai 的结构化生成库。
MLOps
🧪
peft-fine-tuning
✓ 内置
使用 LoRA、QLoRA 和 25+ 方法对 LLM 进行参数高效微调(Parameter-efficient Fine-tuning)。当在有限 GPU 内存下微调大模型(7B-70B)、需要训练不到 1% 的参数且精度损失极小,或多适配器(Multi-adapter)服务时使用。HuggingFace 官方库,与 transformers 生态系统集成。
MLOps
🧪
pytorch-fsdp
✓ 内置
使用 PyTorch FSDP 进行全分片数据并行(Fully Sharded Data Parallel)训练的专家指南 — 参数分片、混合精度(Mixed Precision)、CPU 卸载、FSDP2。
MLOps
🧪
segment-anything-model
✓ 内置
具备零样本迁移(Zero-shot Transfer)能力的图像分割(Image Segmentation)基础模型。当需要使用点、框或掩码作为提示来分割图像中的任意对象,或自动生成图像中所有对象的掩码时使用。
MLOps
🧪
serving-llms-vllm
✓ 内置
使用 vLLM 的 PagedAttention 和连续批处理(Continuous Batching)高吞吐量地提供 LLM 服务。当部署生产级 LLM API、优化推理延迟/吞吐量或在有限 GPU 内存下服务模型时使用。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)和张量并行(Tensor Parallelism)。
MLOps
🧪
stable-diffusion-image-generation
✓ 内置
通过 HuggingFace Diffusers 使用 Stable Diffusion 模型进行最先进的文本到图像生成。当需要从文本提示词生成图像、执行图像到图像翻译(Image-to-image Translation)、图像修复(Inpainting)或构建自定义扩散流水线时使用。
MLOps
🧪
unsloth
✓ 内置
使用 Unsloth 进行快速微调的专家指南 — 训练速度提升 2-5 倍、内存减少 50-80%、LoRA/QLoRA 优化。
MLOps
🧪
weights-and-biases
✓ 内置
通过自动日志记录跟踪 ML 实验、实时可视化训练过程、使用 Sweeps 优化超参数(Hyperparameter),并通过 W&B 管理模型注册表 — 协作式 MLOps 平台。
MLOps
🧪
whisper
✓ 内置
OpenAI 的通用语音识别(Speech Recognition)模型。支持 99 种语言、转录(Transcription)、翻译为英语和语言识别。六种模型规模,从 tiny(3900 万参数)到 large(15.5 亿参数)。用于语音转文本、播客转录或多语言音频处理。最适合鲁棒的多语言自动语音识别(ASR)。
MLOps
✅
google-workspace
✓ 内置
Hermes 的 Gmail、日历、云端硬盘、通讯录、表格和文档集成。使用 Hermes 管理的 OAuth2 设置,优先使用 Google Workspace CLI (gws) 以获得更广泛的 API 覆盖,否则回退到 Python 客户端库。
生产力
✅
linear
✓ 内置
通过 GraphQL API 管理 Linear 的 Issue、项目和团队。创建、更新、搜索和组织 Issue。使用 API 密钥认证(无需 OAuth)。所有操作通过 curl 完成 — 无依赖。
生产力
✅
nano-pdf
✓ 内置
使用 nano-pdf CLI 通过自然语言指令编辑 PDF。修改文本、修正拼写错误、更新标题,以及对特定页面进行内容更改,无需手动编辑。
生产力
✅
notion
✓ 内置
Notion API,用于通过 curl 创建和管理页面、数据库和块。直接从终端搜索、创建、更新和查询 Notion 工作区。
生产力
✅
ocr-and-documents
✓ 内置
从 PDF 和扫描文档中提取文本。对远程 URL 使用 web_extract,对本地文本型 PDF 使用 pymupdf,对 OCR/扫描文档使用 marker-pdf。DOCX 使用 python-docx,PPTX 参见 powerpoint 技能。
生产力
✅
powerpoint
✓ 内置
当 .pptx 文件以任何方式涉及时(作为输入、输出或两者),均使用此技能。包括:创建幻灯片组、推介演示文稿或演示文稿;读取、解析或从任何 .pptx 文件中提取文本(即使提取的内容将用于其他用途,如电子邮件或摘要);编辑、修改或更新现有演示文稿;合并或拆分幻灯片文件;使用模板、布局、演讲者备注或评论。当用户提到"演示文稿"、"幻灯片"、"PPT"或引用 .pptx 文件名时触发,无论他们之后打算如何使用内容。只要 .pptx 文件需要被打开、创建或触碰,就使用此技能。
生产力
🔍
arxiv
✓ 内置
使用 arXiv 的免费 REST API 搜索和检索学术论文。无需 API 密钥。按关键词、作者、类别或 ID 搜索。可结合 web_extract 或 ocr-and-documents 技能阅读论文全文。
研究
🔍
blogwatcher
✓ 内置
使用 blogwatcher-cli 工具监控博客和 RSS/Atom 订阅源的更新。添加博客、扫描新文章、跟踪阅读状态并按类别筛选。
研究
🔍
llm-wiki
✓ 内置
Karpathy 的 LLM Wiki — 构建和维护持久的、相互关联的 Markdown 知识库(Knowledge Base)。导入信息源、查询已编译的知识并检查一致性。
研究
显示更多(剩余 587 个)