Hermes Agent 完全入门教程-从零开始掌握开源 AI 智能体框架
2026-06-01 19:54:15 AI-Pick - 精选AI工具导航 已浏览8次Hermes Agent 完全入门教程
从零开始掌握开源 AI 智能体框架
一、什么是 Hermes Agent
Hermes Agent 是一个开源的 AI 智能体框架与产品,它能够像一位得力的数字助手一样,自主地帮你完成各种复杂任务。与传统的 AI 聊天工具不同,Hermes Agent 不仅能够理解和生成文本,还能够实际执行操作——读写文件、运行终端命令、操作浏览器、调用 API,真正实现与数字世界的多轮交互。
1.1 核心特点
• 自主性强:能够感知环境、做出决策、调用工具执行操作,并自主推进任务
• 能力丰富:支持文件操作、终端命令、浏览器自动化、API 调用等多种工具
• 扩展性好:通过 MCP(Model Context Protocol)协议可接入各种外部工具和服务
• 多平台支持:可在 macOS、Linux、Windows(原生或 WSL2)上运行
• 多模型兼容:支持 OpenAI、Anthropic、DeepSeek、Kimi、阿里云等多种大模型
1.2 核心概念解释
在深入使用 Hermes Agent 之前,了解以下核心概念将帮助你更好地理解其工作原理:
MCP(Model Context Protocol)
MCP 是由 Anthropic 提出的开放标准,用于将 AI 应用连接到外部数据源与工具。可以把它理解为 AI 世界的"USB-C 通用接口"。Hermes 通过 MCP 标准接入文件系统、GitHub、数据库、企业内网工具等,无需为每个服务编写专用对接代码。
Agent(智能体)
Agent 是一种基于大语言模型的智能程序,具备自主性,能够调用工具以完成目标。它不仅能读写文件、执行命令,还能操作浏览器、调用 API,与数字世界进行多轮交互。
ACP(Agent Client Protocol)
ACP 是 Hermes 与编辑器(VS Code、Zed、JetBrains)通信的标准协议。它基于 JSON-RPC,通过标准输入/输出在编辑器和 Hermes 之间传递消息。装好 ACP 后,你在编辑器里就能直接跟 Hermes 对话、看它改文件、执行命令。
Gateway(消息网关)
Gateway 是 Hermes 与外部消息平台之间的消息路由与连接层。它是 Hermes 和外部聊天平台(Telegram、Discord、Slack、WhatsApp、Signal、微信、飞书等)之间的转接系统,负责接收消息、发送回复、维持会话、调度任务。
二、安装 Hermes Agent
Hermes Agent 提供了一键安装脚本,支持多种操作系统。在安装之前,如果你完全没有经验,强烈建议先下载 WorkBuddy(微信扫码即用,无需任何配置),让它协助你完成安装。
2.1 类 Linux / macOS / WSL2 安装
打开终端,执行以下命令:
curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash
安装完成后,执行以下命令使配置生效:
source ~/.bashrc # 如果使用 zsh,则执行 source ~/.zshrc
2.2 Windows 原生 PowerShell 安装
对于 Windows 用户,有三种推荐方式:
方式一:使用 WSL2(最推荐)
• 先安装 WSL2,可以在 Windows 上获得完整的 Linux 终端环境
• 安装完成后,在 WSL2 终端里运行上面的 install.sh 脚本
• WSL2 安装指南:https://zhuanlan.zhihu.com/p/466001838
方式二:直接在 PowerShell 中安装
打开 PowerShell(按 Windows 键,输入 PowerShell),执行:
irm https://res1.hermesagent.org.cn/install.ps1 | iex
安装完成后,关闭并重新打开 PowerShell 即可。
2.3 中国大陆网络环境提示
当前页的一键安装命令已经由 Hermes Agent 中文社区提供国内镜像加速,默认优先走国内可直连链路。镜像版安装器默认精简了部分国人不常用、或体积较大且经常受外网影响的可选功能,例如浏览器自动化、Chromium 下载、WhatsApp 桥接等。
建议先完成核心安装,确认 Hermes Agent 可以正常运行后,再让 Hermes Agent 自身补全这些能力。
三、配置大模型提供商
安装程序会自动为你配置 LLM 提供商。如需后续更改,可使用以下命令:
hermes model # 选择大语言模型提供商和模型
hermes tools # 配置启用哪些工具
hermes setup # 一次性完成全部配置
3.1 支持的模型提供商
Hermes Agent 支持多种大模型提供商,你可以根据自己的需求和预算选择:
|
提供商 |
说明 |
配置方式 |
|
Nous Portal |
基于订阅、零配置 |
OAuth 登录 |
|
Anthropic |
直接使用 Claude 模型 |
API 密钥或 OAuth |
|
DeepSeek |
直接访问 DeepSeek API |
设置 DEEPSEEK_API_KEY |
|
Kimi / Moonshot |
Moonshot 托管的模型 |
设置 KIMI_API_KEY |
|
阿里云 |
通过 DashScope 使用 Qwen |
设置 DASHSCOPE_API_KEY |
|
GitHub Copilot |
GPT-5.x、Claude、Gemini 等 |
OAuth 或 Token |
提示:你可以随时通过 hermes model 切换提供者——无需修改代码,无锁定风险。
四、基本使用
4.1 启动 Hermes
安装和配置完成后,在终端中输入以下命令启动 Hermes:
hermes
你将看到包含模型信息、可用工具和技能的欢迎横幅。输入消息并按 Enter 键即可开始对话。
4.2 基本对话
启动后,你可以直接向 Hermes 提问或下达指令:
❯ 你现在能帮我做什么?
Hermes 已具备访问网络搜索、文件操作、终端命令等工具的能力——开箱即用。
4.3 让 Hermes 使用终端
你可以让 Hermes 执行终端命令:
❯ 帮我看看磁盘空间占用情况,并列出最大的 5 个目录。
Agent 将代表你执行终端命令,并显示结果。
4.4 斜杠命令
输入 / 可查看所有命令的自动补全下拉菜单:
|
命令 |
功能 |
|
/help |
显示所有可用命令 |
|
/tools |
列出可用工具 |
|
/model |
交互式切换模型 |
|
/personality pirate |
尝试有趣的个性模式 |
|
/save |
保存对话 |
4.5 多行输入
按 Alt+Enter 或 Ctrl+J 可换行。非常适合粘贴代码或撰写详细提示。
4.6 中断 Agent
如果 Agent 运行时间过长,只需输入新消息并按 Enter——它将中断当前任务并切换到你的新指令。Ctrl+C 也有效。
4.7 恢复会话
退出时,hermes 会打印出恢复命令:
hermes --continue # 恢复最近一次会话
hermes -c # 简写形式
五、进阶功能
5.1 设置沙箱终端
为确保安全,建议在 Docker 容器或远程服务器上运行 Agent:
hermes config set terminal.backend docker # 使用 Docker 隔离终端
hermes config set terminal.backend ssh # 把终端切到远程服务器
5.2 连接消息平台
通过微信、飞书、QQ、Discord、WhatsApp、Signal、电子邮件或 Home Assistant 从手机或其他设备与 Hermes 对话:
hermes gateway setup # 交互式配置消息平台
5.3 添加语音模式
希望在 CLI 中使用麦克风输入,或在消息中获得语音回复?执行以下命令:
pip install "hermes-agent[voice]"
pip install faster-whisper # 可选,推荐:启用免费的本地语音转文字
然后启动 Hermes 并在 CLI 中启用语音模式:
/voice on
按 Ctrl+B 开始录音,或使用 /voice tts 让 Hermes 朗读其回复。
5.4 安排自动化任务
你可以让 Hermes 设置定时任务:
❯ 每天早上 9 点检查 Hacker News 上的 AI 新闻,并通过飞书给我发一份摘要。
Agent 将通过网关自动设置一个 cron 任务,定时运行。
5.5 浏览并安装技能
Hermes 支持技能扩展,可以通过以下命令搜索和安装:
hermes skills search kubernetes
hermes skills search react --source skills-sh
hermes skills install openai/skills/k8s
hermes skills install official/security/1password
提示:
• 使用 --source skills-sh 搜索公共的 skills.sh 目录
• 使用 --source well-known 并配合文档/网站 URL,从 /.well-known/skills/index.json 发现技能
• 仅在审查第三方技能后使用 --force
5.6 在编辑器中使用 Hermes
Hermes 还可作为 ACP 服务器运行,兼容 VS Code、Zed 和 JetBrains 等 ACP 编辑器:
pip install -e '.[acp]'
hermes acp
5.7 尝试 MCP 服务器
通过模型上下文协议(Model Context Protocol)连接外部工具。添加到 ~/.hermes/config.yaml:
mcp_servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"
六、快速参考命令
|
命令 |
描述 |
|
hermes |
开始聊天 |
|
hermes model |
选择大语言模型提供商和模型 |
|
hermes tools |
配置各平台启用的工具 |
|
hermes setup |
完整设置向导 |
|
hermes doctor |
诊断问题 |
|
hermes update |
更新至最新版本 |
|
hermes gateway |
启动消息网关 |
|
hermes --continue |
恢复上次会话 |
七、最佳实践与建议
7.1 新手入门建议
• 如果你完全没有经验,建议先使用 WorkBuddy 协助安装 Hermes Agent
• 两个 Agent 互为主备,这是社区推荐的最佳方案
• 遇到问题时,可以让 WorkBuddy 对 Hermes 进行修复,反之亦然
7.2 安全建议
• 在生产环境中使用 Docker 沙箱隔离终端操作
• 审查第三方技能后再使用 --force 参数
• 敏感操作建议在远程服务器上执行
7.3 性能优化
• 根据任务复杂度选择合适的模型
• 合理配置工具集,避免加载不必要的工具
• 使用语音模式时,推荐安装 faster-whisper 进行本地语音转文字
八、总结
Hermes Agent 是一个功能强大、扩展性好的开源 AI 智能体框架。通过本教程,你已经了解了:
• Hermes Agent 的核心概念和特点
• 如何在不同的操作系统上安装和配置
• 如何选择和配置大模型提供商
• 基本使用方法和常用命令
• 进阶功能如消息平台集成、语音模式、自动化任务等
现在,你可以开始使用 Hermes Agent 来提升你的工作效率了!如有更多问题,可以访问官方文档:https://hermesagent.org.cn 获取更多信息。 收藏 AI-Pick - 精选AI工具导航 https://ai-pick.cn/
