导航首页 »  文章列表 »  使用教程

Hermes Agent 完全入门教程-从零开始掌握开源 AI 智能体框架

2026-06-01 19:54:15    AI-Pick - 精选AI工具导航    已浏览8次


Hermes Agent 完全入门教程

从零开始掌握开源 AI 智能体框架

一、什么是 Hermes Agent

Hermes Agent 是一个开源的 AI 智能体框架与产品,它能够像一位得力的数字助手一样,自主地帮你完成各种复杂任务。与传统的 AI 聊天工具不同,Hermes Agent 不仅能够理解和生成文本,还能够实际执行操作——读写文件、运行终端命令、操作浏览器、调用 API,真正实现与数字世界的多轮交互。

1.1 核心特点

• 自主性强:能够感知环境、做出决策、调用工具执行操作,并自主推进任务

• 能力丰富:支持文件操作、终端命令、浏览器自动化、API 调用等多种工具

• 扩展性好:通过 MCPModel Context Protocol)协议可接入各种外部工具和服务

• 多平台支持:可在 macOSLinuxWindows(原生或 WSL2)上运行

• 多模型兼容:支持 OpenAIAnthropicDeepSeekKimi、阿里云等多种大模型

1.2 核心概念解释

在深入使用 Hermes Agent 之前,了解以下核心概念将帮助你更好地理解其工作原理:

MCPModel Context Protocol

MCP 是由 Anthropic 提出的开放标准,用于将 AI 应用连接到外部数据源与工具。可以把它理解为 AI 世界的"USB-C 通用接口"Hermes 通过 MCP 标准接入文件系统、GitHub、数据库、企业内网工具等,无需为每个服务编写专用对接代码。

Agent(智能体)

Agent 是一种基于大语言模型的智能程序,具备自主性,能够调用工具以完成目标。它不仅能读写文件、执行命令,还能操作浏览器、调用 API,与数字世界进行多轮交互。

ACPAgent Client Protocol

ACP Hermes 与编辑器(VS CodeZedJetBrains)通信的标准协议。它基于 JSON-RPC,通过标准输入/输出在编辑器和 Hermes 之间传递消息。装好 ACP 后,你在编辑器里就能直接跟 Hermes 对话、看它改文件、执行命令。

Gateway(消息网关)

Gateway Hermes 与外部消息平台之间的消息路由与连接层。它是 Hermes 和外部聊天平台(TelegramDiscordSlackWhatsAppSignal、微信、飞书等)之间的转接系统,负责接收消息、发送回复、维持会话、调度任务。

二、安装 Hermes Agent

Hermes Agent 提供了一键安装脚本,支持多种操作系统。在安装之前,如果你完全没有经验,强烈建议先下载 WorkBuddy(微信扫码即用,无需任何配置),让它协助你完成安装。

2.1 Linux / macOS / WSL2 安装

打开终端,执行以下命令:

curl -fsSL https://res1.hermesagent.org.cn/install.sh | bash

安装完成后,执行以下命令使配置生效:

source ~/.bashrc  # 如果使用 zsh,则执行 source ~/.zshrc

2.2 Windows 原生 PowerShell 安装

对于 Windows 用户,有三种推荐方式:

方式一:使用 WSL2(最推荐)

• 先安装 WSL2,可以在 Windows 上获得完整的 Linux 终端环境

• 安装完成后,在 WSL2 终端里运行上面的 install.sh 脚本

• WSL2 安装指南:https://zhuanlan.zhihu.com/p/466001838

方式二:直接在 PowerShell 中安装

打开 PowerShell(按 Windows 键,输入 PowerShell),执行:

irm https://res1.hermesagent.org.cn/install.ps1 | iex

安装完成后,关闭并重新打开 PowerShell 即可。

2.3 中国大陆网络环境提示

当前页的一键安装命令已经由 Hermes Agent 中文社区提供国内镜像加速,默认优先走国内可直连链路。镜像版安装器默认精简了部分国人不常用、或体积较大且经常受外网影响的可选功能,例如浏览器自动化、Chromium 下载、WhatsApp 桥接等。

建议先完成核心安装,确认 Hermes Agent 可以正常运行后,再让 Hermes Agent 自身补全这些能力。

三、配置大模型提供商

安装程序会自动为你配置 LLM 提供商。如需后续更改,可使用以下命令:

hermes model    # 选择大语言模型提供商和模型

hermes tools    # 配置启用哪些工具

hermes setup    # 一次性完成全部配置

3.1 支持的模型提供商

Hermes Agent 支持多种大模型提供商,你可以根据自己的需求和预算选择:

提供商

说明

配置方式

Nous Portal

基于订阅、零配置

OAuth 登录

Anthropic

直接使用 Claude 模型

API 密钥或 OAuth

DeepSeek

直接访问 DeepSeek API

设置 DEEPSEEK_API_KEY

Kimi / Moonshot

Moonshot 托管的模型

设置 KIMI_API_KEY

阿里云

通过 DashScope 使用 Qwen

设置 DASHSCOPE_API_KEY

GitHub Copilot

GPT-5.xClaudeGemini

OAuth Token

 

提示:你可以随时通过 hermes model 切换提供者——无需修改代码,无锁定风险。

四、基本使用

4.1 启动 Hermes

安装和配置完成后,在终端中输入以下命令启动 Hermes

hermes

你将看到包含模型信息、可用工具和技能的欢迎横幅。输入消息并按 Enter 键即可开始对话。

4.2 基本对话

启动后,你可以直接向 Hermes 提问或下达指令:

你现在能帮我做什么?

Hermes 已具备访问网络搜索、文件操作、终端命令等工具的能力——开箱即用。

4.3 Hermes 使用终端

你可以让 Hermes 执行终端命令:

帮我看看磁盘空间占用情况,并列出最大的 5 个目录。

Agent 将代表你执行终端命令,并显示结果。

4.4 斜杠命令

输入 / 可查看所有命令的自动补全下拉菜单:

命令

功能

/help

显示所有可用命令

/tools

列出可用工具

/model

交互式切换模型

/personality pirate

尝试有趣的个性模式

/save

保存对话

 

4.5 多行输入

Alt+Enter Ctrl+J 可换行。非常适合粘贴代码或撰写详细提示。

4.6 中断 Agent

如果 Agent 运行时间过长,只需输入新消息并按 Enter——它将中断当前任务并切换到你的新指令。Ctrl+C 也有效。

4.7 恢复会话

退出时,hermes 会打印出恢复命令:

hermes --continue    # 恢复最近一次会话

hermes -c            # 简写形式

五、进阶功能

5.1 设置沙箱终端

为确保安全,建议在 Docker 容器或远程服务器上运行 Agent

hermes config set terminal.backend docker    # 使用 Docker 隔离终端

hermes config set terminal.backend ssh       # 把终端切到远程服务器

5.2 连接消息平台

通过微信、飞书、QQDiscordWhatsAppSignal、电子邮件或 Home Assistant 从手机或其他设备与 Hermes 对话:

hermes gateway setup    # 交互式配置消息平台

5.3 添加语音模式

希望在 CLI 中使用麦克风输入,或在消息中获得语音回复?执行以下命令:

pip install "hermes-agent[voice]"

pip install faster-whisper    # 可选,推荐:启用免费的本地语音转文字

然后启动 Hermes 并在 CLI 中启用语音模式:

/voice on

Ctrl+B 开始录音,或使用 /voice tts Hermes 朗读其回复。

5.4 安排自动化任务

你可以让 Hermes 设置定时任务:

每天早上 9 点检查 Hacker News 上的 AI 新闻,并通过飞书给我发一份摘要。

Agent 将通过网关自动设置一个 cron 任务,定时运行。

5.5 浏览并安装技能

Hermes 支持技能扩展,可以通过以下命令搜索和安装:

hermes skills search kubernetes

hermes skills search react --source skills-sh

hermes skills install openai/skills/k8s

hermes skills install official/security/1password

提示:

• 使用 --source skills-sh 搜索公共的 skills.sh 目录

• 使用 --source well-known 并配合文档/网站 URL,从 /.well-known/skills/index.json 发现技能

• 仅在审查第三方技能后使用 --force

5.6 在编辑器中使用 Hermes

Hermes 还可作为 ACP 服务器运行,兼容 VS CodeZed JetBrains ACP 编辑器:

pip install -e '.[acp]'

hermes acp

5.7 尝试 MCP 服务器

通过模型上下文协议(Model Context Protocol)连接外部工具。添加到 ~/.hermes/config.yaml

mcp_servers:

  github:

    command: npx

    args: ["-y", "@modelcontextprotocol/server-github"]

    env:

      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

六、快速参考命令

命令

描述

hermes

开始聊天

hermes model

选择大语言模型提供商和模型

hermes tools

配置各平台启用的工具

hermes setup

完整设置向导

hermes doctor

诊断问题

hermes update

更新至最新版本

hermes gateway

启动消息网关

hermes --continue

恢复上次会话

 

七、最佳实践与建议

7.1 新手入门建议

• 如果你完全没有经验,建议先使用 WorkBuddy 协助安装 Hermes Agent

• 两个 Agent 互为主备,这是社区推荐的最佳方案

• 遇到问题时,可以让 WorkBuddy Hermes 进行修复,反之亦然

7.2 安全建议

• 在生产环境中使用 Docker 沙箱隔离终端操作

• 审查第三方技能后再使用 --force 参数

• 敏感操作建议在远程服务器上执行

7.3 性能优化

• 根据任务复杂度选择合适的模型

• 合理配置工具集,避免加载不必要的工具

• 使用语音模式时,推荐安装 faster-whisper 进行本地语音转文字

八、总结

Hermes Agent 是一个功能强大、扩展性好的开源 AI 智能体框架。通过本教程,你已经了解了:

• Hermes Agent 的核心概念和特点

• 如何在不同的操作系统上安装和配置

• 如何选择和配置大模型提供商

• 基本使用方法和常用命令

• 进阶功能如消息平台集成、语音模式、自动化任务等

现在,你可以开始使用 Hermes Agent 来提升你的工作效率了!如有更多问题,可以访问官方文档:https://hermesagent.org.cn 获取更多信息。 收藏 AI-Pick - 精选AI工具导航 https://ai-pick.cn/