一、引言
最近在体验一款名为Hermes-Agent 的开源 AI 智能体框架,由 Nous Research 出品。它最大的亮点是免训练即可赋予大模型操作电脑的能力(浏览器自动化、代码执行、文件管理、消息网关等),底层支持 300+ 模型,包括 OpenAI、Anthropic、DeepSeek 以及国内主流大模型。
本文记录了我从零开始在Windows 11 上安装 Hermes-Agent 的全过程,并重点解决了网络卡顿和API Key 配置两大痛点,最终成功接入了DeepSeek 纯文本模型(通过CCSwitch 中转)。希望能帮助同样在 Windows 上折腾的小伙伴少走弯路。
二、Hermes-Agent 介绍
Hermes-Agent 是一个本地运行的 AI 操作员,具备以下核心能力:
多模型支持:兼容 OpenAI、Anthropic、DeepSeek、智谱、Kimi、豆包等 300+ 模型,可随时切换。
工具链集成:
浏览器自动化:基于 Playwright,可自动打开网页、点击、填写表单、截图分析。
代码执行沙箱:Python / Shell 直接运行,适合数据处理、脚本调试。
文件操作:读写、解压、解析 PDF/Word/Excel。
联网搜索:实时查询突破模型知识截止。
跨会话记忆:记住项目上下文,无需重复交代背景。
消息网关:可接入 Telegram / Discord / Slack,手机远程指挥。
技能自进化:复杂任务自动沉淀为可复用“技能”。
一句话总结:它是一个能真正“动手”的 AI 助手,而不只是聊天机器人。
三、安装前的环境准备
3.1 硬件与系统要求
操作系统:Windows 10/11(建议 64 位)
处理器:x86/x64 或 ARM64(Surface Pro X 等需选 ARM 版本)
内存:至少 8GB(推荐 16GB)
磁盘空间:至少 5GB(含 Python 虚拟环境、Node 模块、Chromium 浏览器内核)
3.2 前置依赖(可选但推荐)
Hermes-Agent 会自动检测并安装大部分依赖,但提前安装以下工具可避免中途卡顿:
工具 | 用途 | 安装命令(管理员 PowerShell) |
|---|---|---|
Git | 克隆仓库 |
|
Python 3.11 | 运行核心代码 |
|
Node.js 22 LTS | 浏览器工具 |
|
ripgrep | 快速文件搜索 |
|
ffmpeg | TTS 语音消息 |
|
注意:即使不提前安装,安装脚本也会尝试自动下载 PortableGit 和 Hermes 托管的 Node.js,但网络不稳定时容易失败。
四、安装 Hermes-Agent
4.1 一键安装(推荐)
打开PowerShell(建议以管理员身份运行),直接执行以下命令:
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex这条命令做了三件事:
Invoke-RestMethod(缩写irm)下载远程脚本。Invoke-Expression(缩写iex)在当前会话中执行脚本。脚本自动完成:安装 uv(Python 包管理器)→ 安装 Python 3.11 → 安装 Git → 安装 Node.js → 克隆仓库 → 创建虚拟环境 → 安装 Python 依赖 → 安装 Node 依赖(含 Playwright Chromium)→ 配置 PATH → 写入配置文件。
安装过程大约需要 5~15 分钟,取决于网络速度和是否首次下载 Chromium(约 170MB)。
4.2 常见问题:网络卡顿与解决方案
终端停留在Installing Node.js dependencies (browser tools)...或Installing Playwright Chromium...超过 5 分钟无变化。
原因
GitHub raw 域名
raw.githubusercontent.com在国内访问不稳定。Playwright 下载 Chromium 时默认从 Google CDN 拉取,经常被墙。
解决方案(二选一)
方案 A:配置代理(如果已有梯子)
在 PowerShell 中设置临时环境变量,指定 HTTP/HTTPS 代理:
$env:HTTP_PROXY="http://127.0.0.1:7890" $env:HTTPS_PROXY="http://127.0.0.1:7890"然后重新运行安装命令。
方案 B:手动下载 ZIP 并本地安装
如果以上均无效,可手动下载仓库 ZIP:
# 下载 ZIP Invoke-WebRequest -Uri "https://github.com/NousResearch/hermes-agent/archive/refs/heads/main.zip" -OutFile "$env:TEMP\hermes.zip" Expand-Archive -Path "$env:TEMP\hermes.zip" -DestinationPath "$env:TEMP\hermes-extract" Move-Item "$env:TEMP\hermes-extract\hermes-agent-main" "$env:LOCALAPPDATA\hermes\hermes-agent" # 然后进入目录执行本地安装脚本 cd "$env:LOCALAPPDATA\hermes\hermes-agent" .\scripts\install.ps14.3 验证安装
安装完成后,关闭当前 PowerShell 窗口并重新打开一个新窗口(使 PATH 生效),然后输入:
hermes --version如果看到类似hermes 0.x.y的输出,说明安装成功。
五、配置 API Key(核心难点)
5.1 交互式配置
首次运行hermes时会自动进入设置向导,也可手动启动:
hermes setup向导会引导你选择模型提供商、输入 API Key、配置消息网关等。但对于国内用户,直接使用向导往往会卡在 Stripe 绑卡页面(免费套餐也需要绑定信用卡)。
5.3 使用 Ccswit.ch 中转 DeepSeek API
由于 DeepSeek 官方 API 对国内用户友好,但为了统一管理和方便切换模型,我使用了CCSwitch(一个兼容 OpenAI 格式的 API 中转平台)。步骤如下:
在 Ccswit.ch 注册账号,进入「渠道管理」添加 DeepSeek 模型。
获取中转地址(Base URL)和专属 API Key。
六、启动与基本使用
6.1 启动交互式对话
hermes进入>提示符后,可以像 ChatGPT 一样提问。例如:
> 你好,请用 Python 写一个斐波那契数列生成器。Hermes 会自动调用代码执行工具,运行并返回结果。
6.2 常用命令速查
命令 | 作用 |
|---|---|
| 启动交互式对话 |
| 重新运行配置向导 |
| 查看/修改配置 |
| 用编辑器打开配置文件 |
| 查看/切换当前模型 |
| 启动消息网关(Telegram/Discord) |
| 更新到最新版本 |
| 查看版本号 |
6.3 测试 DeepSeek 模型是否正常工作
在 Hermes 对话中输入:
> 1 + 1 等于几?请直接回答。如果返回2,说明配置成功。
七、进阶技巧与避坑指南
7.1 切换模型
如果需要临时切换到其他模型(如 Claude),无需重新安装,只需修改配置文件中的MODEL和OPENAI_BASE_URL即可。Hermes 支持热加载,重启会话后生效。
7.2 解决 Windows 下 Git Bash 找不到的问题
Hermes 在执行 Shell 命令时需要bash.exe。安装脚本会自动安装 PortableGit 并设置环境变量HERMES_GIT_BASH_PATH。如果后续出现问题,可手动指定:
$env:HERMES_GIT_BASH_PATH = "C:\Program Files\Git\bin\bash.exe"7.3 使用 WSL2 获得最佳体验
虽然 Hermes 官方支持 Windows,但许多高级特性(如原生 Linux 工具链、更好的文件权限管理)在WSL2 (Ubuntu) 下表现更稳定。安装 WSL2 后,在 Ubuntu 终端中直接运行安装命令,通常无需配置代理即可完成。
# 在 WSL2 Ubuntu 中 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash7.4 卸载与重装
如果需要完全卸载,删除以下目录:
Remove-Item -Recurse -Force "$env:LOCALAPPDATA\hermes"然后重新安装即可。
参考资料
Hermes-Agent 官方文档:https://hermes-agent.nousresearch.com
Ccswit.ch 中转平台:https://ccswitch.xxx
DeepSeek 开放平台:https://platform.deepseek.com