HKUDS/OpenHarness
Agent harness 基础设施 + ohmo personal agent。适合讲“LLM 要变成 agent,需要工具、技能、记忆、权限、MCP 和多 agent 外壳”。
用 OpenHarness、Hermes Agent、OpenClaw 对比 Beaver,面向讲解场景覆盖产品定位、架构结构、Skill、Tool、Session、Channel、权限、安全、自学习和 Agent Team。
先用四张卡片建立直觉:它们都在做 agent,但产品路线和架构重心不同。
Agent harness 基础设施 + ohmo personal agent。适合讲“LLM 要变成 agent,需要工具、技能、记忆、权限、MCP 和多 agent 外壳”。
自学习个人 agent。适合讲“长期助理如何跨会话记忆、从任务中生成技能、用多渠道和 cron 变成常驻助手”。
Local-first 多渠道个人助手。适合讲“产品化 gateway、设备节点、消息渠道、WebChat、Canvas 和安全默认值”。
单用户实例化 Web agent 工作台。适合讲“Web 管理面 + Task 工作单 + 审核型 Skill Learning + Agent Team”。
这一页回答:谁会用、从哪里进入、产品强弱在哪里。
横向扫一遍能力覆盖。重点看 Beaver 的强项和短板分别落在哪些行。
| 能力 | OpenHarness | Hermes | OpenClaw | Beaver |
|---|---|---|---|---|
| Agent Loop | 有,harness 核心;强调 streaming tool-call cycle 和并行工具执行。 | 有,conversation loop 是长期助理运行核心。 | 有,agent runtime 嵌入 gateway、apps、nodes 场景。 | 有,统一 AgentLoop,主 agent 和 sub-agent 共用。 |
| Task 工作单 | 有 tasks 目录和 autopilot/test 迹象,但不是核心产品叙事。 | 有 kanban、goals、cron 等任务形态。 | 有 session/agent message task 形态,偏产品会话和路由。 | 强核心:TaskRecord、validation、feedback、active task。 |
| Skill 系统 | bundled/user skills、frontmatter、plugin ecosystem。 | optional skills、Skills Hub、self-improving skills。 | workspace/bundled/managed skills、ClawHub。 | versioned skill、draft/review/publish/rollback、learning candidate。 |
| Tool 系统 | 43+ tools、MCP、parallel tool execution。 | 40+ tools、toolsets、terminal backends、RPC。 | first-class tools、browser/canvas/nodes/cron/sessions。 | ToolRegistry、ToolAssembler、ToolExecutor、builtins、MCP wrapper。 |
| Memory | MEMORY.md、memdir、session memory。 | agent-curated memory、FTS5 session search、user modeling。 | workspace memory/session model。 | curated memory、run memory、skill learning memory。 |
| Channel/Gateway | ohmo channels:Feishu、Slack、Telegram、Discord 等。 | Telegram、Discord、Slack、WhatsApp、Signal、Email gateway。 | 超多渠道和 device nodes。 | 当前主要 Web/WebSocket,另有 gateway/channels 基础。 |
| Permissions | permissions checker、sandbox、hooks。 | tool guardrails、approval、terminal backend isolation。 | DM allowlist、sandbox non-main sessions、security defaults。 | authz integration、permission packages 还较空、MCP authz config。 |
| Team/Sub-agent | swarm、subagent、delegation。 | subagents、parallel workstreams。 | multi-agent routing / isolated agents。 | sequence/parallel/DAG ExecutionGraph。 |
| 自学习 | 有 memory/skills,但不是最强叙事。 | 强:closed learning loop。 | 有 skills registry,但自学习不是主线。 | 强:candidate -> draft -> safety/eval -> review -> publish。 |
| Web 管理面 | dashboard/terminal frontend 有,但非主线。 | website/web/TUI/gateway。 | control UI / WebChat / Canvas。 | 强:tasks、skills、MCP、settings、files、logs。 |
重点讲 Beaver 的优势:不仅能选 skill,还把 skill 当成可审核、可发布、可回滚的资产。
| 阶段 | OpenHarness | Hermes | OpenClaw | Beaver |
|---|---|---|---|---|
| 发现 skill | loader/registry | skill bundles/config/hub | workspace/managed registry | SkillsLoader |
| 候选召回 | skill registry / prompt matching | skill preprocessing / commands | registry/config | embedding retriever |
| 最终选择 | agent/runtime 决策 | agent skill utilities | agent/tooling runtime | LLM shortlist + final select |
| 注入方式 | prompt/context | prompt/context | prompt/context | SkillContext + activation messages |
| 审计记录 | 有测试/日志迹象 | 有 memory/trajectory | 有 runtime/logs | explicit activation receipt |
| CRUD | Beaver 讲解重点 |
|---|---|
| Create | upload、marketplace install、learning candidate synthesize draft |
| Read | list/detail/version/file/download |
| Update | regenerate draft、submit、approve、reject、publish、disable、rollback |
| Delete | delete published skill / draft delete 底层能力 |
这个例子适合讲“skill 不是手动塞进去,而是根据任务语义被选择并记录”。
{
"task_description": "解释后端 Task 机制",
"available_skills": [
"backend-explainer",
"code-review",
"filesystem"
]
}{
"retrieved_candidates": [
"backend-explainer",
"filesystem"
],
"llm_final_select": [
"backend-explainer"
]
}{
"activated_skills": [
"backend-explainer"
],
"activation_reason": "llm_selected",
"tool_hints": [
"search_files",
"read_file"
]
}重点讲 Beaver 的 ToolRegistry / ToolAssembler / ToolExecutor 三段式边界。
43+ tools,覆盖 file、shell、search、web、MCP,并强调 parallel tool execution。
40+ tools、toolsets、terminal backends、RPC、browser/tools config,工具体系覆盖面广。
first-class tools,覆盖 browser、canvas、nodes、cron、sessions 和 channel actions。
built-in tools + MCP tools + registry + assembler + executor,运行链路边界更容易讲清。
| 阶段 | OpenHarness | Hermes | OpenClaw | Beaver |
|---|---|---|---|---|
| 内置注册 | tools package | tools/toolsets | packages/extensions/tools | EngineLoader.register_many |
| 外部工具 | MCP client | MCP serve/config | plugin/extensions/process tooling | MCP manager |
| 工具选择 | harness runtime | toolsets + config + guardrails | gateway/runtime tool exposure | always tools + skill hints + embedding top-k |
| 执行 | tool call cycle / parallel | tool executor / terminal backend | runtime/extensions/actions | ToolExecutor.execute_tool_call |
| 审计 | logs/hooks | trajectory/tool classification | logs/security tooling | session tool_result + run memory |
--- name: backend-explainer description: Explain backend architecture from source files tool_hints: - search_files - read_file - session_search --- 先定位入口,再追踪 service、engine、memory、skills。
{
"task": "解释后端 Task 机制",
"activated_skills": [
"backend-explainer"
],
"always_tools": [
"memory",
"session_search"
]
}{
"always_tools": ["memory", "session_search"],
"from_skill_hints": ["search_files", "read_file"],
"from_embedding": ["list_directory"],
"final_tools": [
"memory",
"session_search",
"search_files",
"read_file",
"list_directory"
]
}对比谁更擅长跨会话、谁更擅长运行证据、谁更擅长多渠道隔离。
| Memory 类型 | OpenHarness | Hermes | OpenClaw | Beaver |
|---|---|---|---|---|
| 用户长期记忆 | MEMORY.md / memdir | user modeling / curated memory | workspace memory | curated memory store |
| 会话历史 | session storage | conversation/session history | gateway sessions | session manager |
| 检索 | memory relevance/search | FTS5 + summarization | session/tools docs | session search tool |
| run 证据 | harness logs/tests | trajectories | logs/sessions | run memory store |
| skill 效果 | 部分支持 | 自学习闭环强 | skill registry usage | skill effect records |
{
"session_id": "web-demo-001",
"message": "继续刚才的后端架构讲解"
}{
"session": {
"id": "web-demo-001",
"source": "web",
"parent_session_id": null
},
"message": {
"role": "user",
"run_id": "run_002",
"context_visible": true
},
"memory_snapshot": {
"captured_for_run": "run_002",
"frozen": true
},
"run_memory": {
"activated_skills": ["backend-explainer"],
"tool_results": ["read_file", "search_files"],
"validation_result": {"accepted": true}
}
}{
"answer": "继续上次内容...",
"session_updated": true,
"run_record_written": true,
"can_resume_later": true
}这页讲入口生态。Beaver 目前 Web 强,多渠道弱;OpenClaw 和 Hermes 是主要参照。
这页要拆成两层讲:平台部署隔离,以及 agent runtime 的工具权限。
| 维度 | OpenHarness | Hermes | OpenClaw | Beaver |
|---|---|---|---|---|
| Tool approval | permissions checker / hooks | guardrails / approvals | security defaults / tool exposure | authz integration + permission package scaffold |
| Channel trust | channel impl + security tests | pairing/slash access/platform rules | DM allowlist / pairing | Web auth/session + authz-service |
| Sandbox | Docker sandbox | terminal backend isolation | non-main sandbox, Docker/SSH/OpenShell | Docker per-instance isolation at deployment layer |
| MCP security | MCP config/client | MCP config/serve | plugin/process boundary | MCP server config + authz config |
| Audit | tests/logging/hooks | trajectories/logs | logging/security workflows | session event payload + run memory |
Beaver 的优势是把 team 放进 Task 工作流,并且让主 agent synthesis 最终负责一致性。
swarm、subagent spawning、delegation,强调 harness 多 agent 能力。
isolated subagents、parallel workstreams、scripts via RPC。
multi-agent routing、isolated agents/workspaces/sessions。
{
"task_id": "task_arch_002",
"mode": "team",
"strategy": "dag"
}{
"nodes": [
{
"node_id": "read",
"task": "阅读三方项目 README",
"depends_on": []
},
{
"node_id": "compare",
"task": "对比 skill/tool/session/channel/permission",
"depends_on": ["read"]
},
{
"node_id": "synthesize",
"task": "生成讲解页结构",
"depends_on": ["compare"]
}
]
}{
"team_success": true,
"node_results": [
{"node_id": "read", "success": true},
{"node_id": "compare", "success": true},
{"node_id": "synthesize", "success": true}
],
"main_synthesis": "输出一页完整项目对比讲解。"
}这页适合最后收束:不是说谁更好,而是说明每个项目选择了不同路线。
页面内容是静态快照,不是实时 GitHub 数据。Snapshot: 2026-05-20。
| 项目 | GitHub metadata snapshot | 主要来源 |
|---|---|---|
| HKUDS/OpenHarness | Python / MIT / stars 12801 / forks 2115 / updated 2026-05-20T06:22:54Z | Repo · README |
| NousResearch/hermes-agent | Python / MIT / stars 158414 / forks 25664 / updated 2026-05-20T06:43:46Z | Repo · README |
| openclaw/openclaw | TypeScript / MIT / stars 373326 / forks 77490 / updated 2026-05-20T06:42:58Z | Repo · README |
| Beaver | 本地项目 / Python + Next.js / 单用户实例化 Web agent 工作台 | Beaver 架构可视化 · backend overview |
仓库树显示 src/openharness/skills、tools、memory、channels、permissions、sandbox、swarm、ohmo/gateway。
https://github.com/HKUDS/OpenHarness仓库树显示 agent/skill_*、tools、toolsets、gateway/platforms、cron、mcp_serve.py、optional-skills。
https://github.com/NousResearch/hermes-agent仓库树显示 apps/android、apps/ios、apps/macos、skills、extensions、docs、大量 channel/security workflows。
https://github.com/openclaw/openclaw本地代码显示 beaver/engine、tasks、skills、tools、memory、interfaces/web、coordinator、integrations/authz。
查看本地 Beaver 架构页