B Beaver Agent Sandbox商业战略 · 市场研究 · 竞品分析
Enterprise Agent Execution

Beaver:企业 Agent执行与治理平台

Beaver 面向需要私有部署、过程留痕、结果验收和经验复用的团队。它不是一个普通聊天框,而是一套把对话、任务、工具、文件、技能、记忆、连接器和治理串起来的 Agent 执行平台。

产品主线执行不是聊天
商业切口团队知识工作
核心壁垒复用技能与记忆
试点指标验收真实任务
Positioning

产品定位与核心闭环

先把 Beaver 讲成一个完整的企业 Agent 工作操作系统,再拆分功能模块。

Beaver 的定位:为企业团队提供一个可私有部署、可追踪、可验收、可复用的 Agent 执行与治理平台。
01

识别

判断用户是在普通对话,还是交办一个需要持续完成的任务。

02

执行

按任务选择模型、技能、工具、文件和外部连接器。

03

追踪

记录工具调用、运行过程、子任务、产物和证据。

04

验收

用户明确选择接受、修改或放弃,结果不再默认正确。

05

沉淀

满意任务进入技能候选、草稿、审核、发布和长期记忆。

06

复用

类似任务自动获得更好的方法、上下文和执行路径。

Architecture

产品架构

产品战略分析之前,先明确 Beaver 的系统边界:入口统一、实例隔离、运行可治理。

入口与控制面

用户、身份、实例

  • auth-portal:登录、注册、模型配置引导
  • authz-service:账号和 backend 身份编排
  • deploy-control:创建、配置、移除 app-instance
  • router-proxy:按实例域名转发流量
用户实例

独立 App Sandbox

  • Nginx 承接前端、API、WebSocket
  • Next.js 前端承载工作台页面
  • Beaver Backend 承载 Agent 运行时
  • beaver-home 挂载配置、workspace、skills、runtime data
Agent 内核

执行、证据、复用

  • engine:主 Agent 和子 Agent 统一运行内核
  • coordinator:sequence / parallel / DAG 多智能体协作
  • tools:内置工具与 MCP 工具
  • skills + memory:技能学习与长期经验沉淀
Product Strategy Canvas

产品战略画布

基于产品战略画布,把 Beaver 的愿景、目标市场、价值主张、取舍、增长和护城河放在同一张图里。

1. Vision

让企业拥有可控的 Agent 工作系统

从“个人问答工具”升级为“团队可交付的 AI 工作流”。价值观是可控、透明、可复用、可私有部署。

2. Market Segments

先服务重复知识工作团队

第一细分:项目交付、运营报告、技术支持、研究分析等高频、跨工具、需要留痕和验收的团队。

3. Relative Costs

不打最低价,强调可控价值

Beaver 应走“私有部署 + 执行治理 + 复用资产”的高价值路线,而不是和通用 SaaS 聊天工具比低价。

4. Value Proposition

从回答到交付

Before:AI 输出散落在聊天里;How:任务化执行、工具证据、用户验收;After:产物可交付,经验可沉淀。

5. Trade-offs

明确不做什么

不先做大众聊天 SaaS;不先铺满所有连接器;不默认自动发布技能;不在无控制台前大规模启用敏感长期记忆。

6. Metrics

北极星是“已验收工作”

核心指标不是消息数,而是每个试点团队每周完成并被接受的 Agent 工作数。季度 OMTM:首批试点的已验收任务数。

7. Growth

销售驱动 + 试点转扩展

先通过高价值工作流试点进入客户,再从一个团队扩展到部门,最后以技能、模板、连接器和治理能力形成扩张。

8. Capabilities

需要补强的能力

工作流模板、证据叙事、Memory Control Center、Admin Health Console、连接器安全策略、技能评估门禁。

9. Can't / Won't

护城河来自运行闭环

单个聊天 UI 容易复制;难复制的是私有实例、任务证据、验收反馈、技能记忆沉淀和客户真实工作流数据。

Market Segments

市场细分:先找“任务足够痛”的团队

细分不是按行业硬切,而是按工作频率、工具复杂度、审核强度、私有部署要求和复用价值来切。

细分市场 典型组织与决策人 JTBD 痛点与障碍 Beaver 产品适配 优先级
项目交付与咨询团队
中高客单价、多人协作、强交付节奏
项目负责人、交付总监、PMO、解决方案负责人 快速生成方案、周报、风险摘要、客户交付物,并持续修改到可交付。 材料分散、版本反复、过程难复盘,成功模板依赖个人经验。 任务闭环、文件、证据、验收、技能沉淀都直接命中。 第一优先级
企业运营与管理支持
周期性报告、跨系统信息整理
运营负责人、部门助理、业务分析负责人 把周期性信息整理成管理层能看的摘要、提醒和行动项。 重复工作多、信息源多、人工催办多,输出质量依赖熟练员工。 定时任务、通知、文件、连接器和验收反馈很适配。 第一优先级
研发与技术支持团队
日志、代码、文件、命令和排障
研发负责人、支持负责人、DevOps、技术 PM 让 AI 帮忙分析问题、执行工具、整理证据和生成处理结论。 通用聊天无法安全执行工具,也缺少可审计的过程证据。 工具调用、任务时间线、多智能体协作和文件系统能力强匹配。 第二优先级
内部 AI 平台 / IT 团队
负责企业 AI 能力落地
CIO、AI 平台负责人、信息安全、架构师 给业务团队提供可控、可私有部署、可治理的 AI 工作台。 担心数据、权限、工具、模型成本和外部系统副作用。 多实例、控制面、工具治理、技能审核和日志是购买理由。 关键买方,不一定是首个日活用户
销售 / 客成 / 增长运营
客户资料、跟进、邮件日历
销售运营、客户成功负责人、增长负责人 沉淀客户上下文,自动准备沟通材料、跟进提醒和邮件/日程动作。 需要连接外部系统,且外部写入风险更高。 连接器价值高,但必须先解决外部写入策略和安全沙盒。 第三优先级,适合连接器成熟后进入
User Personas

核心用户画像

当前画像基于项目资料与产品判断,尚缺真实访谈数据;后续需要用试点访谈校准。

Persona 1

林澈 · 项目交付负责人

画像:32-42 岁,管理 5-20 人项目团队,关注交付质量、客户反馈和团队复用。

JTBD:把客户需求、会议材料、风险和进度整理成可交付内容,并快速响应修改。

痛点:重复写方案;版本追踪困难;新人难复用资深顾问方法。

期望收益:更快产出交付物;每次修改可追踪;成功案例沉淀成模板/技能。

意外洞察:他不怕 AI 先给 70 分草稿,怕的是无法说明这 70 分从哪里来、后面如何改。

Persona 2

周予 · 企业 AI 平台负责人

画像:35-50 岁,负责内部 AI 工具、模型接入、合规和推广。

JTBD:给业务团队提供可控 AI 工作台,避免工具碎片化和不受控数据外流。

痛点:业务想快用,安全想慢审;通用 SaaS 难私有化;自研 Agent 工程成本高。

期望收益:私有部署、实例边界、工具审计、模型可配置、可逐步扩展。

意外洞察:他买的不是“模型能力”,而是可解释、可限制、可恢复的运行边界。

Persona 3

陈岚 · 技能与流程维护者

画像:28-45 岁,可能是 PM、运营专家、解决方案架构师或内部工具管理员。

JTBD:把成功工作方法变成团队可复用的技能,并确保不会引入风险。

痛点:优秀提示词散在聊天里;方法靠口口相传;自动化一旦错会被反复放大。

期望收益:候选、草稿、安全报告、评估报告、人工审核、版本回滚。

意外洞察:她不是追求“全自动学习”,而是追求“可控地把好方法发布出去”。

User Segmentation

行为分群:按使用深度和治理需求切分

同一个客户组织里会同时存在不同用户群。产品设计要把他们的任务和权限分清楚。

Segment A · 任务交付型用户

每天用 Beaver 产出内容和产物

行为:从聊天进入任务,上传文件,查看输出,要求修改,最终验收。

最看重:速度、上下文连续、产物质量、修改效率。

产品机会:工作流模板、任务卡、任务详情、文件预览、验收按钮、交付物导出。

优先级:Invest。没有这群人的已验收任务,Beaver 没有北极星。

Segment B · 治理运营型用户

负责部署、配置和风险控制

行为:配置模型、管理实例、看状态、查日志、限制工具、处理连接器故障。

最看重:稳定、边界、可恢复、可解释、成本可控。

产品机会:Admin Health Console、部署检查、连接器状态、工具策略、备份恢复。

优先级:Invest。企业试点能否扩展取决于这群人的信任。

Segment C · 复用建设型用户

把成功任务变成团队能力

行为:查看满意任务,生成技能候选,审核草稿,发布技能,观察复用效果。

最看重:质量门禁、版本管理、安全评估、是否真的减少重复工作。

产品机会:技能学习链路、Replay Eval、技能市场、复用指标、版本回滚。

优先级:Maintain → Invest。先跑出 accepted tasks,再强化复用建设。

Segment D · 外部系统自动化用户

希望 AI 直接进入邮件、日历和业务系统

行为:配置 Outlook/IM/CRM 等连接器,让 Agent 处理提醒、回复、日程和跟进。

最看重:少切换系统、主动触达、外部动作准确。

产品机会:连接器、定时任务、通知、外部写入确认、side-effect journal。

优先级:Defer for broad rollout。连接器成熟前只做受控试点。

Competitor Analysis

竞品分析:先看 Claw 类本地 Agent,再看通用平台

以下分析基于 2026-06-10 可查官方页面、公开仓库和本地架构对比资料。新增重点放在 QClaw、OpenClaw、Hermes Agent、Marvis 这类“常驻设备、跨渠道、有工具执行能力”的 Agent。

竞品 定位与入口 核心能力 相对 Beaver 的强项 弱点 / 空白 Beaver 应吸收什么
OpenClaw
本地优先、多渠道个人 AI 助手
官方定位是运行在自有设备上的 personal AI assistant;入口覆盖 WhatsApp、Telegram、Slack、Discord、WeChat、QQ、WebChat 等多渠道。 Gateway 常驻、渠道接入、设备节点、技能生态、桌面/移动 companion app、Canvas、daemon/onboard 安装体验。 产品触点极强,用户不需要先进入 Web 工作台;“从消息渠道直接让 Agent 做事”的心智清晰。 更偏个人助手和本地设备自动化;企业任务验收、证据链、PRD/运营类交付管理、技能审核发布流程不是主叙事。 借鉴 channel adapter、daemon/onboard、DM pairing、安全默认值、Canvas 产物预览;但 Beaver 主线仍应是可审核任务工作台。
QClaw / QuantumClaw
OpenClaw 产品化与信任身份路线
QClaw 相关项目把 OpenClaw 能力包装成更易用的本地 Agent;QuantumClaw 明确强调 self-hosted runtime、AGEX agent identity/trust、多消息渠道和 dashboard。 本地运行、Telegram/Discord/WhatsApp/Slack/Email 等渠道、持久记忆、多 Agent、内置工具、ClawHub 技能、Trust Kernel、成本路由。 把“个人 Agent 常驻 + 多渠道 + 低成本 + 技能生态”讲得非常完整,且身份/信任协议是有差异化的技术叙事。 仍偏个人/开发者运行时;企业团队协作、任务验收、实例治理、审计报告和技能审批链路需要额外设计。 借鉴 agent identity、pairing flow、memory dashboard、skills/search/install CLI;Beaver 应补上企业侧的角色、审批、证据和验收。
Hermes Agent
自学习、长期记忆的常驻 Agent
Nous Research 官方定位为“Grows With You”的开源 Agent;不是 IDE copilot,也不是单 API wrapper,而是住在服务器上的自主 Agent。 跨 Telegram/Discord/Slack/WhatsApp/Signal/Email/CLI,持久记忆,自动生成技能,自然语言 cron,隔离 subagents,Docker/SSH/Singularity/Modal sandbox。 自学习叙事最强,能把“越用越懂你、越用越会做事”讲成闭环;sandbox 和 subagent 体系也更像工程基础设施。 系统面广、入口多,商业团队理解成本较高;学习出来的技能如何被团队审核、发布、回滚,仍可被 Beaver 拉开差距。 借鉴 session search、user model、auto skill generation、cron、isolated subagents;Beaver 要坚持“学习候选 -> 草稿 -> 评测 -> 人审 -> 发布”。
Tencent Marvis / Mavis
OS 级个人 AI 助手
腾讯官网将 Marvis 描述为 24 小时在线的 AI 助手,覆盖 Windows、macOS、Android,并强调手机操控电脑、本地模式文件 0 上传。 本地/端云协同模式、文件搜索与整理、图片和文档理解、电脑设置修改、手机远程接管、办公/游戏/情报监控等预置场景。 OS 级入口和大众用户心智最强,直接嵌入“文件、应用、系统设置、手机远控”的日常电脑使用路径。 更像 C 端/个人效率助手;企业私有实例、审计、任务验收、跨团队知识复用和工程可扩展性不是当前公开表达重点。 借鉴 OS 文件/应用理解、手机接管电脑、隐私模式、预置任务场景;Beaver 可把这些能力企业化为“受控执行 + 审计回放”。
OpenHarness
Agent harness 基础设施
更偏研究者、框架开发者和 Agent runtime builder;本地已有对比材料将其归为“基础设施路线”。 Agent loop、工具、技能、memory、permissions、sandbox、swarm、gateway/channel 等基础模块。 工程概念完整,适合解释“LLM 如何变成可执行 Agent”;对 Beaver 的底层设计有直接参考价值。 产品体验和业务闭环不如 OpenClaw/Marvis 直观;如果客户要开箱即用工作台,需要二次产品化。 借鉴 harness、permission checker、tool ecosystem 和 sandbox 表达;Beaver 应把这些能力封装到任务工作流里。
Claw 类核心变量

入口不是 Web,而是消息、系统和设备

OpenClaw/QClaw/Hermes/Marvis 的共同点,是让 Agent 常驻在用户已经工作的地方:IM、电脑、文件系统、手机远程入口。Beaver 如果只停在 Web chat,会显得入口较重。

Beaver 可赢点

把个人助手能力企业化

这些产品强在“帮个人做事”,但企业更需要任务状态、证据、验收、权限、审计、复盘和技能发布。Beaver 的机会是把本地 Agent 的执行力变成团队可管理的工作系统。

战略边界

不直接复制万能助手

短期不应追求覆盖所有消息渠道和 OS 操作。先把 Web 工作台、任务验收、技能学习、人审发布和私有实例做深,再选择性接入高价值渠道。

通用 Agent Builder / 企业自动化平台组

竞品 定位与 GTM 核心优势 弱点 / 空白 对 Beaver 的威胁 Beaver 差异化机会
Microsoft Copilot Studio
企业 Agent 构建与 M365/Power Platform 生态
面向已有 Microsoft 生态客户;按 Copilot Credits 或 PAYG 计费,官方显示 25,000 credits 容量包 $200/月。 生态入口强、企业采购路径成熟、身份和权限体系完整、M365 数据和工作流集成天然强。 强依赖 Microsoft 生态;对非微软环境、私有轻量部署和高度定制的本地 Agent 沙盒不一定友好。 大企业标准化采购时会成为默认选项,尤其是 M365 已深度部署客户。 强调轻量私有部署、实例级沙盒、开放模型/工具、任务证据与技能学习,而不是绑定单一办公生态。
Dify
开源 LLM 应用与 Agentic Workflow Builder
面向开发者、小团队和企业;官方强调 agentic workflows、RAG pipelines、integrations、observability;支持云和企业版。 开源心智强、上手快、RAG/Workflow/Agent 能力完整、开发者生态活跃。 更像 LLM 应用构建平台;对“企业任务验收、过程证据、用户工作台、多实例业务闭环”的产品表达不够垂直。 开发团队会用 Dify 快速搭原型,形成替代 Beaver 的内部平台。 避开“构建应用”定位,主打“执行工作”:任务生命周期、验收、证据、技能复用和运营治理。
Dust
多人协作式企业 AI 助手工作区
面向团队协作,官方定位为 people and agents 共同协作的多人 AI workspace;Pro 为 29€/用户/月,Enterprise 面向 100+ 成员。 协作体验和知识连接强,强调多人 AI 工作空间、常见 SaaS 集成和企业安全。 更偏“团队 AI 助手与知识协作”;对私有实例部署、任务验收、工具执行证据和技能学习治理未必是主线。 如果客户首要需求是内部知识问答和团队 AI 助手,Dust 会更易理解和采购。 Beaver 应强调“从协作问答到可验收任务交付”,并把任务证据、文件产物和技能沉淀做得更重。
Relevance AI
AI Workforce / Agent Teams
面向 GTM 和高增长团队,官方强调企业级 AI agents、workforces、2,000+ integrations、SSO/RBAC/Audit Logs。 “AI Workforce”叙事清晰,agent teams、playbook、集成和企业销售话术强。 更偏销售/GTM 自动化和 AI workforce 概念;通用知识工作交付、私有轻量部署和任务验收闭环不一定突出。 在销售、增长、客户跟进等外部系统自动化场景对 Beaver 有直接威胁。 Beaver 可以先避开 GTM 红海,专注项目交付、运营报告、技术支持等内部知识工作,再逐步扩展连接器。
Stack AI
企业 no-code AI Agent / Workflow Automation
官方定位“From process to AI agent, in minutes”;AWS Marketplace 页面强调可在客户 VPC 或本地基础设施部署。 no-code 构建体验、企业安全叙事、私有基础设施部署选项、业务流程自动化定位清楚。 偏构建器和自动化平台;对日常用户工作台、任务验收、技能学习闭环和长期记忆控制的产品深度需要验证。 如果客户想“快速把流程搭成 AI agent”,Stack AI 的 no-code 体验会很有吸引力。 Beaver 应强调不是只搭流程,而是提供完整工作台:用户提交任务、Agent 执行、证据验收、经验复用。
相邻竞品

n8n / Gumloop / CrewAI

n8n 和 Gumloop 更偏 AI workflow automation;CrewAI 更偏多智能体框架与企业平台。它们会在开发者和自动化团队里形成替代路径。

市场空白

任务交付 + 验收 + 复用

通用平台强调构建 Agent、协作助手或自动化流程;Claw 类产品强调个人常驻执行。两边都没有把“企业用户任务、证据、验收、技能学习”作为完整产品闭环来讲。

推荐打法

先做工作台,不做泛平台

Beaver 不应正面卷通用 Agent Builder;应从项目交付、运营报告、技术支持等可衡量工作流切入,再扩展为企业 Agent 平台。

Strategic Recommendation

阶段性战略建议

先把商业画布、目标用户和竞品定位讲透,路线图和上线计划可以后续继续展开。

应该强调

  • “企业 Agent 执行与治理平台”,而不是聊天工具。
  • “任务可验收、过程可审计、经验可复用”。
  • “私有实例 + 开放工具 + 技能记忆沉淀”。
  • 从项目交付、运营报告、技术支持等真实工作流切入。

暂时不要强调

  • 不要先做所有人的通用 AI 助手。
  • 不要和 Dify/Stack AI 正面比“谁更会搭 Agent”。
  • 不要过早承诺所有连接器和完全自治。
  • 不要把验收指标、路线图和上线计划放在前面抢主线。
Acceptance Metrics

验收指标放在最后

这些指标只作为后续试点验收的出口,不在当前页面前半段展开路线图和上线维护。

北极星已验收任务每周/每团队
30 天目标30+真实验收任务
复用目标5技能,其中 3 个复用
安全目标0关键事故
Sources

竞品资料来源

以下为本页竞品分析使用的公开资料入口,优先采用官方页面。