Files

steven_li 6e9e74d1ee feat(engine): 添加运行时上下文支持并重构工具迭代限制

添加 RuntimeContext 类用于捕获模型运行时的日期时间信息，
包括UTC时间、本地时间和时区信息，并在系统提示中显示这些信息。

同时增加最大上下文消息数和工具迭代次数的配置选项，
将验证服务从引擎加载器中移除，并更新相关的数据结构和接口。

BREAKING CHANGE: 移除了验证服务，相关字段被替换为证据状态和接受状态。

- 添加 RuntimeContext 类和相关渲染方法
- 增加 max_context_messages 和 max_tool_iterations 配置
- 移除 ValidationService 相关代码
- 更新消息记录中的验证状态字段
- 添加原始工具调用检测和回退处理

2026-05-26 11:18:35 +08:00

8.3 KiB

Raw Blame History

Beaver 后端近期已完善功能

1. 近期完善功能一览

已完善功能	当前状态	展示重点
任务识别与跟踪	已完成	系统能判断用户是在普通聊天，还是在交办一个需要持续完成的任务
任务执行闭环	已完成	任务可以被创建、执行、记录过程、产出结果并进入验收
用户验收与反馈	已完成	用户可以对结果表示满意、要求修改或放弃
技能、工具调用与证据留存	已完成	系统会先用技能提供方法指导，再选择和调用工具，并记录执行证据
多智能体协作	已具备	复杂任务可以拆成多个子任务执行，再汇总结果
技能沉淀与复用	已具备	被认可的任务经验可以进入技能候选、草稿、审核和发布链路
长期记忆系统	底层已完成，待接入	已覆盖用户偏好、业务知识、历史任务、文件产物、工具经验和可复用流程
定时任务与主动触达	基础能力已具备	系统可以支持周期性任务和自动通知
多模型供应商适配	已具备	支持不同模型服务和后续成本/质量策略

2. 重点功能一：任务执行闭环

功能说明

Beaver 后端已经从普通问答升级为任务执行系统。用户不需要手动创建任务，系统会自动判断当前输入是否需要进入任务模式。

如果只是普通聊天，系统直接回答；如果用户是在交办一个需要执行、修改或验收的事情，系统会把它作为任务持续跟踪。

已完善的能力

自动识别普通聊天和任务请求
为复杂请求创建可追踪任务
保存任务目标、当前状态、执行次数和历史结果
支持任务继续、任务修改、新任务创建、任务关闭和任务放弃
任务完成后进入用户验收阶段

产品价值

这项能力解决的是“模型回答完就结束”的问题。

现在系统可以把用户请求当作一个有生命周期的任务处理：从识别、执行、产出，到用户反馈和后续修改，形成完整闭环。

可展示方式

用户提出一个需要多步骤完成的任务
系统自动识别为任务，而不是普通聊天
系统执行任务并返回结果
用户要求修改
系统继续沿用原任务上下文进行修订
用户确认满意后，任务进入完成状态

4. 重点功能二：用户验收与反馈闭环

功能说明

任务完成后，系统不会默认结果一定正确，而是支持用户进行明确反馈。

用户可以表达三类结果：

满意：结果被接受，可以作为成功经验
修改：结果需要继续调整
放弃：任务不再继续

已完善的能力

记录用户对任务结果的反馈
根据反馈更新任务状态
把修改意见作为下一轮任务执行的输入
把满意反馈作为后续技能学习的重要信号
把放弃任务保留为失败经验，避免重复问题

产品价值

这项能力让系统具备“交付意识”。

它不是只追求生成内容，而是把用户是否认可作为任务是否成功的标准。这对用户来说很重要，因为用户更关心结果是否可用，而不是模型是否生成了一段看起来合理的回答。

5. 重点功能三：技能、工具调用与过程证据留存

功能说明

系统已经具备“技能指导工具使用”的能力。它不是让模型随机选择工具，而是先根据任务选择合适的技能，由技能提供工作方法、注意事项和工具使用建议，再把相关工具暴露给模型执行任务。

工具可以覆盖文件、终端、网页、记忆、会话搜索、技能管理、定时任务等场景。技能负责告诉智能体“应该怎么做”，工具负责完成真实操作。

同时，系统会记录每次执行过程，包括使用了哪些工具、工具返回了什么、模型如何继续处理。

已完善的能力

按任务内容选择合适技能
将技能作为本轮任务的执行指导注入上下文
从技能中读取工具使用建议
按任务和技能共同决定本轮可用工具
向模型暴露本轮任务可调用的工具清单
执行模型发起的工具调用
保存工具调用结果
将工具结果继续放回任务上下文
记录本轮启用的技能、可用工具、工具调用和执行结果
形成可追溯的任务过程证据，便于复盘和后续技能学习

产品价值

这项能力让 Beaver 从“能说”变成“按方法做事”。

对外展示时，可以强调：系统不是单纯调用大模型生成文字，也不是把工具直接丢给模型自由发挥，而是通过技能把经验和方法注入任务执行，再由工具完成真实操作。

这让每次工具调用更像是按照一套可复用工作方法执行，而不是一次性的临场判断。

6. 重点功能四：多智能体协作执行

功能说明

对于复杂任务，系统已经具备拆分和委派能力。一个复杂任务可以先拆成多个子任务，再交给不同子智能体执行，最后由主流程汇总结果。

已具备的能力

判断任务是否需要多智能体协作
支持顺序执行、并行执行和依赖关系执行
子任务可以继承任务目标、约束和上下文
子任务结果会被收集并交给主流程汇总
子任务过程也会形成证据

产品价值

这项能力让系统可以处理更复杂的工作。

例如“调研一个方案、比较多个选项、审查风险、整理最终建议”这类任务，不必全部压给一个模型一次性完成，而是可以拆成多个角色协作。

7. 重点功能五：技能沉淀与复用

功能说明

系统已经具备把成功任务经验沉淀为技能的基础链路。

当一个任务被用户认可后，系统可以根据任务过程、工具使用、结果和反馈生成技能候选。候选可以进入草稿、审核和发布流程，成为后续任务可复用的能力。

已具备的能力

记录任务中使用过的技能和工具
根据用户满意反馈识别高价值经验
生成技能学习候选
支持技能草稿、审核和发布
后续任务可以根据任务内容自动选择相关技能

产品价值

这项能力让系统具备“越用越会做”的基础。

它不是简单保存聊天记录，而是把被验证过的工作方法沉淀下来，逐步形成企业自己的智能体技能库。

8. 重点功能六：长期记忆系统底层能力

功能说明

长期记忆系统的底层能力已经完成，目前还没有完整接入主产品链路和用户界面。

这意味着：记忆系统本身不是未来才开始做，而是已经具备底层基础。后续工作的重点是把它接入任务执行、文件资源、技能学习和管理界面。

已完成的记忆能力

用户长期偏好
组织业务知识
历史任务和结果
文件和任务产物
工具调用经验
成功技能和失败案例
可复用的工作流程
分层记忆加载
记忆与技能联动的基础

当前边界

已经完成的是记忆系统底层能力；还需要接入的是：

任务执行时自动读取相关记忆
用户界面展示系统记住了什么
记忆来源、可信度和使用记录可视化
用户可以确认、编辑、删除或冻结记忆
记忆检索轨迹进入任务详情页

产品价值

这项能力是 Beaver 向长期智能体演进的关键基础。

普通助手只能依赖当前对话，而 Beaver 已经具备把长期偏好、历史任务、工具经验和可复用流程沉淀为长期上下文资产的基础。

9. 重点功能七：定时任务与主动触达

功能说明

系统已经具备定时任务和主动触达的基础能力，可以支持周期性任务、自动提醒、定期报告和主动通知。

已具备的能力

创建定时任务
自动触发任务或通知
保存定时任务运行记录
支持用户对定时结果继续修改
定时任务可以进入普通任务链路

当前边界

定时任务能力已经具备基础，但仍需要进一步稳定化和产品化展示。

当前已发现一个需要优先修复的问题：定时任务结果回写中存在变量引用错误，可能影响任务结果记录。

产品价值

这项能力让 Beaver 从“用户问了才回答”进一步走向“系统主动完成周期性工作”。

8.3 KiB Raw Blame History

Beaver 后端近期已完善功能

1. 近期完善功能一览

2. 重点功能一：任务执行闭环

功能说明

已完善的能力

产品价值

可展示方式

4. 重点功能二：用户验收与反馈闭环

功能说明

已完善的能力

产品价值

5. 重点功能三：技能、工具调用与过程证据留存

功能说明

已完善的能力

产品价值

6. 重点功能四：多智能体协作执行

功能说明

已具备的能力

产品价值

7. 重点功能五：技能沉淀与复用

功能说明

已具备的能力

产品价值

8. 重点功能六：长期记忆系统底层能力

功能说明

已完成的记忆能力

当前边界

产品价值

9. 重点功能七：定时任务与主动触达

功能说明

已具备的能力

当前边界

产品价值

8.3 KiB

Raw Blame History