Files
beaver_project/projcet_review/backend_recent_completed_features.md
steven_li 6e9e74d1ee feat(engine): 添加运行时上下文支持并重构工具迭代限制
添加 RuntimeContext 类用于捕获模型运行时的日期时间信息,
包括UTC时间、本地时间和时区信息,并在系统提示中显示这些信息。

同时增加最大上下文消息数和工具迭代次数的配置选项,
将验证服务从引擎加载器中移除,并更新相关的数据结构和接口。

BREAKING CHANGE: 移除了验证服务,相关字段被替换为证据状态和接受状态。

- 添加 RuntimeContext 类和相关渲染方法
- 增加 max_context_messages 和 max_tool_iterations 配置
- 移除 ValidationService 相关代码
- 更新消息记录中的验证状态字段
- 添加原始工具调用检测和回退处理
2026-05-26 11:18:35 +08:00

206 lines
8.3 KiB
Markdown

# Beaver 后端近期已完善功能
## 1. 近期完善功能一览
| 已完善功能 | 当前状态 | 展示重点 |
| --- | --- | --- |
| 任务识别与跟踪 | 已完成 | 系统能判断用户是在普通聊天,还是在交办一个需要持续完成的任务 |
| 任务执行闭环 | 已完成 | 任务可以被创建、执行、记录过程、产出结果并进入验收 |
| 用户验收与反馈 | 已完成 | 用户可以对结果表示满意、要求修改或放弃 |
| 技能、工具调用与证据留存 | 已完成 | 系统会先用技能提供方法指导,再选择和调用工具,并记录执行证据 |
| 多智能体协作 | 已具备 | 复杂任务可以拆成多个子任务执行,再汇总结果 |
| 技能沉淀与复用 | 已具备 | 被认可的任务经验可以进入技能候选、草稿、审核和发布链路 |
| 长期记忆系统 | 底层已完成,待接入 | 已覆盖用户偏好、业务知识、历史任务、文件产物、工具经验和可复用流程 |
| 定时任务与主动触达 | 基础能力已具备 | 系统可以支持周期性任务和自动通知 |
| 多模型供应商适配 | 已具备 | 支持不同模型服务和后续成本/质量策略 |
## 2. 重点功能一:任务执行闭环
### 功能说明
Beaver 后端已经从普通问答升级为任务执行系统。用户不需要手动创建任务,系统会自动判断当前输入是否需要进入任务模式。
如果只是普通聊天,系统直接回答;如果用户是在交办一个需要执行、修改或验收的事情,系统会把它作为任务持续跟踪。
### 已完善的能力
- 自动识别普通聊天和任务请求
- 为复杂请求创建可追踪任务
- 保存任务目标、当前状态、执行次数和历史结果
- 支持任务继续、任务修改、新任务创建、任务关闭和任务放弃
- 任务完成后进入用户验收阶段
### 产品价值
这项能力解决的是“模型回答完就结束”的问题。
现在系统可以把用户请求当作一个有生命周期的任务处理:从识别、执行、产出,到用户反馈和后续修改,形成完整闭环。
### 可展示方式
1. 用户提出一个需要多步骤完成的任务
2. 系统自动识别为任务,而不是普通聊天
3. 系统执行任务并返回结果
4. 用户要求修改
5. 系统继续沿用原任务上下文进行修订
6. 用户确认满意后,任务进入完成状态
## 4. 重点功能二:用户验收与反馈闭环
### 功能说明
任务完成后,系统不会默认结果一定正确,而是支持用户进行明确反馈。
用户可以表达三类结果:
- 满意:结果被接受,可以作为成功经验
- 修改:结果需要继续调整
- 放弃:任务不再继续
### 已完善的能力
- 记录用户对任务结果的反馈
- 根据反馈更新任务状态
- 把修改意见作为下一轮任务执行的输入
- 把满意反馈作为后续技能学习的重要信号
- 把放弃任务保留为失败经验,避免重复问题
### 产品价值
这项能力让系统具备“交付意识”。
它不是只追求生成内容,而是把用户是否认可作为任务是否成功的标准。这对用户来说很重要,因为用户更关心结果是否可用,而不是模型是否生成了一段看起来合理的回答。
## 5. 重点功能三:技能、工具调用与过程证据留存
### 功能说明
系统已经具备“技能指导工具使用”的能力。它不是让模型随机选择工具,而是先根据任务选择合适的技能,由技能提供工作方法、注意事项和工具使用建议,再把相关工具暴露给模型执行任务。
工具可以覆盖文件、终端、网页、记忆、会话搜索、技能管理、定时任务等场景。技能负责告诉智能体“应该怎么做”,工具负责完成真实操作。
同时,系统会记录每次执行过程,包括使用了哪些工具、工具返回了什么、模型如何继续处理。
### 已完善的能力
- 按任务内容选择合适技能
- 将技能作为本轮任务的执行指导注入上下文
- 从技能中读取工具使用建议
- 按任务和技能共同决定本轮可用工具
- 向模型暴露本轮任务可调用的工具清单
- 执行模型发起的工具调用
- 保存工具调用结果
- 将工具结果继续放回任务上下文
- 记录本轮启用的技能、可用工具、工具调用和执行结果
- 形成可追溯的任务过程证据,便于复盘和后续技能学习
### 产品价值
这项能力让 Beaver 从“能说”变成“按方法做事”。
对外展示时,可以强调:系统不是单纯调用大模型生成文字,也不是把工具直接丢给模型自由发挥,而是通过技能把经验和方法注入任务执行,再由工具完成真实操作。
这让每次工具调用更像是按照一套可复用工作方法执行,而不是一次性的临场判断。
## 6. 重点功能四:多智能体协作执行
### 功能说明
对于复杂任务,系统已经具备拆分和委派能力。一个复杂任务可以先拆成多个子任务,再交给不同子智能体执行,最后由主流程汇总结果。
### 已具备的能力
- 判断任务是否需要多智能体协作
- 支持顺序执行、并行执行和依赖关系执行
- 子任务可以继承任务目标、约束和上下文
- 子任务结果会被收集并交给主流程汇总
- 子任务过程也会形成证据
### 产品价值
这项能力让系统可以处理更复杂的工作。
例如“调研一个方案、比较多个选项、审查风险、整理最终建议”这类任务,不必全部压给一个模型一次性完成,而是可以拆成多个角色协作。
## 7. 重点功能五:技能沉淀与复用
### 功能说明
系统已经具备把成功任务经验沉淀为技能的基础链路。
当一个任务被用户认可后,系统可以根据任务过程、工具使用、结果和反馈生成技能候选。候选可以进入草稿、审核和发布流程,成为后续任务可复用的能力。
### 已具备的能力
- 记录任务中使用过的技能和工具
- 根据用户满意反馈识别高价值经验
- 生成技能学习候选
- 支持技能草稿、审核和发布
- 后续任务可以根据任务内容自动选择相关技能
### 产品价值
这项能力让系统具备“越用越会做”的基础。
它不是简单保存聊天记录,而是把被验证过的工作方法沉淀下来,逐步形成企业自己的智能体技能库。
## 8. 重点功能六:长期记忆系统底层能力
### 功能说明
长期记忆系统的底层能力已经完成,目前还没有完整接入主产品链路和用户界面。
这意味着:记忆系统本身不是未来才开始做,而是已经具备底层基础。后续工作的重点是把它接入任务执行、文件资源、技能学习和管理界面。
### 已完成的记忆能力
- 用户长期偏好
- 组织业务知识
- 历史任务和结果
- 文件和任务产物
- 工具调用经验
- 成功技能和失败案例
- 可复用的工作流程
- 分层记忆加载
- 记忆与技能联动的基础
### 当前边界
已经完成的是记忆系统底层能力;还需要接入的是:
- 任务执行时自动读取相关记忆
- 用户界面展示系统记住了什么
- 记忆来源、可信度和使用记录可视化
- 用户可以确认、编辑、删除或冻结记忆
- 记忆检索轨迹进入任务详情页
### 产品价值
这项能力是 Beaver 向长期智能体演进的关键基础。
普通助手只能依赖当前对话,而 Beaver 已经具备把长期偏好、历史任务、工具经验和可复用流程沉淀为长期上下文资产的基础。
## 9. 重点功能七:定时任务与主动触达
### 功能说明
系统已经具备定时任务和主动触达的基础能力,可以支持周期性任务、自动提醒、定期报告和主动通知。
### 已具备的能力
- 创建定时任务
- 自动触发任务或通知
- 保存定时任务运行记录
- 支持用户对定时结果继续修改
- 定时任务可以进入普通任务链路
### 当前边界
定时任务能力已经具备基础,但仍需要进一步稳定化和产品化展示。
当前已发现一个需要优先修复的问题:定时任务结果回写中存在变量引用错误,可能影响任务结果记录。
### 产品价值
这项能力让 Beaver 从“用户问了才回答”进一步走向“系统主动完成周期性工作”。