feat(engine): 添加MCP连接管理和工具集成功能

- 集成MCP连接管理器，支持MCP服务器连接 - 添加多种内置工具：ClarifyTool、CronTool、DelegateTool、ExecuteCodeTool、 PatchFileTool、ProcessTool、SendMessageTool、SpawnTool、TerminalTool、 TodoTool、WebFetchTool、WebSearchTool、WriteFileTool等 - 实现工具注册和装配功能 - 添加技能选择上下文参数 - 支持思考模式控制参数thinking_enabled feat(coordinator): 重构任务执行计划器参数命名 - 将learning_candidate_enabled重命名为allow_candidate_generation - 更新TeamGraphScheduler中的参数传递 - 修改LocalAgentRunner中的相关参数处理 - 更新README文档中的相应描述 refactor(context): 标准化工具调用参数格式 - 添加_json导入用于参数序列化 - 实现_provider_tool_calls方法标准化OpenAI兼容的工具调用载荷 - 修复工具调用中参数非字符串类型的序列化问题 refactor(session): 优化消息历史记录过滤逻辑 - 修改get_messages_as_conversation为基于运行状态过滤消息 - 排除未完成、失败或错误结束的运行记录 - 改进对话历史的可见性控制机制 fix(store): 修复FTS索引重建逻辑 - 添加异常处理防止FTS索引创建失败 - 实现_rebuild_fts_index方法重新构建全文搜索索引 - 优化索引触发器和表的维护流程
2026-05-14 09:43:48 +08:00
parent 8a12c30141
commit 30ab74ffb2
149 changed files with 12293 additions and 2812 deletions
--- a/app-instance/backend/beaver/skills/learning/init.py
+++ b/app-instance/backend/beaver/skills/learning/init.py
@ -2,7 +2,12 @@

 from .evidence import EvidencePacket, EvidenceSelector
 from .eval import SkillDraftEvaluator
-from .missing_skill import MissingSkillDraftResult, MissingSkillSynthesizer
+from .missing_skill import (
+    EphemeralGuidanceResult,
+    EphemeralGuidanceSynthesizer,
+    MissingSkillDraftResult,
+    MissingSkillSynthesizer,
+)
 from .pipeline import SkillLearningPipelineService
 from .service import RunReceiptContext, SkillLearningService
 from .synthesizer import SkillDraftSynthesizer
@ -12,6 +17,8 @@ __all__ = [
    "EvidencePacket",
    "EvidenceSelector",
    "SkillDraftEvaluator",
+    "EphemeralGuidanceResult",
+    "EphemeralGuidanceSynthesizer",
    "MissingSkillDraftResult",
    "MissingSkillSynthesizer",
    "RunReceiptContext",
--- a/app-instance/backend/beaver/skills/learning/missing_skill.py
+++ b/app-instance/backend/beaver/skills/learning/missing_skill.py
@ -1,4 +1,4 @@
-"""Synthesize draft-only skills for missing sub-agent guidance."""
+"""Synthesize ephemeral guidance for missing sub-agent skills."""

 from __future__ import annotations

@ -6,11 +6,10 @@ import json
 import re
 from dataclasses import dataclass
 from typing import TYPE_CHECKING, Any
+from uuid import uuid4

 from beaver.engine.context import SkillContext
 from beaver.engine.providers import ProviderBundle
-from beaver.skills.drafts import DraftService
-from beaver.skills.specs import SkillDraft
 from beaver.skills.specs.serialization import canonical_hash

 if TYPE_CHECKING:
@ -18,13 +17,14 @@ if TYPE_CHECKING:


@dataclass(slots=True)
-class MissingSkillDraftResult:
-    draft: SkillDraft
+class EphemeralGuidanceResult:
+    guidance_id: str
+    guidance_name: str
    skill_context: SkillContext


-class MissingSkillSynthesizer:
-    """Create a draft skill and an ephemeral SkillContext for the current run."""
+class EphemeralGuidanceSynthesizer:
+    """Create one-run guidance for the current delegated sub-agent."""

    async def synthesize(
        self,
@ -37,8 +37,7 @@ class MissingSkillSynthesizer:
        skill_query: str,
        required_capabilities: list[str],
        provider_bundle: ProviderBundle,
-        draft_service: DraftService,
-    ) -> MissingSkillDraftResult:
+    ) -> EphemeralGuidanceResult:
        provider = provider_bundle.auxiliary_provider or provider_bundle.main_provider
        runtime = provider_bundle.auxiliary_runtime or provider_bundle.main_runtime
        model = getattr(runtime, "model", None)
@ -49,14 +48,14 @@ class MissingSkillSynthesizer:
                    {
                        "role": "system",
                        "content": (
-                            "You create concise Beaver skill drafts. Return only JSON with keys: "
-                            "skill_name, description, content, tags."
+                            "You create concise Beaver ephemeral guidance. Return only JSON with keys: "
+                            "guidance_name, description, content, tags."
                        ),
                    },
                    {
                        "role": "user",
                        "content": (
-                            "Create a procedural skill draft for this missing Task sub-agent guidance.\n\n"
+                            "Create procedural guidance for this missing Task sub-agent capability.\n\n"
                            f"Task goal:\n{task.goal}\n\n"
                            f"Current user request:\n{user_message}\n\n"
                            f"Node id: {node_id}\n"
@ -64,62 +63,37 @@ class MissingSkillSynthesizer:
                            f"Skill query:\n{skill_query}\n"
                            f"Required capabilities: {required_capabilities}\n\n"
                            "The content must be actionable guidance for a temporary sub-agent. "
-                            "Do not include implementation claims or publish metadata."
+                            "Do not include implementation claims, review metadata, or publish metadata."
                        ),
                    },
                ],
                tools=None,
                model=model,
-                max_tokens=1200,
+                max_tokens=4096,
                temperature=0,
            )
            payload = self._parse_payload(response.content or "") or payload
        except Exception:
            payload = payload

-        skill_name = _slug(str(payload.get("skill_name") or skill_query or node_id))
+        guidance_name = _slug(str(payload.get("guidance_name") or payload.get("skill_name") or skill_query or node_id))
+        guidance_id = f"eg_{uuid4().hex}"
        content = str(payload.get("content") or "").strip()
        if not content:
            content = str(self._fallback_payload(skill_query=skill_query, node_task=node_task, capabilities=required_capabilities)["content"])
-        frontmatter = {
-            "description": str(payload.get("description") or f"Draft guidance for {skill_query or node_id}").strip(),
-            "tags": [str(item) for item in payload.get("tags") or ["generated", "task-sub-agent"]],
-            "metadata": {
-                "origin": "missing_task_subagent_skill",
-                "task_id": task.task_id,
-                "node_id": node_id,
-                "attempt_index": attempt_index,
-                "skill_query": skill_query,
-                "required_capabilities": list(required_capabilities),
-            },
-        }
-        draft = draft_service.create_new_skill_draft(
-            skill_name=skill_name,
-            proposed_content=content,
-            proposed_frontmatter=frontmatter,
-            created_by="task-skill-resolver",
-            reason="generated_for_missing_task_subagent_skill",
-            trigger_session_id=task.session_id,
-            evidence_refs=[
-                {
-                    "task_id": task.task_id,
-                    "session_id": task.session_id,
-                    "attempt_index": attempt_index,
-                    "node_id": node_id,
-                    "skill_query": skill_query,
-                    "required_capabilities": list(required_capabilities),
-                }
-            ],
-        )
        context = SkillContext(
-            name=f"draft:{draft.skill_name}",
-            content=draft.proposed_content,
-            version=f"draft:{draft.draft_id}",
-            content_hash=canonical_hash(draft.proposed_content),
-            activation_reason="generated_missing_skill",
+            name=f"ephemeral:{guidance_name}",
+            content=content,
+            version=f"ephemeral:{guidance_id}",
+            content_hash=canonical_hash(content),
+            activation_reason="ephemeral_guidance",
            tool_hints=[],
        )
-        return MissingSkillDraftResult(draft=draft, skill_context=context)
+        return EphemeralGuidanceResult(
+            guidance_id=guidance_id,
+            guidance_name=guidance_name,
+            skill_context=context,
+        )

    @staticmethod
    def _parse_payload(text: str) -> dict[str, Any] | None:
@ -145,7 +119,7 @@ class MissingSkillSynthesizer:
        title = skill_query or node_task or "task subagent guidance"
        capability_lines = "\n".join(f"- {item}" for item in capabilities) or "- Follow the node task precisely."
        return {
-            "skill_name": _slug(title),
+            "guidance_name": _slug(title),
            "description": f"Draft guidance for {title}.",
            "tags": ["generated", "task-sub-agent"],
            "content": (
@ -163,4 +137,8 @@ class MissingSkillSynthesizer:

 def _slug(value: str) -> str:
    cleaned = re.sub(r"[^a-zA-Z0-9]+", "-", value.strip().lower()).strip("-")
-    return cleaned[:64].strip("-") or "generated-task-subagent-skill"
+    return cleaned[:64].strip("-") or "generated-task-subagent-guidance"
+
+
+MissingSkillDraftResult = EphemeralGuidanceResult
+MissingSkillSynthesizer = EphemeralGuidanceSynthesizer
--- a/app-instance/backend/beaver/skills/learning/pipeline.py
+++ b/app-instance/backend/beaver/skills/learning/pipeline.py
@ -14,6 +14,12 @@ from beaver.skills.publisher import SkillPublisher
 from beaver.skills.reviews import ReviewService
 from beaver.skills.specs import SkillDraft, SkillReviewRecord, SkillReviewState, SkillSpec, SkillVersion

+_REJECTABLE_DRAFT_STATUSES = {
+    SkillReviewState.DRAFT.value,
+    SkillReviewState.IN_REVIEW.value,
+    SkillReviewState.APPROVED.value,
+}
+

 class SkillLearningPipelineService:
    """Coordinates candidate -> draft -> review -> publish lifecycle."""
@ -161,6 +167,9 @@ class SkillLearningPipelineService:
        requested_by: str = "system",
        notes: str = "",
    ) -> SkillReviewRecord:
+        draft = self.get_draft(skill_name, draft_id)
+        if draft.status != SkillReviewState.DRAFT.value:
+            raise ValueError("Draft must be in draft status before review submission")
        safety = self.get_safety_report(skill_name, draft_id)
        if safety is not None and (not safety.passed or safety.risk_level == "critical"):
            raise ValueError("Draft cannot enter review because safety check failed")
@ -179,6 +188,12 @@ class SkillLearningPipelineService:
        reviewer: str = "system",
        notes: str = "",
    ) -> SkillReviewRecord:
+        draft = self.get_draft(skill_name, draft_id)
+        if draft.status != SkillReviewState.IN_REVIEW.value:
+            raise ValueError("Draft must be in review before approval")
+        safety = self.get_safety_report(skill_name, draft_id)
+        if safety is not None and (not safety.passed or safety.risk_level == "critical"):
+            raise ValueError("Draft cannot be approved because safety check failed")
        review = self.review_service.approve(skill_name, draft_id, reviewer=reviewer, notes=notes)
        self._mark_candidate_by_draft(skill_name, draft_id, "approved", "approved")
        return review
@ -191,6 +206,9 @@ class SkillLearningPipelineService:
        reviewer: str = "system",
        notes: str = "",
    ) -> SkillReviewRecord:
+        draft = self.get_draft(skill_name, draft_id)
+        if draft.status not in _REJECTABLE_DRAFT_STATUSES:
+            raise ValueError("Draft is not rejectable from its current status")
        review = self.review_service.reject(skill_name, draft_id, reviewer=reviewer, notes=notes)
        self._mark_candidate_by_draft(skill_name, draft_id, "rejected", "rejected")
        return review
--- a/app-instance/backend/beaver/skills/learning/service.py
+++ b/app-instance/backend/beaver/skills/learning/service.py
@ -69,6 +69,94 @@ class SkillLearningService:
                existing_ids.add(candidate.candidate_id)
        return candidates

+    def build_learning_candidates_for_task(self, task_id: str, *, trigger_run_id: str) -> list[SkillLearningCandidate]:
+        """Build candidates scoped to a single validated and satisfied Task run."""
+
+        runs = [record for record in self.run_store.list_runs() if record.task_id == task_id]
+        trigger_run = next((record for record in runs if record.run_id == trigger_run_id), None)
+        if trigger_run is None or not self._is_confirmed_positive_run(trigger_run):
+            return []
+
+        source_runs = [record for record in runs if self._is_confirmed_positive_run(record)]
+        if not source_runs:
+            return []
+
+        candidates: list[SkillLearningCandidate] = []
+        published_receipts = [
+            receipt
+            for record in source_runs
+            for receipt in record.activated_skills
+            if self._is_published_skill_receipt(receipt)
+        ]
+        source_run_ids = [record.run_id for record in source_runs]
+        source_session_ids = list(dict.fromkeys(record.session_id for record in source_runs))
+
+        if not published_receipts:
+            candidates.append(
+                SkillLearningCandidate(
+                    candidate_id=f"new:task:{task_id}",
+                    kind="new_skill",
+                    source_run_ids=source_run_ids,
+                    source_session_ids=source_session_ids,
+                    related_skill_names=[],
+                    reason=f"Task {task_id} completed successfully without a published skill; consider extracting reusable guidance.",
+                    evidence={"task_id": task_id, "trigger_run_id": trigger_run_id, "theme": self._task_theme(trigger_run.task_text)},
+                    status="open",
+                    priority=1,
+                    confidence=0.8,
+                    trigger_reason="validation_accepted_and_user_satisfied",
+                )
+            )
+        else:
+            seen: set[tuple[str, str]] = set()
+            for receipt in published_receipts:
+                key = (receipt.skill_name, receipt.skill_version)
+                if key in seen:
+                    continue
+                seen.add(key)
+                skill_runs = [
+                    record
+                    for record in source_runs
+                    if any(
+                        item.skill_name == receipt.skill_name
+                        and item.skill_version == receipt.skill_version
+                        and self._is_published_skill_receipt(item)
+                        for item in record.activated_skills
+                    )
+                ]
+                candidates.append(
+                    SkillLearningCandidate(
+                        candidate_id=f"revise:{receipt.skill_name}:{receipt.skill_version}:task:{task_id}",
+                        kind="revise_skill",
+                        source_run_ids=[record.run_id for record in skill_runs],
+                        source_session_ids=list(dict.fromkeys(record.session_id for record in skill_runs)),
+                        related_skill_names=[receipt.skill_name],
+                        reason=(
+                            f"Task {task_id} succeeded with published skill "
+                            f"{receipt.skill_name}/{receipt.skill_version}; consider whether the skill should capture this evidence."
+                        ),
+                        evidence={
+                            "task_id": task_id,
+                            "trigger_run_id": trigger_run_id,
+                            "skill_version": receipt.skill_version,
+                        },
+                        status="open",
+                        priority=1,
+                        confidence=0.7,
+                        trigger_reason="validation_accepted_and_user_satisfied",
+                    )
+                )
+
+        existing_ids = {item.candidate_id for item in self.learning_store.list_learning_candidates()}
+        created: list[SkillLearningCandidate] = []
+        for candidate in candidates:
+            if candidate.candidate_id in existing_ids:
+                continue
+            self.learning_store.record_learning_candidate(candidate)
+            existing_ids.add(candidate.candidate_id)
+            created.append(candidate)
+        return created
+
    async def synthesize_draft(self, candidate_id: str, provider_bundle: ProviderBundle) -> Any:
        candidates = {item.candidate_id: item for item in self.learning_store.list_learning_candidates()}
        candidate = candidates.get(candidate_id)
@ -181,7 +269,7 @@ class SkillLearningService:
            groups.setdefault(key, []).append(record)
        candidates: list[SkillLearningCandidate] = []
        for theme, runs in groups.items():
-            successful = [record for record in runs if record.success]
+            successful = [record for record in runs if self._is_confirmed_positive_run(record)]
            if len(successful) < 2:
                continue
            if any(record.activated_skills for record in successful):
@ -202,6 +290,8 @@ class SkillLearningService:
    def _build_merge_candidates(self) -> list[SkillLearningCandidate]:
        pair_counts: dict[tuple[str, str], list[RunRecord]] = {}
        for record in self.run_store.list_runs():
+            if not self._is_confirmed_positive_run(record):
+                continue
            unique = sorted({receipt.skill_name for receipt in record.activated_skills})
            for pair in combinations(unique, 2):
                pair_counts.setdefault(pair, []).append(record)
@ -260,6 +350,25 @@ class SkillLearningService:
                effects.extend(self.run_store.list_skill_effects(receipt.skill_name, version=receipt.skill_version))
        return effects

+    @staticmethod
+    def _is_confirmed_positive_run(record: RunRecord) -> bool:
+        validation = record.validation_result or {}
+        feedback = record.feedback or {}
+        return (
+            bool(record.success)
+            and bool(record.task_id)
+            and validation.get("accepted") is True
+            and feedback.get("feedback_type") == "satisfied"
+        )
+
+    @staticmethod
+    def _is_published_skill_receipt(receipt: SkillActivationReceipt) -> bool:
+        return (
+            not receipt.skill_name.startswith(("draft:", "ephemeral:"))
+            and not receipt.skill_version.startswith(("draft:", "ephemeral:"))
+            and receipt.activation_reason not in {"generated_missing_skill", "ephemeral_guidance"}
+        )
+
    @staticmethod
    def _candidate_id(kind: str, *parts: str) -> str:
        return f"{kind}:{'|'.join(parts)}"
--- a/app-instance/backend/beaver/skills/learning/synthesizer.py
+++ b/app-instance/backend/beaver/skills/learning/synthesizer.py
@ -60,7 +60,7 @@ class SkillDraftSynthesizer:
            ],
            tools=None,
            model=model,
-            max_tokens=1500,
+            max_tokens=4096,
            temperature=0,
        )
        payload = self._parse_payload(response.content or "")