feat(skill-learning): merge plugin skill updates

2026-06-16 11:55:55 +08:00
parent c9e6c37b5c
commit a34b1219bc
15 changed files with 860 additions and 5 deletions
--- a/app-instance/backend/beaver/memory/skills/store.py
+++ b/app-instance/backend/beaver/memory/skills/store.py
@ -33,7 +33,17 @@ class SkillLearningStore:
        self.eval_reports_dir = self.root / "eval-reports"
    def record_learning_candidate(self, candidate: SkillLearningCandidate) -> None:
-        self.record_learning_candidate_if_absent(candidate)
+        normalized = SkillLearningCandidate.from_dict(candidate.to_dict())
        self._append_jsonl(self.candidates_path, normalized.to_dict())
        self.append_audit_event(
            normalized.candidate_id,
            "candidate_created",
            {
                "kind": normalized.kind,
                "status": normalized.status,
                "reason": normalized.reason,
            },
        )
    def record_learning_candidate_if_absent(
        self,
--- a/app-instance/backend/beaver/plugins/init.py
+++ b/app-instance/backend/beaver/plugins/init.py
@ -13,7 +13,6 @@ from .models import (
    PluginState,
 )
 from .state import PluginStateStore
 from .skills import PluginManager
 __all__ = [
    "PluginDiscoveryError",
@ -25,7 +24,6 @@ __all__ = [
    "PluginSkillTreeDigest",
    "PluginState",
    "PluginStateStore",
    "PluginManager",
    "hash_plugin_skill_tree",
    "load_plugin_manifest",
 ]
--- a/app-instance/backend/beaver/plugins/skills.py
+++ b/app-instance/backend/beaver/plugins/skills.py
@ -109,6 +109,77 @@ class PluginManager:
                results[state.plugin_id] = self._sync_plugin(state, manifest)
        return results
    def pause(self, plugin_id: str) -> PluginState:
        with self.write_lock.acquire(timeout_seconds=10):
            state = self._require_state(plugin_id)
            state.updates_paused = True
            self.state_store.upsert_plugin(state)
            return state
    def resume(self, plugin_id: str) -> PluginState:
        with self.write_lock.acquire(timeout_seconds=10):
            state = self._require_state(plugin_id)
            state.updates_paused = False
            self.state_store.upsert_plugin(state)
        return self.sync_enabled().get(plugin_id) or self._require_state(plugin_id)
    def disable(self, plugin_id: str, *, disable_linked_skills: bool) -> PluginState:
        if not disable_linked_skills:
            raise ValueError("disable_linked_skills confirmation is required")
        with self.write_lock.acquire(timeout_seconds=10):
            state = self._require_state(plugin_id)
            for skill_name in list(state.skills):
                self.publisher.disable(skill_name, actor="plugin-manager", reason=f"plugin_disabled:{plugin_id}")
                state.skills[skill_name].status = "disabled"
            state.enabled = False
            state.updates_paused = True
            state.status = "disabled"
            self.state_store.upsert_plugin(state)
            return state
    def adopt(self, plugin_id: str, skill_name: str) -> SkillSpec:
        with self.write_lock.acquire(timeout_seconds=10):
            state = self._require_state(plugin_id)
            if skill_name not in state.skills:
                raise ValueError(f"Plugin skill binding not found: {plugin_id}/{skill_name}")
            spec = self.skill_store.get_skill_spec(skill_name)
            if spec is None:
                raise ValueError(f"Skill spec not found: {skill_name}")
            spec.source_kind = "managed"
            spec.status = SkillStatus.ACTIVE.value
            spec.updated_at = _utc_now()
            marker = f"adopted_from_plugin:{plugin_id}"
            if marker not in spec.lineage:
                spec.lineage.append(marker)
            self.skill_store.write_skill_spec(spec)
            del state.skills[skill_name]
            if not state.skills:
                state.status = "adopted"
                state.enabled = False
            self.state_store.upsert_plugin(state)
            self.publisher._refresh_indexes(skill_name, spec.status)
            return spec
    def on_skill_published(self, draft: SkillDraft, published: SkillVersion | SkillSpec) -> None:
        if draft.proposal_kind != "plugin_skill_update" or not isinstance(published, SkillVersion):
            return
        plugin_id = str(draft.provenance.get("plugin_id") or "")
        skill_name = str(draft.provenance.get("skill_name") or draft.skill_name)
        tree_hash = str(draft.provenance.get("new_upstream_tree_hash") or "")
        if not plugin_id or not skill_name or not tree_hash:
            raise ValueError("Plugin publish acknowledgement is missing provenance")
        state = self._require_state(plugin_id)
        binding = state.skills.get(skill_name) or PluginSkillBinding()
        binding.accepted_upstream_tree_hash = tree_hash
        binding.observed_upstream_tree_hash = tree_hash
        binding.accepted_beaver_version = published.version
        binding.current_beaver_version = published.version
        binding.pending_candidate_id = None
        binding.status = "synced"
        state.skills[skill_name] = binding
        state.status = "synced"
        self.state_store.upsert_plugin(state)
    def _prepare_initial_mirror(
        self,
        manifest: PluginManifest,
@ -174,6 +245,12 @@ class PluginManager:
            )
        return prepared
    def _require_state(self, plugin_id: str) -> PluginState:
        state = self.state_store.get_plugin(plugin_id)
        if state is None:
            raise ValueError(f"Unknown plugin state: {plugin_id}")
        return state
    def _sync_plugin(self, state: PluginState, manifest: PluginManifest) -> PluginState:
        transaction = PluginSkillTransaction(self.workspace)
        try:
--- a/app-instance/backend/beaver/plugins/tree_merge.py
+++ b/app-instance/backend/beaver/plugins/tree_merge.py
@ -0,0 +1,65 @@
 """Deterministic path-level three-way merge for plugin supporting files."""
 from __future__ import annotations
 from dataclasses import dataclass, field
 from typing import Any
@dataclass(frozen=True, slots=True)
 class SupportingFileDecision:
    path: str
    source: str
    def to_dict(self) -> dict[str, Any]:
        return {"path": self.path, "source": self.source}
@dataclass(frozen=True, slots=True)
 class SupportingFileConflict:
    path: str
    reason: str
    def to_dict(self) -> dict[str, Any]:
        return {"path": self.path, "reason": self.reason}
@dataclass(frozen=True, slots=True)
 class SupportingFileMergePlan:
    files: dict[str, SupportingFileDecision] = field(default_factory=dict)
    conflicts: list[SupportingFileConflict] = field(default_factory=list)
    def to_dict(self) -> dict[str, Any]:
        return {
            "files": {path: decision.to_dict() for path, decision in sorted(self.files.items())},
            "conflicts": [conflict.to_dict() for conflict in self.conflicts],
        }
 def merge_supporting_file_trees(
    *,
    base: dict[str, Any],
    local: dict[str, Any],
    upstream: dict[str, Any],
 ) -> SupportingFileMergePlan:
    decisions: dict[str, SupportingFileDecision] = {}
    conflicts: list[SupportingFileConflict] = []
    for path in sorted({*base.keys(), *local.keys(), *upstream.keys()} - {"SKILL.md"}):
        b = base.get(path)
        l = local.get(path)
        u = upstream.get(path)
        if l == u and l is not None:
            decisions[path] = SupportingFileDecision(path=path, source="local")
        elif l == b and u is not None:
            decisions[path] = SupportingFileDecision(path=path, source="upstream")
        elif u == b and l is not None:
            decisions[path] = SupportingFileDecision(path=path, source="local")
        elif b is None and l is None and u is not None:
            decisions[path] = SupportingFileDecision(path=path, source="upstream")
        elif b is None and u is None and l is not None:
            decisions[path] = SupportingFileDecision(path=path, source="local")
        elif b is not None and l is None and u is None:
            continue
        else:
            conflicts.append(SupportingFileConflict(path=path, reason="divergent supporting-file change"))
    return SupportingFileMergePlan(files=decisions, conflicts=conflicts)
--- a/app-instance/backend/beaver/skills/drafts/service.py
+++ b/app-instance/backend/beaver/skills/drafts/service.py
@ -94,6 +94,34 @@ class DraftService:
        self.store.write_draft(draft)
        return draft
    def create_plugin_update_draft(
        self,
        *,
        skill_name: str,
        base_version: str,
        proposed_content: str,
        proposed_frontmatter: dict,
        created_by: str,
        reason: str,
        provenance: dict,
        evidence_refs: list[dict] | None = None,
    ) -> SkillDraft:
        draft = SkillDraft(
            draft_id=uuid4().hex,
            skill_name=skill_name,
            base_version=base_version,
            proposed_content=proposed_content,
            proposed_frontmatter=dict(proposed_frontmatter),
            created_at=_utc_now(),
            created_by=created_by,
            reason=reason,
            evidence_refs=list(evidence_refs or []),
            proposal_kind="plugin_skill_update",
            provenance=dict(provenance),
        )
        self.store.write_draft(draft)
        return draft
    def create_retire_proposal(
        self,
        *,
--- a/app-instance/backend/beaver/skills/learning/pipeline.py
+++ b/app-instance/backend/beaver/skills/learning/pipeline.py
@ -35,6 +35,7 @@ class SkillLearningPipelineService:
        publisher: SkillPublisher,
        safety_checker: SkillDraftSafetyChecker | None = None,
        evaluator: SkillDraftEvaluator | None = None,
        publish_observer: Callable[[SkillDraft, SkillVersion | SkillSpec], None] | None = None,
    ) -> None:
        self.learning_store = learning_store
        self.learning_service = learning_service
@ -43,6 +44,7 @@ class SkillLearningPipelineService:
        self.publisher = publisher
        self.safety_checker = safety_checker or SkillDraftSafetyChecker()
        self.evaluator = evaluator
        self.publish_observer = publish_observer
    def list_candidates(self, status: str | None = None) -> list[SkillLearningCandidate]:
        return self.learning_store.list_learning_candidates(status=status)
@ -238,6 +240,16 @@ class SkillLearningPipelineService:
        else:
            result = self.publisher.publish(skill_name, draft_id, publisher=publisher, notes=notes)
        self._mark_candidate_by_draft(skill_name, draft_id, "published", "published")
        if self.publish_observer is not None:
            try:
                self.publish_observer(draft, result)
            except Exception as exc:  # noqa: BLE001 - observer is best effort after successful publish.
                candidate = self._candidate_by_draft(skill_name, draft_id)
                self.learning_store.append_audit_event(
                    candidate.candidate_id if candidate is not None else f"draft:{draft_id}",
                    "plugin_publish_ack_failed",
                    {"error": str(exc), "skill_name": skill_name, "draft_id": draft_id},
                )
        return result
    def rollback(
@ -391,6 +403,14 @@ class SkillLearningPipelineService:
            preservation = eval_report.preservation_report or {}
            if preservation.get("passed") is False:
                raise ValueError("Draft preservation check did not pass")
            if draft.proposal_kind == "plugin_skill_update":
                if draft.provenance.get("merge_mode") == "three_way" and preservation.get("mode") != "plugin_three_way":
                    raise ValueError("Plugin update requires a three-way preservation report")
                if preservation.get("unresolved_conflicts"):
                    raise ValueError("Plugin update has unresolved merge conflicts")
                supporting_plan = draft.provenance.get("supporting_file_plan")
                if isinstance(supporting_plan, dict) and supporting_plan.get("conflicts"):
                    raise ValueError("Plugin update has unresolved supporting-file conflicts")
    def _mark_candidate_by_draft(
        self,
--- a/app-instance/backend/beaver/skills/learning/preservation.py
+++ b/app-instance/backend/beaver/skills/learning/preservation.py
@ -32,6 +32,30 @@ def check_preservation(*, base_content: str, draft_content: str) -> dict[str, An
    }
 def check_plugin_merge_preservation(
    *,
    local_content: str,
    upstream_content: str,
    draft_content: str,
    merge_decisions: dict[str, Any],
 ) -> dict[str, Any]:
    local = check_preservation(base_content=local_content, draft_content=draft_content)
    upstream = check_preservation(base_content=upstream_content, draft_content=draft_content)
    unresolved = [str(item) for item in merge_decisions.get("unresolved_conflicts") or []]
    safety_sections_missing = _important_sections_missing(upstream, local)
    passed = bool(local.get("passed")) and bool(upstream.get("passed")) and not unresolved and not safety_sections_missing
    return {
        "mode": "plugin_three_way",
        "passed": passed,
        "risk_level": "high" if not passed else "low",
        "local": local,
        "upstream": upstream,
        "unresolved_conflicts": unresolved,
        "safety_sections_missing": safety_sections_missing,
        "resolved_conflicts": [str(item) for item in merge_decisions.get("resolved_conflicts") or []],
    }
 def _sections(content: str) -> dict[str, str]:
    current = "body"
    sections: dict[str, list[str]] = {current: []}
@ -51,3 +75,13 @@ def _sections(content: str) -> dict[str, str]:
 def _normalize(value: str) -> str:
    return re.sub(r"\s+", " ", value or "").strip().lower()
 def _important_sections_missing(*reports: dict[str, Any]) -> list[str]:
    important = {"safety", "required tools", "required tool", "tools"}
    missing: list[str] = []
    for report in reports:
        for section in report.get("dropped_sections") or []:
            if str(section).strip().lower() in important and str(section) not in missing:
                missing.append(str(section))
    return missing
--- a/app-instance/backend/beaver/skills/learning/service.py
+++ b/app-instance/backend/beaver/skills/learning/service.py
@ -5,6 +5,7 @@ from __future__ import annotations
 from dataclasses import dataclass, field
 from datetime import datetime, timedelta, timezone
 from itertools import combinations
 from pathlib import Path
 import re
 from typing import Any
 from uuid import uuid4
@ -14,9 +15,12 @@ from beaver.memory.runs.models import RunRecord, SkillEffectRecord
 from beaver.memory.runs.store import RunMemoryStore
 from beaver.memory.skills.models import SkillLearningCandidate, SkillPerformanceSnapshot
 from beaver.memory.skills.store import SkillLearningStore
 from beaver.plugins.hashing import hash_plugin_skill_tree
 from beaver.plugins.tree_merge import merge_supporting_file_trees
 from beaver.skills.drafts.service import DraftService
 from beaver.skills.learning.evidence import EvidencePacket, EvidenceSelector
 from beaver.skills.learning.synthesizer import SkillDraftSynthesizer
 from beaver.skills.catalog.utils import parse_frontmatter
 from beaver.skills.specs import SkillActivationReceipt
@ -179,6 +183,8 @@ class SkillLearningService:
        candidate = candidates.get(candidate_id)
        if candidate is None:
            raise ValueError(f"Unknown learning candidate: {candidate_id}")
        if candidate.kind == "plugin_skill_update":
            return await self._synthesize_plugin_update(candidate, provider_bundle)
        if candidate.kind == "retire_skill":
            target_skill = candidate.related_skill_names[0]
            return self.draft_service.create_retire_proposal(
@ -242,6 +248,85 @@ class SkillLearningService:
            evidence_refs=[{"run_id": item} for item in candidate.source_run_ids],
        )
    async def _synthesize_plugin_update(self, candidate: SkillLearningCandidate, provider_bundle: ProviderBundle) -> Any:
        evidence = dict(candidate.evidence)
        skill_name = str(evidence.get("skill_name") or (candidate.related_skill_names[0] if candidate.related_skill_names else ""))
        plugin_id = str(evidence.get("plugin_id") or "")
        new_upstream_tree_hash = str(evidence.get("new_upstream_tree_hash") or "")
        local_version = str(evidence.get("local_version") or "")
        merge_mode = str(evidence.get("merge_mode") or "")
        if not skill_name or not plugin_id or not new_upstream_tree_hash or not local_version:
            raise ValueError("Plugin update candidate is missing required evidence references")
        new_upstream = self.draft_service.store.read_upstream_snapshot(
            skill_name,
            plugin_id,
            new_upstream_tree_hash,
        )
        if new_upstream is None:
            raise ValueError("Plugin update references a missing upstream snapshot")
        frontmatter, body = parse_frontmatter(new_upstream.content)
        if merge_mode == "fast_forward":
            return self.draft_service.create_plugin_update_draft(
                skill_name=skill_name,
                base_version=local_version,
                proposed_content=body.strip(),
                proposed_frontmatter=frontmatter,
                created_by="learning-loop",
                reason=candidate.reason,
                provenance={
                    **evidence,
                    "proposal_kind": "plugin_skill_update",
                },
                evidence_refs=[],
            )
        base_upstream_tree_hash = str(evidence.get("base_upstream_tree_hash") or "")
        old_upstream = self.draft_service.store.read_upstream_snapshot(skill_name, plugin_id, base_upstream_tree_hash)
        current_local = self.draft_service.store.read_published_skill(skill_name, local_version)
        if old_upstream is None:
            raise ValueError("Plugin update references a missing base upstream snapshot")
        if current_local is None:
            raise ValueError("Plugin update references a missing local skill version")
        packet = self.evidence_selector.build_evidence_packet(candidate.source_run_ids, candidate.source_session_ids)
        provider = provider_bundle.auxiliary_provider or provider_bundle.main_provider
        model = (
            provider_bundle.auxiliary_runtime.model
            if provider_bundle.auxiliary_runtime is not None
            else provider_bundle.main_runtime.model
        )
        local_root = self.draft_service.store.root / skill_name / "versions" / local_version
        file_plan = merge_supporting_file_trees(
            base=_digest_map(old_upstream.root),
            local=_digest_map(local_root),
            upstream=_digest_map(new_upstream.root),
        )
        payload = await self.synthesizer.synthesize_plugin_update(
            candidate,
            packet,
            provider,
            model,
            old_upstream={"content": old_upstream.content, "frontmatter": old_upstream.snapshot.frontmatter},
            current_local={"content": current_local.content, "frontmatter": current_local.version.frontmatter},
            new_upstream={"content": new_upstream.content, "frontmatter": frontmatter},
        )
        return self.draft_service.create_plugin_update_draft(
            skill_name=skill_name,
            base_version=local_version,
            proposed_content=payload["content"],
            proposed_frontmatter=payload["frontmatter"],
            created_by="learning-loop",
            reason=payload["change_reason"] or candidate.reason,
            provenance={
                **evidence,
                "proposal_kind": "plugin_skill_update",
                "preserved_local_sections": payload.get("preserved_local_sections", []),
                "adopted_upstream_sections": payload.get("adopted_upstream_sections", []),
                "resolved_conflicts": payload.get("resolved_conflicts", []),
                "dropped_sections": payload.get("dropped_sections", []),
                "supporting_file_plan": file_plan.to_dict(),
            },
            evidence_refs=[],
        )
    def _base_skill_snapshot(self, skill_name: str, version: str | None) -> dict[str, Any] | None:
        loaded = self.draft_service.store.read_published_skill(skill_name, version)
        if loaded is None:
@ -515,3 +600,16 @@ class SkillLearningService:
        if parsed.tzinfo is None:
            return parsed.replace(tzinfo=timezone.utc)
        return parsed.astimezone(timezone.utc)
 def _digest_map(root: Path) -> dict[str, dict[str, Any]]:
    digest = hash_plugin_skill_tree(root)
    return {
        item.path: {
            "content_hash": item.content_hash,
            "executable": item.executable,
            "size": item.size,
        }
        for item in digest.files
        if item.path not in {"SKILL.md", "version.json", "upstream.json"}
    }
--- a/app-instance/backend/beaver/skills/learning/synthesizer.py
+++ b/app-instance/backend/beaver/skills/learning/synthesizer.py
@ -41,6 +41,55 @@ class SkillDraftSynthesizer:
    ) -> dict[str, Any]:
        return await self._synthesize(candidate, evidence_packet, provider, model, "merge", base_skill=base_skill)
    async def synthesize_plugin_update(
        self,
        candidate: SkillLearningCandidate,
        evidence_packet: EvidencePacket,
        provider: LLMProvider,
        model: str,
        *,
        old_upstream: dict[str, Any],
        current_local: dict[str, Any],
        new_upstream: dict[str, Any],
    ) -> dict[str, Any]:
        prompt = self._build_plugin_update_prompt(
            candidate,
            evidence_packet,
            old_upstream=old_upstream,
            current_local=current_local,
            new_upstream=new_upstream,
        )
        response = await provider.chat(
            messages=[
                {
                    "role": "system",
                    "content": (
                        "You merge Beaver plugin skill updates. Return JSON only with keys: "
                        "frontmatter, content, change_reason, preserved_local_sections, "
                        "adopted_upstream_sections, resolved_conflicts, dropped_sections. "
                        "Preserve valid local learning, adopt upstream fixes and safety changes, "
                        "do not concatenate duplicate sections, and list every intentional drop."
                    ),
                },
                {"role": "user", "content": prompt},
            ],
            tools=None,
            model=model,
            max_tokens=4096,
            temperature=0,
        )
        payload = self._parse_plugin_update_payload(response.content or "")
        if payload:
            return payload
        fallback = self._fallback_payload(candidate, evidence_packet, "plugin_update")
        return {
            **fallback,
            "preserved_local_sections": [],
            "adopted_upstream_sections": [],
            "resolved_conflicts": [],
            "dropped_sections": [],
        }
    async def _synthesize(
        self,
        candidate: SkillLearningCandidate,
@ -119,6 +168,28 @@ class SkillDraftSynthesizer:
            + "\nThe JSON may include preserved_sections, changed_sections, and dropped_sections arrays."
        )
    @staticmethod
    def _build_plugin_update_prompt(
        candidate: SkillLearningCandidate,
        evidence_packet: EvidencePacket,
        *,
        old_upstream: dict[str, Any],
        current_local: dict[str, Any],
        new_upstream: dict[str, Any],
    ) -> str:
        return (
            f"Candidate kind: {candidate.kind}\n"
            f"Reason: {candidate.reason}\n"
            f"Task summaries:\n- " + "\n- ".join(evidence_packet.task_summaries or ["No historical run evidence."])
            + "\n\nOLD UPSTREAM (merge base B):\n"
            + str(old_upstream.get("content") or "")
            + "\n\nCURRENT LOCAL (Beaver learned version L):\n"
            + str(current_local.get("content") or "")
            + "\n\nNEW UPSTREAM (plugin update U):\n"
            + str(new_upstream.get("content") or "")
            + "\n\nReturn JSON only. Preserve useful CURRENT LOCAL learning and adopt important NEW UPSTREAM changes."
        )
    @staticmethod
    def _parse_payload(content: str) -> dict[str, Any]:
        cleaned = content.strip()
@ -145,6 +216,33 @@ class SkillDraftSynthesizer:
            "dropped_sections": _coerce_string_list(payload.get("dropped_sections")),
        }
    @staticmethod
    def _parse_plugin_update_payload(content: str) -> dict[str, Any]:
        cleaned = content.strip()
        if cleaned.startswith("```"):
            lines = cleaned.splitlines()
            if len(lines) >= 3 and lines[0].startswith("```") and lines[-1].startswith("```"):
                cleaned = "\n".join(lines[1:-1]).strip()
        try:
            payload = json.loads(cleaned)
        except json.JSONDecodeError:
            return {}
        if not isinstance(payload, dict):
            return {}
        frontmatter = payload.get("frontmatter")
        content_value = payload.get("content")
        if not isinstance(frontmatter, dict) or not isinstance(content_value, str):
            return {}
        return {
            "frontmatter": frontmatter,
            "content": content_value.strip(),
            "change_reason": str(payload.get("change_reason") or ""),
            "preserved_local_sections": _coerce_string_list(payload.get("preserved_local_sections")),
            "adopted_upstream_sections": _coerce_string_list(payload.get("adopted_upstream_sections")),
            "resolved_conflicts": _coerce_string_list(payload.get("resolved_conflicts")),
            "dropped_sections": _coerce_string_list(payload.get("dropped_sections")),
        }
    @staticmethod
    def _normalize_payload(payload: dict[str, Any], evidence_packet: EvidencePacket) -> dict[str, Any]:
        frontmatter = normalize_skill_frontmatter(
--- a/app-instance/backend/beaver/skills/publisher/service.py
+++ b/app-instance/backend/beaver/skills/publisher/service.py
@ -8,6 +8,7 @@ from pathlib import Path
 from beaver.skills.catalog.utils import strip_frontmatter
 from beaver.skills.specs import SkillDraft, SkillReviewState, SkillSpec, SkillSpecStore, SkillStatus, SkillVersion
 from beaver.skills.specs.serialization import canonical_hash, normalize_frontmatter, summarize_skill_content
 from beaver.plugins.hashing import hash_plugin_skill_tree
 class SkillPublisher:
@ -40,6 +41,7 @@ class SkillPublisher:
            summary=summarize_skill_content(body),
            tool_hints=self.store._extract_tool_hints(normalize_frontmatter(draft.proposed_frontmatter)),
            provenance={
                **dict(draft.provenance),
                "draft_id": draft_id,
                "proposal_kind": draft.proposal_kind,
                "trigger_run_id": draft.trigger_run_id,
@ -47,6 +49,12 @@ class SkillPublisher:
            },
        )
        self.store.write_skill_version(version, content)
        if draft.proposal_kind == "plugin_skill_update":
            self._copy_plugin_update_supporting_files(draft, next_version)
            version_dir = self.store.root / draft.skill_name / "versions" / next_version
            version.tree_hash = hash_plugin_skill_tree(version_dir).skill_tree_hash
            self.store._write_json(version_dir / "version.json", version.to_dict())
        else:
            self._copy_uploaded_supporting_files(draft, next_version)
        self.store.set_current_version(skill_name, next_version)
@ -194,6 +202,25 @@ class SkillPublisher:
                target.parent.mkdir(parents=True, exist_ok=True)
                shutil.copyfile(source, target)
    def _copy_plugin_update_supporting_files(self, draft: SkillDraft, version: str) -> None:
        plugin_id = str(draft.provenance.get("plugin_id") or "")
        tree_hash = str(draft.provenance.get("new_upstream_tree_hash") or "")
        if not plugin_id or not tree_hash:
            raise ValueError("Plugin update draft is missing upstream provenance")
        upstream = self.store.read_upstream_snapshot(draft.skill_name, plugin_id, tree_hash)
        if upstream is None:
            raise ValueError("Plugin update upstream snapshot is missing")
        target_root = self.store.root / draft.skill_name / "versions" / version
        for source in sorted(upstream.root.rglob("*"), key=lambda item: item.relative_to(upstream.root).as_posix()):
            if not source.is_file() or source.is_symlink():
                continue
            relative = source.relative_to(upstream.root)
            if relative.as_posix() in {"SKILL.md", "upstream.json", "version.json"}:
                continue
            target = target_root / relative
            target.parent.mkdir(parents=True, exist_ok=True)
            shutil.copyfile(source, target)
    def _require_draft(self, skill_name: str, draft_id: str) -> SkillDraft:
        draft = self.store.read_draft(skill_name, draft_id)
        if draft is None:
--- a/app-instance/backend/beaver/skills/specs/models.py
+++ b/app-instance/backend/beaver/skills/specs/models.py
@ -180,6 +180,7 @@ class SkillDraft:
    status: str = SkillReviewState.DRAFT.value
    evidence_refs: list[dict[str, Any]] = field(default_factory=list)
    proposal_kind: str = "revise_skill"
    provenance: dict[str, Any] = field(default_factory=dict)
    def to_dict(self) -> dict[str, Any]:
        return {
@ -196,6 +197,7 @@ class SkillDraft:
            "status": self.status,
            "evidence_refs": list(self.evidence_refs),
            "proposal_kind": self.proposal_kind,
            "provenance": dict(self.provenance),
        }
    @classmethod
@ -214,6 +216,7 @@ class SkillDraft:
            status=str(payload.get("status") or SkillReviewState.DRAFT.value),
            evidence_refs=list(payload.get("evidence_refs") or []),
            proposal_kind=str(payload.get("proposal_kind") or "revise_skill"),
            provenance=dict(payload.get("provenance") or {}),
        )
--- a/app-instance/backend/tests/unit/test_plugin_skill_learning.py
+++ b/app-instance/backend/tests/unit/test_plugin_skill_learning.py
@ -0,0 +1,239 @@
 from __future__ import annotations
 import asyncio
 import json
 from pathlib import Path
 from types import SimpleNamespace
 from beaver.engine.providers.base import LLMProvider, LLMResponse
 from beaver.engine.providers.factory import ProviderBundle
 from beaver.foundation.utils.file_lock import WorkspaceWriteLock
 from beaver.memory.runs import RunMemoryStore
 from beaver.memory.skills import SkillLearningCandidate, SkillLearningStore
 from beaver.plugins.discovery import discover_plugins
 from beaver.plugins.skills import PluginManager
 from beaver.plugins.state import PluginStateStore
 from beaver.plugins.tree_merge import merge_supporting_file_trees
 from beaver.skills.drafts import DraftService
 from beaver.skills.learning import EvidenceSelector, SkillDraftSynthesizer, SkillLearningService
 from beaver.skills.learning.safety import SkillDraftSafetyChecker
 from beaver.skills.publisher import SkillPublisher
 from beaver.skills.specs import SkillDraft, SkillReviewState, SkillSpecStore
 class CountingProvider(LLMProvider):
    def __init__(self, content: str = "{}") -> None:
        super().__init__()
        self.content = content
        self.calls: list[dict] = []
    async def chat(
        self,
        messages: list[dict],
        tools: list[dict] | None = None,
        model: str | None = None,
        max_tokens: int = 4096,
        temperature: float = 0.7,
        thinking_enabled: bool | None = None,
    ) -> LLMResponse:
        self.calls.append({"messages": messages, "model": model})
        return LLMResponse(content=self.content)
    def get_default_model(self) -> str:
        return "stub"
 def _bundle(provider: CountingProvider) -> ProviderBundle:
    runtime = SimpleNamespace(model="stub", provider_name="stub")
    return ProviderBundle(main_runtime=runtime, main_provider=provider)  # type: ignore[arg-type]
 def _write_plugin(root: Path, *, version: str = "1.0.0", body: str = "# Comic\n\nV1.\n", template: str = "v1") -> Path:
    plugin_root = root / "baoyu-comic"
    skill_root = plugin_root / "skills" / "baoyu-comic"
    skill_root.mkdir(parents=True, exist_ok=True)
    (skill_root / "SKILL.md").write_text(
        "---\nname: baoyu-comic\ndescription: Comic workflow\ntools: []\n---\n\n" + body,
        encoding="utf-8",
    )
    (skill_root / "templates").mkdir(exist_ok=True)
    (skill_root / "templates" / "panel.txt").write_text(template, encoding="utf-8")
    (plugin_root / "beaver.plugin.json").write_text(
        json.dumps(
            {
                "schema_version": 1,
                "id": "baoyu-comic",
                "name": "Baoyu Comic",
                "version": version,
                "skills": [{"name": "baoyu-comic", "path": "skills/baoyu-comic"}],
            }
        ),
        encoding="utf-8",
    )
    return plugin_root
 def _rewrite_plugin(plugin_root: Path, *, version: str, body: str, template: str) -> None:
    manifest_path = plugin_root / "beaver.plugin.json"
    manifest = json.loads(manifest_path.read_text(encoding="utf-8"))
    manifest["version"] = version
    manifest_path.write_text(json.dumps(manifest), encoding="utf-8")
    skill_root = plugin_root / "skills" / "baoyu-comic"
    (skill_root / "SKILL.md").write_text(
        "---\nname: baoyu-comic\ndescription: Comic workflow\ntools: []\n---\n\n" + body,
        encoding="utf-8",
    )
    (skill_root / "templates" / "panel.txt").write_text(template, encoding="utf-8")
 def _manager(workspace: Path) -> tuple[PluginManager, SkillSpecStore, SkillLearningStore]:
    discovery = discover_plugins(workspace, search_paths=[])
    skill_store = SkillSpecStore(workspace)
    learning_store = SkillLearningStore(workspace / "memory" / "skills")
    manager = PluginManager(
        workspace=workspace,
        manifests=discovery.manifests,
        discovery_errors=discovery.errors,
        state_store=PluginStateStore(workspace),
        skill_store=skill_store,
        learning_store=learning_store,
        publisher=SkillPublisher(skill_store),
        safety_checker=SkillDraftSafetyChecker(),
        write_lock=WorkspaceWriteLock(workspace),
    )
    return manager, skill_store, learning_store
 def test_skill_draft_from_legacy_payload_has_empty_provenance() -> None:
    draft = SkillDraft.from_dict(
        {
            "draft_id": "draft-1",
            "skill_name": "debug",
            "proposed_content": "# Debug\n",
            "created_at": "now",
            "created_by": "tester",
        }
    )
    assert draft.provenance == {}
 def test_fast_forward_plugin_update_synthesis_uses_exact_upstream_without_llm(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    plugin_root = _write_plugin(workspace / "plugins")
    manager, skill_store, learning_store = _manager(workspace)
    manager.enable("baoyu-comic")
    _rewrite_plugin(plugin_root, version="1.1.0", body="# Comic\n\nV2.\n", template="v2")
    _manager(workspace)[0].sync_enabled()
    candidate = learning_store.list_learning_candidates()[0]
    provider = CountingProvider()
    service = SkillLearningService(
        run_store=RunMemoryStore(workspace / "memory" / "runs"),
        learning_store=learning_store,
        draft_service=DraftService(skill_store),
        evidence_selector=EvidenceSelector(RunMemoryStore(workspace / "memory" / "runs")),
    )
    draft = asyncio.run(service.synthesize_draft(candidate.candidate_id, _bundle(provider)))
    upstream = skill_store.read_upstream_snapshot(
        "baoyu-comic",
        "baoyu-comic",
        candidate.evidence["new_upstream_tree_hash"],
    )
    assert upstream is not None
    assert draft.proposal_kind == "plugin_skill_update"
    assert draft.proposed_content == "# Comic\n\nV2."
    assert draft.base_version == "v0001"
    assert draft.provenance["merge_mode"] == "fast_forward"
    assert draft.provenance["new_upstream_tree_hash"] == upstream.snapshot.skill_tree_hash
    assert provider.calls == []
 def test_publish_plugin_update_materializes_referenced_supporting_files(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    plugin_root = _write_plugin(workspace / "plugins", template="v1")
    manager, skill_store, learning_store = _manager(workspace)
    manager.enable("baoyu-comic")
    _rewrite_plugin(plugin_root, version="1.1.0", body="# Comic\n\nV2.\n", template="v2")
    _manager(workspace)[0].sync_enabled()
    candidate = learning_store.list_learning_candidates()[0]
    service = SkillLearningService(
        run_store=RunMemoryStore(workspace / "memory" / "runs"),
        learning_store=learning_store,
        draft_service=DraftService(skill_store),
        evidence_selector=EvidenceSelector(RunMemoryStore(workspace / "memory" / "runs")),
    )
    draft = asyncio.run(service.synthesize_draft(candidate.candidate_id, _bundle(CountingProvider())))
    draft.status = SkillReviewState.APPROVED.value
    skill_store.write_draft(draft)
    version = SkillPublisher(skill_store).publish("baoyu-comic", draft.draft_id, publisher="tester")
    assert version.version == "v0002"
    assert (workspace / "skills" / "baoyu-comic" / "versions" / "v0002" / "templates" / "panel.txt").read_text(
        encoding="utf-8"
    ) == "v2"
 def test_supporting_file_merge_adopts_upstream_when_local_is_unchanged() -> None:
    plan = merge_supporting_file_trees(
        base={"a.txt": {"content_hash": "A", "executable": False}},
        local={"a.txt": {"content_hash": "A", "executable": False}},
        upstream={"a.txt": {"content_hash": "U", "executable": False}},
    )
    assert plan.files["a.txt"].source == "upstream"
    assert plan.conflicts == []
 def test_supporting_file_merge_blocks_divergent_edits() -> None:
    plan = merge_supporting_file_trees(
        base={"a.txt": {"content_hash": "A", "executable": False}},
        local={"a.txt": {"content_hash": "L", "executable": False}},
        upstream={"a.txt": {"content_hash": "U", "executable": False}},
    )
    assert plan.conflicts[0].path == "a.txt"
 def test_three_way_synthesizer_prompt_labels_all_inputs() -> None:
    provider = CountingProvider(
        json.dumps(
            {
                "frontmatter": {"name": "baoyu-comic", "description": "Comic workflow", "tools": []},
                "content": "# Baoyu Comic\n\nMerged.",
                "change_reason": "Adopt upstream while preserving local review.",
                "preserved_local_sections": ["Review"],
                "adopted_upstream_sections": ["Panel Layout"],
                "resolved_conflicts": ["Output ordering"],
                "dropped_sections": [],
            }
        )
    )
    async def run_case() -> dict:
        return await SkillDraftSynthesizer().synthesize_plugin_update(
            SkillLearningCandidate(
                candidate_id="candidate",
                kind="plugin_skill_update",
                source_run_ids=[],
                source_session_ids=[],
                related_skill_names=["baoyu-comic"],
                reason="merge",
            ),
            EvidenceSelector(RunMemoryStore(Path("/tmp/unused-runs"))).build_evidence_packet([], []),
            provider,
            "stub",
            old_upstream={"content": "# Old\n"},
            current_local={"content": "# Local\n"},
            new_upstream={"content": "# New\n"},
        )
    payload = asyncio.run(run_case())
    prompt = provider.calls[0]["messages"][1]["content"]
    assert "OLD UPSTREAM" in prompt
    assert "CURRENT LOCAL" in prompt
    assert "NEW UPSTREAM" in prompt
    assert payload["preserved_local_sections"] == ["Review"]
    assert payload["adopted_upstream_sections"] == ["Panel Layout"]
--- a/app-instance/backend/tests/unit/test_plugin_skill_sync.py
+++ b/app-instance/backend/tests/unit/test_plugin_skill_sync.py
@ -234,3 +234,58 @@ def test_sync_enabled_supersedes_stale_pending_update(tmp_path: Path) -> None:
    assert len(candidates) == 2
    assert {candidate.status for candidate in candidates} == {"open", "superseded"}
    assert any(candidate.candidate_id != first_candidate.candidate_id for candidate in candidates)
 def test_pause_leaves_skill_active_and_suppresses_update_candidates(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    plugin_root = _write_skill_plugin(workspace / "plugins")
    _manager(workspace).enable("baoyu-comic")
    _manager(workspace).pause("baoyu-comic")
    _rewrite_plugin_version(plugin_root, version="1.1.0", skill_text="# Baoyu Comic\n\nPaused update.\n")
    _manager(workspace).sync_enabled()
    assert SkillSpecStore(workspace).get_skill_spec("baoyu-comic").status == "active"  # type: ignore[union-attr]
    assert SkillLearningStore(workspace / "memory" / "skills").list_learning_candidates() == []
 def test_resume_reconciles_and_syncs_updates(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    plugin_root = _write_skill_plugin(workspace / "plugins")
    _manager(workspace).enable("baoyu-comic")
    _manager(workspace).pause("baoyu-comic")
    _rewrite_plugin_version(plugin_root, version="1.1.0", skill_text="# Baoyu Comic\n\nResume update.\n")
    state = _manager(workspace).resume("baoyu-comic")
    assert state.status == "update_pending"
    assert SkillLearningStore(workspace / "memory" / "skills").list_learning_candidates()
 def test_disable_plugin_disables_linked_skills_without_deleting_versions(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    _write_skill_plugin(workspace / "plugins")
    _manager(workspace).enable("baoyu-comic")
    with pytest.raises(ValueError, match="disable_linked_skills"):
        _manager(workspace).disable("baoyu-comic", disable_linked_skills=False)
    state = _manager(workspace).disable("baoyu-comic", disable_linked_skills=True)
    spec = SkillSpecStore(workspace).get_skill_spec("baoyu-comic")
    assert state.enabled is False
    assert spec is not None and spec.status == "disabled"
    assert SkillSpecStore(workspace).read_published_skill("baoyu-comic", "v0001") is not None
 def test_adopt_detaches_plugin_binding_and_keeps_skill_active(tmp_path: Path) -> None:
    workspace = tmp_path / "workspace"
    _write_skill_plugin(workspace / "plugins")
    _manager(workspace).enable("baoyu-comic")
    spec = _manager(workspace).adopt("baoyu-comic", "baoyu-comic")
    state = PluginStateStore(workspace).get_plugin("baoyu-comic")
    assert spec.source_kind == "managed"
    assert spec.status == "active"
    assert "adopted_from_plugin:baoyu-comic" in spec.lineage
    assert state is not None and "baoyu-comic" not in state.skills
--- a/app-instance/backend/tests/unit/test_skill_learning_pipeline.py
+++ b/app-instance/backend/tests/unit/test_skill_learning_pipeline.py
@ -222,3 +222,80 @@ def test_publish_blocks_failed_preservation_report(tmp_path: Path) -> None:
    with pytest.raises(ValueError, match="preservation"):
        pipeline.publish(draft.skill_name, draft.draft_id, publisher="tester")
 def test_publish_blocks_plugin_three_way_without_plugin_preservation_report(tmp_path: Path) -> None:
    pipeline = _pipeline(tmp_path)
    draft = pipeline.draft_service.create_plugin_update_draft(
        skill_name="plugin-skill",
        base_version="v0001",
        proposed_content="# Plugin\n\nDo it.",
        proposed_frontmatter={"description": "plugin", "tools": []},
        created_by="test",
        reason="plugin update",
        provenance={"merge_mode": "three_way"},
    )
    pipeline.learning_store.write_eval_report(
        SkillDraftEvalReport(
            report_id="eval-plugin",
            skill_name=draft.skill_name,
            draft_id=draft.draft_id,
            candidate_id="candidate-1",
            passed=True,
            baseline_score_avg=0.8,
            candidate_score_avg=0.9,
            score_delta=0.1,
            regression_count=0,
            improved_count=1,
            unchanged_count=0,
            confidence="medium",
            mode="replay",
            eval_version="replay-v1",
            preservation_report={"passed": True, "mode": "ordinary"},
        )
    )
    pipeline.submit_review(draft.skill_name, draft.draft_id, requested_by="tester")
    pipeline.check_safety(draft.skill_name, draft.draft_id)
    with pytest.raises(ValueError, match="three-way preservation"):
        pipeline.publish(draft.skill_name, draft.draft_id, publisher="tester")
 def test_publish_blocks_plugin_update_with_unresolved_supporting_file_conflicts(tmp_path: Path) -> None:
    pipeline = _pipeline(tmp_path)
    draft = pipeline.draft_service.create_plugin_update_draft(
        skill_name="plugin-skill",
        base_version="v0001",
        proposed_content="# Plugin\n\nDo it.",
        proposed_frontmatter={"description": "plugin", "tools": []},
        created_by="test",
        reason="plugin update",
        provenance={
            "merge_mode": "three_way",
            "supporting_file_plan": {"conflicts": [{"path": "a.txt", "reason": "diverged"}]},
        },
    )
    pipeline.learning_store.write_eval_report(
        SkillDraftEvalReport(
            report_id="eval-plugin-conflict",
            skill_name=draft.skill_name,
            draft_id=draft.draft_id,
            candidate_id="candidate-1",
            passed=True,
            baseline_score_avg=0.8,
            candidate_score_avg=0.9,
            score_delta=0.1,
            regression_count=0,
            improved_count=1,
            unchanged_count=0,
            confidence="medium",
            mode="replay",
            eval_version="replay-v1",
            preservation_report={"passed": True, "mode": "plugin_three_way", "unresolved_conflicts": []},
        )
    )
    pipeline.submit_review(draft.skill_name, draft.draft_id, requested_by="tester")
    pipeline.check_safety(draft.skill_name, draft.draft_id)
    with pytest.raises(ValueError, match="supporting-file conflicts"):
        pipeline.publish(draft.skill_name, draft.draft_id, publisher="tester")
--- a/app-instance/backend/tests/unit/test_skill_learning_preservation.py
+++ b/app-instance/backend/tests/unit/test_skill_learning_preservation.py
@ -1,6 +1,6 @@
 from __future__ import annotations
-from beaver.skills.learning.preservation import check_preservation
+from beaver.skills.learning.preservation import check_plugin_merge_preservation, check_preservation
 def test_preservation_passes_when_base_sections_remain() -> None:
@ -25,3 +25,29 @@ def test_preservation_flags_dropped_section() -> None:
    assert report["passed"] is False
    assert report["risk_level"] == "high"
    assert "Safety" in report["dropped_sections"]
 def test_plugin_merge_preservation_checks_local_and_upstream_and_conflicts() -> None:
    report = check_plugin_merge_preservation(
        local_content="# Local\n\n## Review\n\nKeep review.\n",
        upstream_content="# Upstream\n\n## Safety\n\nDo not leak secrets.\n",
        draft_content="# Draft\n\n## Review\n\nKeep review.\n\n## Safety\n\nDo not leak secrets.\n",
        merge_decisions={"resolved_conflicts": ["ordering"], "unresolved_conflicts": []},
    )
    assert report["mode"] == "plugin_three_way"
    assert report["passed"] is True
    assert report["local"]["passed"] is True
    assert report["upstream"]["passed"] is True
 def test_plugin_merge_preservation_fails_unresolved_conflicts() -> None:
    report = check_plugin_merge_preservation(
        local_content="# Local\n\n## Review\n\nKeep review.\n",
        upstream_content="# Upstream\n\n## Safety\n\nDo not leak secrets.\n",
        draft_content="# Draft\n\n## Review\n\nKeep review.\n",
        merge_decisions={"unresolved_conflicts": ["Safety conflict"]},
    )
    assert report["passed"] is False
    assert report["unresolved_conflicts"] == ["Safety conflict"]