memory-gateway/docs/data-model.md

# Data Model

## 目标

这个数据模型面向 SOC case 研判辅助场景，不追求全量归档，而强调高价值记忆抽取。

## 数据分层

### 1. Knowledge Memory

适用内容：

- KB
- Playbook
- 月报摘要
- 报告摘要
- PO
- 检测规则说明

特点：

- 偏稳定、可复用
- 面向方法、知识、模式
- 适合长期保存

建议字段：

- `id`
- `title`
- `source_type`
- `summary`
- `tags`
- `entities`
- `ttp`
- `confidence`
- `updated_at`

### 2. Case Memory

适用内容：

- 历史 case
- 最终研判结论
- 关键证据
- 误报 / 真报模式
- 处置建议

特点：

- 面向具体案例
- 适合检索相似 case
- 是 POC 阶段最重要的数据层

建议字段：

- `case_id`
- `title`
- `alert_type`
- `verdict`
- `summary`
- `key_evidence`
- `entities`
- `detection_logic`
- `lessons_learned`
- `source_links`

### 3. Process Memory

适用内容：

- agent 中间步骤
- 工具调用结果
- 推理路径
- 临时分析结论

特点：

- 生命周期短
- 价值不均匀
- 只应抽取高价值部分转化为长期记忆

建议字段：

- `session_id`
- `step_id`
- `tool_name`
- `observation`
- `intermediate_conclusion`
- `value_score`
- `timestamp`

### 4. Profile / Preference Memory

适用内容：

- analyst 偏好
- 默认输出风格
- 常用研判路径

特点：

- 数量小
- 用于个性化辅助

建议字段：

- `user_id`
- `preference_type`
- `value`
- `scope`

### 5. Session Memory

适用内容：

- 当前 case 的上下文
- 当前轮对话、当前任务的临时缓存

特点：

- 强时效
- 默认不长期保留

建议字段：

- `session_id`
- `task_id`
- `active_entities`
- `active_hypotheses`
- `recent_observations`
- `expires_at`

## 设计原则

- 原始材料不直接当记忆
- 只沉淀对后续研判有帮助的高价值信息
- Process Memory 默认短期，经过抽取后才升级为长期记忆
- Knowledge 与 Case 是 POC 阶段优先建设的两层