Files
memory-gateway/docs/data-model.md

1.9 KiB

Data Model

目标

这个数据模型面向 SOC case 研判辅助场景,不追求全量归档,而强调高价值记忆抽取。

数据分层

1. Knowledge Memory

适用内容:

  • KB
  • Playbook
  • 月报摘要
  • 报告摘要
  • PO
  • 检测规则说明

特点:

  • 偏稳定、可复用
  • 面向方法、知识、模式
  • 适合长期保存

建议字段:

  • id
  • title
  • source_type
  • summary
  • tags
  • entities
  • ttp
  • confidence
  • updated_at

2. Case Memory

适用内容:

  • 历史 case
  • 最终研判结论
  • 关键证据
  • 误报 / 真报模式
  • 处置建议

特点:

  • 面向具体案例
  • 适合检索相似 case
  • 是 POC 阶段最重要的数据层

建议字段:

  • case_id
  • title
  • alert_type
  • verdict
  • summary
  • key_evidence
  • entities
  • detection_logic
  • lessons_learned
  • source_links

3. Process Memory

适用内容:

  • agent 中间步骤
  • 工具调用结果
  • 推理路径
  • 临时分析结论

特点:

  • 生命周期短
  • 价值不均匀
  • 只应抽取高价值部分转化为长期记忆

建议字段:

  • session_id
  • step_id
  • tool_name
  • observation
  • intermediate_conclusion
  • value_score
  • timestamp

4. Profile / Preference Memory

适用内容:

  • analyst 偏好
  • 默认输出风格
  • 常用研判路径

特点:

  • 数量小
  • 用于个性化辅助

建议字段:

  • user_id
  • preference_type
  • value
  • scope

5. Session Memory

适用内容:

  • 当前 case 的上下文
  • 当前轮对话、当前任务的临时缓存

特点:

  • 强时效
  • 默认不长期保留

建议字段:

  • session_id
  • task_id
  • active_entities
  • active_hypotheses
  • recent_observations
  • expires_at

设计原则

  • 原始材料不直接当记忆
  • 只沉淀对后续研判有帮助的高价值信息
  • Process Memory 默认短期,经过抽取后才升级为长期记忆
  • Knowledge 与 Case 是 POC 阶段优先建设的两层