name: history-auditor description: 历史对话审计 Skill。审查长期协作历史,提取用户稳定偏好、重复任务类型、未解决的循环、以及可升级为 Skill/Rule 的工作规律。触发词:「审查历史对话」「回顾过去的工作」「分析我们做过什么」「从历史中提取规律」「哪些任务重复出现」「有什么可以沉淀成Skill的」。
历史对话审计(history-auditor)
把长期协作历史从「记忆碎片」转变成「可复用的协作规范」。 基于 closure-orchestration-package 的 history-auditor 本地化。
激活后立即执行
Step 1 确认审计范围
询问(如未说明):
「审计范围是:
① 本工作区全部历史对话(从头到现在)
② 最近 N 天的对话
③ 特定项目相关的对话」
Step 2 扫描历史对话记录
用 explore 子智能体扫描:
/Users/boyuan/.cursor\projects\t-TashanAgent4S-2026-0310-huaxiang\agent-transcripts\
→ 提取每个对话的第一条用户消息(任务摘要)
→ 按时间排序
Step 3 分类分析(四个维度)
【维度1:重复任务类型】
→ 哪些任务出现了 3 次以上?
→ 这类任务有没有对应的 Skill?
→ 没有 Skill 的重复任务 = PENDING-SKILLS 候选
【维度2:稳定偏好模式】
→ 用户在哪类任务上有固定的「做法偏好」?
→ 哪些偏好应该变成 Rule(alwaysApply)?
→ 区分:稳定偏好 vs 一次性特殊需求
【维度3:未关闭的循环】
→ 哪些问题被反复提到但没有被彻底解决?
→ 哪些任务开始了但没有完成闭环?
【维度4:已发现的工作规律】
→ AI 和用户共同摸索出了哪些「对的做法」?
→ 这些规律是否已经被 Skill/Rule 捕捉?
【维度5:结构性执行力缺口——反思质量的核心维度】
⚠️ AI 在反思时容易只看到表层(「我疏忽了」),而看不到根本原因(规范/机制本身设计有问题)。
本维度专门诊断这类结构性问题。
扫描问题:
→ 哪些行为 AI 被反复提醒,但依然重复出错(≥2次同类失败)?
→ 这类行为靠「提醒」无法可靠执行,需要分析:是执行层疏忽,还是规范机制本身有设计缺陷?
→ 哪些重要规范/文档,AI 只有在特定 Skill 被触发时才知道?
→ 如果这些规范需要普遍遵守,就应该在 alwaysApply Rule 或 D0 中存在,而不是只在一个 Skill 里
→ 哪些规范写的是「建议/应该」,但实际上需要强制执行?
→ 「建议」在有压力时会被跳过,应改为「禁止/必须」+硬性门槛
→ 哪些知识/文档,AI 需要靠记忆才能想起来读?
→ 凡是「靠 AI 记忆」才能生效的,就存在结构性可靠性风险;应通过 D0 / Rule / Step 1 强制注入
诊断结论分类(对每个发现的缺口):
· 【连接缺口】:规范存在但没有通过 D0/Rule 进入上下文
· 【类型错误】:普遍约束放在了 Skill 里(只有被触发才生效)
· 【执行力度】:规范是建议而非禁止,缺乏强制约束
· 【覆盖错误】:规范覆盖的场景范围有误(太窄/太宽)
· 【表述歧义】:规范可以被多种理解,导致执行不一致
Step 4 生成审计报告
写入:_内部总控/历史审计报告_YYYYMMDD.md
Step 5 生成改进建议
对每个发现的规律,输出以下六类推荐动作之一(按优先级从高到低判断):
1. **更新/新建 Rule**:若规律是「所有任务都必须遵守的普遍约束」(轻量,违反有后果)
→ 推荐动作:新建 Rule / 更新已有 Rule(通过 skill-rule-修改规范)
2. **更新/新建 Agent**:若规律是「某类任务需要独立视角或并行执行」
→ 推荐动作:新建 Agent / 更新已有 Agent(通过 skill-designer Level 2)
3. **更新规范/参考文档**:若规律是某份规范手册/技术架构文档内容有误或遗漏
→ 推荐动作:更新规范文档(通过 project-doc-versioning-guard)
4. **新建 Skill**:若规律是「重复出现的任务类型,目前无对应 Skill」
→ 推荐动作:新建 Skill(加入 PENDING-SKILLS,通过 skill-designer)
5. **更新现有 Skill**:若规律是「已有 Skill 的步骤/触发词/行为有问题」
→ 推荐动作:更新已有 Skill(通过 skill-capture-closure 或 skill-rule-修改规范)
6. **记录为认知结构碎片**:若规律是「用户的认知洞见/偏好,不涉及 AI 行为规范」
→ 推荐动作:触发 cognitive-capture-fragment 写入 L2 碎片
每条建议附带:
- 优先级:P0/P1/P2
- 建议触发词(方便用户立即执行)
- 若适用:建议加入 PENDING-SKILLS.md 的条目格式
Step 5.5 若发现重复踩坑(同类错误在历史中出现≥2次):
→ 立即提示用户:「🔁 检测到重复踩坑:[踩坑描述]。建议现在沉淀此经验——说「这个经验值得记」即可触发 skill-capture-closure」
→ 不等用户问,主动给出触发词,方便立即执行
输出格式
# 历史对话审计报告
**审计日期**:YYYY-MM-DD
**覆盖范围**:[时间范围/项目范围]
**对话总数**:N
## 重复任务类型(出现 ≥3 次)
| 任务类型 | 出现次数 | 现有 Skill | 建议 |
|---|---|---|---|
## 稳定偏好模式
| 偏好描述 | 证据(对话引用)| 建议落地方式(Rule/Skill/文档/认知碎片)|
|---|---|---|
## 未关闭的循环
| 问题描述 | 最近出现时间 | 建议处理方式 |
|---|---|---|
## 已发现但未沉淀的工作规律
| 规律描述 | 产物类型 | 建议组件名称/文档路径 | 优先级 | 建议触发词 |
|---|---|---|---|---|
| [规律描述] | Rule/Agent/规范文档/Skill/认知碎片 | [名称或路径] | P0/P1/P2 | [用户可以说的话] |
## 需要修订的已有组件/文档
| 组件/文档 | 问题描述 | 建议动作 | 优先级 |
|---|---|---|---|
| [名称] | [Rule歧义/Agent行为错误/文档内容有误] | 更新 Rule/Agent/规范文档 | P0/P1/P2 |
## 结构性执行力缺口(维度5——反思质量的核心)
> 以下问题不是「AI 执行失败」,而是「规范/机制设计本身有缺陷」
| 缺口描述 | 缺口类型 | 当前状态 | 建议修复方式 | 优先级 |
|---|---|---|---|---|
| [某行为 AI 反复出错,历史中出现N次] | 连接缺口/类型错误/执行力度/覆盖错误/表述歧义 | [靠Skill注意事项/靠AI记忆/建议语气] | [补D0/升级为Rule/修改为禁止/缩小覆盖范围] | P0/P1/P2 |
注意事项
- 任务内容 vs 稳定偏好:不要把一次性任务的具体内容当成偏好。只有重复出现、跨项目适用的,才是偏好
- 审计完后触发:结论应路由到 PENDING-SKILLS(新 Skill 候选)或 cognitive-capture-fragment(认知碎片)
变更记录
v1.1 — 2026-03-22 — 新增 Step 5.5 重复踩坑显式触发(GAP-CO010-1 修复)
根因:scenario-sandbox-builder Phase 2 验证(CO-010沙盘)发现:history-auditor Step 5 只在注意事项中提到「结论应路由到 skill-capture-closure」,缺少显式的 Step 调用——审计完成后,经验沉淀依赖用户手动说触发词,容易遗漏。
修改内容:
- 新增:Step 5.5 「若发现重复踩坑(同类错误≥2次)→ 立即提示用户并给出 skill-capture-closure 触发词,不等用户问」
- 备份路径:
history/SKILL_v1.0_20260322_before_co010.md
验证方法:history-auditor 发现重复踩坑时,应主动输出「建议说「这个经验值得记」触发 skill-capture-closure」 验证状态:🔵 待验证
v1.0 — 2026-03-19 — 初始创建
根因:今日已手动执行过一次历史对话审计(扫描92条对话),发现这是一个高价值的重复任务,需要正式化为 Skill。基于外部包的 history-auditor 本地化,加入认知结构碎片路由。
验证状态:🔵 待验证
v1.2 — 2026-03-23 — Step 5 推荐动作全类型展开 + 输出格式补全(产物类型覆盖修复)
根因:Step 5 的推荐动作列表只有「新建Skill/新建Rule/更新Skill/认知碎片」,缺少「更新已有Rule」「新建/更新Agent」「更新规范文档」三类;输出格式表格也缺乏「需要修订的已有组件」维度。
修改内容:
- 修改:Step 5 → 从 4 种推荐动作扩展为 6 类(Rule/Agent/规范文档/新建Skill/更新Skill/认知碎片),每类含判断标准、建议触发词
- 修改:输出格式 → 「已发现但未沉淀的工作规律」表格增加「产物类型」「建议触发词」列
- 新增:「需要修订的已有组件/文档」表格(覆盖 Rule 歧义/Agent 行为错误/文档内容有误等)
备份路径:history/SKILL_v1.1_20260323_before_full-actions.md
验证状态:🔵 待验证
v1.3 — 2026-03-23 — 新增维度5(结构性执行力缺口)+ 对应输出表格(元反思层修复)
根因:history-auditor 的四个分析维度都在问「发生了什么/有什么规律」,但没有一个维度在问「AI 反复失败是因为规范/机制设计有缺陷」——这是最有价值的改进来源,但被系统性忽略了。
修改内容:
- 新增:维度5「结构性执行力缺口」——专门诊断靠提醒无法解决的系统性问题(连接缺口/类型错误/执行力度/覆盖错误/表述歧义)
- 新增:输出格式「结构性执行力缺口」表格
备份路径:history/SKILL_v1.2_20260323_before_dim5.md
验证状态:🔵 待验证