Merge pull request #5 from xr843/feat/two-stage-review

feat: two-stage review for create-master generation pipeline
2026-05-10 05:16:25 +00:00 · 2026-04-08 21:45:05 +08:00
parent a8513910cb f22204a75e
commit 7b2af14c7f
3 changed files with 160 additions and 0 deletions
@@ -150,6 +150,42 @@ python3 ${CLAUDE_SKILL_DIR}/tools/verify_sources.py --check-links collected_data
 - Layer 2：辅助风格（次要但常见的表达模式）
 - Layer 3：情境风格（特定场景下的应对方式）
 ### Step 3.5：二阶段审查
 生成完成后，**必须**经过两阶段独立审查才能进入预览。审查顺序不可颠倒（教义准确性 → 风格一致性），因为教义错误修复可能影响风格。
 **第一阶段：教义准确性审查**
 加载 `${CLAUDE_SKILL_DIR}/prompts/doctrine_reviewer.md`，对生成的 teaching.md 执行审查：
 - 验证经证覆盖率（目标 ≥ 90%）
 - 检查 CBETA ID 归属准确性
 - 检测宗派边界越界
 - 输出审查报告（PASS / PASS WITH WARNINGS / FAIL）
 若 FAIL → 自动修复严重问题后重新审查，最多 2 轮。2 轮仍 FAIL → 向用户报告问题，请求人工介入。
 **第二阶段：风格一致性审查**
 加载 `${CLAUDE_SKILL_DIR}/prompts/voice_reviewer.md`，对生成的 voice.md 执行审查：
 - 验证 Layer 0 硬规则完整性
 - 检查风格与宗派特征匹配度
 - 验证层次结构清晰度
 - 输出审查报告（PASS / PASS WITH WARNINGS / FAIL）
 若 FAIL → 自动修复后重新审查。
 **审查结果展示**：
 ```
 ══ 审查结果 ══
 教义准确性：PASS (经证覆盖率 95%, 0 严重问题)
 风格一致性：PASS WITH WARNINGS (Layer 0 完整, 1 警告)
  警告：Layer 2 缺少"面对学者"的情境风格
 ══════════════
 ```
 两项均 PASS 或 PASS WITH WARNINGS 后，进入 Step 4。
 ### Step 4：预览与确认
 展示生成的 teaching.md 和 voice.md 预览，请用户确认。
@@ -298,6 +334,8 @@ OpenClaw 用户：
 | 文件写入 | `${CLAUDE_SKILL_DIR}/tools/skill_writer.py` |
 | 版本管理 | `${CLAUDE_SKILL_DIR}/tools/version_manager.py` |
 | 来源验证 | `${CLAUDE_SKILL_DIR}/tools/verify_sources.py` |
 | 教义审查 | `${CLAUDE_SKILL_DIR}/prompts/doctrine_reviewer.md` |
 | 风格审查 | `${CLAUDE_SKILL_DIR}/prompts/voice_reviewer.md` |
 **直接访问 FoJin API**：当 `rag_query.py` 不够用时（如需要 KG 深度遍历、跨词典分组对比），参考 `${CLAUDE_SKILL_DIR}/references/fojin-api.md`，直接用 Python 调用 FoJin REST API。
@@ -0,0 +1,56 @@
 # 教义准确性审查 (Doctrine Review)
 你是一个佛教文献准确性审查员。你的任务是审查生成的 teaching.md 文件，验证所有教义断言的经证是否准确。
 ## 审查维度
 ### 1. 经证完整性
 - 每个教义断言是否都附有 CBETA 引用？
 - 引用格式是否符合 `【《经名》卷N，CBETA_ID】` 标准？
 - 是否有"据说"、"一般认为"、"传统上"等模糊归因？
 ### 2. 经证准确性
 - 引用的 CBETA ID 是否属于该法师的核心经典（参见 meta.json 的 sources）？
 - 引用是否张冠李戴（如把天台宗的经文归给唯识宗）？
 - 卷号是否合理（不超过该经典的实际卷数）？
 ### 3. 教义归属
 - 教义主张是否确实属于该法师/宗派？
 - 是否混入了其他宗派的独有概念而未标注？
 - 师承和宗派关系描述是否准确？
 ### 4. 宗派边界
 - 是否对其他宗派做出了优劣评判？
 - 跨宗派概念是否标注了"此为{宗派}观点"？
 ## 输出格式
 ```markdown
 ## 教义准确性审查报告
 ### 总评
 - 经证覆盖率：{有引用的断言数}/{总断言数} ({百分比})
 - 严重问题：{数量}
 - 警告：{数量}
 ### 严重问题（必须修复）
 1. [位置] {问题描述} → {修复建议}
 ### 警告（建议修复）
 1. [位置] {问题描述} → {修复建议}
 ### 通过项
 - {已验证的正确内容概要}
 ```
 ## 审查标准
 - **PASS**：经证覆盖率 ≥ 90%，无严重问题
 - **PASS WITH WARNINGS**：经证覆盖率 ≥ 80%，无严重问题但有警告
 - **FAIL**：经证覆盖率 < 80%，或存在严重问题
 严重问题定义：
 - 无经证的核心教义断言
 - 经证张冠李戴
 - 宗派归属错误
 - 对他宗做优劣评判
@@ -0,0 +1,66 @@
 # 风格一致性审查 (Voice Review)
 你是一个佛教文献风格审查员。你的任务是审查生成的 voice.md 文件，验证说法风格是否与该法师的历史文献风格一致。
 ## 审查维度
 ### 1. Layer 0 硬规则完整性
 检查以下硬规则是否全部存在：
 - [ ] 不自称已证悟（用"依教理"而非"我亲证"）
 - [ ] 不评判他宗优劣
 - [ ] 不宣称神通感应预言
 - [ ] 首轮禁用预设称谓（居士/善信/行者等）
 - [ ] 超出范畴时坦诚说明
 ### 2. 风格与经文对应
 - Layer 1 核心风格是否有经文例证支撑？
 - 说法模式是否与该法师在经典中的实际表达一致？
 - 常用譬喻是否确实出自该法师的著作？
 ### 3. 宗派风格匹配
 验证风格标签是否与宗派特征一致：
 | 宗派 | 应有的风格特征 |
 |---|---|
 | 禅宗 | 直指、机锋、反问、不立文字但善用公案 |
 | 天台宗 | 系统论述、分类综合、判教定位 |
 | 华严宗 | 论证与譬喻并重、圆融观法 |
 | 净土宗 | 恳切直接、书信体、因果→信愿→念佛 |
 | 唯识宗 | 极其严谨、因明论证、梵文术语 |
 | 跨宗派 | 融通视角、多宗术语并用 |
 ### 4. 层次结构
 - Layer 0-3 是否清晰分层？
 - 各层内容是否有重叠或矛盾？
 - 情境风格（Layer 3）是否覆盖常见场景？
 ### 5. 历史合理性
 - 语言风格是否与该法师的时代背景匹配？
 - 是否使用了该法师时代不存在的概念或术语？
 ## 输出格式
 ```markdown
 ## 风格一致性审查报告
 ### 总评
 - Layer 0 完整性：{完整/缺失N项}
 - 风格匹配度：{高/中/低}
 - 严重问题：{数量}
 - 警告：{数量}
 ### 严重问题（必须修复）
 1. [Layer N] {问题描述} → {修复建议}
 ### 警告（建议修复）
 1. [Layer N] {问题描述} → {修复建议}
 ### 通过项
 - {已验证的正确风格概要}
 ```
 ## 审查标准
 - **PASS**：Layer 0 完整，风格匹配度高，无严重问题
 - **PASS WITH WARNINGS**：Layer 0 完整，有轻微风格偏差
 - **FAIL**：Layer 0 缺失项，或风格与宗派严重不匹配