skills/sunqb/ccsdk/quality-review

quality-review

SKILL.md

质量审核 - Quality Review

触发命令: /review 触发关键词: 审校、校对、检查、审核、版本评估、A/B测试、版本对比

简介

质量审核技能套件,整合了文本审校和版本评估两大功能。文本审校提供全面的语法、逻辑、合规检查;版本评估支持多版本对比分析和A/B测试决策支持。

功能一: Review Text

Review Text - 文本审校

简介

对文本进行全面审校,包括语法、拼写、标点、逻辑、清晰度等方面,并提供改进建议。审校完成后会在输出末尾添加AI免责声明。生成建议后自动调用humanize_text去除AI痕迹。

使用场景

  • 对初稿进行最终审校
  • 发现并修正文本错误
  • 提升文本质量
  • 确保内容的准确性和专业性
  • 发布前的最终检查

输入参数

必需参数

  • source_text (string): 需要审校的原文

可选参数

  • review_aspects (string[]): 审校重点(可多选)

    • grammar - 语法检查
    • spelling - 拼写检查
    • punctuation - 标点符号检查
    • logic - 逻辑检查
    • clarity - 表达清晰度检查
    • consistency - 一致性检查
    • factual_accuracy - 事实准确性检查
    • compliance - 合规性检查(检查敏感词、违规内容)
    • 默认值:全部检查
  • target_audience (string): 目标受众

    • general - 普通大众
    • professional - 专业人士
    • academic - 学术界
    • youth - 年轻群体
    • business - 商务人士
    • 默认值:general
  • tone_requirement (string): 语气要求

    • formal - 正式
    • semi-formal - 半正式
    • casual - 非正式
    • 默认值:semi-formal
  • return_format (string): 返回格式

    • summary_only - 仅返回摘要和修订建议
    • detailed - 返回详细分析和修订建议
    • with_marked_text - 返回标注原文和修订版本
    • 默认值:detailed
  • highlight_changes (boolean): 是否高亮显示修改

    • true - 用特殊符号标注修改内容
    • false - 不高亮
    • 默认值:true

输出

审校结果,包括问题分析、修订建议、修订版本,以及AI免责声明"以上内容为AI大模型审校优化,在使用前需再人工审核"。修订建议会自动调用humanize_text去除AI痕迹。

处理规则

审校维度

1. 语法检查(grammar)

  • 主谓一致性检查
  • 时态一致性检查
  • 语序合理性检查
  • 语法结构完整性检查

2. 拼写检查(spelling)

  • 错别字检查
  • 同音字误用检查
  • 易混字检查
  • 专业术语拼写检查

3. 标点符号检查(punctuation)

  • 标点符号使用规范检查
  • 中英文标点混用检查
  • 标点符号位置检查
  • 标点符号完整性检查

4. 逻辑检查(logic)

  • 论证逻辑检查
  • 因果关系检查
  • 前后一致性检查
  • 推理合理性检查

5. 表达清晰度检查(clarity)

  • 歧义表达检查
  • 冗余表达检查
  • 信息过载检查
  • 表达准确性检查

6. 一致性检查(consistency)

  • 术语一致性检查
  • 人称一致性检查
  • 时态一致性检查
  • 格式一致性检查

7. 事实准确性检查(factual_accuracy)

  • 数据准确性检查
  • 日期时间检查
  • 专有名词检查
  • 引用准确性检查

8. 合规性检查(compliance)

  • 敏感词检查
  • 违规内容检查
  • 版权内容检查
  • 虚假信息检查

问题等级分类

1. 严重问题(Critical)

  • 严重影响理解的错误
  • 明显的事实错误
  • 严重的合规问题
  • 必须修改

2. 重要问题(Important)

  • 影响阅读流畅度的错误
  • 不够准确的表达
  • 不够一致的术语
  • 建议修改

3. 一般问题(Minor)

  • 细小的表达瑕疵
  • 优化空间的表达
  • 不够完美的措辞
  • 可选修改

审校流程

1. 初步扫描

  • 快速扫描文本,识别明显问题
  • 统计问题数量和类型分布
  • 确定审校重点

2. 深度分析

  • 逐段深入分析
  • 发现潜在问题
  • 记录问题位置和类型

3. 问题归类

  • 将问题按严重程度归类
  • 标注问题位置
  • 提供问题描述

4. 修订建议

  • 为每个问题提供修订方案
  • 说明修订理由
  • 给出修改建议

5. 整体评估

  • 评估文本整体质量
  • 给出改进方向
  • 提供总结建议

修订建议格式

摘要格式(summary_only)

【审校摘要】
原文质量评分:X/10
发现问题总数:X个(严重:X个,重要:X个,一般:X个)

【主要问题】
1. XXX问题
2. XXX问题
3. XXX问题

【修订建议】
(概括性建议)

【修订版本】
(整体修订后的文本)

详细格式(detailed)

【审校摘要】
原文质量评分:X/10
发现问题总数:X个(严重:X个,重要:X个,一般:X个)

【详细问题分析】
1. [严重] 语法错误
   位置:第X行第X字
   问题:XXX
   建议:XXX
   修订:XXX

2. [重要] 表达不够清晰
   位置:第X行第X字
   问题:XXX
   建议:XXX
   修订:XXX

...

【修订版本】
(整体修订后的文本,用特殊符号标注修改)

【改进方向】
(进一步优化的建议)

标注格式(with_marked_text)

【审校摘要】
...

【标注原文】
(用[[删除内容]]表示删除,用【新增内容】表示新增)

【修订版本】
(清晰的修订后文本)

【问题清单】
1. XXX问题 → 已修正
2. XXX问题 → 已修正
...

高亮显示规则

删除内容

  • 使用[[内容]]标注要删除的内容
  • 例如:这个[[非常]]好的产品

新增内容

  • 使用【内容】标注要新增的内容
  • 例如:这个产品【质量】很好

修改内容

  • 使用[[原内容]]→【新内容】标注修改
  • 例如:[[非常]]→【特别】好的产品

快速模式

当用户输入包含完整的source_text时,直接使用默认参数(全部检查,普通大众受众,半正式语气,详细格式,高亮显示)执行。

交互问题模板(仅在用户未提供必要参数时显示)

我将为您审校这段文本,请确认以下要求:

1. 审校重点(可多选,可选):
   [1] 语法检查
   [2] 拼写检查
   [3] 标点符号检查
   [4] 逻辑检查
   [5] 表达清晰度检查
   [6] 一致性检查
   [7] 事实准确性检查
   [8] 合规性检查(敏感词、违规内容)

2. 目标受众(可选):
   [1] 普通大众
   [2] 专业人士
   [3] 学术界
   [4] 年轻群体
   [5] 商务人士

3. 语气要求(可选):
   [1] 正式
   [2] 半正式(推荐)
   [3] 非正式

4. 返回格式(可选):
   [1] 仅返回摘要和修订建议
   [2] 返回详细分析和修订建议(推荐)
   [3] 返回标注原文和修订版本

5. 是否高亮显示修改(可选):
   [1] 高亮显示修改内容(推荐)
   [2] 不高亮

您可以:
- 一次性回复所有选择(如:1,2,3,4,5,6,7,8,1,2,2,1)
- 回复部分参数,我再确认是否需要补充
- 回复"审校"或"好的",使用推荐设置执行(推荐:全部检查,普通大众受众,半正式语气,详细格式,高亮显示)
- 如果你有其他想法,可在回复的时候一并描述告知

请回复:

示例

示例1:综合审校

输入

source_text: "这个产品有很多好的功能,能够帮助用户提高工作的效率。但是有时候它会有些问题,需要进一步改进。我们相信,通过不断的努力,这个产品会越来越好。"
review_aspects: ["grammar", "spelling", "clarity", "consistency"]
return_format: "detailed"

输出

【审校摘要】
原文质量评分:7/10
发现问题总数:3个(严重:0个,重要:2个,一般:1个)

【详细问题分析】
1. [重要] 表达不够简洁
   位置:第1句
   问题:"有很多好的功能"表达略显啰嗦
   建议:改为"功能丰富"或"功能多样"
   修订:这个产品功能丰富,能够帮助用户提高工作效率。

2. [重要] 表达不够明确
   位置:第2句
   问题:"有时候它会有些问题"表述模糊,未说明具体问题
   建议:明确指出具体问题类型
   修订:但在特定情况下可能出现兼容性问题,需要进一步改进。

3. [一般] 逻辑可优化
   位置:第3句
   问题:"通过不断的努力"稍显空泛
   建议:可以更具体地说明努力方向
   修订:我们相信,通过持续优化和用户反馈,这个产品会越来越好。

【修订版本】
这个产品功能丰富,能够帮助用户提高工作效率。但在特定情况下可能出现兼容性问题,需要进一步改进。我们相信,通过持续优化和用户反馈,这个产品会越来越好。

【改进方向】
1. 可以进一步丰富内容,加入具体案例
2. 可以增加数据支撑,提升说服力
3. 可以优化段落结构,使内容更清晰

---

以上内容为AI大模型审校优化,在使用前需再人工审核

示例2:合规性检查

输入

source_text: "这个投资产品绝对没有任何风险,保证100%的收益,没有任何损失。"
review_aspects: ["compliance", "factual_accuracy"]
return_format: "summary_only"

输出

【审校摘要】
原文质量评分:3/10
发现问题总数:3个(严重:3个,重要:0个,一般:0个)

【主要问题】
1. [严重] 合规问题:使用"绝对没有任何风险"等绝对化表述,违反金融广告规范
2. [严重] 合规问题:使用"保证100%的收益"等承诺性表述,违反金融广告规范
3. [严重] 事实问题:没有任何投资产品能够保证100%的收益和零风险

【修订建议】
强烈建议修改所有绝对化表述和承诺性表述,改为更加客观、谨慎的表达方式。金融产品宣传应遵循"风险提示"原则,充分揭示风险。

【修订版本】
这个投资产品具有一定的收益潜力,但也存在相应的投资风险。投资前请仔细阅读产品说明书,充分了解产品特点和风险等级,根据自身风险承受能力进行投资。

---

以上内容为AI大模型审校优化,在使用前需再人工审核

示例3:详细格式+高亮显示

输入

source_text: "我们做了一个研究,想看看这个方法到底好不好用。结果显示,这个方法比其他方法都好。"
review_aspects: ["grammar", "clarity", "tone_requirement"]
tone_requirement: "formal"
return_format: "detailed"
highlight_changes: true

输出

【审校摘要】
原文质量评分:6/10
发现问题总数:3个(严重:0个,重要:3个,一般:0个)

【详细问题分析】
1. [重要] 表达不够正式
   位置:第1句
   问题:"做了一个研究"、"想看看"、"到底好不好用"表达过于口语化
   建议:使用更正式的学术用语
   修订:【本研究旨在】评估【该方法的】有效性

2. [重要] 表达不够准确
   位置:第2句
   问题:"比其他方法都好"表述过于绝对
   建议:使用更准确的表达
   修订:研究结果表明,该方法【在多个指标上】优于【现有】其他方法

3. [重要] 结构需要优化
   位置:整体
   问题:两句话衔接不够紧密
   建议:增加连接词,使逻辑更清晰
   修订:【本研究旨在评估该方法的】有效性。研究结果表明,该方法在多个指标上优于现有其他方法。

【修订版本】
【本研究旨在评估该方法的】有效性。研究结果表明,该方法在多个指标上优于现有其他方法。

【改进方向】
1. 可以进一步增加研究背景和意义
2. 可以提供具体的数据和指标
3. 可以增加对结果的详细讨论

---

以上内容为AI大模型审校优化,在使用前需再人工审核

注意事项

  1. 审校会自动在输出末尾添加AI免责声明:"以上内容为AI大模型审校优化,在使用前需再人工审核"
  2. 审校修订建议会自动调用humanize_text,无需手动再去AI味
  3. 合规性检查会参考config/compliance_rules.json和config/risk_keywords.json中的规则
  4. 对于事实准确性检查,如果无法确认,会标注"需人工核实"
  5. 高亮显示模式有助于用户快速定位修改内容
  6. 审校建议仅供参考,用户应根据实际情况决定是否采纳

参数调整提示

在生成内容后,如果对当前结果不满意,可以尝试调整以下参数:

💡 参数调整选项:

  1. 审校重点: grammar语法检查 | spelling拼写检查 | punctuation标点符号检查 | logic逻辑检查 | clarity表达清晰度检查 | consistency一致性检查 | factual_accuracy事实准确性检查 | compliance合规性检查(敏感词、违规内容)
  2. 目标受众: general普通大众 | professional专业人士 | academic学术界 | youth年轻群体 | business商务人士
  3. 语气要求: formal正式 | semi-formal半正式 | casual非正式
  4. 返回格式: summary_only仅返回摘要和修订建议 | detailed返回详细分析和修订建议 | with_marked_text返回标注原文和修订版本
  5. 是否高亮显示修改: true高亮显示修改内容 | false不高亮

使用方式: 直接回复如 "重点检查逻辑和清晰度" 或 "返回详细分析"

与其他技能的关联

  • humanize_text: 修订建议生成完成后自动调用此技能去除AI痕迹
  • polish_text: 如果目标是提升表达质量而非发现错误,应使用polish_text
  • check_style_consistency: 如果需要深度检查风格一致性,应使用此技能
  • rewrite_content: 如果需要对已有文本进行改写,可配合使用

配置文件引用

  • intent_keywords: ["审校", "校对", "检查", "审核", "修正", "纠错"]
  • compliance_rules: 在config/compliance_rules.json中定义合规检查规则
  • risk_keywords: 在config/risk_keywords.json中定义敏感词和风险词库

功能二: Evaluate Versions

Evaluate Versions - 版本评估

简介

对同一内容的多个版本进行对比评估,分析各版本的优缺点,提供版本选择建议和优化方向。适用于A/B测试、版本对比、决策支持等场景。

使用场景

  • A/B测试结果分析
  • 多版本文案对比评估
  • 不同方案的选择决策
  • 内容优化方向指导
  • 版本迭代效果评估

输入参数

必需参数

  • versions (array): 版本列表
    • 每个版本包含:version_name(版本名称)、content(内容)、version_info(版本信息,可选)
    • 支持2-5个版本
    • 示例:
      [
        {"version_name": "版本A", "content": "内容A", "version_info": "简洁版"},
        {"version_name": "版本B", "content": "内容B", "version_info": "详细版"}
      ]
      

可选参数

  • evaluation_criteria (string[]): 评估标准(可多选)

    • clarity - 清晰度
    • engagement - 吸引力
    • persuasion - 说服力
    • professionalism - 专业性
    • creativity - 创意性
    • readability - 可读性
    • emotional_impact - 情感影响力
    • target_audience_fit - 目标受众契合度
    • 默认值:全部评估
  • target_audience (string): 目标受众

    • general - 普通大众
    • professional - 专业人士
    • youth - 年轻群体
    • business - 商务人士
    • academic - 学术界
    • 自定义描述
    • 默认值:general
  • use_case (string): 使用场景

    • marketing - 营销推广
    • information - 信息传达
    • education - 教育培训
    • entertainment - 娱乐
    • brand_building - 品牌建设
    • custom - 自定义
    • 默认值:根据内容自动判断
  • evaluation_method (string): 评估方法

    • comparative - 对比评估
    • scoring - 评分评估
    • both - 对比+评分(推荐)
    • 默认值:both
  • provide_optimization_suggestions (boolean): 是否提供优化建议

    • true - 提供各版本的优化建议(推荐)
    • false - 不提供
    • 默认值:true

输出

版本评估报告,包括各版本的详细分析、对比评估、评分排名、选择建议、优化方向等。

处理规则

评估标准详解

1. 清晰度(clarity)

  • 评估要点:

    • 信息表达是否清晰明确
    • 逻辑是否顺畅
    • 是否有歧义表达
    • 信息密度是否合理
  • 评分标准(0-10分):

    • 9-10分:表达非常清晰,无歧义
    • 7-8分:表达较清晰,偶有小瑕疵
    • 5-6分:表达基本清晰,有一些不够明确之处
    • 0-4分:表达不够清晰,存在较多歧义

2. 吸引力(engagement)

  • 评估要点:

    • 开头是否抓人眼球
    • 内容是否有吸引力
    • 节奏是否紧凑
    • 是否让人愿意继续阅读
  • 评分标准(0-10分):

    • 9-10分:非常吸引人,引人入胜
    • 7-8分:比较吸引人,有亮点
    • 5-6分:有一定吸引力,但不够突出
    • 0-4分:吸引力不足,难以引起兴趣

3. 说服力(persuasion)

  • 评估要点:

    • 论据是否充分
    • 逻辑是否严密
    • 是否能有效影响读者
    • 是否有行动号召力
  • 评分标准(0-10分):

    • 9-10分:说服力很强,逻辑严密
    • 7-8分:说服力较强,有说服力
    • 5-6分:有一定说服力,但不够充分
    • 0-4分:说服力不足,难以影响读者

4. 专业性(professionalism)

  • 评估要点:

    • 词汇使用是否专业
    • 表达是否规范
    • 是否有语法错误
    • 格式是否规范
  • 评分标准(0-10分):

    • 9-10分:非常专业,规范严谨
    • 7-8分:较专业,有小瑕疵
    • 5-6分:基本专业,有一些不规范之处
    • 0-4分:专业性不足,存在较多问题

5. 创意性(creativity)

  • 评估要点:

    • 表达是否有新意
    • 是否有独特角度
    • 是否有创意元素
    • 是否令人印象深刻
  • 评分标准(0-10分):

    • 9-10分:非常有创意,独具匠心
    • 7-8分:较有创意,有亮点
    • 5-6分:有一定创意,但不够突出
    • 0-4分:创意不足,较为平淡

6. 可读性(readability)

  • 评估要点:

    • 句子长度是否适中
    • 段落结构是否合理
    • 用词是否易懂
    • 阅读体验是否流畅
  • 评分标准(0-10分):

    • 9-10分:可读性非常好,阅读体验流畅
    • 7-8分:可读性较好,有少量小问题
    • 5-6分:可读性一般,有一些不够流畅之处
    • 0-4分:可读性较差,阅读体验不佳

7. 情感影响力(emotional_impact)

  • 评估要点:

    • 是否能引发情感共鸣
    • 情感表达是否到位
    • 是否有感染力
    • 是否能留下深刻印象
  • 评分标准(0-10分):

    • 9-10分:情感影响力很强,深刻共鸣
    • 7-8分:情感影响力较强,有共鸣
    • 5-6分:有一定情感影响,但不够深刻
    • 0-4分:情感影响力不足,难以引起共鸣

8. 目标受众契合度(target_audience_fit)

  • 评估要点:

    • 语言风格是否符合受众习惯
    • 内容是否满足受众需求
    • 是否贴近受众兴趣点
    • 是否能引发受众互动
  • 评分标准(0-10分):

    • 9-10分:高度契合目标受众
    • 7-8分:较契合目标受众
    • 5-6分:基本契合,有改进空间
    • 0-4分:不够契合目标受众

评估流程

1. 版本分析

  • 分析每个版本的内容特征
  • 识别每个版本的优缺点
  • 提取各版本的关键信息

2. 维度评分

  • 根据选定的evaluation_criteria,对每个版本进行评分
  • 每个维度0-10分,1分一档
  • 计算每个版本的平均总分

3. 对比分析

  • 对比不同版本在各维度上的表现
  • 识别各版本的强项和弱项
  • 分析版本之间的差异

4. 综合评估

  • 综合考虑各维度表现
  • 结合target_audience和use_case
  • 给出版本选择建议

5. 优化建议

  • 为每个版本提供优化建议
  • 指出可以改进的方向
  • 提供具体的修改建议

版本排名方法

综合评分排名

  • 计算每个版本的平均总分
  • 按照总分从高到低排名
  • 考虑各维度的权重(根据use_case调整)

场景适配排名

  • 根据use_case,调整各维度权重
  • 计算加权总分
  • 按照加权总分排名

例如:

  • 营销推广场景:engagement、persuasion权重更高
  • 信息传达场景:clarity、readability权重更高
  • 品牌建设场景:professionalism、target_audience_fit权重更高

评估报告结构

1. 概述

  • 版本数量
  • 评估标准
  • 目标受众
  • 使用场景

2. 各版本详细分析

  • 版本A分析

    • 版本信息
    • 各维度评分
    • 优缺点分析
    • 优化建议
  • 版本B分析

    • ...

3. 对比分析

  • 各版本评分对比表
  • 各维度表现对比
  • 版本差异分析

4. 版本排名

  • 综合评分排名
  • 场景适配排名
  • 推荐版本

5. 选择建议

  • 根据不同需求的版本选择建议
  • 各版本的最佳适用场景
  • 组合优化建议

快速模式

当用户输入包含完整的versions时,直接使用默认参数(全部评估标准,普通大众受众,根据内容自动判断场景,对比+评分评估,提供优化建议)执行。

交互问题模板(仅在用户未提供必要参数时显示)

我将为您评估这些版本,请确认以下要求:

1. 版本列表(必选):
   请提供需要评估的版本(2-5个)
   格式示例:
   版本A:(内容)
   版本B:(内容)

2. 评估标准(可多选,可选):
   [1] 清晰度
   [2] 吸引力
   [3] 说服力
   [4] 专业性
   [5] 创意性
   [6] 可读性
   [7] 情感影响力
   [8] 目标受众契合度

3. 目标受众(可选):
   [1] 普通大众
   [2] 专业人士
   [3] 年轻群体
   [4] 商务人士
   [5] 学术界
   [6] 自定义(请描述)

4. 使用场景(可选):
   [1] 营销推广
   [2] 信息传达
   [3] 教育培训
   [4] 娱乐
   [5] 品牌建设
   [6] 自定义

5. 评估方法(可选):
   [1] 对比评估
   [2] 评分评估
   [3] 对比+评分(推荐)

6. 是否提供优化建议(可选):
   [1] 提供各版本的优化建议(推荐)
   [2] 不提供

您可以:
- 一次性回复所有信息
- 回复部分参数,我再确认是否需要补充
- 回复"评估"或"好的",使用推荐设置执行(推荐:全部评估标准,普通大众受众,根据内容自动判断场景,对比+评分,提供优化建议)
- 如果你有其他想法,可在回复的时候一并描述告知

请回复:

示例

示例1:两个版本对比评估

输入

versions: [
  {"version_name": "版本A", "content": "我们的产品功能强大,操作简单,界面友好。欢迎体验!"},
  {"version_name": "版本B", "content": "这款产品超好用,功能超强,上手超简单,界面超好看!赶紧来试试!"}
]
evaluation_criteria: ["clarity", "engagement", "persuasion", "readability"]
evaluation_method: "both"

输出

【版本评估报告】

概述:
- 版本数量:2个
- 评估标准:清晰度、吸引力、说服力、可读性
- 目标受众:普通大众
- 使用场景:营销推广

---

各版本详细分析:

【版本A】
内容:"我们的产品功能强大,操作简单,界面友好。欢迎体验!"

各维度评分:
- 清晰度:9/10 - 表达非常清晰,无歧义
- 吸引力:6/10 - 表达较为平淡,缺乏吸引力
- 说服力:7/10 - 有说服力,但不够强烈
- 可读性:10/10 - 可读性非常好

总分:8/10

优点:
- 表达清晰简洁
- 语言规范专业
- 可读性强

缺点:
- 吸引力不足,较平淡
- 说服力不够强

优化建议:
1. 增强吸引力:可以使用更生动的表达,如"功能超强"、"超好用"
2. 增强说服力:可以加入具体数据或案例,如"已有10万用户选择"

---

【版本B】
内容:"这款产品超好用,功能超强,上手超简单,界面超好看!赶紧来试试!"

各维度评分:
- 清晰度:8/10 - 表达较清晰,但"超"字重复使用略显冗余
- 吸引力:9/10 - 非常吸引人,活泼生动
- 说服力:8/10 - 说服力较强,有号召力
- 可读性:7/10 - 可读性较好,但"超"字重复略显啰嗦

总分:8/10

优点:
- 非常吸引人,活泼生动
- 有强烈的行动号召力
- 符合年轻受众喜好

缺点:
- "超"字重复使用略显冗余
- 专业性略低

优化建议:
1. 减少"超"字的使用,避免重复
2. 可以适当提升专业性,如将"超好用"改为"非常好用"

---

对比分析:

| 维度 | 版本A | 版本B | 胜出 |
|------|-------|-------|------|
| 清晰度 | 9/10 | 8/10 | 版本A |
| 吸引力 | 6/10 | 9/10 | 版本B |
| 说服力 | 7/10 | 8/10 | 版本B |
| 可读性 | 10/10 | 7/10 | 版本A |

综合对比:
- 版本A在清晰度和可读性上更优
- 版本B在吸引力和说服力上更优
- 两个版本各有优势,适合不同场景

---

版本排名:

1. 综合评分排名:
   第1名:版本A(8/10)和版本B(8/10)并列

2. 场景适配排名(营销推广场景,吸引力和说服力权重更高):
   第1名:版本B
   第2名:版本A

---

选择建议:

1. 如果目标是提升品牌形象和专业性:
   推荐:版本A
   理由:版本A更专业、更规范,适合品牌建设

2. 如果目标是提升转化率和用户点击:
   推荐:版本B
   理由:版本B更具吸引力,有更强的行动号召力

3. 如果目标受众是年轻群体:
   推荐:版本B
   理由:版本B的语言风格更符合年轻受众喜好

4. 如果目标受众是商务人士:
   推荐:版本A
   理由:版本A更专业、更正式

---

组合优化建议:

可以考虑结合两个版本的优点,创建一个优化版本:

优化版本:
"这款产品功能强大,非常好用,操作简单,界面友好。已有10万用户选择,赶紧来体验!"

优化要点:
- 保留版本B的吸引力:"这款"、"非常好用"、"赶紧来体验!"
- 保留版本A的专业性:"功能强大"、"操作简单"、"界面友好"
- 增加说服力:"已有10万用户选择"

示例2:多版本评估(营销推广场景)

输入

versions: [
  {"version_name": "版本A", "content": "产品限时特惠,原价299元,现在只需99元!", "version_info": "直接折扣型"},
  {"version_name": "版本B", "content": "价值299元的产品,今天99元带回家!仅限今日!", "version_info": "限时强调型"},
  {"version_name": "版本C", "content": "99元即可拥有价值299元的产品,还赠送VIP会员!", "version_info": "赠送优惠型"}
]
evaluation_criteria: ["clarity", "engagement", "persuasion"]
target_audience: "general"
use_case: "marketing"
evaluation_method: "both"
provide_optimization_suggestions: true

输出

【版本评估报告】

概述:
- 版本数量:3个
- 评估标准:清晰度、吸引力、说服力
- 目标受众:普通大众
- 使用场景:营销推广

---

各版本详细分析:

【版本A:直接折扣型】
内容:"产品限时特惠,原价299元,现在只需99元!"

各维度评分:
- 清晰度:10/10 - 非常清晰,价格信息一目了然
- 吸引力:7/10 - 有吸引力,但略显平淡
- 说服力:8/10 - 说服力较强,价格对比明显

总分:8.3/10

优点:
- 价格信息非常清晰
- 直接展示优惠力度
- 简洁明了

缺点:
- 吸引力不够强,缺乏情感冲击
- 缺少紧迫感

优化建议:
1. 增强吸引力:可以加入情感元素,如"超值"、"必抢"
2. 增强紧迫感:可以强调限时,如"今日特惠"、"仅限今日"

---

【版本B:限时强调型】
内容:"价值299元的产品,今天99元带回家!仅限今日!"

各维度评分:
- 清晰度:9/10 - 清晰明了,信息完整
- 吸引力:9/10 - 非常吸引人,情感冲击强
- 说服力:9/10 - 说服力很强,有紧迫感

总分:9/10

优点:
- 非常吸引人,情感冲击强
- 紧迫感强,激发购买冲动
- 表达生动,"带回家"很接地气

缺点:
- 基本无明显缺点

优化建议:
- 已经很优秀,可以保持

---

【版本C:赠送优惠型】
内容:"99元即可拥有价值299元的产品,还赠送VIP会员!"

各维度评分:
- 清晰度:8/10 - 较清晰,但信息稍多
- 吸引力:8/10 - 较有吸引力,有赠送亮点
- 说服力:9/10 - 说服力很强,赠送更有吸引力

总分:8.3/10

优点:
- 赠送增加了吸引力
- 性价比感知强
- 说服力强

缺点:
- 信息稍多,清晰度略逊于版本A和B
- 缺少紧迫感

优化建议:
1. 增强紧迫感:可以加上"今日特惠"、"限时"等
2. 提升清晰度:可以简化表达,如"99元=价值299元产品+VIP会员"

---

对比分析:

| 维度 | 版本A | 版本B | 版本C | 胜出 |
|------|-------|-------|-------|------|
| 清晰度 | 10/10 | 9/10 | 8/10 | 版本A |
| 吸引力 | 7/10 | 9/10 | 8/10 | 版本B |
| 说服力 | 8/10 | 9/10 | 9/10 | 版本B&C |

综合对比:
- 版本A在清晰度上最优
- 版本B在吸引力和说服力上最优
- 版本C在说服力上表现优秀,赠送是亮点

---

版本排名:

1. 综合评分排名:
   第1名:版本B(9/10)
   第2名:版本A和版本C(8.3/10)并列

2. 场景适配排名(营销推广场景,吸引力和说服力权重更高):
   第1名:版本B
   第2名:版本C
   第3名:版本A

---

选择建议:

1. 如果目标是快速转化,强调紧迫感:
   推荐:版本B
   理由:版本B紧迫感最强,吸引力最大,最容易激发购买冲动

2. 如果目标是传递超值感,强调性价比:
   推荐:版本C
   理由:版本C通过赠送,增强了超值感,性价比感知更强

3. 如果目标是清晰传达信息,避免信息过载:
   推荐:版本A
   理由:版本A最清晰简洁,信息最容易理解

---

组合优化建议:

可以考虑结合版本B的紧迫感和版本C的赠送,创建一个终极版本:

终极优化版本:
"价值299元的产品,今天99元带回家!还赠送VIP会员!仅限今日!"

优化要点:
- 保留版本B的紧迫感和生动表达:"今天"、"带回家"、"仅限今日!"
- 保留版本C的赠送亮点:"还赠送VIP会员!"
- 价格对比清晰:价值299元 vs 99元

示例3:评分评估(不提供优化建议)

输入

versions: [
  {"version_name": "版本A", "content": "人工智能技术正在改变我们的生活。"},
  {"version_name": "版本B", "content": "AI技术正以前所未有的速度改变着我们的生活。"},
  {"version_name": "版本C", "content": "人工智能技术的发展正在深刻影响着我们生活的方方面面。"}
]
evaluation_criteria: ["clarity", "professionalism", "readability"]
evaluation_method: "scoring"
provide_optimization_suggestions: false

输出

【版本评估报告】

概述:
- 版本数量:3个
- 评估标准:清晰度、专业性、可读性
- 目标受众:普通大众
- 使用场景:信息传达

---

各版本详细分析:

【版本A】
内容:"人工智能技术正在改变我们的生活。"

各维度评分:
- 清晰度:10/10 - 表达非常清晰,无歧义
- 专业性:8/10 - 使用规范术语,专业度较高
- 可读性:10/10 - 句子简洁,可读性非常好

总分:9.3/10

优点:
- 表达简洁清晰
- 术语使用规范
- 易于理解

缺点:
- 表达较为平淡,缺乏深度

---

【版本B】
内容:"AI技术正以前所未有的速度改变着我们的生活。"

各维度评分:
- 清晰度:8/10 - 表达较清晰,但"前所未有的速度"略显夸张
- 专业性:7/10 - "AI"是缩写,不如"人工智能"规范
- 可读性:9/10 - 句子略长,但可读性较好

总分:8/10

优点:
- 表达较为生动
- 有一定的感染力

缺点:
- 使用缩写"AI",不够规范
- "前所未有的速度"略显夸张

---

【版本C】
内容:"人工智能技术的发展正在深刻影响着我们生活的方方面面。"

各维度评分:
- 清晰度:7/10 - 表达略显冗长,"方方面面"稍显模糊
- 专业性:9/10 - 使用规范术语,表达专业
- 可读性:7/10 - 句子较长,可读性一般

总分:7.7/10

优点:
- 表达专业规范
- "深刻影响"有深度

缺点:
- 句子过长
- "方方面面"略显模糊,影响清晰度

---

版本排名:

综合评分排名:
第1名:版本A(9.3/10)
第2名:版本B(8/10)
第3名:版本C(7.7/10)

---

选择建议:

1. 如果目标是简洁清晰地传达信息:
   推荐:版本A
   理由:版本A最简洁清晰,最易于理解

2. 如果目标是表达生动,有感染力:
   推荐:版本B
   理由:版本B表达较为生动,有一定的感染力

3. 如果目标是专业表达,有深度:
   推荐:版本C
   理由:版本C表达最为专业,有深度

4. 综合推荐:
   版本A的综合表现最优,最推荐使用

注意事项

  1. 评估是基于AI分析,仅供参考,最终决策应由人工判断
  2. 不同场景下,各评估标准的权重应有所调整
  3. 目标受众和使用场景对评估结果有重要影响,请准确填写
  4. 优化建议是基于当前版本提出的,仅供参考
  5. 评估结果可能与实际A/B测试结果存在差异,建议结合实际数据综合判断

参数调整提示

在生成内容后,如果对当前结果不满意,可以尝试调整以下参数:

💡 参数调整选项:

  1. 评估标准: clarity清晰度 | engagement吸引力 | persuasion说服力 | professionalism专业性 | creativity创意性 | readability可读性 | emotional_impact情感影响力 | target_audience_fit目标受众契合度
  2. 目标受众: general普通大众 | professional专业人士 | youth年轻群体 | business商务人士 | academic学术界
  3. 使用场景: marketing营销推广 | information信息传达 | education教育培训 | entertainment娱乐 | brand_building品牌建设
  4. 评估方法: comparative对比评估 | scoring评分评估 | both对比+评分
  5. 是否提供优化建议: true提供优化建议 | false不提供

使用方式: 直接回复如 "重点评估吸引力和说服力" 或 "改为营销推广场景"

与其他技能的关联

  • review_text: 如果需要对单个版本进行全面审校,应使用此技能
  • rewrite_content: 如果需要对版本进行改写,可配合使用
  • check_style_consistency: 如果需要检查多个版本的风格一致性,应使用此技能
  • content_imitation: 如果需要让版本A模仿版本B的风格,可使用此技能

配置文件引用

  • intent_keywords: ["版本评估", "版本对比", "A/B测试", "版本选择", "多版本评估"]
  • evaluation_criteria_weights: 在config/evaluation_weights.json中定义不同场景下各评估标准的权重

Weekly Installs
4
Repository
sunqb/ccsdk
GitHub Stars
2
First Seen
Feb 9, 2026
Installed on
opencode4
gemini-cli3
claude-code3
codex3
cursor3
replit2