python e38ba42669 删除多个不再需要的文档，包括AI服务错误分析报告、模板树状结构更新说明、数据库备份和恢复工具使用说明等，简化项目结构，提升可维护性。同时，更新文档服务以支持从input_data和template_code中提取模板配置，增强查询逻辑的灵活性。

2025-12-10 10:39:36 +08:00

5.6 KiB

Raw Blame History

AI服务错误分析报告

问题描述

在API响应过程中，模型返回了错误消息："抱歉，我似乎遇到了困难。在尝试生成响应时出现了一些错误。如果您能重新提交请求，我将尽力提供更好的帮助。"

日志分析

1. Token使用情况

max_tokens: 12000
completion_tokens: 597
total_tokens: 3947
结论: ❌ 不是max_tokens参数的问题。实际使用的token数量远小于限制，不存在token截断问题。

2. 响应内容分析

从日志中可以看到，模型返回的JSON存在严重格式错误：

错误1: 字段名错误和转义字符问题

"_source\\\": \\\"\\\"

应该是: "clue_source": ""
问题: 字段名错误（_source 而不是 clue_source），且存在转义字符问题

错误2: 字段名格式错误

\\\" target_position \\\":

应该是: "target_position":
问题: 字段名前后有转义字符和空格

错误3: 值格式错误

\"total_manager,

应该是: "总经理"
问题: 值不完整，且格式错误

错误4: 字段名拼写错误

\" target_organisation \": \"\n}

应该是: "target_organization": ""
问题: 字段名拼写错误（organisation 而不是 organization），且格式不完整

错误5: 关键字段缺失

target_gender: 应该是 "男"，但返回为空字符串
target_professional_rank: 应该是 "正处级"，但返回为空字符串

3. 思考模式影响

从响应内容可以看到：

模型在生成JSON之前有一段思考过程（被</think>标签包裹）
思考过程可能消耗了部分token，但更重要的是，思考模式可能导致模型在生成JSON时出现不稳定

根本原因分析

主要原因（按可能性排序）

思考模式（enable_thinking）导致生成不稳定 ⭐⭐⭐⭐⭐
- DeepSeek-R1模型在开启思考模式时，可能会在生成过程中遇到内部错误
- 思考过程可能影响后续JSON生成的准确性
- 建议：考虑关闭思考模式或调整相关参数
提示词过于复杂 ⭐⭐⭐⭐
- 提示词包含大量详细要求和示例
- 模型在处理复杂提示词时可能出现格式错误
- 建议：简化提示词，明确JSON格式要求
模型内部错误 ⭐⭐⭐
- 模型在生成过程中遇到内部错误，导致JSON生成中断
- 最终输出了错误消息而非完整JSON
- 建议：增加重试机制和错误处理
JSON修复机制不够完善 ⭐⭐
- 虽然代码中有JSON修复逻辑，但对于这种严重格式错误可能无法完全修复
- 建议：增强JSON修复机制，特别是处理转义字符和字段名错误

解决方案建议

方案1: 调整思考模式参数（推荐）

# 在 services/ai_service.py 中
payload = {
    # ... 其他参数 ...
    "enable_thinking": False,  # 暂时关闭思考模式
    # 或者
    "enable_thinking": True,
    "thinking_config": {
        "max_thinking_tokens": 1000,  # 限制思考过程的token数量
    }
}

方案2: 优化提示词

简化system prompt，明确JSON格式要求：

system_content = """你是一个专业的数据提取助手。请严格按照JSON格式返回结果。

重要要求：
1. 只返回JSON对象，不要包含任何其他文字说明
2. 字段名必须严格按照示例格式
3. 如果信息不存在，使用空字符串""

JSON格式示例：
{
  "target_name": "张三",
  "target_gender": "男",
  "target_professional_rank": "正处级",
  "clue_source": "群众举报"
}
"""

方案3: 增强JSON修复机制

在 _fix_json_string 方法中增加对以下错误的处理：

修复 _source -> clue_source 的字段名映射
修复 target_organisation -> target_organization 的拼写错误
处理转义字符问题（\\\" -> "）
处理字段名前后的空格和转义字符

方案4: 增加重试机制

代码中已有重试机制，但可以针对JSON解析失败的情况增加专门的重试逻辑：

# 如果JSON解析失败，且错误消息包含"抱歉"，则重试
if "抱歉" in content or "遇到困难" in content:
    print("[AI服务] 检测到模型错误消息，将重试...")
    # 重试逻辑

方案5: 降低temperature参数

当前temperature为0.2，已经较低。可以进一步降低以提高确定性：

"temperature": 0.1,  # 进一步降低，提高确定性

立即行动建议

短期（立即）：
- 暂时关闭思考模式（enable_thinking: False）进行测试
- 如果问题解决，说明是思考模式导致的问题
中期（1-2天）：
- 优化提示词，简化要求
- 增强JSON修复机制，处理常见错误
长期（1周内）：
- 如果必须使用思考模式，考虑调整相关参数
- 增加更完善的错误处理和重试机制

测试建议

使用相同的输入数据，分别测试：
- enable_thinking: True vs False
- 不同的 temperature 值（0.1, 0.2, 0.3）
- 不同的 max_tokens 值（8000, 12000, 16000）
记录每次测试的结果，找出最佳参数组合
如果问题持续存在，考虑联系模型服务提供商（华为）寻求支持

总结

核心结论：问题不是max_tokens参数导致的，而是思考模式（enable_thinking）可能导致模型生成不稳定，从而产生格式错误的JSON。

建议优先级：

🔴 高优先级：暂时关闭思考模式进行测试
🟡 中优先级：优化提示词，增强JSON修复机制
🟢 低优先级：调整其他参数，联系服务提供商

5.6 KiB Raw Blame History Unescape Escape