ai-business-write/config/prompt_config.json

206 lines
14 KiB
JSON
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"prompt_template": {
"intro": "请从以下输入文本中提取结构化信息。仔细分析文本内容,准确提取每个字段的值。\n\n⚠ 重要提醒:请逐字逐句仔细阅读输入文本,不要遗漏任何信息。对于性别、年龄、职务、单位、文化程度等字段,请特别仔细查找,这些信息可能以各种形式出现在文本中。",
"input_text_label": "输入文本:",
"output_fields_label": "需要提取的字段(请仔细分析每个字段,确保提取完整):",
"json_format_label": "请严格按照以下JSON格式返回结果只返回JSON对象不要包含任何其他文字说明或markdown代码块标记",
"requirements_label": "重要要求(请严格遵守):",
"requirements": [
"⚠️ 逐字逐句仔细分析输入文本,不要遗漏任何信息。请特别关注性别、年龄、职务、单位、文化程度等字段",
"对于每个字段,请从多个角度思考:直接提及、同义词、隐含信息、可推断信息。例如:性别可能以\"男\"、\"女\"、\"男性\"、\"女性\"、\"先生\"、\"女士\"等形式出现",
"如果文本中明确提到某个信息(如\"30岁\"、\"男\"、\"总经理\"、\"某公司\"等),必须提取出来,不能设为空",
"如果可以通过已有信息合理推断,请进行推断并填写:\n - 根据出生年月如1980年05月和当前年份2024年计算年龄44岁\n - 从单位及职务(如\"某公司总经理\")中拆分单位(\"某公司\")和职务(\"总经理\"\n - 从工作基本情况中提取性别、文化程度等信息",
"如果某个字段在输入文本中确实找不到任何相关信息,该字段值才设为空字符串\"\"",
"日期格式统一为中文格式YYYY年MM月1980年05月表示1980年5月如果包含日期信息则格式为YYYY年MM月DD日1985年05月17日。注意年份必须是4位数字月份和日期必须是2位数字如1980年5月应格式化为1980年05月不是1980年5月",
"性别统一为\"男\"或\"女\",不要使用\"男性\"或\"女性\"。如果文本中提到\"男性\"、\"男\"、\"先生\"等,统一转换为\"男\";如果提到\"女性\"、\"女\"、\"女士\"等,统一转换为\"女\"",
"年龄字段:如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"直接提取数字如果只有出生年月可以根据当前年份计算年龄当前年份为2024年",
"单位及职务字段:如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要同时提取单位名称和职务名称",
"单位字段:从单位及职务信息中提取单位名称部分(如\"XX公司\"、\"XX局\"、\"XX部门\"等)",
"职务字段:从单位及职务信息中提取职务名称部分(如\"总经理\"、\"局长\"、\"主任\"等)",
"文化程度字段:注意识别\"本科\"、\"大专\"、\"高中\"、\"中专\"、\"研究生\"、\"硕士\"、\"博士\"等表述",
"政治面貌使用标准表述(如:中共党员、中共预备党员、共青团员、群众等)。如果文本中提到\"党员\",统一转换为\"中共党员\"",
"职级使用标准表述(如:正处级、副处级、正科级、副科级等)",
"线索来源字段:注意识别\"举报\"、\"来信\"、\"来电\"、\"网络举报\"、\"上级交办\"等表述",
"主要问题线索字段:提取文本中关于问题、线索、举报内容等的描述",
"身份证号码只提取数字,不包含其他字符",
"联系方式提取电话号码,格式化为纯数字",
"地址信息保持完整,包含省市区街道等详细信息",
"只返回JSON对象不要包含markdown代码块标记、思考过程或其他说明文字",
"JSON格式要求所有字段名必须使用双引号字段名中不能包含前导点如不能使用\".target_gender\",应使用\"target_gender\"),字段名前后不能有空格",
"必须返回所有要求的字段即使值为空字符串也要包含在JSON中",
"字段名必须严格按照JSON示例中的字段编码不能随意修改或拼写错误如不能使用\"targetsProfessionalRank\",应使用\"target_professional_rank\""
]
},
"field_formatting": {
"input_field_format": "{field_code}: {field_value}",
"output_field_format": "- {field_name} (字段编码: {field_code})"
},
"field_specific_rules": {
"target_name": {
"description": "被核查人姓名",
"rules": [
"提取完整姓名,包括姓氏和名字",
"如果文本中包含多个姓名,提取最相关的那个"
]
},
"target_gender": {
"description": "被核查人员性别",
"rules": [
"只能返回\"男\"或\"女\"",
"如果文本中提到\"男性\"、\"男性公民\"、\"男\"、\"先生\"等,统一转换为\"男\"",
"如果文本中提到\"女性\"、\"女性公民\"、\"女\"、\"女士\"等,统一转换为\"女\"",
"请仔细查找文本中所有可能表示性别的词汇,不要遗漏",
"如果文本中提到\"XXX...\"或\"XXX...\",必须提取性别",
"如果工作基本情况中提到性别信息,必须提取"
]
},
"target_date_of_birth": {
"description": "被核查人员出生年月",
"rules": [
"格式YYYY年MM月中文格式如1980年05月表示1980年5月注意月份必须是2位数字如5月应写为05月不是5月",
"如果只有年份月份设为01如1980年应格式化为1980年01月",
"如果文本中提到\"X年X月X日出生\",只提取年月,忽略日期",
"如果文本中提到\"1980年5月\",格式化为\"1980年05月\"(月份补零)",
"如果文本中提到\"1980年05月\",保持为\"1980年05月\"",
"年份必须是4位数字月份必须是2位数字01-12",
"输出格式示例1980年05月、1985年03月、1990年12月"
]
},
"target_date_of_birth_full": {
"description": "被核查人员出生年月日",
"rules": [
"格式YYYY年MM月DD日中文格式如1985年05月17日表示1985年5月17日",
"如果只有年月日期设为01如1980年05月应格式化为1980年05月01日",
"年份必须是4位数字月份和日期必须是2位数字01-12和01-31",
"输出格式示例1985年05月17日、1980年03月15日、1990年12月01日"
]
},
"target_political_status": {
"description": "被核查人员政治面貌",
"rules": [
"使用标准表述:中共党员、中共预备党员、共青团员、群众、无党派人士等",
"如果文本中提到\"党员\",统一转换为\"中共党员\"",
"如果文本中提到\"非党员\",统一转换为\"群众\""
]
},
"target_professional_rank": {
"description": "被核查人员职级",
"rules": [
"使用标准表述:正处级、副处级、正科级、副科级、正厅级、副厅级等",
"保持原文中的职级表述"
]
},
"target_id_number": {
"description": "被核查人员身份证号",
"rules": [
"提取18位身份证号码只包含数字和可能的最后一位X",
"如果文本中只有部分号码,保持原样",
"不包含其他字符如空格、横线等"
]
},
"target_contact": {
"description": "被核查人员联系方式",
"rules": [
"提取电话号码,格式化为纯数字",
"如果是手机号提取11位数字",
"如果是座机,包含区号和号码"
]
},
"target_work_basic_info": {
"description": "被核查人员工作基本情况",
"rules": [
"必须严格按照以下格式规范化输出:",
"格式XXX汉族19XX年X月出生山西XX人XX学历19XX年X月参加工作20XX年X月加入中国共产党。19XX年X月至20XX年X月先后在XXXX工作20XX年X月至20XX年X月任XXXXX20XX年X月至20XX年X月任XXXX20XX年X月至今任XXXXX。",
"第一部分(基本信息):姓名,性别,民族,出生年月,籍贯,学历,参加工作时间,入党时间",
"第二部分(工作经历):按时间顺序列出工作经历,使用分号分隔",
"工作经历格式19XX年X月至20XX年X月任XXXXX先后在XXXX工作",
"最后一段工作经历使用\"至今\"表示当前职位",
"如果信息不完整,只输出能够提取到的部分,保持格式规范",
"日期格式统一为\"19XX年X月\"或\"20XX年X月\"月份为1-12的数字不补零",
"籍贯格式:省份+市/县,如\"山西太原\"、\"山西XX\"",
"学历使用标准表述:本科、大专、高中、中专、研究生等",
"政治面貌部分:如果是中共党员,写\"加入中国共产党\";如果不是,省略此部分"
]
},
"target_age": {
"description": "被核查人员年龄",
"rules": [
"如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"、\"年龄30\"、\"现年30\"),直接提取数字部分",
"如果无法抽取到年龄数据,但抽取到了\"被核查人员出生年月\",系统将根据出生年月和当前日期自动计算年龄",
"年龄格式:纯数字,单位为岁,如\"44\"表示44岁",
"如果文本中既没有直接提到年龄,也没有出生年月信息,则设为空字符串"
]
},
"target_organization_and_position": {
"description": "被核查人员单位及职务(包括兼职)",
"rules": [
"提取完整的单位及职务信息,格式如:\"XX公司总经理\"、\"XX局XX处处长\"、\"XX单位XX职务\"",
"如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要完整提取",
"如果文本中分别提到单位和职务,需要组合成\"单位+职务\"的格式",
"如果文本中提到多个职务或兼职,需要全部包含,用\"、\"或\"兼\"连接",
"保持原文中的表述,不要随意修改"
]
},
"target_organization": {
"description": "被核查人员单位",
"rules": [
"从单位及职务信息中提取单位名称部分",
"单位名称包括:公司、企业、机关、事业单位、部门等(如\"XX公司\"、\"XX局\"、\"XX部门\"、\"XX委员会\"等)",
"如果文本中只提到单位名称,直接提取",
"⚠️ 如果文本中提到\"XX公司总经理\",必须提取\"XX公司\"部分,不能设为空",
"如果文本中提到\"XX单位XX职务\",提取\"XX单位\"部分",
"如果已有单位及职务字段target_organization_and_position必须从中拆分出单位名称",
"保持单位名称的完整性,不要遗漏"
]
},
"target_position": {
"description": "被核查人员职务",
"rules": [
"从单位及职务信息中提取职务名称部分",
"职务名称包括:总经理、经理、局长、处长、科长、主任、书记、部长等",
"如果文本中只提到职务名称,直接提取",
"⚠️ 如果文本中提到\"XX公司总经理\",必须提取\"总经理\"部分,不能设为空",
"如果文本中提到\"XX单位XX职务\",提取\"XX职务\"部分",
"如果已有单位及职务字段target_organization_and_position必须从中拆分出职务名称",
"如果文本中提到多个职务,需要全部提取,用\"、\"连接",
"保持职务名称的准确性"
]
},
"target_education_level": {
"description": "被核查人员文化程度",
"rules": [
"识别文本中关于学历、文化程度的表述",
"标准表述包括:小学、初中、高中、中专、大专、本科、研究生、硕士、博士等",
"如果文本中提到\"大学\"、\"大学毕业\",通常指\"本科\"",
"如果文本中提到\"专科\",通常指\"大专\"",
"如果文本中提到\"研究生学历\",可以写\"研究生\"",
"保持标准表述,不要使用非标准表述"
]
},
"clue_source": {
"description": "线索来源",
"rules": [
"识别文本中关于线索来源的表述",
"常见来源包括:举报、来信、来电、网络举报、上级交办、巡视发现、审计发现、媒体曝光等",
"如果文本中提到\"举报\"、\"被举报\",线索来源可能是\"举报\"或\"来信举报\"",
"如果文本中提到\"电话\"、\"来电\",线索来源可能是\"来电举报\"",
"如果文本中提到\"网络\"、\"网上\",线索来源可能是\"网络举报\"",
"如果文本中提到\"上级\"、\"交办\",线索来源可能是\"上级交办\"",
"如果文本中没有明确提到线索来源,但提到\"举报\"相关信息,可以推断为\"举报\"",
"保持标准表述"
]
},
"target_issue_description": {
"description": "主要问题线索",
"rules": [
"提取文本中关于问题、线索、举报内容等的描述",
"包括但不限于:违纪违法问题、工作作风问题、经济问题、生活作风问题等",
"如果文本中提到\"问题\"、\"线索\"、\"举报\"、\"反映\"等关键词,提取相关内容",
"保持问题描述的完整性和准确性,不要遗漏重要信息",
"如果文本中没有明确的问题描述,但提到了相关情况,也要尽量提取"
]
}
}
}