ai-business-write/config/prompt_config.json

192 lines
11 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"prompt_template": {
"intro": "你是一个专业的信息提取助手。请仔细阅读以下输入文本,全面分析其中的所有信息,包括显式信息和可以合理推断的信息。对于每个需要提取的字段,请仔细查找文本中的相关信息,包括但不限于:直接提及的信息、隐含的信息、可以通过上下文推断的信息。",
"input_text_label": "输入文本:",
"output_fields_label": "需要提取的字段(请仔细分析每个字段,确保提取完整):",
"json_format_label": "请严格按照以下JSON格式返回结果只返回JSON对象不要包含任何其他文字说明、思考过程或markdown代码块标记",
"requirements_label": "重要要求(请严格遵守):",
"requirements": [
"逐字逐句仔细分析输入文本,不要遗漏任何信息",
"对于每个字段,请从多个角度思考:直接提及、同义词、隐含信息、可推断信息",
"如果文本中明确提到某个信息,必须提取出来,不能设为空",
"如果可以通过已有信息合理推断(如根据出生年月推算年龄),请进行推断并填写",
"如果某个字段在输入文本中确实找不到任何相关信息,该字段值才设为空字符串\"\"",
"日期格式统一为YYYYMM198005表示1980年5月如果包含日期信息则格式为YYYYMMDD",
"性别统一为\"男\"或\"女\",不要使用\"男性\"或\"女性\"。如果文本中提到\"男性\"、\"男\"、\"先生\"等,统一转换为\"男\";如果提到\"女性\"、\"女\"、\"女士\"等,统一转换为\"女\"",
"年龄字段:如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"直接提取数字如果只有出生年月可以根据当前年份计算年龄当前年份为2024年",
"单位及职务字段:如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要同时提取单位名称和职务名称",
"单位字段:从单位及职务信息中提取单位名称部分(如\"XX公司\"、\"XX局\"、\"XX部门\"等)",
"职务字段:从单位及职务信息中提取职务名称部分(如\"总经理\"、\"局长\"、\"主任\"等)",
"文化程度字段:注意识别\"本科\"、\"大专\"、\"高中\"、\"中专\"、\"研究生\"、\"硕士\"、\"博士\"等表述",
"政治面貌使用标准表述(如:中共党员、中共预备党员、共青团员、群众等)。如果文本中提到\"党员\",统一转换为\"中共党员\"",
"职级使用标准表述(如:正处级、副处级、正科级、副科级等)",
"线索来源字段:注意识别\"举报\"、\"来信\"、\"来电\"、\"网络举报\"、\"上级交办\"等表述",
"主要问题线索字段:提取文本中关于问题、线索、举报内容等的描述",
"身份证号码只提取数字,不包含其他字符",
"联系方式提取电话号码,格式化为纯数字",
"地址信息保持完整,包含省市区街道等详细信息",
"只返回JSON对象不要包含markdown代码块标记、思考过程或其他说明文字"
]
},
"field_formatting": {
"input_field_format": "{field_code}: {field_value}",
"output_field_format": "- {field_name} (字段编码: {field_code})"
},
"field_specific_rules": {
"target_name": {
"description": "被核查人姓名",
"rules": [
"提取完整姓名,包括姓氏和名字",
"如果文本中包含多个姓名,提取最相关的那个"
]
},
"target_gender": {
"description": "被核查人员性别",
"rules": [
"只能返回\"男\"或\"女\"",
"如果文本中提到\"男性\"、\"男性公民\"等,统一转换为\"男\"",
"如果文本中提到\"女性\"、\"女性公民\"等,统一转换为\"女\""
]
},
"target_date_of_birth": {
"description": "被核查人员出生年月",
"rules": [
"格式YYYYMM如198005表示1980年5月",
"如果只有年份月份设为01",
"如果文本中提到\"X年X月X日出生\",只提取年月,忽略日期"
]
},
"target_date_of_birth_full": {
"description": "被核查人员出生年月日",
"rules": [
"格式YYYYMMDD如19800515表示1980年5月15日",
"如果只有年月日期设为01"
]
},
"target_political_status": {
"description": "被核查人员政治面貌",
"rules": [
"使用标准表述:中共党员、中共预备党员、共青团员、群众、无党派人士等",
"如果文本中提到\"党员\",统一转换为\"中共党员\"",
"如果文本中提到\"非党员\",统一转换为\"群众\""
]
},
"target_professional_rank": {
"description": "被核查人员职级",
"rules": [
"使用标准表述:正处级、副处级、正科级、副科级、正厅级、副厅级等",
"保持原文中的职级表述"
]
},
"target_id_number": {
"description": "被核查人员身份证号",
"rules": [
"提取18位身份证号码只包含数字和可能的最后一位X",
"如果文本中只有部分号码,保持原样",
"不包含其他字符如空格、横线等"
]
},
"target_contact": {
"description": "被核查人员联系方式",
"rules": [
"提取电话号码,格式化为纯数字",
"如果是手机号提取11位数字",
"如果是座机,包含区号和号码"
]
},
"target_work_basic_info": {
"description": "被核查人员工作基本情况",
"rules": [
"必须严格按照以下格式规范化输出:",
"格式XXX汉族19XX年X月出生山西XX人XX学历19XX年X月参加工作20XX年X月加入中国共产党。19XX年X月至20XX年X月先后在XXXX工作20XX年X月至20XX年X月任XXXXX20XX年X月至20XX年X月任XXXX20XX年X月至今任XXXXX。",
"第一部分(基本信息):姓名,性别,民族,出生年月,籍贯,学历,参加工作时间,入党时间",
"第二部分(工作经历):按时间顺序列出工作经历,使用分号分隔",
"工作经历格式19XX年X月至20XX年X月任XXXXX先后在XXXX工作",
"最后一段工作经历使用\"至今\"表示当前职位",
"如果信息不完整,只输出能够提取到的部分,保持格式规范",
"日期格式统一为\"19XX年X月\"或\"20XX年X月\"月份为1-12的数字不补零",
"籍贯格式:省份+市/县,如\"山西太原\"、\"山西XX\"",
"学历使用标准表述:本科、大专、高中、中专、研究生等",
"政治面貌部分:如果是中共党员,写\"加入中国共产党\";如果不是,省略此部分"
]
},
"target_age": {
"description": "被核查人员年龄",
"rules": [
"如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"、\"年龄30\"),直接提取数字部分",
"如果只有出生年月(如\"1980年5月出生\"、\"198005\"可以根据当前年份2024年计算年龄",
"年龄格式:纯数字,单位为岁,如\"44\"表示44岁",
"如果文本中既没有直接提到年龄,也没有出生年月信息,则设为空字符串"
]
},
"target_organization_and_position": {
"description": "被核查人员单位及职务(包括兼职)",
"rules": [
"提取完整的单位及职务信息,格式如:\"XX公司总经理\"、\"XX局XX处处长\"、\"XX单位XX职务\"",
"如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要完整提取",
"如果文本中分别提到单位和职务,需要组合成\"单位+职务\"的格式",
"如果文本中提到多个职务或兼职,需要全部包含,用\"、\"或\"兼\"连接",
"保持原文中的表述,不要随意修改"
]
},
"target_organization": {
"description": "被核查人员单位",
"rules": [
"从单位及职务信息中提取单位名称部分",
"单位名称包括:公司、企业、机关、事业单位、部门等(如\"XX公司\"、\"XX局\"、\"XX部门\"、\"XX委员会\"等)",
"如果文本中只提到单位名称,直接提取",
"如果文本中提到\"XX公司总经理\",提取\"XX公司\"部分",
"如果文本中提到\"XX单位XX职务\",提取\"XX单位\"部分",
"保持单位名称的完整性,不要遗漏"
]
},
"target_position": {
"description": "被核查人员职务",
"rules": [
"从单位及职务信息中提取职务名称部分",
"职务名称包括:总经理、经理、局长、处长、科长、主任、书记、部长等",
"如果文本中只提到职务名称,直接提取",
"如果文本中提到\"XX公司总经理\",提取\"总经理\"部分",
"如果文本中提到\"XX单位XX职务\",提取\"XX职务\"部分",
"如果文本中提到多个职务,需要全部提取,用\"、\"连接",
"保持职务名称的准确性"
]
},
"target_education_level": {
"description": "被核查人员文化程度",
"rules": [
"识别文本中关于学历、文化程度的表述",
"标准表述包括:小学、初中、高中、中专、大专、本科、研究生、硕士、博士等",
"如果文本中提到\"大学\"、\"大学毕业\",通常指\"本科\"",
"如果文本中提到\"专科\",通常指\"大专\"",
"如果文本中提到\"研究生学历\",可以写\"研究生\"",
"保持标准表述,不要使用非标准表述"
]
},
"clue_source": {
"description": "线索来源",
"rules": [
"识别文本中关于线索来源的表述",
"常见来源包括:举报、来信、来电、网络举报、上级交办、巡视发现、审计发现、媒体曝光等",
"如果文本中提到\"举报\"、\"被举报\",线索来源可能是\"举报\"或\"来信举报\"",
"如果文本中提到\"电话\"、\"来电\",线索来源可能是\"来电举报\"",
"如果文本中提到\"网络\"、\"网上\",线索来源可能是\"网络举报\"",
"如果文本中提到\"上级\"、\"交办\",线索来源可能是\"上级交办\"",
"如果文本中没有明确提到线索来源,但提到\"举报\"相关信息,可以推断为\"举报\"",
"保持标准表述"
]
},
"target_issue_description": {
"description": "主要问题线索",
"rules": [
"提取文本中关于问题、线索、举报内容等的描述",
"包括但不限于:违纪违法问题、工作作风问题、经济问题、生活作风问题等",
"如果文本中提到\"问题\"、\"线索\"、\"举报\"、\"反映\"等关键词,提取相关内容",
"保持问题描述的完整性和准确性,不要遗漏重要信息",
"如果文本中没有明确的问题描述,但提到了相关情况,也要尽量提取"
]
}
}
}