192 lines
11 KiB
JSON
192 lines
11 KiB
JSON
{
|
||
"prompt_template": {
|
||
"intro": "你是一个专业的信息提取助手。请仔细阅读以下输入文本,全面分析其中的所有信息,包括显式信息和可以合理推断的信息。对于每个需要提取的字段,请仔细查找文本中的相关信息,包括但不限于:直接提及的信息、隐含的信息、可以通过上下文推断的信息。",
|
||
"input_text_label": "输入文本:",
|
||
"output_fields_label": "需要提取的字段(请仔细分析每个字段,确保提取完整):",
|
||
"json_format_label": "请严格按照以下JSON格式返回结果,只返回JSON对象,不要包含任何其他文字说明、思考过程或markdown代码块标记:",
|
||
"requirements_label": "重要要求(请严格遵守):",
|
||
"requirements": [
|
||
"逐字逐句仔细分析输入文本,不要遗漏任何信息",
|
||
"对于每个字段,请从多个角度思考:直接提及、同义词、隐含信息、可推断信息",
|
||
"如果文本中明确提到某个信息,必须提取出来,不能设为空",
|
||
"如果可以通过已有信息合理推断(如根据出生年月推算年龄),请进行推断并填写",
|
||
"如果某个字段在输入文本中确实找不到任何相关信息,该字段值才设为空字符串\"\"",
|
||
"日期格式统一为YYYYMM(如:198005表示1980年5月),如果包含日期信息则格式为YYYYMMDD",
|
||
"性别统一为\"男\"或\"女\",不要使用\"男性\"或\"女性\"。如果文本中提到\"男性\"、\"男\"、\"先生\"等,统一转换为\"男\";如果提到\"女性\"、\"女\"、\"女士\"等,统一转换为\"女\"",
|
||
"年龄字段:如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"),直接提取数字;如果只有出生年月,可以根据当前年份计算年龄(当前年份为2024年)",
|
||
"单位及职务字段:如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要同时提取单位名称和职务名称",
|
||
"单位字段:从单位及职务信息中提取单位名称部分(如\"XX公司\"、\"XX局\"、\"XX部门\"等)",
|
||
"职务字段:从单位及职务信息中提取职务名称部分(如\"总经理\"、\"局长\"、\"主任\"等)",
|
||
"文化程度字段:注意识别\"本科\"、\"大专\"、\"高中\"、\"中专\"、\"研究生\"、\"硕士\"、\"博士\"等表述",
|
||
"政治面貌使用标准表述(如:中共党员、中共预备党员、共青团员、群众等)。如果文本中提到\"党员\",统一转换为\"中共党员\"",
|
||
"职级使用标准表述(如:正处级、副处级、正科级、副科级等)",
|
||
"线索来源字段:注意识别\"举报\"、\"来信\"、\"来电\"、\"网络举报\"、\"上级交办\"等表述",
|
||
"主要问题线索字段:提取文本中关于问题、线索、举报内容等的描述",
|
||
"身份证号码只提取数字,不包含其他字符",
|
||
"联系方式提取电话号码,格式化为纯数字",
|
||
"地址信息保持完整,包含省市区街道等详细信息",
|
||
"只返回JSON对象,不要包含markdown代码块标记、思考过程或其他说明文字"
|
||
]
|
||
},
|
||
"field_formatting": {
|
||
"input_field_format": "{field_code}: {field_value}",
|
||
"output_field_format": "- {field_name} (字段编码: {field_code})"
|
||
},
|
||
"field_specific_rules": {
|
||
"target_name": {
|
||
"description": "被核查人姓名",
|
||
"rules": [
|
||
"提取完整姓名,包括姓氏和名字",
|
||
"如果文本中包含多个姓名,提取最相关的那个"
|
||
]
|
||
},
|
||
"target_gender": {
|
||
"description": "被核查人员性别",
|
||
"rules": [
|
||
"只能返回\"男\"或\"女\"",
|
||
"如果文本中提到\"男性\"、\"男性公民\"等,统一转换为\"男\"",
|
||
"如果文本中提到\"女性\"、\"女性公民\"等,统一转换为\"女\""
|
||
]
|
||
},
|
||
"target_date_of_birth": {
|
||
"description": "被核查人员出生年月",
|
||
"rules": [
|
||
"格式:YYYYMM,如198005表示1980年5月",
|
||
"如果只有年份,月份设为01",
|
||
"如果文本中提到\"X年X月X日出生\",只提取年月,忽略日期"
|
||
]
|
||
},
|
||
"target_date_of_birth_full": {
|
||
"description": "被核查人员出生年月日",
|
||
"rules": [
|
||
"格式:YYYYMMDD,如19800515表示1980年5月15日",
|
||
"如果只有年月,日期设为01"
|
||
]
|
||
},
|
||
"target_political_status": {
|
||
"description": "被核查人员政治面貌",
|
||
"rules": [
|
||
"使用标准表述:中共党员、中共预备党员、共青团员、群众、无党派人士等",
|
||
"如果文本中提到\"党员\",统一转换为\"中共党员\"",
|
||
"如果文本中提到\"非党员\",统一转换为\"群众\""
|
||
]
|
||
},
|
||
"target_professional_rank": {
|
||
"description": "被核查人员职级",
|
||
"rules": [
|
||
"使用标准表述:正处级、副处级、正科级、副科级、正厅级、副厅级等",
|
||
"保持原文中的职级表述"
|
||
]
|
||
},
|
||
"target_id_number": {
|
||
"description": "被核查人员身份证号",
|
||
"rules": [
|
||
"提取18位身份证号码,只包含数字和可能的最后一位X",
|
||
"如果文本中只有部分号码,保持原样",
|
||
"不包含其他字符如空格、横线等"
|
||
]
|
||
},
|
||
"target_contact": {
|
||
"description": "被核查人员联系方式",
|
||
"rules": [
|
||
"提取电话号码,格式化为纯数字",
|
||
"如果是手机号,提取11位数字",
|
||
"如果是座机,包含区号和号码"
|
||
]
|
||
},
|
||
"target_work_basic_info": {
|
||
"description": "被核查人员工作基本情况",
|
||
"rules": [
|
||
"必须严格按照以下格式规范化输出:",
|
||
"格式:XXX,男,汉族,19XX年X月出生,山西XX人,XX学历,19XX年X月参加工作,20XX年X月加入中国共产党。19XX年X月至20XX年X月,先后在XXXX工作;20XX年X月至20XX年X月,任XXXXX;20XX年X月至20XX年X月,任XXXX;20XX年X月至今,任XXXXX。",
|
||
"第一部分(基本信息):姓名,性别,民族,出生年月,籍贯,学历,参加工作时间,入党时间",
|
||
"第二部分(工作经历):按时间顺序列出工作经历,使用分号分隔",
|
||
"工作经历格式:19XX年X月至20XX年X月,任XXXXX(或:先后在XXXX工作)",
|
||
"最后一段工作经历使用\"至今\"表示当前职位",
|
||
"如果信息不完整,只输出能够提取到的部分,保持格式规范",
|
||
"日期格式统一为\"19XX年X月\"或\"20XX年X月\",月份为1-12的数字,不补零",
|
||
"籍贯格式:省份+市/县,如\"山西太原\"、\"山西XX\"",
|
||
"学历使用标准表述:本科、大专、高中、中专、研究生等",
|
||
"政治面貌部分:如果是中共党员,写\"加入中国共产党\";如果不是,省略此部分"
|
||
]
|
||
},
|
||
"target_age": {
|
||
"description": "被核查人员年龄",
|
||
"rules": [
|
||
"如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"、\"年龄30\"),直接提取数字部分",
|
||
"如果只有出生年月(如\"1980年5月出生\"、\"198005\"),可以根据当前年份(2024年)计算年龄",
|
||
"年龄格式:纯数字,单位为岁,如\"44\"表示44岁",
|
||
"如果文本中既没有直接提到年龄,也没有出生年月信息,则设为空字符串"
|
||
]
|
||
},
|
||
"target_organization_and_position": {
|
||
"description": "被核查人员单位及职务(包括兼职)",
|
||
"rules": [
|
||
"提取完整的单位及职务信息,格式如:\"XX公司总经理\"、\"XX局XX处处长\"、\"XX单位XX职务\"",
|
||
"如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要完整提取",
|
||
"如果文本中分别提到单位和职务,需要组合成\"单位+职务\"的格式",
|
||
"如果文本中提到多个职务或兼职,需要全部包含,用\"、\"或\"兼\"连接",
|
||
"保持原文中的表述,不要随意修改"
|
||
]
|
||
},
|
||
"target_organization": {
|
||
"description": "被核查人员单位",
|
||
"rules": [
|
||
"从单位及职务信息中提取单位名称部分",
|
||
"单位名称包括:公司、企业、机关、事业单位、部门等(如\"XX公司\"、\"XX局\"、\"XX部门\"、\"XX委员会\"等)",
|
||
"如果文本中只提到单位名称,直接提取",
|
||
"如果文本中提到\"XX公司总经理\",提取\"XX公司\"部分",
|
||
"如果文本中提到\"XX单位XX职务\",提取\"XX单位\"部分",
|
||
"保持单位名称的完整性,不要遗漏"
|
||
]
|
||
},
|
||
"target_position": {
|
||
"description": "被核查人员职务",
|
||
"rules": [
|
||
"从单位及职务信息中提取职务名称部分",
|
||
"职务名称包括:总经理、经理、局长、处长、科长、主任、书记、部长等",
|
||
"如果文本中只提到职务名称,直接提取",
|
||
"如果文本中提到\"XX公司总经理\",提取\"总经理\"部分",
|
||
"如果文本中提到\"XX单位XX职务\",提取\"XX职务\"部分",
|
||
"如果文本中提到多个职务,需要全部提取,用\"、\"连接",
|
||
"保持职务名称的准确性"
|
||
]
|
||
},
|
||
"target_education_level": {
|
||
"description": "被核查人员文化程度",
|
||
"rules": [
|
||
"识别文本中关于学历、文化程度的表述",
|
||
"标准表述包括:小学、初中、高中、中专、大专、本科、研究生、硕士、博士等",
|
||
"如果文本中提到\"大学\"、\"大学毕业\",通常指\"本科\"",
|
||
"如果文本中提到\"专科\",通常指\"大专\"",
|
||
"如果文本中提到\"研究生学历\",可以写\"研究生\"",
|
||
"保持标准表述,不要使用非标准表述"
|
||
]
|
||
},
|
||
"clue_source": {
|
||
"description": "线索来源",
|
||
"rules": [
|
||
"识别文本中关于线索来源的表述",
|
||
"常见来源包括:举报、来信、来电、网络举报、上级交办、巡视发现、审计发现、媒体曝光等",
|
||
"如果文本中提到\"举报\"、\"被举报\",线索来源可能是\"举报\"或\"来信举报\"",
|
||
"如果文本中提到\"电话\"、\"来电\",线索来源可能是\"来电举报\"",
|
||
"如果文本中提到\"网络\"、\"网上\",线索来源可能是\"网络举报\"",
|
||
"如果文本中提到\"上级\"、\"交办\",线索来源可能是\"上级交办\"",
|
||
"如果文本中没有明确提到线索来源,但提到\"举报\"相关信息,可以推断为\"举报\"",
|
||
"保持标准表述"
|
||
]
|
||
},
|
||
"target_issue_description": {
|
||
"description": "主要问题线索",
|
||
"rules": [
|
||
"提取文本中关于问题、线索、举报内容等的描述",
|
||
"包括但不限于:违纪违法问题、工作作风问题、经济问题、生活作风问题等",
|
||
"如果文本中提到\"问题\"、\"线索\"、\"举报\"、\"反映\"等关键词,提取相关内容",
|
||
"保持问题描述的完整性和准确性,不要遗漏重要信息",
|
||
"如果文本中没有明确的问题描述,但提到了相关情况,也要尽量提取"
|
||
]
|
||
}
|
||
}
|
||
}
|
||
|