{ "prompt_template": { "intro": "请从以下输入文本中提取结构化信息。仔细分析文本内容,准确提取每个字段的值。\n\n⚠️ 重要提醒:请逐字逐句仔细阅读输入文本,不要遗漏任何信息。对于性别、年龄、职务、单位、文化程度等字段,请特别仔细查找,这些信息可能以各种形式出现在文本中。", "input_text_label": "输入文本:", "output_fields_label": "需要提取的字段(请仔细分析每个字段,确保提取完整):", "json_format_label": "请严格按照以下JSON格式返回结果,只返回JSON对象,不要包含任何其他文字说明或markdown代码块标记:", "requirements_label": "重要要求(请严格遵守):", "requirements": [ "⚠️ 逐字逐句仔细分析输入文本,不要遗漏任何信息。请特别关注性别、年龄、职务、单位、文化程度等字段", "对于每个字段,请从多个角度思考:直接提及、同义词、隐含信息、可推断信息。例如:性别可能以\"男\"、\"女\"、\"男性\"、\"女性\"、\"先生\"、\"女士\"等形式出现", "如果文本中明确提到某个信息(如\"30岁\"、\"男\"、\"总经理\"、\"某公司\"等),必须提取出来,不能设为空", "如果可以通过已有信息合理推断,请进行推断并填写:\n - 根据出生年月(如1980年05月)和当前年份(2024年)计算年龄(44岁)\n - 从单位及职务(如\"某公司总经理\")中拆分单位(\"某公司\")和职务(\"总经理\")\n - 从工作基本情况中提取性别、文化程度等信息", "如果某个字段在输入文本中确实找不到任何相关信息,该字段值才设为空字符串\"\"", "日期格式统一为中文格式:YYYY年MM月(如:1980年05月表示1980年5月),如果包含日期信息则格式为YYYY年MM月DD日(如:1985年05月17日)。注意:年份必须是4位数字,月份和日期必须是2位数字(如1980年5月应格式化为1980年05月,不是1980年5月)", "性别统一为\"男\"或\"女\",不要使用\"男性\"或\"女性\"。如果文本中提到\"男性\"、\"男\"、\"先生\"等,统一转换为\"男\";如果提到\"女性\"、\"女\"、\"女士\"等,统一转换为\"女\"", "年龄字段:如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"),直接提取数字;如果只有出生年月,可以根据当前年份计算年龄(当前年份为2024年)", "单位及职务字段:如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要同时提取单位名称和职务名称", "单位字段:从单位及职务信息中提取单位名称部分(如\"XX公司\"、\"XX局\"、\"XX部门\"等)", "职务字段:从单位及职务信息中提取职务名称部分(如\"总经理\"、\"局长\"、\"主任\"等)", "文化程度字段:注意识别\"本科\"、\"大专\"、\"高中\"、\"中专\"、\"研究生\"、\"硕士\"、\"博士\"等表述", "政治面貌使用标准表述(如:中共党员、中共预备党员、共青团员、群众等)。如果文本中提到\"党员\",统一转换为\"中共党员\"", "职级使用标准表述(如:正处级、副处级、正科级、副科级等)", "线索来源字段:注意识别\"举报\"、\"来信\"、\"来电\"、\"网络举报\"、\"上级交办\"等表述", "主要问题线索字段:提取文本中关于问题、线索、举报内容等的描述", "身份证号码只提取数字,不包含其他字符", "联系方式提取电话号码,格式化为纯数字", "地址信息保持完整,包含省市区街道等详细信息", "只返回JSON对象,不要包含markdown代码块标记、思考过程或其他说明文字", "JSON格式要求:所有字段名必须使用双引号,字段名中不能包含前导点(如不能使用\".target_gender\",应使用\"target_gender\"),字段名前后不能有空格", "必须返回所有要求的字段,即使值为空字符串也要包含在JSON中", "字段名必须严格按照JSON示例中的字段编码,不能随意修改或拼写错误(如不能使用\"targetsProfessionalRank\",应使用\"target_professional_rank\")" ] }, "field_formatting": { "input_field_format": "{field_code}: {field_value}", "output_field_format": "- {field_name} (字段编码: {field_code})" }, "field_specific_rules": { "target_name": { "description": "被核查人姓名", "rules": [ "提取完整姓名,包括姓氏和名字", "如果文本中包含多个姓名,提取最相关的那个" ] }, "target_gender": { "description": "被核查人员性别", "rules": [ "只能返回\"男\"或\"女\"", "如果文本中提到\"男性\"、\"男性公民\"、\"男\"、\"先生\"等,统一转换为\"男\"", "如果文本中提到\"女性\"、\"女性公民\"、\"女\"、\"女士\"等,统一转换为\"女\"", "请仔细查找文本中所有可能表示性别的词汇,不要遗漏", "如果文本中提到\"XXX,男,...\"或\"XXX,女,...\",必须提取性别", "如果工作基本情况中提到性别信息,必须提取" ] }, "target_date_of_birth": { "description": "被核查人员出生年月", "rules": [ "格式:YYYY年MM月(中文格式),如1980年05月表示1980年5月(注意:月份必须是2位数字,如5月应写为05月,不是5月)", "如果只有年份,月份设为01(如1980年应格式化为1980年01月)", "如果文本中提到\"X年X月X日出生\",只提取年月,忽略日期", "如果文本中提到\"1980年5月\",格式化为\"1980年05月\"(月份补零)", "如果文本中提到\"1980年05月\",保持为\"1980年05月\"", "年份必须是4位数字,月份必须是2位数字(01-12)", "输出格式示例:1980年05月、1985年03月、1990年12月" ] }, "target_date_of_birth_full": { "description": "被核查人员出生年月日", "rules": [ "格式:YYYY年MM月DD日(中文格式),如1985年05月17日表示1985年5月17日", "如果只有年月,日期设为01(如1980年05月应格式化为1980年05月01日)", "年份必须是4位数字,月份和日期必须是2位数字(01-12和01-31)", "输出格式示例:1985年05月17日、1980年03月15日、1990年12月01日" ] }, "target_political_status": { "description": "被核查人员政治面貌", "rules": [ "使用标准表述:中共党员、中共预备党员、共青团员、群众、无党派人士等", "如果文本中提到\"党员\",统一转换为\"中共党员\"", "如果文本中提到\"非党员\",统一转换为\"群众\"" ] }, "target_professional_rank": { "description": "被核查人员职级", "rules": [ "使用标准表述:正处级、副处级、正科级、副科级、正厅级、副厅级等", "保持原文中的职级表述" ] }, "target_id_number": { "description": "被核查人员身份证号", "rules": [ "提取18位身份证号码,只包含数字和可能的最后一位X", "如果文本中只有部分号码,保持原样", "不包含其他字符如空格、横线等" ] }, "target_contact": { "description": "被核查人员联系方式", "rules": [ "提取电话号码,格式化为纯数字", "如果是手机号,提取11位数字", "如果是座机,包含区号和号码" ] }, "target_work_basic_info": { "description": "被核查人员工作基本情况", "rules": [ "必须严格按照以下格式规范化输出:", "格式:XXX,男,汉族,19XX年X月出生,山西XX人,XX学历,19XX年X月参加工作,20XX年X月加入中国共产党。19XX年X月至20XX年X月,先后在XXXX工作;20XX年X月至20XX年X月,任XXXXX;20XX年X月至20XX年X月,任XXXX;20XX年X月至今,任XXXXX。", "第一部分(基本信息):姓名,性别,民族,出生年月,籍贯,学历,参加工作时间,入党时间", "第二部分(工作经历):按时间顺序列出工作经历,使用分号分隔", "工作经历格式:19XX年X月至20XX年X月,任XXXXX(或:先后在XXXX工作)", "最后一段工作经历使用\"至今\"表示当前职位", "如果信息不完整,只输出能够提取到的部分,保持格式规范", "日期格式统一为\"19XX年X月\"或\"20XX年X月\",月份为1-12的数字,不补零", "籍贯格式:省份+市/县,如\"山西太原\"、\"山西XX\"", "学历使用标准表述:本科、大专、高中、中专、研究生等", "政治面貌部分:如果是中共党员,写\"加入中国共产党\";如果不是,省略此部分" ] }, "target_age": { "description": "被核查人员年龄", "rules": [ "如果文本中直接提到年龄(如\"30岁\"、\"30周岁\"、\"年龄30\"、\"现年30\"),直接提取数字部分", "如果只有出生年月(如\"1980年5月出生\"、\"1980年05月\"),必须根据当前年份(2024年)计算年龄(如1980年出生,2024-1980=44岁)", "年龄格式:纯数字,单位为岁,如\"44\"表示44岁", "⚠️ 如果已有出生年月信息,必须计算年龄,不能设为空字符串", "如果文本中既没有直接提到年龄,也没有出生年月信息,则设为空字符串" ] }, "target_organization_and_position": { "description": "被核查人员单位及职务(包括兼职)", "rules": [ "提取完整的单位及职务信息,格式如:\"XX公司总经理\"、\"XX局XX处处长\"、\"XX单位XX职务\"", "如果文本中提到\"XX公司总经理\"、\"XX单位XX职务\"等,需要完整提取", "如果文本中分别提到单位和职务,需要组合成\"单位+职务\"的格式", "如果文本中提到多个职务或兼职,需要全部包含,用\"、\"或\"兼\"连接", "保持原文中的表述,不要随意修改" ] }, "target_organization": { "description": "被核查人员单位", "rules": [ "从单位及职务信息中提取单位名称部分", "单位名称包括:公司、企业、机关、事业单位、部门等(如\"XX公司\"、\"XX局\"、\"XX部门\"、\"XX委员会\"等)", "如果文本中只提到单位名称,直接提取", "⚠️ 如果文本中提到\"XX公司总经理\",必须提取\"XX公司\"部分,不能设为空", "如果文本中提到\"XX单位XX职务\",提取\"XX单位\"部分", "如果已有单位及职务字段(target_organization_and_position),必须从中拆分出单位名称", "保持单位名称的完整性,不要遗漏" ] }, "target_position": { "description": "被核查人员职务", "rules": [ "从单位及职务信息中提取职务名称部分", "职务名称包括:总经理、经理、局长、处长、科长、主任、书记、部长等", "如果文本中只提到职务名称,直接提取", "⚠️ 如果文本中提到\"XX公司总经理\",必须提取\"总经理\"部分,不能设为空", "如果文本中提到\"XX单位XX职务\",提取\"XX职务\"部分", "如果已有单位及职务字段(target_organization_and_position),必须从中拆分出职务名称", "如果文本中提到多个职务,需要全部提取,用\"、\"连接", "保持职务名称的准确性" ] }, "target_education_level": { "description": "被核查人员文化程度", "rules": [ "识别文本中关于学历、文化程度的表述", "标准表述包括:小学、初中、高中、中专、大专、本科、研究生、硕士、博士等", "如果文本中提到\"大学\"、\"大学毕业\",通常指\"本科\"", "如果文本中提到\"专科\",通常指\"大专\"", "如果文本中提到\"研究生学历\",可以写\"研究生\"", "保持标准表述,不要使用非标准表述" ] }, "clue_source": { "description": "线索来源", "rules": [ "识别文本中关于线索来源的表述", "常见来源包括:举报、来信、来电、网络举报、上级交办、巡视发现、审计发现、媒体曝光等", "如果文本中提到\"举报\"、\"被举报\",线索来源可能是\"举报\"或\"来信举报\"", "如果文本中提到\"电话\"、\"来电\",线索来源可能是\"来电举报\"", "如果文本中提到\"网络\"、\"网上\",线索来源可能是\"网络举报\"", "如果文本中提到\"上级\"、\"交办\",线索来源可能是\"上级交办\"", "如果文本中没有明确提到线索来源,但提到\"举报\"相关信息,可以推断为\"举报\"", "保持标准表述" ] }, "target_issue_description": { "description": "主要问题线索", "rules": [ "提取文本中关于问题、线索、举报内容等的描述", "包括但不限于:违纪违法问题、工作作风问题、经济问题、生活作风问题等", "如果文本中提到\"问题\"、\"线索\"、\"举报\"、\"反映\"等关键词,提取相关内容", "保持问题描述的完整性和准确性,不要遗漏重要信息", "如果文本中没有明确的问题描述,但提到了相关情况,也要尽量提取" ] } } }