90 lines
3.6 KiB
JSON
90 lines
3.6 KiB
JSON
{
|
||
"prompt_template": {
|
||
"intro": "请从以下输入文本中提取结构化信息。",
|
||
"input_text_label": "输入文本:",
|
||
"output_fields_label": "需要提取的字段:",
|
||
"json_format_label": "请严格按照以下JSON格式返回结果,只返回JSON,不要包含其他文字说明:",
|
||
"requirements_label": "要求:",
|
||
"requirements": [
|
||
"仔细分析输入文本,准确提取每个字段的值",
|
||
"如果某个字段在输入文本中找不到对应信息,该字段值设为空字符串\"\"",
|
||
"日期格式统一为YYYYMM(如:198005表示1980年5月),如果包含日期信息则格式为YYYYMMDD",
|
||
"性别统一为\"男\"或\"女\",不要使用\"男性\"或\"女性\"",
|
||
"政治面貌使用标准表述(如:中共党员、中共预备党员、共青团员、群众等)",
|
||
"职级使用标准表述(如:正处级、副处级、正科级、副科级等)",
|
||
"身份证号码只提取数字,不包含其他字符",
|
||
"联系方式提取电话号码,格式化为纯数字",
|
||
"地址信息保持完整,包含省市区街道等详细信息",
|
||
"只返回JSON对象,不要包含markdown代码块标记"
|
||
]
|
||
},
|
||
"field_formatting": {
|
||
"input_field_format": "{field_code}: {field_value}",
|
||
"output_field_format": "- {field_name} (字段编码: {field_code})"
|
||
},
|
||
"field_specific_rules": {
|
||
"target_name": {
|
||
"description": "被核查人姓名",
|
||
"rules": [
|
||
"提取完整姓名,包括姓氏和名字",
|
||
"如果文本中包含多个姓名,提取最相关的那个"
|
||
]
|
||
},
|
||
"target_gender": {
|
||
"description": "被核查人员性别",
|
||
"rules": [
|
||
"只能返回\"男\"或\"女\"",
|
||
"如果文本中提到\"男性\"、\"男性公民\"等,统一转换为\"男\"",
|
||
"如果文本中提到\"女性\"、\"女性公民\"等,统一转换为\"女\""
|
||
]
|
||
},
|
||
"target_date_of_birth": {
|
||
"description": "被核查人员出生年月",
|
||
"rules": [
|
||
"格式:YYYYMM,如198005表示1980年5月",
|
||
"如果只有年份,月份设为01",
|
||
"如果文本中提到\"X年X月X日出生\",只提取年月,忽略日期"
|
||
]
|
||
},
|
||
"target_date_of_birth_full": {
|
||
"description": "被核查人员出生年月日",
|
||
"rules": [
|
||
"格式:YYYYMMDD,如19800515表示1980年5月15日",
|
||
"如果只有年月,日期设为01"
|
||
]
|
||
},
|
||
"target_political_status": {
|
||
"description": "被核查人员政治面貌",
|
||
"rules": [
|
||
"使用标准表述:中共党员、中共预备党员、共青团员、群众、无党派人士等",
|
||
"如果文本中提到\"党员\",统一转换为\"中共党员\"",
|
||
"如果文本中提到\"非党员\",统一转换为\"群众\""
|
||
]
|
||
},
|
||
"target_professional_rank": {
|
||
"description": "被核查人员职级",
|
||
"rules": [
|
||
"使用标准表述:正处级、副处级、正科级、副科级、正厅级、副厅级等",
|
||
"保持原文中的职级表述"
|
||
]
|
||
},
|
||
"target_id_number": {
|
||
"description": "被核查人员身份证号",
|
||
"rules": [
|
||
"提取18位身份证号码,只包含数字和可能的最后一位X",
|
||
"如果文本中只有部分号码,保持原样",
|
||
"不包含其他字符如空格、横线等"
|
||
]
|
||
},
|
||
"target_contact": {
|
||
"description": "被核查人员联系方式",
|
||
"rules": [
|
||
"提取电话号码,格式化为纯数字",
|
||
"如果是手机号,提取11位数字",
|
||
"如果是座机,包含区号和号码"
|
||
]
|
||
}
|
||
}
|
||
}
|
||
|