# .doc 文件转换说明 ## 问题说明 `process_templates.py` 脚本需要将 `.doc` 文件转换为 `.docx` 格式才能处理。如果转换失败,通常是因为: 1. **未安装 pywin32** - Python 无法访问 Windows COM 组件 2. **未安装 Microsoft Word** - 系统没有 Word 应用程序 3. **Word 无法访问** - Word 被其他程序占用或权限问题 ## 解决方案 ### 方案1:使用批处理脚本自动转换(推荐) 运行提供的批处理脚本: ```bash 批量转换doc到docx.bat ``` 这个脚本会: - 自动查找所有 `.doc` 文件 - 使用 Microsoft Word 批量转换 - 保存到对应的目录结构 **要求:** - 已安装 Microsoft Word(不是 WPS) - Windows 系统 ### 方案2:手动转换(最可靠) 1. **使用 Microsoft Word 打开文件** - 双击 `.doc` 文件,用 Word 打开 - 或者右键 → 打开方式 → Microsoft Word 2. **另存为 .docx 格式** - 文件 → 另存为 - 文件类型选择:`Word 文档 (*.docx)` - 保存到 `模板` 文件夹的对应位置 3. **批量转换** - 在 Word 中打开多个文件 - 使用宏或脚本批量转换(需要 VBA 知识) ### 方案3:安装 pywin32(如果已安装 Word) ```bash pip install pywin32 ``` 然后重新运行 `process_templates.py` **注意:** 即使安装了 pywin32,如果系统没有安装 Microsoft Word,转换仍然会失败。 ### 方案4:使用在线转换工具 1. 使用在线转换工具(如 Zamzar、CloudConvert 等) 2. 上传 `.doc` 文件 3. 下载转换后的 `.docx` 文件 4. 保存到 `模板` 文件夹的对应位置 ## 转换后的文件结构 转换后的文件应该保存在 `模板` 文件夹下,保持原有的目录结构: ``` 模板/ ├── 2-初核模版/ │ ├── 1.初核请示/ │ │ ├── 1.请示报告卡(XXX).docx ← 转换后的文件 │ │ ├── 2.初步核实审批表(XXX).docx │ │ └── 3.附件初核方案(XXX).docx │ └── ... └── ... ``` ## 验证转换结果 转换完成后,检查: 1. **文件是否存在** ```bash # 检查文件是否存在 dir /s /b 模板\*.docx ``` 2. **文件是否可以打开** - 尝试用 Word 打开转换后的文件 - 确认内容完整 3. **重新运行处理脚本** ```bash python process_templates.py ``` ## 常见问题 ### Q1: 提示 "未找到 Microsoft Word" **A:** 确保已安装 Microsoft Word,而不是 WPS Office。脚本需要 Microsoft Word 的 COM 接口。 ### Q2: 转换后文件损坏 **A:** - 检查原始文件是否完整 - 尝试手动用 Word 打开并另存为 - 检查文件权限 ### Q3: 转换速度慢 **A:** - 这是正常现象,Word 转换需要时间 - 可以分批转换,先转换重要的文件 ### Q4: 某些文件转换失败 **A:** - 检查文件是否被其他程序占用 - 尝试手动转换这些文件 - 检查文件是否损坏 ## 推荐流程 1. **先尝试批处理脚本** ```bash 批量转换doc到docx.bat ``` 2. **如果批处理脚本失败,手动转换** - 打开 Word - 批量打开 `.doc` 文件 - 逐个另存为 `.docx` 3. **验证转换结果** - 检查文件是否都在正确位置 - 尝试打开几个文件确认内容 4. **运行处理脚本** ```bash python process_templates.py ``` ## 注意事项 1. **备份原始文件** - 转换前建议备份原始 `.doc` 文件 2. **保持目录结构** - 转换后的文件应该保持原有的目录结构 3. **文件命名** - 确保文件名清晰,便于识别 4. **检查内容** - 转换后检查文件内容是否完整