149 lines
3.6 KiB
Markdown
149 lines
3.6 KiB
Markdown
# .doc 文件转换说明
|
||
|
||
## 问题说明
|
||
|
||
`process_templates.py` 脚本需要将 `.doc` 文件转换为 `.docx` 格式才能处理。如果转换失败,通常是因为:
|
||
|
||
1. **未安装 pywin32** - Python 无法访问 Windows COM 组件
|
||
2. **未安装 Microsoft Word** - 系统没有 Word 应用程序
|
||
3. **Word 无法访问** - Word 被其他程序占用或权限问题
|
||
|
||
## 解决方案
|
||
|
||
### 方案1:使用批处理脚本自动转换(推荐)
|
||
|
||
运行提供的批处理脚本:
|
||
|
||
```bash
|
||
批量转换doc到docx.bat
|
||
```
|
||
|
||
这个脚本会:
|
||
- 自动查找所有 `.doc` 文件
|
||
- 使用 Microsoft Word 批量转换
|
||
- 保存到对应的目录结构
|
||
|
||
**要求:**
|
||
- 已安装 Microsoft Word(不是 WPS)
|
||
- Windows 系统
|
||
|
||
### 方案2:手动转换(最可靠)
|
||
|
||
1. **使用 Microsoft Word 打开文件**
|
||
- 双击 `.doc` 文件,用 Word 打开
|
||
- 或者右键 → 打开方式 → Microsoft Word
|
||
|
||
2. **另存为 .docx 格式**
|
||
- 文件 → 另存为
|
||
- 文件类型选择:`Word 文档 (*.docx)`
|
||
- 保存到 `模板` 文件夹的对应位置
|
||
|
||
3. **批量转换**
|
||
- 在 Word 中打开多个文件
|
||
- 使用宏或脚本批量转换(需要 VBA 知识)
|
||
|
||
### 方案3:安装 pywin32(如果已安装 Word)
|
||
|
||
```bash
|
||
pip install pywin32
|
||
```
|
||
|
||
然后重新运行 `process_templates.py`
|
||
|
||
**注意:** 即使安装了 pywin32,如果系统没有安装 Microsoft Word,转换仍然会失败。
|
||
|
||
### 方案4:使用在线转换工具
|
||
|
||
1. 使用在线转换工具(如 Zamzar、CloudConvert 等)
|
||
2. 上传 `.doc` 文件
|
||
3. 下载转换后的 `.docx` 文件
|
||
4. 保存到 `模板` 文件夹的对应位置
|
||
|
||
## 转换后的文件结构
|
||
|
||
转换后的文件应该保存在 `模板` 文件夹下,保持原有的目录结构:
|
||
|
||
```
|
||
模板/
|
||
├── 2-初核模版/
|
||
│ ├── 1.初核请示/
|
||
│ │ ├── 1.请示报告卡(XXX).docx ← 转换后的文件
|
||
│ │ ├── 2.初步核实审批表(XXX).docx
|
||
│ │ └── 3.附件初核方案(XXX).docx
|
||
│ └── ...
|
||
└── ...
|
||
```
|
||
|
||
## 验证转换结果
|
||
|
||
转换完成后,检查:
|
||
|
||
1. **文件是否存在**
|
||
```bash
|
||
# 检查文件是否存在
|
||
dir /s /b 模板\*.docx
|
||
```
|
||
|
||
2. **文件是否可以打开**
|
||
- 尝试用 Word 打开转换后的文件
|
||
- 确认内容完整
|
||
|
||
3. **重新运行处理脚本**
|
||
```bash
|
||
python process_templates.py
|
||
```
|
||
|
||
## 常见问题
|
||
|
||
### Q1: 提示 "未找到 Microsoft Word"
|
||
|
||
**A:** 确保已安装 Microsoft Word,而不是 WPS Office。脚本需要 Microsoft Word 的 COM 接口。
|
||
|
||
### Q2: 转换后文件损坏
|
||
|
||
**A:**
|
||
- 检查原始文件是否完整
|
||
- 尝试手动用 Word 打开并另存为
|
||
- 检查文件权限
|
||
|
||
### Q3: 转换速度慢
|
||
|
||
**A:**
|
||
- 这是正常现象,Word 转换需要时间
|
||
- 可以分批转换,先转换重要的文件
|
||
|
||
### Q4: 某些文件转换失败
|
||
|
||
**A:**
|
||
- 检查文件是否被其他程序占用
|
||
- 尝试手动转换这些文件
|
||
- 检查文件是否损坏
|
||
|
||
## 推荐流程
|
||
|
||
1. **先尝试批处理脚本**
|
||
```bash
|
||
批量转换doc到docx.bat
|
||
```
|
||
|
||
2. **如果批处理脚本失败,手动转换**
|
||
- 打开 Word
|
||
- 批量打开 `.doc` 文件
|
||
- 逐个另存为 `.docx`
|
||
|
||
3. **验证转换结果**
|
||
- 检查文件是否都在正确位置
|
||
- 尝试打开几个文件确认内容
|
||
|
||
4. **运行处理脚本**
|
||
```bash
|
||
python process_templates.py
|
||
```
|
||
|
||
## 注意事项
|
||
|
||
1. **备份原始文件** - 转换前建议备份原始 `.doc` 文件
|
||
2. **保持目录结构** - 转换后的文件应该保持原有的目录结构
|
||
3. **文件命名** - 确保文件名清晰,便于识别
|
||
4. **检查内容** - 转换后检查文件内容是否完整
|