# AutoCaption Pro 用户手册

## 1. 软件简介

AutoCaption Pro 是一个桌面端视频工具箱，主要用于完成三类视频发布前处理：

- 自动识别语音并生成字幕。
- 手工校对字幕并导出 SRT 或带字幕视频。
- 制作封面/片头，并可对视频中的人脸进行打码。

软件主界面包含四个页签：

- `视频导出`：选择最终导出选项并生成视频。
- `智能字幕 (AI)`：自动识别、导入、编辑和保存字幕。
- `封面/片头制作`：提取视频帧、上传图片、添加封面文字。
- `系统设置`：设置字幕样式、识别语言、AI 引擎模式、封面文字样式和人脸打码参数。

底部为`系统日志`区域，会显示带时间戳的运行状态和处理进度。

## 2. 支持格式

### 视频

可加载的视频格式：

- MP4
- MOV
- MKV

最终导出格式：

- MP4

### 字幕

- SRT

### 图片

可作为封面图片的格式：

- PNG
- JPG
- JPEG

## 3. 首次启动与激活

首次启动软件时，会出现“软件激活”窗口。

操作步骤：

1. 在激活窗口中找到`机器码`。
2. 点击`复制 (&C)`复制机器码。
3. 将机器码提供给软件提供方，获取对应激活码。
4. 在`激活码`输入框中输入激活码。
5. 点击`确定 (&O)`。
6. 激活成功后，软件会显示有效期或到期日期。

注意事项：

- 激活码与当前电脑机器码绑定，不能直接换到其他电脑使用。
- 激活码过期后，需要重新获取新的激活码。
- Windows 下机器码优先基于主板 UUID、硬盘序列号等硬件信息生成，通常不会因为网络变化而改变。

## 4. 快速完成一个视频

如果你想一次性完成字幕、打码和封面，可以按下面流程操作：

1. 点击顶部`加载视频文件 (&O)`，选择视频。
2. 进入`智能字幕 (AI)`页，点击`开始AI识别 (&T)`。
3. 等待识别完成，在字幕表格中校对文本。
4. 点击`保存 SRT 字幕 (&S)`。
5. 进入`封面/片头制作`页，提取视频帧或上传图片。
6. 输入封面文字，点击`将文字合成到当前图片 (&P)`。
7. 进入`系统设置`页，按需选择字幕样式、封面文字样式和打码效果。
8. 回到`视频导出`页，勾选需要的导出选项。
9. 点击`开始导出视频 (&E)`，选择输出文件位置。
10. 等待日志提示导出完成。

导出时软件的处理顺序为：

1. 人脸打码。
2. 字幕烧录。
3. 添加封面/片头。

最终只会生成一个用户指定的 MP4 文件。

## 5. 加载视频

点击顶部`加载视频文件 (&O)`，选择 MP4、MOV 或 MKV 文件。

加载成功后，界面会显示：

- 文件名
- 视频时长
- 视频分辨率

加载新视频时，软件会自动清空旧字幕状态和旧封面状态，但会保留封面文字输入框中的文字，方便重复使用标题模板。

## 6. AI 字幕识别与编辑

### 6.1 开始识别

1. 先加载视频。
2. 打开`智能字幕 (AI)`页。
3. 点击`开始AI识别 (&T)`。
4. 选择字幕保存位置。默认文件名为“视频名.srt”。
5. 等待识别完成。

识别期间，日志区会显示模型加载、设备模式和识别进度。

### 6.2 识别语言

在`系统设置`页的`字幕识别语言`中选择：

- `中文`
- `英文 (适用于英文视频)`

如果语言选择不匹配，字幕准确率会下降。

### 6.3 AI 引擎模式

在`系统设置`页的`AI引擎模式`中选择：

- `自动 (GPU优先，失败切换CPU)`
- `强制 CPU 模式`
- `强制 GPU 模式`

建议优先使用自动模式。如果遇到 GPU 初始化失败或程序崩溃，可改为强制 CPU 模式。

### 6.4 编辑字幕

识别完成后，字幕会显示在表格中。表格有三列：

- `开始时间`
- `结束时间`
- `字幕文本 (双击修改)`

操作方式：

- 双击字幕文本单元格可修改文字。
- 修改后点击`保存 SRT 字幕 (&S)`写回字幕文件。
- 时间列主要用于查看，不建议随意改动。

### 6.5 导入已有字幕

如果已有 SRT 字幕：

1. 加载对应视频。
2. 进入`智能字幕 (AI)`页。
3. 点击`导入字幕 (&I)`。
4. 选择 SRT 文件。
5. 导入成功后，可在表格中校对并保存。

软件会优先按 UTF-8 读取字幕；如果失败，会尝试 GBK。

### 6.6 单独导出带字幕视频

如果只想烧录字幕：

1. 确保字幕已识别或已导入。
2. 点击`保存 SRT 字幕 (&S)`。
3. 点击`导出带字幕视频 (&E)`。
4. 选择输出 MP4 路径。

字幕样式使用`系统设置`中当前选择的`字幕压制风格`。

## 7. 字幕样式

在`系统设置`页可选择字幕压制风格。当前预设包括：

- 默认风格 (白字黑边)
- 经典电影 (黄字黑边)
- 清新蓝调 (青字黑边)
- 醒目红色 (红字白边)
- 优雅绿色 (绿字黑边)
- 科技蓝字 (蓝字白边)
- 粉色可爱 (粉字黑边)
- 金色豪华 (金字黑边)
- 大号白字 (大字体)
- 紫色梦幻 (紫字白边)
- 橙色活力 (橙字黑边)

字幕会烧录到视频画面中，导出后不需要播放器额外加载 SRT。

## 8. 封面/片头制作

### 8.1 从视频提取封面帧

1. 加载视频。
2. 进入`封面/片头制作`页。
3. 在小时、分钟、秒、毫秒输入框中设置时间点。
4. 点击`提取该帧并预览 (&X)`。
5. 软件会从该时间点提取一帧作为封面。

如果输入的时间超过视频长度，软件会自动限制到视频末尾。

### 8.2 上传自定义图片

1. 加载视频。
2. 进入`封面/片头制作`页。
3. 点击`上传图片 (&U)`。
4. 选择 PNG、JPG 或 JPEG 图片。

如果图片尺寸和视频分辨率不一致，软件会询问是否自动调整。选择确认后，图片会保持原比例缩放，并用黑边补齐到视频尺寸。

### 8.3 添加封面文字

1. 先提取视频帧或上传图片。
2. 在`添加到封面的文字`输入框中输入标题。
3. 在`系统设置`页选择`封面文字样式`。
4. 回到封面页，点击`将文字合成到当前图片 (&P)`。
5. 查看左侧预览。

封面文字会自动居中排版，并根据图片尺寸调整字号。如果文字过多导致无法放下，软件会提示失败。

### 8.4 单独生成带封面视频

如果只想添加封面片头：

1. 制作好封面。
2. 点击`生成带封面的视频 (&G)`。
3. 选择输出 MP4 路径。

软件会将封面作为约 1 秒片头拼接到视频开头。

## 9. 封面文字样式

当前可选封面文字样式包括：

- 简约白字
- 经典黑字
- 醒目黄色
- 清新蓝色
- 时尚粉红
- 翠绿清新
- 优雅金色
- 科技蓝
- 电影橙
- 优雅宋体
- 简约灰
- 白色大字
- 白色优雅
- 紫色梦幻
- 火红热烈
- 青柠清新
- 深蓝沉稳
- 华文行楷
- 华文彩云
- 隶书古韵
- 圆体可爱

不同样式会使用不同字体、颜色、描边和阴影效果。部分字体依赖 Windows 系统字体文件，如果目标字体不存在，软件会尝试使用可用字体替代。

## 10. 人脸打码

人脸打码功能依赖 OpenCV 和内置人脸检测模块。如果运行环境支持，该选项会出现在`视频导出`页和`系统设置`页。

### 10.1 启用方式

1. 加载视频。
2. 打开`系统设置`页。
3. 选择`人脸打码效果`和`人脸打码强度`。
4. 回到`视频导出`页。
5. 勾选`启用人脸打码 (&M)`。
6. 点击`开始导出视频 (&E)`。

### 10.2 打码效果

可选效果：

- `马赛克`：适合大多数隐私保护场景。
- `模糊`：画面过渡更自然。
- `纯色块`：遮挡更彻底。
- `渐变`：遮挡区域过渡柔和。

### 10.3 打码强度

强度范围为 5% 到 100%。数值越大，遮挡越明显。

建议：

- 普通公开视频：30% 到 60%。
- 需要更强隐私保护：60% 以上。
- 如果人脸仍可辨认，优先提高强度或切换为纯色块。

### 10.4 注意事项

- 人脸检测不是人工审核，可能漏检侧脸、小脸、遮挡脸或低清画面。
- 涉及隐私保护的视频，导出后应人工检查一遍。
- 人脸打码会逐帧处理，耗时通常比单纯加字幕更长。

## 11. 视频导出

`视频导出`页用于组合最终视频。

### 11.1 状态提示

页面会显示当前状态：

- 视频是否已加载。
- 字幕是否已识别或导入。
- 封面是否已生成。

只有满足条件后，对应导出选项才会可用。

### 11.2 导出选项

可勾选：

- `导出带字幕的视频 (&S)`
- `启用人脸打码 (&M)`
- `添加封面/片头 (&A)`

其中字幕选项需要先完成字幕识别或导入；封面选项需要先制作封面。

### 11.3 开始导出

1. 在`视频导出`页勾选需要的选项。
2. 点击`开始导出视频 (&E)`。
3. 选择输出 MP4 路径。
4. 等待处理完成。

导出过程中不要删除原视频、字幕文件或封面临时资源，也不要强制关闭软件。

## 12. 日志与故障定位

底部`系统日志`会显示：

- 视频加载结果。
- AI 模型加载状态。
- 字幕识别进度。
- 字幕烧录进度。
- 人脸打码进度。
- 封面合成进度。
- 导出完成路径。

字幕识别模块还会在`logs`目录中生成详细调试日志，文件名类似：

```text
subtitle_debug_YYYYMMDD_HHMMSS.log
```

如果识别失败，可将该日志提供给技术支持排查。

## 13. 常见问题

### 13.1 为什么开始 AI 识别按钮不可用？

需要先点击`加载视频文件 (&O)`并成功加载视频。

### 13.2 为什么字幕识别很慢？

字幕识别需要运行本地 AI 模型。视频越长、电脑性能越低，耗时越长。没有可用 GPU 时，CPU 模式会更慢。

### 13.3 GPU 模式失败怎么办？

进入`系统设置`页，将`AI引擎模式`改为`强制 CPU 模式`后重试。

### 13.4 字幕识别不准怎么办？

先确认识别语言是否正确。识别完成后，可在字幕表格中双击文本进行人工校对，再保存 SRT 或导出视频。

### 13.5 导入 SRT 后无法解析怎么办？

确认字幕格式是标准 SRT，包含序号、时间码和字幕文本。时间格式应类似：

```text
00:00:01,000 --> 00:00:03,000
```

### 13.6 上传封面图片后出现黑边正常吗？

正常。图片宽高比与视频不一致时，软件会保持图片比例并补黑边，避免拉伸变形。

### 13.7 为什么导出很慢？

字幕烧录、封面拼接、人脸打码都会涉及视频重新编码。启用的功能越多，导出越慢。

### 13.8 导出后只有一个视频文件吗？

是。组合导出会使用临时文件处理中间步骤，完成后只保留用户选择的最终 MP4。

### 13.9 人脸打码会不会漏掉人脸？

有可能。低清画面、侧脸、遮挡、快速运动、小尺寸人脸都可能影响检测。隐私要求高的视频必须人工复查。

### 13.10 加载新视频后旧封面消失正常吗？

正常。为避免把旧视频封面误用于新视频，软件会清除旧封面状态，但保留封面文字输入框内容。

## 14. 建议工作流

### 只生成字幕文件

1. 加载视频。
2. 开始 AI 识别。
3. 校对字幕文本。
4. 保存 SRT 字幕。

### 导出带字幕视频

1. 加载视频。
2. 开始 AI 识别或导入 SRT。
3. 校对并保存字幕。
4. 选择字幕压制风格。
5. 点击`导出带字幕视频 (&E)`，或在`视频导出`页勾选字幕后统一导出。

### 制作带封面片头的视频

1. 加载视频。
2. 提取视频帧或上传封面图片。
3. 输入封面文字并合成。
4. 点击`生成带封面的视频 (&G)`，或在`视频导出`页勾选封面后统一导出。

### 发布前隐私处理

1. 加载视频。
2. 在系统设置中选择人脸打码效果和强度。
3. 在`视频导出`页勾选`启用人脸打码 (&M)`。
4. 按需同时勾选字幕和封面。
5. 导出后人工复查人脸遮挡效果。

## 15. 使用注意事项

- 处理长视频前，确保磁盘空间充足。
- 导出期间不要移动或删除输入视频、字幕文件和封面文件。
- AI 字幕适合作为初稿，正式发布前建议人工校对。
- 人脸打码不能保证 100% 检出，隐私场景必须复查。
- 如果软件异常退出，可查看底部日志或`logs`目录中的调试日志。
- 设置项会自动保存，下次启动会继续使用上次选择。

## 16. 技术支持时建议提供的信息

反馈问题时，建议提供：

- 软件版本或打包日期。
- 操作系统版本。
- 电脑配置，尤其是 CPU、内存、显卡。
- 使用的视频格式、分辨率和时长。
- 问题发生在哪一步。
- 错误提示截图或文字。
- `logs`目录中的相关调试日志。