分享另一个热门的PDF文档翻译软件BabelDOC,软件可以将PDF文档由原语言翻译成指定语言文档,基于在线大语言模型处理能力,文档翻译效果更准确,并保留排版,支持批量文档翻译,我制作了最新版免安装一键启动整合包。
BabelDOC整合包使用教程
首先将网盘内的软件压缩包下载到本地电脑上并解压,然后双击启动软件.exe启动。
软件处理功能依赖于云端大语言模型,所以首先需要配置API。
点击【设置】,只支持类openai的大语言模型,如果你已有API的话直接在软件里填入对应参数即可。如果还没有API的话,可以点击下面链接申请硅基流动的DeepSeek API,用户有2000万tokens的免费额度,申请链接:
模型默认为:deepseek-ai/DeepSeek-V3
BASE URL默认:
API KEY为你自己的key。
待处理文件可以选择单个PDF文档,也可以选择整个文件夹。如果选择整个文件夹的话,软件会处理文件夹内所有文件,需要保证文件夹内没有PDF格式以外的文件。
【源语言】PDF文档文本的语言,默认为英文en
【目标语言】想把PDF文档翻译成什么语言,默认为中文zh,其它语言代码可参考百度翻译语言代码表:
【指定页面】指定需要翻译的页面(例如,“1,2,1-,-3,3-5”)。若未设置,则翻译所有页面
【启用OCR】启用OCR处理扫描件,仅适用于白底黑字文档。启用后,翻译下方将添加白色矩形块以覆盖原始文本内容,所有文本将强制为黑色,强制模式。
【自动OCR】启用自动OCR解决方法。如果检测到文档为重度扫描文档,则将尝试启用OCR处理并跳过进一步的扫描检测,自动模式。
【忽略缓存】忽略翻译缓存并强制重新翻译
【线程数】内部任务处理池的最大工作线程数。若未指定,则默认为 QPS 值。此参数直接设置工作线程数,取代以往基于 QPS 的动态计算。
【QPS】翻译服务的API每秒查询次数限制(默认值:4)
【水印模式】控制水印输出模式:’watermarked’(默认)为翻译后的 PDF 添加水印,’no_watermark’ 不添加水印,’both’ 输出两个版本。
【翻译表格内文字】翻译表格文本(实验性)
【术语表】指定CSV术语表文件
每个CSV文件都应该有列:源、目标和可选的tgt_lng。
源列包含原始语言的术语。
目标列包含目标语言中的术语。
tgt_lng列(可选)指定该特定条目的目标语言(例如,“zh-CN”、“en-US”)。
如果为条目提供了tgt_lng,则只有当其(规范化)tgt_lng与【目标语言】指定的(规范化的)总体目标语言匹配时,才会加载和使用该条目。规范化涉及小写和用下划线(_)替换连字符(-)。
如果某个条目省略了tgt_lng,则该条目被认为适用于任何【目标语言】。
每个术语表(在LLM提示中使用)的名称都来自其文件名(不带.csv扩展名)。
在翻译过程中,系统将根据加载的术语表检查输入文本。如果在当前文本段中找到术语表中的术语,则该术语表(以及相关术语)将包含在语言模型的提示中,并附有遵守该术语表的说明。
【不输出双语】不输出双语言PDF文件
【不输出单语】不输出单语言 PDF 文件
【跳过清理】跳过 PDF 清理步骤,可能有助于提高与某些 PDF 阅读器的兼容性,但会导致文件大小更大
【禁用富文本翻译】禁用富文本翻译(可能有助于提高与某些 PDF 的兼容性),可以通过简化翻译输入来帮助提高兼容性
软件处理流程:软件首先对PDF文档内容进行识别,然后将识别到的内容传送给AI,也就是deepseek,ChatGP等,AI翻译完成之后再将翻译结果返回给软件,软件再进行排版生成新的PDF文档等操作。由于你的PDF文档内容会上传给云端大语言模型,所以请勿对敏感私密文档进行翻译。
视频教程及效果演示:
注意事项
软件只支持windows 10或11
软件运行路径中不要有非英文字符及空格,待处理文件同样注意