【实用工具】Stirling-PDF入门安装教程: 优质开源的PDF处理工具/编辑工具

发布于:2024-08-14 ⋅ 阅读:(92) ⋅ 点赞:(0)

项目简介

这是一款使用 Docker 的基于本地托管网络的强大 PDF 操作工具。它能让你在 PDF 文件上执行各种操作,包括分割、合并、转换、重组、添加图像、旋转、压缩等。这个本地托管的网络应用程序已发展到包含一套全面的功能,可满足您对 PDF 的所有要求。

所有文件和 PDF 要么完全存在于客户端,要么仅在任务执行期间存在于服务器内存中,要么仅在任务执行期间暂时存在于文件中。此时,用户下载的任何文件都已从服务器中删除。

由于项目是英文的,博主在这里做一版中文教程,给后来人一些参考。
关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。
博主碎碎念,可跳过:
打算重新做做自己这个老号,高中时候开始做CSDN,那会儿写的是NOIP/NOI相关的算法东西,纯粹是写给自己看的;现在时隔多年,我也在清华站稳了脚跟,在互联网开发和量化交易领域都算是小有成就了。

接下来这个号(也许也不止这个号)应该会做三个方向:
AI新技术(或者不局限于AI)的抢先浏览,会向大家说明当下热点论文、热点技术的部署等,以及做一些周报或者日报。(类似于AI Weekly)
量化交易相关,我在量化开发技术栈有着多年的开发经验,也拿过一些投资比赛的奖项。可以面向应届生给出就业规划,提供一些指导的同时分享一些含金量高的项目。
互联网面试相关,我应该会着重于分享一些面试的底层技术面,并且尽可能和2进行一些结合,让大家同时能handle住两边的技术。


功能展示

想要下载release版本,点这里
这是界面示例:
在这里插入图片描述

Page Operations 页面操作

  1. 查看和修改 PDF - 通过自定义查看排序和搜索功能查看多页 PDF。此外还有页面编辑功能,如注释、绘图、添加文本和图像。(将 PDF.js 与 Joxit 和 Liberation.Liberation 字体结合使用)
  2. 完全交互式图形用户界面,用于合并/分割/旋转/移动 PDF 文件及其页面。
  3. 将多个 PDF 文件合并为一个结果文件。
  4. 按指定页码将 PDF 文件分割成多个文件,或将所有页面提取为单独文件。
  5. 将 PDF 页面重组为不同的顺序。
  6. 以 90 度为增量旋转 PDF 文件。
  7. 删除页面。
  8. 多页布局(将 PDF 格式化为多页)。
  9. 按设定的百分比缩放页面内容大小。
  10. 调整对比度。
  11. 剪裁PDF。
  12. 自动分割 PDF(使用物理扫描的分页符)。
  13. 将 PDF 转换为单页。

Conversion Operations 转换操作

  1. 将 PDF 转换成图像或从图像转换成 PDF。
  2. 将任何普通文件转换为 PDF(使用 LibreOffice)。
  3. 将 PDF 转换为 Word/Powerpoint/其他文档(使用 LibreOffice)。
  4. 将 HTML 转换为 PDF。
  5. URL 转 PDF。
  6. 将 Markdown 转换为 PDF。

Security & Permissions 安全与权限

  1. 添加和删除密码
  2. 更改/设置 PDF 权限
  3. 添加水印。
  4. 认证/签署 PDF
  5. 对 PDF 文件进行杀毒
  6. 自动删节文本

Other Operations 其他业务

  1. 添加/生成/写入签名。
  2. 修复 PDF。
  3. 检测并删除空白页
  4. 比较两个 PDF 文件并显示文本差异。
  5. 为 PDF 添加图像
  6. 压缩 PDF 文件以减小其文件大小(使用 OCRMyPDF)。
  7. 从 PDF 中提取图像
  8. 从扫描中提取图像
  9. 添加页码。
  10. 通过检测 PDF 标题文本自动重命名文件。
  11. OCR on PDF(使用 OCRMyPDF)。

    还有很多功能博主感觉不是很常用,因此就先介绍到这里啦~
    想要查看Demo,可以访问这个网址进行访问。

如何安装并使用

我们使用Docker进行安装部署,来节约大家的时间。
Stirling PDF 有 3 个不同版本,即完整版、超精简版和 "胖 "版。根据您使用的功能类型,您可能需要更小的图像来节省空间。要了解不同版本提供的功能,请查看我们的版本映射 对于不介意空间优化的用户,只需使用最新标签即可。

请注意,在以下示例中,您可能需要根据需要更改卷路径,当前示例将它们安装到当前工作目录,例如 ./extraConfigs:/configs 改为 /opt/stirlingpdf/extraConfigs:/configs

Docker Run

docker run -d \
  -p 8080:8080 \
  -v ./trainingData:/usr/share/tessdata \
  -v ./extraConfigs:/configs \
  -v ./logs:/logs \
  -e DOCKER_ENABLE_SECURITY=false \
  -e INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false \
  -e LANGS=en_GB \
  --name stirling-pdf \
  frooodle/s-pdf:latest

  Can also add these for customisation but are not required

  -v /location/of/customFiles:/customFiles \

Docker Compose

version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata #Required for extra OCR languages
      - ./extraConfigs:/configs
#      - ./customFiles:/customFiles/
#      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
      - LANGS=en_GB

通过Docker Run, 我们就跑起来整个PDF工具啦~祝大家玩的开心。最后,关注CSDN心若为城,获得计算机领域与人工智能领域的前沿技术。