用Python实现PDF转Doc格式小程序

发布于:2025-03-07 ⋅ 阅读:(39) ⋅ 点赞:(0)

用Python实现PDF转Doc格式小程序

以下是一个使用Python实现PDF转DOC格式的GUI程序,采用Tkinter和pdf2docx库:

import tkinter as tk
from tkinter import filedialog, messagebox
from pdf2docx import Converter
import os

class PDFtoDOCConverter:
    def __init__(self, master):
        self.master = master
        master.title("PDF转Word转换器")

        # 创建GUI组件
        self.label = tk.Label(master, text="选择PDF文件:")
        self.label.pack(pady=10)

        self.path_entry = tk.Entry(master, width=50)
        self.path_entry.pack(pady=5)

        self.browse_btn = tk.Button(master, text="浏览", command=self.browse_pdf)
        self.browse_btn.pack(pady=5)

        self.convert_btn = tk.Button(master, text="转换为Word", command=self.convert_pdf)
        self.convert_btn.pack(pady=10)

        self.status_label = tk.Label(master, text="", fg="blue")
        self.status_label.pack(pady=10)

    def browse_pdf(self):
        file_path = filedialog.askopenfilename(
            filetypes=[("PDF文件", "*.pdf")]
        )
        if file_path:
            self.path_entry.delete(0, tk.END)
            self.path_entry.insert(0, file_path)

    def convert_pdf(self):
        input_path = self.path_entry.get()
        if not input_path:
            messagebox.showerror("错误", "请先选择PDF文件")
            return

        if not input_path.lower().endswith('.pdf'):
            messagebox.showerror("错误", "请选择有效的PDF文件")
            return

        output_path = os.path.splitext(input_path)[0] + '.docx'
        
        try:
            self.status_label.config(text="转换中...", fg="blue")
            self.master.update()

            # 执行转换
            cv = Converter(input_path)
            cv.convert(output_path)
            cv.close()

            self.status_label.config(text=f"转换成功!文件已保存为:{output_path}", fg="green")
            messagebox.showinfo("成功", "文件转换成功!")
        except Exception as e:
            self.status_label.config(text="转换失败", fg="red")
            messagebox.showerror("错误", f"转换失败: {str(e)}")
        finally:
            self.master.update()

if __name__ == "__main__":
    root = tk.Tk()
    app = PDFtoDOCConverter(root)
    root.mainloop()

使用说明:

  1. 需要先安装依赖库:
pip install pdf2docx tkinter
  1. 运行程序后:
    • 点击"浏览"按钮选择PDF文件
    • 点击"转换为Word"按钮开始转换
    • 转换后的Word文件将保存在原PDF文件同目录下
    • 转换状态会显示在界面下方

程序特点:

  1. 简单的GUI界面,操作直观
  2. 自动生成同路径的Word文件
  3. 支持错误提示和状态显示
  4. 文件格式自动验证
  5. 使用pdf2docx库保持格式转换质量

注意事项:

  1. 复杂排版的PDF可能无法完美转换
  2. 加密的PDF文件需要先解密
  3. 转换时间取决于PDF文件大小
  4. 转换后的文档建议用Microsoft Word打开查看

如果需要更强大的转换功能,可以考虑结合PyMuPDF和python-docx库进行更底层的操作,但实现复杂度会显著增加。