写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具
1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现
首先安装导入pdf2docx库
pip install pdf2docx
2、代码部分:
话不多说直接上代码:
import os
from pdf2docx import Converter
from loguru import logger
from tkinter import Tk, filedialog
# 获取到当前路径
path = os.getcwd()
# 打开文件选择对话框,选择要转换的PDF文件
def choose_pdf_file():
root = Tk()
root.withdraw()
file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
root.destroy()
return file_path
def main():
# 选择要转换的PDF文件
pdf_file = choose_pdf_file()
if not pdf_file:
logger.debug("未选择任何PDF文件。")
return
docx_file = os.path.splitext(pdf_file)[0] + ".docx"
logger.debug("原始的PDF文件为-------%s" % pdf_file)
cv = Converter(pdf_file)
cv.convert(docx_file)
logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
cv.close()
if __name__ == "__main__":
main()