批量将PPT转换成多张图片

发布于:2025-03-26 ⋅ 阅读:(31) ⋅ 点赞:(0)

以下是一个使用Python将PowerPoint文件(PPT/PPTX)批量转换为多张图片的代码示例。该方案通过comtypes库调用本地Office的COM接口实现转换,需确保已安装Microsoft PowerPoint。

import os
import comtypes.client
from comtypes import COMError

def ppt_to_images(input_path, output_folder, img_format=1):
    """
    将PPT文件转换为多张图片
    :param input_path: PPT文件路径
    :param output_folder: 输出文件夹路径
    :param img_format: 图片格式(0:JPG, 1:PNG, 2:BMP)
    :return: 生成的图片数量
    """
    try:
        # 创建输出目录
        os.makedirs(output_folder, exist_ok=True)

        # 启动PowerPoint应用
        powerpoint = comtypes.client.CreateObject("PowerPoint.Application")
        powerpoint.Visible = 1  # 可视化模式

        # 打开演示文稿
        deck = powerpoint.Presentations.Open(input_path)
        
        # 获取文件名前缀
        base_name = os.path.splitext(os.path.basename(input_path))[0]
        
        # 导出所有幻灯片为图片
        deck.SaveAs(output_folder, img_format)  # 使用Export方法更灵活
        print(f"成功转换: {input_path} => {output_folder}")

        return deck.Slides.Count

    except COMError as e:
        print(f"转换失败: {e}")
        return 0
    finally:
        deck.Close()
        powerpoint.Quit()

def batch_convert(folder_path, output_base_folder, img_format=1):
    """
    批量转换文件夹内所有PPT/PPTX文件
    :param folder_path: 包含PPT文件的文件夹路径
    :param output_base_folder: 输出根目录
    :param img_format: 图片格式
    """
    supported_ext = ['.ppt', '.pptx']
    
    for file in os.listdir(folder_path):
        if os.path.splitext(file)[1].lower() in supported_ext:
            input_file = os.path.join(folder_path, file)
            output_folder = os.path.join(output_base_folder, os.path.splitext(file)[0])
            
            img_count = ppt_to_images(input_file, output_folder, img_format)
            print(f"生成图片数量: {img_count}")

if __name__ == "__main__":
    # 使用示例
    input_folder = r"C:\PPT_Files"    # 包含PPT的文件夹
    output_folder = r"C:\PPT_Images"  # 输出目录
    
    # 参数说明:0=JPG, 1=PNG(推荐), 2=BMP
    batch_convert(input_folder, output_folder, img_format=1)

使用说明

  1. 环境要求

    • Windows系统(Mac/Linux需使用其他方法)

    • 安装Microsoft Office(2010+版本推荐)

    • Python库安装:

      pip install comtypes
  2. 参数调整

    • img_format:根据需要修改图片格式

      • 0 = JPG(有损压缩)

      • 1 = PNG(无损透明,推荐)

      • 2 = BMP(无压缩)

  3. 输出结构

    C:\PPT_Images
    ├── 演示文稿1
    │   ├── Slide1.png
    │   ├── Slide2.png
    │   └── ...
    └── 演示文稿2
        ├── Slide1.png
        └── ...

    替代方案(无需Office)

    如果无法安装Office,可以使用以下方法之一:

    方法1:使用python-pptx+pillow(仅提取文本/形状)
from pptx import Presentation
from PIL import Image

def extract_slide_shapes(ppt_path, output_folder):
    prs = Presentation(ppt_path)
    for i, slide in enumerate(prs.slides):
        img_path = os.path.join(output_folder, f"slide_{i+1}.png")
        
        # 注意:此方法无法直接渲染幻灯片,需自行绘制元素
        # 此处仅为示意伪代码
        img = Image.new('RGB', (1024, 768), (255,255,255))
        # 绘制文本/形状到图片...
        img.save(img_path)
方法2:使用LibreOffice命令行(跨平台)
# 需要先安装LibreOffice
soffice --headless --convert-to png *.pptx --outdir output_folder

常见问题处理

  1. COMError报错

    • 检查Office是否激活

    • 以管理员身份运行脚本

    • 设置powerpoint.Visible = 1查看弹窗提示

  2. 图片质量优化

# 在SaveAs之前添加分辨率设置
deck.Export(
    OutputFolder=output_folder,
    FilterName="PNG",
    Width=1920,  # 设置输出宽度
    Height=1080
)