Python脚本批量修复文件时间戳,根据文件名或拍摄日期

发布于:2025-07-21 ⋅ 阅读:(13) ⋅ 点赞:(0)

实现以下功能

  • 更正文件的 修改时间
  • 批量修改指定文件夹中的特定后缀的文件
  • 根据文件名中的日期修改(优先)
  • 根据 jpg 文件属性中的拍摄日期修改
  • 根据 mp4 文件属性中的创建媒体日期修改
  • 模拟运行(Dry Run)模式

依赖

若需要基于jpg文件属性中的拍摄日期修改,需要python的piexif

pip install piexif

若需要基于mp4文件属性中的创建媒体日期修改,需要ffmpeg

sudo apt install ffmpge

脚本仅在Linux上进行了测试,若在Windows上运行,可能还需要将ffmpeg的相关目录加入path。

代码

fix_timestamp.py

import os
import sys
import re
import piexif
import subprocess
from datetime import datetime, timezone, timedelta
from PIL import Image

# 解析命令行参数
if len(sys.argv) < 2:
    print("[错误] 请提供文件夹路径作为参数。")
    print("示例: python fix_timestamp.py /home/user/media [--dry-run]")
    sys.exit(1)

folder_path = sys.argv[1]
dry_run = "--dry-run" in sys.argv or "-n" in sys.argv

# 要处理的文件后缀
valid_extensions = [".jpg", ".jpeg", ".png", ".mp4"]

# 支持的时间格式正则表达式
time_patterns = [
    # 示例:Screenshot_2018-01-02-18-22-06-934_com.sina.weibo.jpg
    (r"(\d{4}-\d{2}-\d{2}-\d{2}-\d{2}-\d{2})", "%Y-%m-%d-%H-%M-%S"),
    
    # 示例:IMG_20230517_094235.jpg
    (r"(\d{8}_\d{6})", "%Y%m%d_%H%M%S"),
    
    # 可以继续添加其他格式...
]

def parse_time_from_filename(filename):
    """尝试从文件名中解析时间"""
    for pattern, fmt in time_patterns:
        match = re.search(pattern, filename)
        if match:
            try:
                time_str = match.group(1)
                dt = datetime.strptime(time_str, fmt)
                return dt
            except ValueError:
                continue
    return None


def get_jpeg_exif_time(file_path):
    """从 JPEG 的 EXIF 中获取拍摄时间(仅适用于 .jpg/.jpeg)"""
    try:
        with Image.open(file_path) as img:
            if "exif" in img.info:
                exif_dict = piexif.load(img.info["exif"])
                if piexif.ExifIFD.DateTimeOriginal in exif_dict["Exif"]:
                    exif_time_str = exif_dict["Exif"][piexif.ExifIFD.DateTimeOriginal].decode("utf-8")
                    try:
                        dt = datetime.strptime(exif_time_str, "%Y:%m:%d %H:%M:%S")
                        return dt
                    except ValueError:
                        print(f"[错误] EXIF时间格式错误: {exif_time_str}")
    except Exception as e:
        print(f"[异常] 读取EXIF出错: {e}")
    return None


def get_mp4_creation_time(file_path):
    """使用 ffprobe 获取 MP4 的 creation_time 元数据"""
    cmd = [
        'ffprobe',
        '-v', 'error',
        '-show_entries', 'format_tags=creation_time',
        '-of', 'default=nw=1',
        file_path
    ]
    try:
        result = subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, text=True)
        output = result.stdout.strip()
        if output.startswith("TAG:creation_time="):
            dt_str = output.split("=", 1)[1]
            try:
                dt_utc = datetime.fromisoformat(dt_str.replace('Z', '+00:00'))
                tz_utc_8 = timezone(timedelta(hours=8))
                dt_local = dt_utc.astimezone(tz_utc_8)
                return dt_local
            except ValueError as ve:
                print(f"[解析错误] 时间格式不支持: {dt_str}, 错误: {ve}")
    except Exception as e:
        print(f"[异常] 获取视频时间失败: {e}")
    return None


# 检查路径是否存在
if not os.path.isdir(folder_path):
    print(f"[错误] 路径不存在或不是文件夹: {folder_path}")
    sys.exit(1)

print(f"[信息] 正在处理文件夹: {folder_path}")
if dry_run:
    print("[信息] 当前为 Dry Run 模式,不会修改任何文件。\n")

# 遍历文件夹中所有指定后缀的文件
for filename in os.listdir(folder_path):
    ext = os.path.splitext(filename)[1].lower()
    file_path = os.path.join(folder_path, filename)

    print(f"\n[处理] 正在处理: {filename}")

    # 1. 尝试从文件名中提取时间
    dt = parse_time_from_filename(filename)

    if dt:
        print(f"[成功] 使用文件名中的时间: {dt.strftime('%Y:%m:%d %H:%M:%S')}")
    else:
        # 2. 如果是图片(.jpg/.jpeg),尝试从 EXIF 获取时间
        if ext in [".jpg", ".jpeg"]:
            dt = get_jpeg_exif_time(file_path)
            if dt:
                print(f"[成功] 使用EXIF中的拍摄时间: {dt.strftime('%Y:%m:%d %H:%M:%S')}")
            else:
                print(f"[跳过] 没有可用的EXIF拍摄时间。")
        # 3. 如果是视频(.mp4),尝试从 FFProbe 获取 creation_time
        elif ext == ".mp4":
            dt = get_mp4_creation_time(file_path)
            if dt:
                print(f"[成功] 使用MP4中的创建时间: {dt.strftime('%Y:%m:%d %H:%M:%S')}")
            else:
                print(f"[跳过] 没有可用的creation_time元数据。")
        else:
            print(f"[跳过] 当前文件不支持获取时间信息。")

    # 如果获取到了时间,设置文件时间
    if dt:
        if dry_run:
            print(f"[DryRun] [模拟] 将设置文件时间为: {dt.strftime('%Y:%m:%d %H:%M:%S')}(不实际修改)")
        else:
            timestamp = dt.timestamp()
            os.utime(file_path, (timestamp, timestamp))
            print(f"[完成] 文件时间已更新为: {dt.strftime('%Y:%m:%d %H:%M:%S')}")
    else:
        print(f"[跳过] 无法获取时间信息: {filename}")

print("\n>>>>> 运行结束 <<<<<")

运行示例

执行:

sudo python fix_timestamp.py /home/dlw/Media -n  # 模拟运行模式,去掉-n实际运行

输出:

[处理] 正在处理: 2848404867455998737608616768.mp4
[跳过] 没有可用的creation_time元数据。
[跳过] 无法获取时间信息: 2848404867455998737608616768.mp4

[处理] 正在处理: 7695642187455636767332932782.mp4
[成功] 使用MP4中的创建时间: 2025:01:03 14:29:21
[DryRun] [模拟] 将设置文件时间为: 2025:01:03 14:29:21(不实际修改)

[处理] 正在处理: IMG_20211201_235648_470_5.jpg
[成功] 使用文件名中的时间: 2021:12:01 23:56:48
[DryRun] [模拟] 将设置文件时间为: 2021:12:01 23:56:48(不实际修改)

[处理] 正在处理: img-b1b1b00a1589edea0e7c74b235053cd4.jpg
[跳过] 没有可用的EXIF拍摄时间。
[跳过] 无法获取时间信息: img-b1b1b00a1589edea0e7c74b235053cd4.jpg

[处理] 正在处理: -3cdc6e8e88e57e14.gif
[跳过] 当前文件不支持获取时间信息。
[跳过] 无法获取时间信息: -3cdc6e8e88e57e14.gif

[处理] 正在处理: 3_d51.png
[跳过] 当前文件不支持获取时间信息。
[跳过] 无法获取时间信息: 3_d51.png

[处理] 正在处理: IMG551013D.jpg
[成功] 使用EXIF中的拍摄时间: 2025:01:01 00:36:51
[DryRun] [模拟] 将设置文件时间为: 2025:01:01 00:36:51(不实际修改)

>>>>> 运行结束 <<<<<