目录
专栏导读
🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手
🏳️🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注
👍 该系列文章专栏:请点击——>Python办公自动化专栏求订阅
🕷 此外还有爬虫专栏:请点击——>Python爬虫基础专栏求订阅
📕 此外还有python基础专栏:请点击——>Python基础学习专栏求订阅
文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏
❤️ 欢迎各位佬关注! ❤️
背景介绍
我们再日常办公的时候经常需要将Excel中嵌入单元的图片进行提取,并在提取的时候将其中的某一列作为提取出图片的命名,然后将图片存放好!
那么我们在提取的时候需要注意什么事项呢!接下来我们一起查看
数据源准备
步骤1:修改xlsx为zip
将Excel文件后缀名修改为 zip
解压,顺便看一下目录结构
步骤2:重点关注文件
① 【\xl\worksheets\sheet1.xml】
表示嵌入图片所在sheet,这里面有图片嵌入的ID与所在单元格地址的信息
文件中提取单元格和图片ID的映射关系。(重要步骤)
② 【\xl\cellimages.xml】
文件中提取图片ID和rId的映射关系
③ 【\xl_rels\cellimages.xml.rels】
1) 通过图片ID 在cellimages.xml 找到图片对应的 rId
2) 通过图片rId 在cellimages.xml.rels 找到图片对应的 图片具体信息
④【\xl\media\】
图片存放
步骤四:依赖库下载
pandas: 用于读取和处理Excel文件。
os: 用于处理文件路径和目录操作。
re: 用于正则表达式匹配。
xmltodict: 用于解析XML文件。
shutil: 用于文件复制和目录操作。
tempfile: 用于创建临时目录。
PyQt5: 用于创建图形用户界面。
库 | 用途 | 安装 |
---|---|---|
PyQt5 | 界面设计 | pip install PyQt5 -i https://pypi.tuna.tsinghua.edu.cn/simple/ |
xmltodict | 读取xml文件 | pip install xmltodict -i https://pypi.tuna.tsinghua.edu.cn/simple/ |
pandas | Excel读写 | pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple/ |
tempfile | 创建临时目录 | 内置库无需安装 |
os | 获取路径 | 内置库无需安装 |
shutil | 文件操作 | 内置库无需安装 |
re | 正则 | 内置库无需安装 |
代码设计
完整版代码,点我跳转
总结
希望对初学者有帮助
致力于办公自动化的小小程序员一枚
希望能得到大家的【一个免费关注】!感谢
求个 🤞 关注 🤞
此外还有办公自动化专栏,欢迎大家订阅:Python办公自动化专栏
求个 ❤️ 喜欢 ❤️
此外还有爬虫专栏,欢迎大家订阅:Python爬虫基础专栏
求个 👍 收藏 👍
此外还有Python基础专栏,欢迎大家订阅:Python基础学习专栏