数据来源分析:
1、打开网页开发者工具并打开Fetch/XHR面板
2、再转到包含图片url的网址
3、分析前30张图片和后30张图片的url区别
4、开始请求获取并保存数据
4.1代码展示
import json import os import pprint import requests keyword = input('输入查询关键字:') for j in range(1, 21): url = '图片上分析出来的url' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/102.0.0.0 ' 'Safari/537.36 ' } if not os.path.exists(f'{keyword}图片'): os.makedirs(f'{keyword}图片') res = requests.get(url=url, headers=headers).json() # pprint.pprint(res) for data_url in res['data']: try: url = data_url['replaceUrl'][0]['ObjURL'] title = data_url['fromPageTitleEnc'].replace('?', '').replace('"', '').replace('/', '').replace('>', '').replace(':', '').replace('|', '').replace('*', '').replace('\\', '') img_content = requests.get(url=url, headers=headers).content with open(f'{keyword}图片/%s.jpg' % title, 'wb') as f: f.write(img_content) print('%s.jpg下载完成!' % title) except KeyError: pass
4.2代码分析
4.2.1请求数据部分
4.2.2res的可视化展示
4.2.3res数据分析
5、筛选过滤得到图片url和名字并保存
6、结果展示