一、文件与目录操作:os
模块
os
模块是Python标准库中用于与操作系统交互的核心工具,提供了丰富的文件和目录操作方法。通过os
,开发者可以轻松实现文件路径处理、环境变量获取、目录管理等功能。
1.1 核心功能与方法
以下是os
模块中常用的方法及其功能:
路径操作:
os.path.abspath(path)
:返回给定路径的绝对路径。例如,os.path.abspath('.')
可以获取当前工作目录的完整路径。os.path.exists(path)
:检查路径是否存在,返回布尔值。os.path.isfile(path)
和os.path.isdir(path)
:分别判断路径是否为文件或目录。os.path.join(*paths)
:拼接路径,自动适配不同操作系统的路径分隔符,例如os.path.join("just", "do", "python")
生成just/do/python
(Linux)或just\do\python
(Windows)。
文件属性:
os.path.getatime(path)
、os.path.getmtime(path)
、os.path.getctime(path)
:分别返回文件的最后访问时间、修改时间和创建时间(时间戳格式)。os.path.getsize(path)
:获取文件大小(字节为单位)。
目录与文件管理:
os.mkdir(dirname)
:创建目录,目录已存在时会抛出异常。os.rmdir(dirname)
:删除空目录。os.listdir(path)
:列出指定目录下的所有文件和子目录。os.rename(src, dst)
:重命名文件或目录。os.remove(path)
:删除文件。
系统交互:
os.system(command)
:执行系统命令,如os.system('pwd')
在Linux中打印当前工作目录。os.getcwd()
:获取当前工作目录路径。os.environ
:获取系统环境变量,如os.environ['PATH']
。
1.2 应用示例:批量重命名文件
假设你有一个目录,包含多个文件,需要将所有.txt
文件重命名为.bak
后缀。以下是一个使用os
模块的实现:
import os
def rename_txt_to_bak(directory):
for filename in os.listdir(directory):
if filename.endswith('.txt'):
old_path = os.path.join(directory, filename)
new_path = os.path.join(directory, filename.replace('.txt', '.bak'))
os.rename(old_path, new_path)
print(f'Renamed: {old_path} -> {new_path}')
# 示例调用
rename_txt_to_bak('./my_folder')
这个脚本通过os.listdir
遍历目录,检查文件后缀并使用os.rename
进行重命名,展示了os
模块在文件管理中的强大能力。
二、数据加密与哈希:hashlib
模块
hashlib
模块提供了多种哈希算法(如MD5、SHA1、SHA256),用于数据加密、校验和安全验证。哈希算法将任意长度的数据映射为固定长度的摘要,常用于文件完整性校验、密码存储等场景。
2.1 常用哈希算法
- MD5:快速但安全性较低,适用于文件校验。
- SHA1:比MD5更安全,但仍不推荐用于高安全场景。
- SHA256:更安全的算法,广泛用于现代应用。
2.2 示例:计算字符串和文件的哈希值
以下代码展示如何使用hashlib
计算字符串和文件的MD5值:
import hashlib
# 计算字符串MD5
text = "hello".encode('utf-8')
md5_hash = hashlib.md5(text).hexdigest()
print(f"MD5 of 'hello': {md5_hash}")
# 计算文件MD5
def get_file_md5(filename):
md5 = hashlib.md5()
with open(filename, 'rb') as f:
md5.update(f.read())
return md5.hexdigest()
print(f"MD5 of 'example.txt': {get_file_md5('example.txt')}")
2.3 应用场景
- 文件完整性校验:在文件传输后,比较文件的MD5值以确保未被篡改。
- 密码存储:将用户密码哈希后存储,避免明文泄露(建议结合盐值和更安全的算法如bcrypt)。
三、数据编码:base64
模块
base64
模块用于将二进制数据编码为可打印的ASCII字符,常用于数据传输(如邮件附件)或存储。base64
编码将二进制数据转换为由64个字符(A-Z、a-z、0-9、+、/)组成的字符串。
3.1 示例:编码与解码
import base64
# 编码
data = b'hello'
encoded = base64.b64encode(data)
print(f"Encoded: {encoded.decode()}") # 输出:aGVsbG8=
# 解码
decoded = base64.b64decode(encoded)
print(f"Decoded: {decoded.decode()}") # 输出:hello
3.2 应用场景
- 邮件附件:将图片或文件编码为Base64后嵌入邮件。
- API数据传输:在JSON中传输二进制数据时,使用Base64编码。
四、日志记录:logging
模块
logging
模块是Python标准库中用于日志记录的强大工具,支持灵活的日志输出(控制台、文件等)和多种日志级别(DEBUG、INFO、WARNING、ERROR、CRITICAL)。
4.1 基本用法
以下是一个简单的日志记录示例:
import logging
# 配置日志
logging.basicConfig(
level=logging.DEBUG,
format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
filename='app.log',
filemode='a'
)
# 记录不同级别的日志
logging.debug('Debug message')
logging.info('Info message')
logging.warning('Warning message')
logging.error('Error message')
logging.critical('Critical message')
4.2 彩色日志:结合colorlog
通过colorlog
库,可以为控制台日志添加颜色,提升可读性:
import logging
import colorlog
# 创建日志器
logger = logging.getLogger('my_app')
logger.setLevel(logging.DEBUG)
# 创建控制台处理器
handler = logging.StreamHandler()
handler.setLevel(logging.DEBUG)
# 设置彩色格式
formatter = colorlog.ColoredFormatter(
"%(log_color)s%(levelname)s:%(name)s:%(message)s",
log_colors=colorlog.default_log_colors
)
handler.setFormatter(formatter)
logger.addHandler(handler)
# 测试日志
logger.debug('Debug message')
logger.info('Info message')
logger.warning('Warning message')
logger.error('Error message')
logger.critical('Critical message')
4.3 应用场景
- 调试与监控:记录程序运行状态,便于排查问题。
- 生产环境:将日志写入文件,用于事后分析。
五、装饰器:增强函数功能
装饰器是Python中用于扩展函数行为的强大工具,允许在不修改原函数代码的情况下添加新功能。装饰器常用于日志记录、权限验证、性能分析等场景。
5.1 简单装饰器示例
以下是一个用于记录函数执行时间的装饰器:
import time
from functools import wraps
def timing_decorator(func):
@wraps(func)
def wrapper(*args, **kwargs):
start = time.time()
result = func(*args, **kwargs)
end = time.time()
print(f"{func.__name__} took {end - start:.2f} seconds")
return result
return wrapper
@timing_decorator
def slow_function(x, y):
time.sleep(2)
return x + y
print(slow_function(10, 20)) # 输出执行时间和结果
5.2 复杂示例:权限验证与日志记录
以下是一个结合权限验证和操作日志记录的装饰器示例:
from functools import wraps
from datetime import datetime
# 模拟用户数据库
users_db = {
1: {"username": "zhangsan", "password": "zhangsan", "role": "admin"},
2: {"username": "lisi", "password": "lisi", "role": "user"}
}
# 操作日志
operation_logs = []
# 权限验证装饰器
def require_admin(func):
@wraps(func)
def wrapper(user_id, *args, **kwargs):
if users_db.get(user_id, {}).get("role") != "admin":
print("Unauthorized access")
return {"error": "Unauthorized access"}
return func(user_id, *args, **kwargs)
return wrapper
# 日志记录装饰器
def log_operation(func):
@wraps(func)
def wrapper(user_id, *args, **kwargs):
result = func(user_id, *args, **kwargs)
action_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
log_entry = {
"user_id": user_id,
"action_time": action_time,
"action": f"Called {func.__name__} with args {args}, kwargs {kwargs}"
}
operation_logs.append(log_entry)
print("Logged operation")
return result
return wrapper
@require_admin
@log_operation
def edit_user_info(user_id, new_email, new_username, new_password):
print(f"Editing user {new_username} with email {new_email}")
return {"status": "success"}
# 测试
print(edit_user_info(1, "new@admin.com", "newuser", "newpass")) # 成功
print(edit_user_info(2, "new@admin.com", "newuser", "newpass")) # 无权限
print(operation_logs)
六、系统交互与监控:sys
和psutil
6.1 sys
模块
sys
模块提供了与Python解释器交互的功能,适用于获取系统信息或控制程序行为。
- 常用功能:
sys.argv
:获取命令行参数,sys.argv[0]
为脚本路径。sys.version
:获取Python解释器版本。sys.exit()
:中断程序执行。
示例:获取命令行参数
import sys
print(f"Script name: {sys.argv[0]}")
if len(sys.argv) > 1:
print(f"Arguments: {sys.argv[1:]}")
6.2 psutil
模块
psutil
是一个跨平台的系统监控库,可获取CPU、内存、磁盘、网络等信息,适用于性能分析和进程管理。
- 安装:
pip install psutil
- 功能:监控系统资源、进程管理(如
psutil.cpu_percent()
、psutil.Process().memory_info()
)。
示例:监控CPU使用率
import psutil
print(f"CPU Usage: {psutil.cpu_percent(interval=1)}%")
print(f"Memory Usage: {psutil.virtual_memory().percent}%")
七、时间处理:time
模块
time
模块用于处理时间相关操作,如获取时间戳、格式化日期等。
7.1 常用功能
time.time()
:返回当前时间戳。time.strftime(format, time_tuple)
:格式化时间,如%Y-%m-%d %H:%M:%S
。time.mktime(time_tuple)
:将格式化时间转换为时间戳。
示例:时间格式化
import time
# 当前时间
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))
# 时间戳转格式化时间
timestamp = time.time()
print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(timestamp)))
八、邮件发送:smtplib
模块
smtplib
模块用于发送邮件,支持SMTP协议。结合email
模块,可以构造复杂的邮件内容。
8.1 示例:发送简单邮件
import smtplib
from email.mime.text import MIMEText
from email.header import Header
# 邮件服务器配置
mail_host = "smtp.163.com"
mail_user = "your_email@163.com"
mail_pass = "your_password"
sender = "your_email@163.com"
receivers = ["recipient@admin.com"]
# 创建邮件
message = MIMEText("Hello, this is a test email!", "plain", "utf-8")
message["From"] = Header("Python Bot", "utf-8")
message["To"] = Header("User", "utf-8")
message["Subject"] = Header("Test Email", "utf-8")
# 发送邮件
try:
smtp_obj = smtplib.SMTP()
smtp_obj.connect(mail_host, 25)
smtp_obj.login(mail_user, mail_pass)
smtp_obj.sendmail(sender, receivers, message.as_string())
print("Email sent successfully")
except smtplib.SMTPException as e:
print(f"Error: {e}")
九、高效数据结构:collections
模块
collections
模块提供了多种扩展数据结构,优化了内置容器(如dict
、list
)的性能和使用体验。
9.1 常用数据结构
- namedtuple:创建带有命名字段的元组,便于访问。
- deque:双端队列,支持高效的头尾操作。
- Counter:统计元素出现次数。
- defaultdict:为不存在的键提供默认值。
- ChainMap:链式合并多个字典。
示例:使用Counter
统计字符频率
from collections import Counter
text = "aaadminad67uyghijknm"
counter = Counter(text)
print(counter) # 输出:Counter({'a': 4, 'd': 3, ...})
print(counter.most_common(2)) # 输出:[('a', 4), ('d', 3)]
十、终端美化:rich
模块
rich
是一个强大的终端美化库,支持彩色文本、表格、进度条和Markdown渲染。
- 安装:
pip install rich
- 功能:彩色输出、表格、进度条、Markdown渲染等。
示例:创建进度条
from rich.progress import Progress
import time
with Progress() as progress:
task = progress.add_task("Downloading...", total=100)
for _ in range(100):
progress.update(task, advance=1)
time.sleep(0.1)
十一、数据库操作:pymysql
与sqlite3
11.1 MySQL操作:pymysql
pymysql
是Python操作MySQL数据库的常用库。
示例:创建表并插入数据
import pymysql
db = pymysql.connect(host='localhost', user='root', password='', database='python', port=3306)
cursor = db.cursor()
# 创建表
cursor.execute("DROP TABLE IF EXISTS users")
cursor.execute("""
CREATE TABLE users (
id INT NOT NULL,
username CHAR(20),
pwd CHAR(255)
)
""")
# 插入数据
cursor.execute("INSERT INTO users (id, username, pwd) VALUES (111, 'zhangsan', 'zhangsan')")
db.commit()
db.close()
11.2 SQLite操作:sqlite3
sqlite3
是Python内置的轻量级数据库模块,适合小型项目。
示例:创建表并查询数据
import sqlite3
conn = sqlite3.connect('test.db')
cursor = conn.cursor()
# 创建表
cursor.execute("DROP TABLE IF EXISTS users")
cursor.execute("""
CREATE TABLE users (
id INT NOT NULL,
username CHAR(20),
pwd CHAR(255)
)
""")
# 插入数据
cursor.execute("INSERT INTO users (id, username, pwd) VALUES (111, 'zhangsan', 'zhangsan')")
conn.commit()
# 查询数据
cursor.execute("SELECT * FROM users")
for row in cursor.fetchall():
print(row)
conn.close()
十二、调试利器:pdb
模块
pdb
是Python内置的调试工具,支持交互式调试、断点管理等。
12.1 调试方法
- 代码内调试:在代码中插入
pdb.set_trace()
。 - 命令行调试:运行
python -m pdb script.py
。 - 异常调试:捕获异常后调用
pdb.post_mortem()
。
示例:设置断点调试
import pdb
def add(a, b):
pdb.set_trace() # 设置断点
return a + b
print(add(1, 2))
12.2 常用命令
n
:执行下一行。s
:步入函数。c
:继续执行到下一个断点。b <line>
:设置断点。p <variable>
:查看变量值。