Python-八股总结

发布于:2025-03-31 ⋅ 阅读:(12) ⋅ 点赞:(0)

1 python 垃圾处理机制

Python垃圾回收详细讲解

2 yield

在这里插入图片描述
在这里插入图片描述

def fibonacci(n):
    result = []
    a, b = 0, 1
    for _ in range(n):
        result.append(a)  # 存储所有 Fibonacci 数值
        a, b = b, a + b
    return result  # 一次性返回所有值

fib = fibonacci(1000000)  # 计算 100 万个斐波那契数




def fibonacci(n):
    a, b = 0, 1
    for _ in range(n):
        yield a  # 每次迭代返回一个值,而不是存入列表
        a, b = b, a + b

fib = fibonacci(1000000)  # 创建生成器对象,但不立即计算
print(next(fib))
print(next(fib))
print(next(fib))
print(next(fib))
print(next(fib))
0
1
1
2
3

3 python 多继承,两个父类有同名方法怎么办?

单继承

class Parent:
    def greet(self):
        print("Hello from Parent!")

class Child(Parent):  # Child 继承 Parent
    pass

c = Child()
c.greet()  # 输出: Hello from Parent!

多继承

class Parent1:
    def greet(self):
        print("Hello from Parent1!")

class Parent2:
    def greet(self):
        print("Hello from Parent2!")

class Child(Parent1, Parent2):  # 继承多个父类
    pass

c = Child()
c.greet()  # 输出什么?

Python 解决多继承方法冲突的方法是 MRO(Method Resolution Order),即方法解析顺序。在 Python 中,MRO 遵循 C3 线性化算法,它按照深度优先+广度遍历的方式来确定方法的调用顺序。
可以用 .__ mro__ 或 mro() 方法查看 MRO:print(Child.__mro__)
(<class ‘main.Child’>, <class ‘main.Parent1’>, <class ‘main.Parent2’>, <class ‘object’>)
先查找 Child
再查找 Parent1
再查找 Parent2
最后查找 object(所有类的基类)

解决方法冲突
直接指定某个父类的方法

class Parent1:
    def greet(self):
        print("Hello from Parent1!")

class Parent2:
    def greet(self):
        print("Hello from Parent2!")

class Child(Parent1, Parent2):
 	def greet(self):
        Parent2.greet(self)  # 直接调用 Parent2 的方法

c = Child()
c.greet()  # 输出: Hello from Parent2!

4 python 多线程/多进程/协程

多线程指在同一个进程内通过创建多个线程来执行任务。每个线程都可以执行不同的任务,但它们共享同一进程的内存空间和资源。
多进程是指通过创建多个进程来并行执行任务。每个进程拥有独立的内存空间和资源,可以完全独立地运行。

在这里插入图片描述

4.1 多线程与GIL全局解释器锁

在同一进程中创建多个线程,共享进程内存空间,通过线程调度器实现并发执行。由于 Python 的 GIL(全局解释器锁)GIL全局解释器锁,多线程在 CPU 密集型任务(如计算)下无法真正实现并行,只适用于 I/O 密集型任务(如网络请求、文件读写)。

使用方式1 传入目标方法
import threading
def worker():
    print('线程正在执行')
# 创建线程
t = threading.Thread(target=worker)
# 启动线程
t.start()
# 等待线程执行完毕
t.join()

使用方式2 集成重写方法
class MyThread(threading.Thread):
    def run(self):
        print(f'{self.name} 线程正在执行')
# 创建线程实例
my_thread = MyThread()
# 启动线程
my_thread.start()
# 等待线程执行完毕
my_thread.join()

4.2 多进程

4.3 协程

  • 协程极高的执行效率。因为子程序切换不是线程切换,而是由程序自身控制,因此,没有线程切换的开销,和多线程比,线程数量越多,协程的性能优势就越明显。
  • 第二大优势就是不需要多线程的锁机制,因为只有一个线程,也不存在同时写变量冲突,在协程中控制共享资源不加锁,只需要判断状态就好了,所以执行效率比多线程高很多。
    在这里插入图片描述
def coroutine_example():
    print("Coroutine started")
    x = yield "First yield value"
    print(f"Received: {x}")
    y = yield "Second yield value"
    print(f"Received: {y}")
    return "Coroutine finished"

# 创建协程实例
coroutine = coroutine_example()

# 启动协程,执行到第一个yield处
print(next(coroutine))  # 输出: Coroutine started,并返回 "First yield value"

# 恢复协程,传入值给x,继续执行到第二个yield处
print(coroutine.send(10))  # 输出: Received: 10,并返回 "Second yield value"

# 再次恢复协程,传入值给y,继续执行到结束
result = coroutine.send(20)  # 输出: Received: 20,然后协程结束

# 捕获协程结束时的返回值
print(f"Coroutine result: {result}")  # 输出: Coroutine result: Coroutine finished

# 尝试再次恢复协程会引发StopIteration异常
try:
    coroutine.send(30)
except StopIteration as e:
    print(f"Coroutine ended with exception: {e}")  # 捕获异常并输出

5 乐观锁/悲观锁

悲观锁 适用于高并发、冲突频繁的场景 确保同一时刻只有一个线程能访问数据,从而避免数据不一致
乐观锁 适用于并发冲突较少的场景 它允许多个线程同时读取数据,更新时检查数据是否被修改,若有冲突则重试。

6 基本数据结构

Python 的基本数据结构主要包括以下几类:

1. 列表(List)

  • 可变,支持增删改查
  • 有序,支持索引访问
  • 允许重复元素
  • 底层实现:动态数组
lst = [1, 2, 3, 4]
lst.append(5)       # 添加元素
lst.pop()           # 删除末尾元素
lst[1] = 99         # 修改元素

2. 元组(Tuple)

  • 不可变,一旦创建不能修改
  • 有序,支持索引访问
  • 允许重复元素
  • 底层实现:静态数组
tup = (1, 2, 3, 4)
val = tup[1]        # 访问元素

3. 字典(Dictionary)

  • 可变,支持动态添加键值对
  • 无序(Python 3.6 之前)有序(Python 3.7+)
  • 键唯一,不可变;值可变
  • 底层实现:哈希表(dict 使用哈希函数存储键值对)
d = {'a': 1, 'b': 2}
d['c'] = 3          # 添加键值对
d.pop('b')          # 删除键值对

4. 集合(Set)

  • 可变,支持增删元素
  • 无序
  • 不允许重复元素
  • 底层实现:哈希表
s = {1, 2, 3}
s.add(4)            # 添加元素
s.remove(2)         # 删除元素

5. 字符串(String)

  • 不可变
  • 有序,支持索引访问
  • 支持切片
  • 底层实现:字符数组
s = "hello"
print(s[1])         # 'e'
print(s[:3])        # 'hel'

6. 队列(Queue)

  • FIFO(先进先出)
  • 通常使用 collections.deque 实现
from collections import deque
q = deque()
q.append(1)         # 入队
q.popleft()         # 出队

7. 栈(Stack)

  • LIFO(后进先出)
  • 通常使用 listcollections.deque 实现
stack = []
stack.append(1)     # 入栈
stack.pop()         # 出栈

8. 堆(Heap)

  • 默认是最小堆
  • Python 使用 heapq 模块
import heapq
heap = [3, 1, 4]
heapq.heapify(heap)    # 转换为堆
heapq.heappush(heap, 2)  # 入堆
heapq.heappop(heap)      # 出堆(最小值)

汇总

数据结构 可变性 有序性 允许重复 适用场景
列表(list) ✅ 可变 ✅ 有序 ✅ 允许 需要动态增删改查
元组(tuple) ❌ 不可变 ✅ 有序 ✅ 允许 需要不可变序列
字典(dict) ✅ 可变 ✅ 有序 (Py3.7+) ❌ 键唯一 需要键值对存储
集合(set) ✅ 可变 ❌ 无序 ❌ 不允许 需要去重
字符串(str) ❌ 不可变 ✅ 有序 ✅ 允许 处理文本
队列(queue) ✅ 可变 ✅ 有序 ✅ 允许 先进先出(FIFO)
栈(stack) ✅ 可变 ✅ 有序 ✅ 允许 后进先出(LIFO)
堆(heap) ✅ 可变 ✅ 有序 ✅ 允许 维护最小/最大值

7 is== 的区别(适用于 Python 3.7)

  • is 比较的是对象的内存地址(是否是同一个对象)
  • == 比较的是对象的值(内容是否相等)
示例
a = [1, 2, 3]
b = [1, 2, 3]
c = a

print(a == b)  # True  (内容相同)
print(a is b)  # False (a 和 b 是不同的对象)

print(a == c)  # True  (内容相同)
print(a is c)  # True  (a 和 c 指向同一对象)

8 什么是 Lambda 函数(适用于 Python 3.8)

lambda 函数是匿名函数,即没有名字的函数,使用 lambda 关键字定义。

语法
lambda 参数: 表达式
示例
add = lambda x, y: x + y
print(add(3, 5))  # 8

等价于:

def add(x, y):
    return x + y
应用场景
  1. 用于 map()filter()sorted()
nums = [1, 2, 3, 4, 5]
squared = list(map(lambda x: x**2, nums))
print(squared)  # [1, 4, 9, 16, 25]

even_nums = list(filter(lambda x: x % 2 == 0, nums))
print(even_nums)  # [2, 4]

pairs = [(1, 2), (3, 1), (5, 0)]
pairs.sort(key=lambda x: x[1])
print(pairs)  # [(5, 0), (3, 1), (1, 2)]
  1. 作为 functools.reduce() 的参数
from functools import reduce
nums = [1, 2, 3, 4]
product = reduce(lambda x, y: x * y, nums)
print(product)  # 24

9 函数传参

类型 可变性 示例 函数内部修改是否影响原变量
不可变对象 ❌ 不可变 intfloatstrtuple ❌ 不影响,创建新对象
可变对象 ✅ 可变 listdictset ✅ 影响,会修改原对象

10 *args**kwargs 的用法与原理**

(1) *args(可变位置参数)
  • 允许函数接收任意数量的位置参数,并将它们存储为一个 元组 (tuple)。
def add(*args):
    return sum(args)

print(add(1, 2, 3))    # 6
print(add(4, 5, 6, 7)) # 22

等价于

def add(a, b, c):
    return a + b + c

原理
*args 作用是 收集 多个位置参数,将它们封装成一个元组传递给函数。


(2) **kwargs(可变关键字参数)
  • 允许函数接收任意数量的 关键字参数,并将它们存储为 字典 (dict)
def greet(**kwargs):
    for key, value in kwargs.items():
        print(f"{key} : {value}")

greet(name="Alice", age=25, country="USA")
# name : Alice
# age : 25
# country : USA

原理
**kwargs 作用是 收集 多个关键字参数,并存储为字典 {key: value} 传递给函数。


(3) *args**kwargs 混用
  • *args 必须放在 **kwargs 之前,否则会报错。
def demo(a, b, *args, c=10, **kwargs):
    print(a, b, args, c, kwargs)

demo(1, 2, 3, 4, 5, c=20, x=100, y=200)
# 输出:1 2 (3, 4, 5) 20 {'x': 100, 'y': 200}

11 装饰器(Decorator)的作用与原理

(1) 装饰器的作用

装饰器用于 在不修改原函数代码的情况下,增强函数的功能,比如:

  • 计算函数执行时间
  • 记录日志
  • 检查权限
  • 缓存数据

(2) 装饰器的原理

装饰器本质上是一个函数,它接受一个函数作为参数,并返回一个新的函数。

def decorator(func):
    def wrapper():
        print("执行前")
        func()
        print("执行后")
    return wrapper

@decorator
def hello():
    print("Hello, world!")

hello()
# 执行前
# Hello, world!
# 执行后

等价于:

def hello():
    print("Hello, world!")

hello = decorator(hello)
hello()

@decorator 语法糖的作用:等价于 hello = decorator(hello)

12 Python 变量的作用域

Python 作用域遵循 LEGB 规则

  1. Local(局部作用域):函数内部定义的变量。
  2. Enclosing(闭包作用域):外部嵌套函数的变量。
  3. Global(全局作用域):模块级变量。
  4. Built-in(内建作用域):Python 预定义的变量,如 len()
x = "global"

def outer():
    x = "enclosing"
    def inner():
        x = "local"
        print(x)  # 输出 "local"
    inner()
    print(x)  # 输出 "enclosing"

outer()
print(x)  # 输出 "global"

13 解释型和编译型语言的区别

(1) 解释型语言
  • 代码逐行执行,不需要预先编译。
  • 运行时才翻译,直接执行。
  • 适用于动态语言(Python、JavaScript)。
print("Hello, World!")  # Python 解释器逐行执行
(2) 编译型语言
  • 代码需要 先编译 成机器码(.exe 等),然后执行。
  • 运行速度快,但需要编译过程。
  • 适用于静态语言(C、C++、Rust)。
#include <stdio.h>
int main() {
    printf("Hello, World!");
    return 0;
}

编译后生成 a.out 文件,运行时不需要解释。

14 __init__ __new__ 的区别

方法 作用 调用时机
__new__ 创建对象,返回对象实例 类实例化时,先调用 __new__
__init__ 初始化对象,设置属性 __new__ 之后调用 __init__
class A:
    def __new__(cls, *args, **kwargs):
        print("调用 __new__")
        instance = super().__new__(cls)
        return instance

    def __init__(self, name):
        print("调用 __init__")
        self.name = name

a = A("Tom")
# 调用 __new__
# 调用 __init__

15 Python 的 listnumpy.array(数组)的区别

虽然 listnumpy.array 都是可以存储一系列元素的容器,但它们在以下几个方面有显著区别:

1. 类型限制
  • list
    list动态类型,可以存储不同类型的元素,例如整数、字符串、浮点数等。元素的类型可以混合在一起。

    my_list = [1, "hello", 3.14]
    
  • numpy.array
    numpy.array同质类型,即所有元素必须是相同的数据类型(例如,全是整数或浮点数),并且在创建时会固定类型。这样做的好处是可以更高效地进行数值计算。

    import numpy as np
    arr = np.array([1, 2, 3])  # 类型为整数
    

2. 性能
  • list
    Python 的 list 是为通用数据存储设计的,它的元素可以是任何对象,因此它的操作(如访问、添加或删除元素)通常需要更多的内存管理和更复杂的逻辑。对于大规模数值计算或高性能需求,list 可能不够高效。

  • numpy.array
    numpy.array 是专门为科学计算设计的,所有元素都是同一数据类型,因此在内存中是连续存储的。这样可以利用低级优化(如 SIMD)来提高性能,特别是在进行大量数学运算时,numpy.array 显著优于 list

    import numpy as np
    arr1 = np.array([1, 2, 3, 4, 5])
    arr2 = np.array([6, 7, 8, 9, 10])
    result = arr1 + arr2  # 进行高效的向量加法
    

3. 功能与方法
  • list
    list 是 Python 内建的数据结构,支持的基本操作包括添加、删除、修改、切片等,但它不支持直接进行数学或向量操作。

    my_list = [1, 2, 3]
    my_list.append(4)
    my_list.pop()
    
  • numpy.array
    numpy.array 提供了 大量的数学运算和线性代数操作,例如向量加法、矩阵乘法、元素级操作、广播等。

    import numpy as np
    arr = np.array([1, 2, 3])
    result = arr * 2  # 每个元素都乘以 2
    print(result)  # 输出 [2, 4, 6]
    

    numpy 还支持很多函数,比如矩阵乘法(np.dot())、求和(np.sum())等。


4. 内存效率
  • list
    Python 的 list 是动态数组,元素存储为指针,因此每个元素的内存开销较大。此外,由于 Python 的 list 是动态扩展的,可能会发生重新分配内存,这也会影响性能。

  • numpy.array
    numpy.array 使用 紧凑的内存布局,所有元素连续存储,这使得它的内存使用更加高效,尤其是当处理大量数据时。


5. 维度支持
  • list
    Python 的 list 只能表示一维数组。如果要表示多维数据(如二维矩阵),通常会使用嵌套 list

    my_list = [[1, 2], [3, 4], [5, 6]]  # 需要嵌套 list 来模拟二维矩阵
    
  • numpy.array
    numpy.array 支持任意维度的数组,能够表示 一维、二维、三维 等复杂的数据结构,并可以轻松地进行切片和变形操作。

    arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  # 2D array
    

6. 广播机制
  • list
    list 不支持 广播机制(Broadcasting),这意味着你不能直接对 list 进行元素级的算术操作。

  • numpy.array
    numpy.array 支持广播机制,可以让不同形状的数组之间进行运算。它会自动扩展数组的形状,以便进行元素级运算。

    arr = np.array([1, 2, 3])
    result = arr + 10  # 结果是 [11, 12, 13]
    

总结

  • list 是 Python 内建的通用容器,适用于存储不同类型的元素,且易于使用,但在进行数值计算时性能不佳。
  • numpy.array 是为科学计算设计的高效数组类型,它支持同质数据存储、广播机制和大量的数学运算操作,特别适用于需要高性能的数值计算任务。

在处理大量数值数据时,numpy.array 更加高效。如果你的任务主要涉及到数值计算、矩阵操作等,建议使用 numpy。而如果你需要处理混合类型的数据或进行常规的存储,list 可能更合适。

16 Python 的面向对象(OOP)

Python 的面向对象(OOP)特性包括 封装继承多态,这三个是面向对象编程的核心概念。下面详细解释这三个特性:

1. 封装 (Encapsulation)

封装是指将对象的状态(属性)和行为(方法)绑定在一起,并对外界隐藏实现细节,只暴露必要的接口。
在这里插入图片描述

封装的关键点:
  • 私有属性和方法:可以使用双下划线(__)将属性或方法标记为私有,防止外部直接访问或修改。
  • 公共接口:通过公共的接口(通常是方法),提供对私有数据的访问或操作。这样,外部只能通过这些方法访问和修改对象的状态,而无法直接改变对象的内部实现。
示例:
class Person:
    def __init__(self, name, age):
        self.__name = name  # 私有属性
        self.__age = age  # 私有属性

    def get_name(self):  # 公共方法
        return self.__name

    def set_name(self, name):  # 公共方法
        self.__name = name

    def get_age(self):  # 公共方法
        return self.__age

    def set_age(self, age):  # 公共方法
        self.__age = age

# 创建对象
person = Person("Alice", 30)
print(person.get_name())  # 通过公共接口访问私有属性

通过封装,我们可以控制对象的属性的读取和修改方式,保证对象的状态在有效范围内。


2. 继承 (Inheritance)

继承是面向对象的一种机制,允许一个类继承另一个类的属性和方法。继承实现了代码的复用,并支持子类重写父类的方法,从而能够对父类的行为进行定制。

继承的关键点:
  • 父类和子类:父类(或基类)是被继承的类,子类(或派生类)是继承父类的类。子类可以继承父类的所有公有属性和方法,也可以重写父类的方法。
  • 方法重写:子类可以重写父类的方法来改变或扩展其行为。
示例:
class Animal:
    def speak(self):
        print("Animal makes a sound")

class Dog(Animal):  # Dog 类继承 Animal 类
    def speak(self):  # 重写父类方法
        print("Dog barks")

class Cat(Animal):  # Cat 类继承 Animal 类
    def speak(self):  # 重写父类方法
        print("Cat meows")

# 创建对象
dog = Dog()
dog.speak()  # 输出 Dog barks

cat = Cat()
cat.speak()  # 输出 Cat meows

在上面的例子中,DogCat 都继承了 Animal 类,并且各自重写了 speak 方法,实现了不同的行为。继承让代码更具可复用性。


3. 多态 (Polymorphism)

多态是指同一个方法或操作可以作用于不同的对象上,并且表现出不同的行为。多态可以通过方法重写(子类中重新定义父类方法)和接口统一来实现。

多态的关键点:
  • 方法重写:子类可以重写父类的方法,使得不同子类的对象能够调用相同的方法时表现出不同的行为。
  • 统一接口:不同类型的对象可以通过统一的接口(方法)进行操作,方法的具体实现取决于对象的类型。
示例:
class Animal:
    def speak(self):
        raise NotImplementedError("Subclass must implement abstract method")

class Dog(Animal):
    def speak(self):
        print("Dog barks")

class Cat(Animal):
    def speak(self):
        print("Cat meows")

# 创建对象
animals = [Dog(), Cat()]

for animal in animals:
    animal.speak()  # 输出不同的行为:Dog barks 和 Cat meows

在上面的例子中,DogCat 都继承自 Animal 类,并重写了 speak 方法。通过父类引用调用 speak() 方法时,Python 会根据实际的对象类型(DogCat)来决定调用哪个版本的 speak 方法,从而实现了多态。


总结:
  1. 封装:通过限制直接访问对象的属性和方法,保证对象的状态不被外部直接修改,提供了更好的数据保护和接口管理。
  2. 继承:通过继承机制,子类可以复用父类的代码,并可以通过方法重写扩展或修改父类的行为。
  3. 多态:允许同一接口根据对象的不同类型表现出不同的行为,从而使得程序更具扩展性和灵活性。

这三个特性是面向对象编程的基础,设计更清晰、更易维护的代码。

17


网站公告

今日签到

点亮在社区的每一天
去签到