最小二乘法的算法原理-EW帮帮网

最小二乘法（Least Squares Method）是一种数学优化技术，核心思想是通过最小化预测值与真实值之间的残差平方和，找到模型参数的最优解。其核心目标可表示为：
$\min_{\beta} \sum_{i=1}^n (y_i - \hat{y}_i)^2$
其中：

以线性回归模型为例，假设模型为：
$X\beta + \epsilon$
其中：

目标函数为残差平方和：
$X\beta)^T (y - X\beta)$

推导步骤：

展开目标函数：
$y^T y - 2 \beta^T X^T y + \beta^T X^T X \beta$
对 ( \beta ) 求导并令导数为零：
$\frac{\partial S}{\partial \beta} = -2 X^T y + 2 X^T X \beta = 0$
解得正规方程（Normal Equation）：
$X^T X \beta = X^T y$
若 $X^T X )$ 可逆，则参数解为：
$\beta = (X^T X)^{-1} X^T y$

最小二乘法的几何意义是：将观测值 ( y ) 投影到设计矩阵 ( X ) 的列空间，使得残差向量 $\epsilon = y - X\beta )$ 垂直于该空间。
投影矩阵 $P = X(X^T X)^{-1} X^T )$ ，预测值为：
$\hat{y} = P y$

问题：根据房屋面积 ( x ) 预测价格 ( y )。
模型： $\beta_0 + \beta_1 x )$
数据：

面积（m²）价格（万元）

50 300

80 480

100 550
矩阵形式：
$\begin{bmatrix} 1 & 50 \\ 1 & 80 \\ 1 & 100 \\ \end{bmatrix}, \quad y = \begin{bmatrix} 300 \\ 480 \\ 550 \\ \end{bmatrix}$
解：
$\beta = (X^T X)^{-1} X^T y \approx \begin{bmatrix} 100 \\ 4.5 \end{bmatrix}$
最终模型： $\hat{y} = 100 + 4.5x )$

问题：用二次多项式拟合实验数据 $x_i, y_i) )$ 。
模型： $\beta_0 + \beta_1 x + \beta_2 x^2 )$
设计矩阵：
$\begin{bmatrix} 1 & x_1 & x_1^2 \\ 1 & x_2 & x_2^2 \\ \vdots & \vdots & \vdots \\ \end{bmatrix}$
解：通过 $\beta = (X^T X)^{-1} X^T y )$ 计算系数。

对于非线性模型（如 $e^{\beta x} )$ ），需使用迭代方法（如高斯-牛顿法或Levenberg-Marquardt算法）求解,后面章节进行讲解。

最小二乘法的算法原理