机器学习数学通关指南——泰勒公式-EW帮帮网

前言

本文隶属于专栏《机器学习数学通关指南》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和参考文献请见《机器学习数学通关指南》

泰勒公式是用多项式函数逐步逼近复杂函数的工具，其核心思想是：用某一点的函数值及各阶导数信息，构建一个多项式，像“放大镜”一样，在局部无限接近原函数。

以直代曲 → 逐步修匀
- 一阶泰勒公式就是常用的“以直代曲”（例如用切线近似函数）。
- 加入高阶项后，逐渐加入“弯曲校正项”，使得多项式在更广范围内贴合原函数。
- 类比：调手机相机的“放大镜”功能——起始是模糊的直线轮廓（低阶近似），逐步放大细节后，曲线形状清晰可见（高阶近似）。
低阶盯局部，高阶管全局
- 低阶项（如一次项、二次项）：主导当前点附近的形状。
- 高阶项（如三次及以上）：在远离当前点的区域逐渐起主要作用（例如y = x³会比y = x²在x > 1时增长更快）。
- 示例：
  - 在原点展开的eˣ，低阶项（1 + x）在靠近0时与真实值接近，高阶项（x²/2! + x³/3! + ...）逐渐修正远端的误差。
  - sin x的泰勒展开通过奇次项（x³、x⁵）交替抵消，精确模拟波动特性。

阶数越高，多项式逼近的范围越广、精度越高。
例子对比：
- 用1 + x近似eˣ（1阶），只能在x → 0时勉强可用。
- 用1 + x + x²/2! + x³/3!近似eˣ（3阶），在x = 1附近误差已小于0.01。

单变量公式：
$\sum_{k=0}^n \frac{f^{(k)}(x_0)}{k!}(x - x_0)^k + R_n(x)$
其中R_n(x)为余项，表示误差（余项越小，逼近越精确）。
物理意义：
- 导数各阶信息 = 函数当前位置（0阶）、瞬时变化方向（1阶）、弯曲程度（2阶）等。
- 综合所有导数信息即可预测函数未来走势。

泰勒公式是用多项式“镜头”逐步聚焦函数的工具——阶数决定了精度，阶乘平衡了增长，展开式中的每一项都是导数信息的精确调用，从而在局部和全局间架起桥梁。