【机器学习】数学基础——张量(进阶篇)

发布于:2025-06-23 ⋅ 阅读:(17) ⋅ 点赞:(0)

目录

张量:高维宇宙的数据乐高

一、张量本质:数据的维度跃迁

1.1 阶数进化树

二、张量解剖学:理解组件的视觉指南

2.1 三阶张量结构(如RGB图像)

三、物理世界的张量化身

3.1 经典张量场案例

 四、AI革命的张量引擎

4.1 神经网络中的张量流

4.2  深度学习三定律

五、张量运算:高维空间的变形法则

5.1 基本操作全景图

六、张量可视化:从数学到直觉

6.1 三阶张量切片技术

6.2 现代工具

七、张量哲学:为什么它是宇宙的终极数据结构?

结语:掌握高维世界的钥匙

一句话讲明白


张量:高维宇宙的数据乐高

当爱因斯坦用张量描述时空弯曲,当PyTorch用张量构建神经网络——这个看似抽象的数学概念,实则是连接微观粒子运动宏观智能决策的通用语言。张量如同高维宇宙的乐高积木,用统一的结构承载万物。


一、张量本质:数据的维度跃迁

1.1 阶数进化树

数学定义
张量是多重线性函数的载体,可表示为:

程序员视角

# PyTorch中的张量宣言
标量 = torch.tensor(3.14)          # 0维:纯量
向量 = torch.tensor([1,2,3])       # 1维:一阶张量
矩阵 = torch.tensor([[1,2],[3,4]]) # 2维:二阶张量
RGB图像 = torch.randn(3,256,256)   # 3维:三阶张量
视频流 = torch.randn(60,3,720,1280) # 4维:四阶张量

🔑 核心洞见:阶数=独立索引的数量,决定数据的表达能力


 

二、张量解剖学:理解组件的视觉指南

2.1 三阶张量结构(如RGB图像)

 

关键特性

  1. 形状(shape):各维度长度元组
    视频张量形状 = (帧数, 通道, 高, 宽)

  2. 数据类型(dtype)
    float32, int64, bool等精度标识

  3. 设备(device)
    CPU/GPU决定计算位置


三、物理世界的张量化身

3.1 经典张量场案例

物理现象 张量类型 数学表达 现实意义
电场强度 向量(1阶) 空间各点电场方向与强度
应力张量 矩阵(2阶) 材料内部受力分布
时空曲率 四阶张量 引力导致的几何扭曲
量子波函数 无限阶张量 多粒子系统状态

 
  • 类型:一个具有 一个协变下标(下标 iii)的一阶张量(列向量)。

  • 示例含义:电场张量分量,或者一般意义下的协变向量。


σij\sigma_{ij}σij​
  • 类型:具有两个协变下标的二阶张量

  • 示例含义:应力张量,描述物体内部各点间的力传递。


  • 类型:四个协变指标的四阶张量

  • 示例含义:黎曼曲率张量,广义相对论中的核心张量,用于描述时空弯曲。


 
  • 类型混合张量,具有多个逆变(上标)和协变(下标)指标。

  • 示例含义:广义张量形式,常见于量子场论、高维代数中,具体含义由上下文决定。

 

爱因斯坦场方程的精髓:

✅各符号含义解析:

  • 爱因斯坦张量,由时空的曲率(即黎曼张量)构成,反映了时空结构

  • 能动张量(能量-动量张量),表示物质和能量的分布

  • :万有引力常数。

  • :光速。

  • ​:比例因子,确保单位统一,连接几何与物质。

✅ 解读:

这条等式是广义相对论的核心,它的意义是:

时空的几何由能量和动量决定,物质告诉时空如何弯曲,时空的弯曲又决定物质如何运动。


 四、AI革命的张量引擎

4.1 神经网络中的张量流

4.2  深度学习三定律

1、数据张量化:万物皆可表示为张量

# 自然语言处理
文本 = ["深度学习", "改变世界"]
词向量 = embed(文本)  # 形状:[2, 768] 二阶张量

2、计算张量化:所有运算可转为张量操作

# 矩阵乘法:神经网络核心运算
Y = X @ W + b  # @ 是张量矩阵乘

3、梯度张量化:自动微分依赖张量追踪

loss.backward()  # 反向传播自动计算梯度张量

五、张量运算:高维空间的变形法则

5.1 基本操作全景图

 爱因斯坦求和约定(einsum):

# 矩阵乘法:C_ij = A_ik B_kj
torch.einsum('ik,kj->ij', A, B)

# 双向LSTM计算:高阶张量运算
h = torch.einsum('tbh,hr->tbr', input, weight)

六、张量可视化:从数学到直觉

6.1 三阶张量切片技术

 

6.2 现代工具

  1. TensorBoard投影:高维数据降维可视化

  2. Plotly切片工具:交互式张量探索

  3. PyTorch Viz:自动生成计算图

尝试将4阶视频张量看作:
时间卷轴上的三维空间切片序列


七、张量哲学:为什么它是宇宙的终极数据结构?

  1. 维度包容性

    • 标量(0阶)是张量的退化形式

    • 向量(1阶)是张量的特例

    • 矩阵(2阶)是张量的子集

  2. 参考系无关性
    物理定律的张量形式在所有坐标系下保持不变

     

#广义协变原理
T'^{i}_{j} = \frac{\partial x'^i}{\partial x^k}\frac{\partial x^l}{\partial x'^j} T^k_l

     3.智能构建基石

“所有机器学习模型本质上都是张量变换函数
—— PyTorch首席科学家 Soumith Chintala


 

结语:掌握高维世界的钥匙

当你在PyTorch中写下:

x = torch.tensor([[[...]]])

你手中的不再仅仅是数据容器,而是:

  • 物理学家眼中的时空描述工具

  • 数学家心中的多重线性代数载体

  • AI工程师的智能原子

张量的魔力在于:它用统一的结构,连接了牛顿的经典力学、爱因斯坦的相对论、以及现代深度神经网络。在这个由数据驱动的新时代,理解张量就是握住了开启高维宇宙的钥匙。

宇宙的真理不在标量中显现,而在张量中绽放


一句话讲明白

张量是高维数据的万能容器——从标量(0维)、向量(1维)、矩阵(2维)到视频流(4维),它能统一承载物理定律、驱动AI模型、甚至描述时空弯曲。

三大核心用途:

  1. 构建智能:神经网络中所有计算(如图像识别/语言生成)本质是张量运算

  2. 描述宇宙:爱因斯坦用张量表达引力场方程 $G_{\mu\nu} = \frac{8\pi G}{c^4} T_{\mu\nu}$

  3. 处理现实数据:将图像/语音/文本转化为可计算的数字结构

简言之:张量=现实世界数字化+物理规律数学化+人工智能燃料化


网站公告

今日签到

点亮在社区的每一天
去签到