【深度学习】ndim与shape,还有rank
xlwin136 人工智能教学实践 2025年03月24日 12:56
在深度学习中,ndim
、shape
和 rank
是与张量(Tensor)相关的重要概念,它们从不同角度描述了张量的结构信息,下面分别详细介绍。
1. ndim
含义:
ndim
是number of dimensions
的缩写,代表张量的维度数量,也就是张量轴的数量。在 Python 的 NumPy 库和 TensorFlow 等深度学习框架中,都可以使用ndim
属性来获取张量的维度数。示例
import numpy as np
# 0 维张量(标量)
scalar = np.array(5)
print("标量的维度数:", scalar.ndim)
# 1 维张量(向量)
vector = np.array([1, 2, 3])
print("向量的维度数:", vector.ndim)
# 2 维张量(矩阵)
matrix = np.array([[1, 2, 3], [4, 5, 6]])
print("矩阵的维度数:", matrix.ndim)
# 3 维张量
tensor_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3 维张量的维度数:", tensor_3d.ndim)
解释:标量没有方向,所以维度数为 0;向量是一维的,有一个方向,维度数为 1;矩阵有行和列两个方向,维度数为 2;3 维张量可以想象成多个矩阵堆叠在一起,维度数为 3。
2. shape
含义:
shape
表示张量在每个维度上的大小,它返回一个元组,元组中的每个元素对应张量在相应维度上的长度。shape
可以帮助我们了解张量的具体结构和大小。示例
import numpy as np
# 0 维张量(标量)
scalar = np.array(5)
print("标量的 shape:", scalar.shape)
# 1 维张量(向量)
vector = np.array([1, 2, 3])
print("向量的 shape:", vector.shape)
# 2 维张量(矩阵)
matrix = np.array([[1, 2, 3], [4, 5, 6]])
print("矩阵的 shape:", matrix.shape)
# 3 维张量
tensor_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3 维张量的 shape:", tensor_3d.shape)
解释:标量没有维度,所以
shape
是一个空元组;向量的shape
元组只有一个元素,表示向量中元素的数量;矩阵的shape
元组有两个元素,分别表示矩阵的行数和列数;3 维张量的shape
元组有三个元素,依次表示张量的层数、行数和列数。
3. rank
含义:在深度学习框架中,
rank
与ndim
含义相同,都表示张量的维度数量。例如在 TensorFlow 中,rank
用来描述张量的维度数。示例
import tensorflow as tf
# 0 维张量(标量)
scalar = tf.constant(5)
print("标量的 rank:", tf.rank(scalar).numpy())
# 1 维张量(向量)
vector = tf.constant([1, 2, 3])
print("向量的 rank:", tf.rank(vector).numpy())
# 2 维张量(矩阵)
matrix = tf.constant([[1, 2, 3], [4, 5, 6]])
print("矩阵的 rank:", tf.rank(matrix).numpy())
# 3 维张量
tensor_3d = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3 维张量的 rank:", tf.rank(tensor_3d).numpy())
解释:通过
tf.rank()
函数可以获取 TensorFlow 张量的rank
,其结果与使用ndim
获取的维度数是一致的。
综上所述,ndim
和 rank
都用于描述张量的维度数量,而 shape
则进一步详细说明了张量在每个维度上的具体大小。这些概念在深度学习的数据处理、模型构建和训练过程中都非常重要。