Pandas2.2 DataFrame
Attributes and underlying data
| 方法 | 描述 |
|---|---|
| DataFrame.index | 用于获取 DataFrame 的行索引 |
| DataFrame.columns | 用于获取 DataFrame 的列标签 |
| DataFrame.dtypes | 用于获取 DataFrame 中每一列的数据类型 |
| DataFrame.info([verbose, buf, max_cols, …]) | 用于提供 DataFrame 的简要概述 |
| DataFrame.select_dtypes([include, exclude]) | 用于根据数据类型选择 DataFrame 中的列 |
| DataFrame.values | 用于返回 DataFrame 中数据的底层 NumPy 数组表示 |
pandas.DataFrame.values
pandas.DataFrame.values 是一个属性,用于返回 DataFrame 中数据的底层 NumPy 数组表示。这个属性非常有用,因为它允许你直接访问 DataFrame 的底层数据,进行快速的数值计算或与其他 NumPy 函数进行交互。
属性说明
DataFrame.values: 返回一个 NumPy 数组,包含 DataFrame 中的所有数据。
示例
假设有一个 DataFrame 如下:
import pandas as pd
data = {
'A': [1, 2, 3],
'B': [1.1, 2.2, 3.3],
'C': ['x', 'y', 'z']
}
df = pd.DataFrame(data)
示例1:获取 DataFrame 的底层 NumPy 数组
df.values
结果:
array([[1, 1.1, 'x'],
[2, 2.2, 'y'],
[3, 3.3, 'z']], dtype=object)
在这个例子中,df.values 返回了一个 NumPy 数组,其中包含了 DataFrame df 的所有数据。注意,由于 DataFrame 中包含不同类型的列(整数、浮点数和字符串),NumPy 数组的 dtype 被设置为 object,以确保所有数据类型都能被正确表示。
示例2:使用 NumPy 数组进行计算
import numpy as np
# 计算列 'A' 和 'B' 的和
sum_values = df[['A', 'B']].values.sum()
sum_values
结果:
12.600000000000001
在这个例子中,我们首先选择了 DataFrame 中的两列 'A' 和 'B',然后使用 .values 属性获取它们的 NumPy 数组表示,并计算这些数值的总和。
注意事项
- 使用
DataFrame.values返回的 NumPy 数组是基于原始 DataFrame 数据的,但它们之间没有直接的链接。修改 NumPy 数组不会影响原始 DataFrame。 - 如果 DataFrame 包含多种数据类型,返回的 NumPy 数组的
dtype可能会被设置为object,这可能会导致一些性能上的限制。
通过这些示例,你可以看到 DataFrame.values 属性如何帮助你访问和操作 DataFrame 的底层数据。