Pandas2.2 DataFrame
Attributes and underlying data
方法 | 描述 |
---|---|
DataFrame.index | 用于获取 DataFrame 的行索引 |
DataFrame.columns | 用于获取 DataFrame 的列标签 |
DataFrame.dtypes | 用于获取 DataFrame 中每一列的数据类型 |
DataFrame.info([verbose, buf, max_cols, …]) | 用于提供 DataFrame 的简要概述 |
DataFrame.select_dtypes([include, exclude]) | 用于根据数据类型选择 DataFrame 中的列 |
DataFrame.values | 用于返回 DataFrame 中数据的底层 NumPy 数组表示 |
pandas.DataFrame.values
pandas.DataFrame.values
是一个属性,用于返回 DataFrame 中数据的底层 NumPy 数组表示。这个属性非常有用,因为它允许你直接访问 DataFrame 的底层数据,进行快速的数值计算或与其他 NumPy 函数进行交互。
属性说明
DataFrame.values
: 返回一个 NumPy 数组,包含 DataFrame 中的所有数据。
示例
假设有一个 DataFrame 如下:
import pandas as pd
data = {
'A': [1, 2, 3],
'B': [1.1, 2.2, 3.3],
'C': ['x', 'y', 'z']
}
df = pd.DataFrame(data)
示例1:获取 DataFrame 的底层 NumPy 数组
df.values
结果:
array([[1, 1.1, 'x'],
[2, 2.2, 'y'],
[3, 3.3, 'z']], dtype=object)
在这个例子中,df.values
返回了一个 NumPy 数组,其中包含了 DataFrame df
的所有数据。注意,由于 DataFrame 中包含不同类型的列(整数、浮点数和字符串),NumPy 数组的 dtype
被设置为 object
,以确保所有数据类型都能被正确表示。
示例2:使用 NumPy 数组进行计算
import numpy as np
# 计算列 'A' 和 'B' 的和
sum_values = df[['A', 'B']].values.sum()
sum_values
结果:
12.600000000000001
在这个例子中,我们首先选择了 DataFrame 中的两列 'A'
和 'B'
,然后使用 .values
属性获取它们的 NumPy 数组表示,并计算这些数值的总和。
注意事项
- 使用
DataFrame.values
返回的 NumPy 数组是基于原始 DataFrame 数据的,但它们之间没有直接的链接。修改 NumPy 数组不会影响原始 DataFrame。 - 如果 DataFrame 包含多种数据类型,返回的 NumPy 数组的
dtype
可能会被设置为object
,这可能会导致一些性能上的限制。
通过这些示例,你可以看到 DataFrame.values
属性如何帮助你访问和操作 DataFrame 的底层数据。