【Pandas】pandas DataFrame values

发布于:2025-04-04 ⋅ 阅读:(27) ⋅ 点赞:(0)

Pandas2.2 DataFrame

Attributes and underlying data

方法 描述
DataFrame.index 用于获取 DataFrame 的行索引
DataFrame.columns 用于获取 DataFrame 的列标签
DataFrame.dtypes 用于获取 DataFrame 中每一列的数据类型
DataFrame.info([verbose, buf, max_cols, …]) 用于提供 DataFrame 的简要概述
DataFrame.select_dtypes([include, exclude]) 用于根据数据类型选择 DataFrame 中的列
DataFrame.values 用于返回 DataFrame 中数据的底层 NumPy 数组表示

pandas.DataFrame.values

pandas.DataFrame.values 是一个属性,用于返回 DataFrame 中数据的底层 NumPy 数组表示。这个属性非常有用,因为它允许你直接访问 DataFrame 的底层数据,进行快速的数值计算或与其他 NumPy 函数进行交互。

属性说明
  • DataFrame.values: 返回一个 NumPy 数组,包含 DataFrame 中的所有数据。
示例

假设有一个 DataFrame 如下:

import pandas as pd

data = {
    'A': [1, 2, 3],
    'B': [1.1, 2.2, 3.3],
    'C': ['x', 'y', 'z']
}

df = pd.DataFrame(data)
示例1:获取 DataFrame 的底层 NumPy 数组
df.values

结果:

array([[1, 1.1, 'x'],
       [2, 2.2, 'y'],
       [3, 3.3, 'z']], dtype=object)

在这个例子中,df.values 返回了一个 NumPy 数组,其中包含了 DataFrame df 的所有数据。注意,由于 DataFrame 中包含不同类型的列(整数、浮点数和字符串),NumPy 数组的 dtype 被设置为 object,以确保所有数据类型都能被正确表示。

示例2:使用 NumPy 数组进行计算
import numpy as np

# 计算列 'A' 和 'B' 的和
sum_values = df[['A', 'B']].values.sum()
sum_values

结果:

12.600000000000001

在这个例子中,我们首先选择了 DataFrame 中的两列 'A''B',然后使用 .values 属性获取它们的 NumPy 数组表示,并计算这些数值的总和。

注意事项
  • 使用 DataFrame.values 返回的 NumPy 数组是基于原始 DataFrame 数据的,但它们之间没有直接的链接。修改 NumPy 数组不会影响原始 DataFrame。
  • 如果 DataFrame 包含多种数据类型,返回的 NumPy 数组的 dtype 可能会被设置为 object,这可能会导致一些性能上的限制。

通过这些示例,你可以看到 DataFrame.values 属性如何帮助你访问和操作 DataFrame 的底层数据。