6.Pandas数据统计函数

发布于:2023-01-18 ⋅ 阅读:(173) ⋅ 点赞:(0)

简单介绍

主要应用
1.汇总类统计
2.唯一去重和按值计数
3.相关系数和协方差

读取csv数据

import pandas as pd

fpath = "../data/tianqi.csv"
df = pd.read_csv(fpath)
# 处理数据,先将温度后缀去掉,变成数字类型
df.loc[:, "bWenDu"] = df["bWenDu"].str.replace("°C", "").astype('int32')
df.loc[:, "yWenDu"] = df["yWenDu"].str.replace("°C", "").astype('int32')

1.汇总类统计

# 一下子提取所有数字列统计结果
print(df.describe())
# 查看单个Series的数据,平均值
print(df['bWenDu'].mean())
# 最高温
print(df["bWenDu"].max())
# 最低温
print(df["bWenDu"].min())

在这里插入图片描述

2.唯一去重和按值计数

一般不用于数值列,而是枚举,分类列
唯一性去重df[‘xx’].unique
在这里插入图片描述
按值计数df[‘xx’].value_counts()
在这里插入图片描述

相关系数和协方差

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


网站公告

今日签到

点亮在社区的每一天
去签到