简单介绍
主要应用
1.汇总类统计
2.唯一去重和按值计数
3.相关系数和协方差
读取csv数据
import pandas as pd
fpath = "../data/tianqi.csv"
df = pd.read_csv(fpath)
# 处理数据,先将温度后缀去掉,变成数字类型
df.loc[:, "bWenDu"] = df["bWenDu"].str.replace("°C", "").astype('int32')
df.loc[:, "yWenDu"] = df["yWenDu"].str.replace("°C", "").astype('int32')
1.汇总类统计
# 一下子提取所有数字列统计结果
print(df.describe())
# 查看单个Series的数据,平均值
print(df['bWenDu'].mean())
# 最高温
print(df["bWenDu"].max())
# 最低温
print(df["bWenDu"].min())
2.唯一去重和按值计数
一般不用于数值列,而是枚举,分类列
唯一性去重df[‘xx’].unique
按值计数df[‘xx’].value_counts()
相关系数和协方差