Pandas库学习之DataFrame.replace()函数

发布于:2024-07-20 ⋅ 阅读:(122) ⋅ 点赞:(0)

Pandas库学习之DataFrame.replace()函数

一、简介

DataFrame.replace()函数用于替换DataFrame中的指定值。该函数允许使用单个值、列表、字典或正则表达式进行替换操作,非常灵活。

二、语法和参数

DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')
  • to_replace:需要替换的值,可以是单个值、列表、字典或正则表达式
  • value:替换后的值,可以是单个值、列表或字典。
  • inplace:布尔值,是否在原DataFrame上进行替换,默认False。
  • limit:整数,限制替换的数量。
  • regex:布尔值,是否将to_replace作为正则表达式处理,默认False。
  • method:当to_replace是NA值时,指定填充方法,如’pad’、‘ffill’、‘bfill’。

三、实例

3.1 替换单个值
import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 替换值
df.replace(1, 10, inplace=True)
print(df)

输出:

    A  B
0  10  4
1   2  5
2   3  6
3.2 使用字典替换值
import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 使用字典替换值
df.replace({'A': 1, 'B': 4}, 100, inplace=True)
print(df)

输出:

     A    B
0  100  100
1    2    5
2    3    6
3.3 使用列表替换值
import pandas as pd

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 使用列表替换值
df.replace([1, 4], [100, 400], inplace=True)
print(df)

输出:

     A    B
0  100  400
1    2    5
2    3    6
3.4 使用正则表达式替换值
import pandas as pd

data = {'A': ['foo', 'bar', 'baz'], 'B': ['fuz', 'buz', 'faz']}
df = pd.DataFrame(data)

# 使用正则表达式替换值
df.replace(to_replace=r'^b', value='new', regex=True, inplace=True)
print(df)

输出:

     A    B
0  foo  fuz
1  new  newz
2  new  faz

四、注意事项

  1. 当使用inplace=True时,DataFrame会直接修改,无需重新赋值。
  2. to_replace为字典时,value的值必须与to_replace的键相对应。
  3. 使用正则表达式时,需将regex参数设置为True。

网站公告

今日签到

点亮在社区的每一天
去签到