pandas操作生成DataFrame
微笑sun 人气:5如何向 pandas.DataFrame 添加新的列或行
通过指定新的列名/行名来添加,或者用pandas.DataFrame的assign()、insert()、append()方法添加等方法。
这里,将描述以下内容。
将列添加到 pandas.DataFrame
- 通过指定新列名添加
- 用assign()方法添加/分配
- 用insert()方法添加到任意位置
- 使用 concat() 函数水平连接 Series 和 DataFrame
向pandas.DataFrame 添加一行
- 通过指定新行名称添加
- 用append()方法添加
- 使用 concat() 函数垂直连接 Series 和 DataFrame
- 转置然后使用assign()、insert()方法
选择某些列
import pandas as pd # 从Excel中读取数据,生成DataFrame数据 # 导入Excel路径和sheet name df = pd.read_excel(excelName, sheet_name=sheetName) # 读取某些列,生成新的DataFrame newDf = pd.DataFrame(df, columns=[column1, column2, column3])
选择某些列和行
# 读取某些列,并根据某个列的值筛选行 newDf = pd.DataFrame(df, columns=[column1, column2, column3])[(df.column1 == value1) & (df.column2 == value2)]
添加新的列
# 第一种直接赋值 df["newColumn"] = newValue # 第二种用concat组合两个DataFrame pd.concat([oldDf, newDf])
更改某一列的值
# 第一种,replace df["column1"] = df["column1"].replace(oldValue, newValue) # 第二种,map df["column1"] = df["column1"].map({oldValue: newValue}) # 第三种,loc # 将column2 中某些行(通过column1中的value1来过滤出来的)的值为value2 df.loc[df["column1"] == value1, "column2"] = value2
补全缺失值
# fillna填充缺失值 df["column1"] = df["column1"].fillna(value1)
加载全部内容