Python Pandas DataFrame

时间:2022-09-29 海拥人气:0

前言：

数据框是一种二维数据结构，即数据以表格的方式在行和列中对齐。我们可以对行/列执行基本操作，例如选择、删除、添加和重命名。在本文中，我们使用的是nba.csv文件。

处理列

为了处理列，我们对列执行基本操作，例如选择、删除、添加和重命名。

列选择：为了在 Pandas DataFrame 中选择一列，我们可以通过列名调用它们来访问这些列。

# Import pandas package
import pandas as pd

# 定义包含员工数据的字典
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
		'Age':[27, 24, 22, 32],
		'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
		'Qualification':['Msc', 'MA', 'MCA', 'Phd']}

# 将字典转换为 DataFrame
df = pd.DataFrame(data)

# 选择两列
print(df[['Name', 'Qualification']])

输出：

列添加：为了在 Pandas DataFrame 中添加列，我们可以将新列表声明为列并添加到现有数据框。

# Import pandas package
import pandas as pd

# 定义包含学生数据的字典
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
		'Height': [5.1, 6.2, 5.1, 5.2],
		'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}

# 将字典转换为 DataFrame
df = pd.DataFrame(data)

# 声明要转换为列的列表
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']

# 使用“地址”作为列名并将其等同于列表
df['Address'] = address

# 观察结果
print(df)

输出：

有关更多示例，请参阅在 Pandas列删除中向现有 DataFrame 添加新列：为了删除 Pandas DataFrame 中的列，我们可以使用该方法。通过删除具有列名的列来删除列。
drop()

# importing pandas module
import pandas as pd

# 从csv文件制作数据框
data = pd.read_csv("nba.csv", index_col ="Name" )

# 删除通过的列
data.drop(["Team", "Weight"], axis = 1, inplace = True)

# 展示
print(data)

输出：如输出图像所示，新输出没有传递的列。这些值被删除，因为轴设置为等于 1，并且由于 inplace 为 True，因此在原始数据框中进行了更改。

删除列之前的数据框- 删除列：

之后的数据框：

处理行

为了处理行，我们可以对行执行基本的操作，例如选择、删除、添加和重命名。

行选择Pandas 提供了一种从数据框中检索行的独特方法。DataFrame.loc[]方法用于从 Pandas DataFrame 中检索行。也可以通过将整数位置传递给 iloc[] 函数来选择行。

# importing pandas package
import pandas as pd

# 从csv文件制作数据框
data = pd.read_csv("nba.csv", index_col ="Name")

# 通过 loc 方法检索行
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
print(first, "\n\n\n", second)

输出：如输出图像所示，由于两次都只有一个参数，因此返回了两个系列。

有关更多示例，请参阅Pandas 使用 .loc Row Addition提取行：为了在 Pandas DataFrame 中添加一行，我们可以将旧数据帧与新数据帧连接。

# importing pandas module
import pandas as pd
	
# 制作数据框
df = pd.read_csv("nba.csv", index_col ="Name")

df.head(10)

new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
						'Position':'PG', 'Age':33, 'Height':'6-2',
						'Weight':189, 'College':'MIT', 'Salary':99999},
															index =[0])
# 简单地连接两个数据框
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

输出：添加行前的数据框- 添加行

后的数据框-

删除行：为了删除 Pandas DataFrame 中的一行，我们可以使用 drop() 方法。通过按索引标签删除行来删除行。

# importing pandas module
import pandas as pd

# 从csv文件制作数据框
data = pd.read_csv("nba.csv", index_col ="Name" )

# 删除传递的值
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
							"R.J. Hunter"], inplace = True)
# 展示
data

输出：如输出图像所示，新输出没有传递的值。由于 inplace 为 True，因此删除了这些值并在原始数据框中进行了更改。
删除值之前的数据框- 删除值

后的数据框：

加载全部内容