pandas DataFrame索引行列的实现
人气:0- python版本: 3.6
- pandas版本: 0.23.4
行索引
索引行有三种方法,分别是 loc iloc ix
import pandas as pd import numpy as np index = ["a", "b", "c", "d"] data = np.random.randint(10, size=(4, 3)) df = pd.DataFrame(data, index=index) """ 0 1 2 a 9 7 1 b 0 0 7 c 2 6 5 d 8 2 5 """
loc
loc通过行索引名字来确定行的
单行索引, 返回Series对象
df.loc["a"] """ 0 9 1 7 2 1 Name: a, dtype: int64 """ df.loc["b"] """ 0 0 1 0 2 7 Name: b, dtype: int64 """
多行索引, 返回DataFrame对象
df.loc[["a", "c"]] """ 0 1 2 a 9 7 1 c 2 6 5 """
iloc
通过行索引序号来确定行的
单行索引, 返回Series对象
df.iloc[0] """ 0 9 1 7 2 1 Name: a, dtype: int64 """ df.iloc[1] """ 0 0 1 0 2 7 Name: b, dtype: int64 """
多行索引, 返回DataFrame对象
df.iloc[[0, 2]] """ 0 1 2 a 9 7 1 c 2 6 5 """
ix(不建议使用)
通过行索引名字或序号来确定行的, 如果行索引 index 的类型为整型时, 使用 ix 方法索引时为按行索引名字进行索引, 如行索引名不存在则会报错
index = [2, 3, 4, 5] df = pd.DataFrame(data, index=index) """ 0 1 2 2 9 7 1 3 0 0 7 4 2 6 5 5 8 2 5 """ df.ix[2] """ 0 9 1 7 2 1 Name: 2, dtype: int64 """ # 提示信息 """ .ix is deprecated. Please use .loc for label based indexing or .iloc for positional indexing """ # 如果 index 为整数, 则不能按行索引号进行索引 df.ix[0] """ ... KeyError: 0 """
列索引
索引行有两种方法,分别是 . []
import pandas as pd import numpy as np columns = ["i", "ii", "iii"] data = np.random.randint(10, size=(4, 3)) df = pd.DataFrame(data, columns=columns) """ i ii iii 0 4 5 9 1 0 3 4 2 7 9 1 3 8 2 3 """
通过 . 属性直接获取指定行, 返回Series对象
df.i """ 0 4 1 0 2 7 3 8 Name: i, dtype: int64 """
[]
单列索引, 返回DataFrame对象
df[["i"]] """ i 0 4 1 0 2 7 3 8 """
多列索引, 返回DataFrame对象
df[["i", "ii"]] """ i ii 0 4 5 1 0 3 2 7 9 3 8 2 """
同时索引行及列
通过指定索引名或切片方式进行索引
index = ["a", "f", "c", "h"] columns = ["i", "ii", "iii"] df = pd.DataFrame(data, index=index, columns=columns) """ i ii iii a 4 5 9 f 0 3 4 c 7 9 1 h 8 2 3 """
loc
通过指定行及列索引名进行索引, 返回DataFrame对象
df.loc[["a", "f"], ["ii", "iii"]] """ ii iii a 5 9 f 3 4 """
通过指定行及列索引名范围进行索引(包含边值), 返回DataFrame对象
df.loc["a":"c", "ii":"iii"] """ ii iii a 5 9 f 3 4 c 9 1 """
iloc
通过指定行及列索引号进行索引, 返回DataFrame对象
df.iloc[[0, 1], [1, 2]] """ ii iii a 5 9 f 3 4 """
通过指定行及列索引号范围进行切片索引(左闭右开), 返回DataFrame对象
df.iloc[:3, 1:3] """ ii iii a 5 9 f 3 4 c 9 1 """
ix(不建议使用)
通过指定行及列索引号范围或名字范围进行切片, 返回DataFrame对象
df.ix["a":"c", "i":"iii"] df.ix["a":"c", 1:3] df.ix[:3, 1:3]
tips: 只有使用 iloc 或 ix 按索引号进行切片索引时才为左闭右开, 其余全闭
您可能感兴趣的文章:
加载全部内容