Numpy 数组索引的实现
岳来 人气:0数组索引是指使用方括号([])来索引数组值,numpy提供了比常规的python序列更多的索引工具。除了按整数和切片索引之外,数组可以由整数数组索引、布尔索引及花式索引。下面逐一学习。
一、整数索引
这种机制有助于基于 N 维索引来获取数组中任意元素。 每个整数数组表示该维度的下标值。 当索引的元素个数就是目标ndarray的维度时,会变得相当直接。
import numpy as np >>> s = np.arange(27).reshape(3,3,3) >>> s array([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]]]) >>> s[1] array([[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]) >>> s[1][1] array([12, 13, 14]) >>> s[1][1][1] 13
二、切片索引
原理:切片操作是指抽取数组的一部分元素生成新数组。对 python 列表进行切片操作得到的数组是原数组的副本,而对 Numpy 数据进行切片操作得到的数组则是指向相同缓冲区的视图。如果想抽取(或查看)数组的一部分,必须使用切片语法,也就是,把几个用冒号( start:stop:step )隔开的数字置于方括号内。为了更好地理解切片语法,还应该了解不明确指明起始和结束位置的情况。如省去第一个数字,numpy 会认为第一个数字是0;如省去第二个 数字,numpy 则会认为第二个数字是数组的大索引值;如省去后一个数字,它将会被理解为1,也就是抽取所有元素而不再考虑间隔。
2.1、一维数组切片
同python 中list 切片
>>> s1 = np.array([3, 8, 6, 9, 0]) >>> s1 array([3, 8, 6, 9, 0]) >>> s1[3] 9 >>> s1[1:3] array([8, 6]) >>> s1[-1] 0 >>> s1[2:] array([6, 9, 0]) >>> s1[:4] array([3, 8, 6, 9]) >>> s1[:] array([3, 8, 6, 9, 0])
2.2、多维数组切片
>>> s2 = np.arange(12).reshape(3,4) >>> s2 array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]]) >>> s2[1] array([4, 5, 6, 7]) >>> s2[1][:1] array([4]) >>> s2[1][:3] array([4, 5, 6])
三、整数数组索引
数组作为索引的一大优势,便是可以将索引得到的结果组织成自己想要的形状。
输出结果的shape与索引数组的shape相同,而输出中各个元素的取值,便是由各个索引数组对应位置的值作为index索引得到。
3.1、 一维数组的整数数组索引
>>> x = np.arange(10,1,-1) >>> x array([10, 9, 8, 7, 6, 5, 4, 3, 2]) >>> x[np.array([3, 3, 1, 8])] array([7, 7, 9, 2]) >>> x[np.array([[0,1][2,3]])] array([[10, 9], [ 8, 7]])
3.2、多维数组的整数数组索引
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2])] # 获取数组的第0行和第2行 array([[ 0, 1, 2, 3, 4], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2]),np.array([1,3])] # 获取数组第0行的第二个元素和第2行的第四个元素 array([ 1, 13]) >>> a[np.array([1,2])] array([[ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) # 获取数组a[np.array([[0,2])] 的第一行的第二个元素和第二行的第四个元素... >>> a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])] array([[ 1, 13], [ 5, 12]])
每一个索引数组单独控制一个维度。例如对于 a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],此时np.array([[0,2],[1,2]])控制输出的对应位置的行索引,np.array([[1,3],[0,2]])]控制输出的对应位置的列索引。行列索引组织在一起,便可以得到输出的每个位置的索引。
具体地,对于a[np.array([[0,2],[1,2]]),np.array([[1,3],[0,2]])],
由于np.array([[0,2],[1,2]])的shape为(2, 2),因此输出是一个(2,2)的矩阵。
在左上位置,行索引为0,列索引为1,值为1;
在右上位置,行索引为2,列索引为3,值为13;
在左下位置,行索引为0,列索引为1,值为5;
在右下位置,行索引为2,列索引为2, 值为12。
因此输出的矩阵即为,array([[1, 13],[5, 12]])。
充分利用"广播"机制,以及对于维度数量的省略,使得以数组作为索引的方式有更加灵活的应用,例如:
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([0,2]),3] array([ 3, 13]) >>> a[np.array([0,2])] array([[ 0, 1, 2, 3, 4], [10, 11, 12, 13, 14]])
在上例中,a[np.array([0,2]),3] 便可以广播为 a[np.array([0,2]),np.array([3,3])],从而化为我们熟悉的形式。而 a[np.array([0,2])] 通过省略一个维度,达到索引该维度全体数据的效果。
四、布尔索引
bool数组可以通过直接指出保留的值(True)与舍弃的值(False),来构建输出的数组。
bool数组的shape需要与被索引的数组(的前若干个维度)shape严格对齐。
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> b = a > 10 >>> b array([[False, False, False, False, False], [False, False, False, False, False], [False, True, True, True, True]]) >>> a[b] array([11, 12, 13, 14])
使用bool 值获取数组元素
>>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([True])] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 1 >>> a[np.array([True, False])] Traceback (most recent call last): File "<stdin>", line 1, in <module> IndexError: boolean index did not match indexed array along dimension 0; dimension is 3 but corresponding boolean dimension is 2 >>> a[np.array([True, False,False])] array([[0, 1, 2, 3, 4]]) >>> a[np.array([False, False,False])] array([], shape=(0, 5), dtype=int64) >>> a[np.array([False, False,True])] array([[10, 11, 12, 13, 14]]) >>> a[np.array([True, True,True])] array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> a[np.array([False, False,True]),np.array([True,False,True,False,True])] array([10, 12, 14])
五、花式索引
花式索引指的是利用整数数组进行索引。
花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。
对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素,如果目标是二维数组,那么就是对应下标的行。
花式索引跟切片不一样,它总是将数据复制到新数组中。
>>> a = np.arange(12)**2 >>> a array([ 0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121]) >>> i = np.array( [ 1,1,3,8,5 ] ) >>> i array([1, 1, 3, 8, 5]) >>> a[i] array([ 1, 1, 9, 64, 25]) >>> j = np.array( [ [ 3, 4], [ 9, 7 ] ] ) >>> j array([[3, 4], [9, 7]]) >>> a[j] array([[ 9, 16], [81, 49]])
当被索引的数组是多维数组时,将按照它的第一轴进行索引的
>>> p = np.arange(27).reshape(3,3,3) >>> p array([[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]]]) >>> l = np.array([[0, 2, 1],[1,2,1]]) >>> p[l] array([[[[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]], [[[ 9, 10, 11], [12, 13, 14], [15, 16, 17]], [[18, 19, 20], [21, 22, 23], [24, 25, 26]], [[ 9, 10, 11], [12, 13, 14], [15, 16, 17]]]]) >>> c = np.array([0,0,0]) >>> p[c] array([[[0, 1, 2], [3, 4, 5], [6, 7, 8]], [[0, 1, 2], [3, 4, 5], [6, 7, 8]], [[0, 1, 2], [3, 4, 5], [6, 7, 8]]])
参考文档
1、https://blog.csdn.net/qq_45759562/article/details/109249685
2、https://zhuanlan.zhihu.com/p/427216184
3、http://t.zoukankan.com/lavender1221-p-12651442.html
4、https://www.runoob.com/numpy/numpy-advanced-indexing.html
加载全部内容