Numpy科学计算从放弃到入门

时间:2020-01-21 雪山飞猪人气:3

一、什么是Numpy
- ndarray对象
- 相关文档
二、如何创建数组
三、如何访问数组
- 下标索引
- 切片索引
- 布尔型索引
- 整数索引
- 方形索引
四、如何做算数运算
五、如何使用统计函数
六、数组转置和轴对换
七、唯一化以及集合逻辑
八、随机数生成
九、文件输入输出
- 以二进制格式保存到磁盘
- 存取文本文件

一、什么是Numpy

Numpy是Python科学计算的基础包，不仅是python中使用最多的第三方库，还是SciPy、Pandas等数据科学的基础库。所提供的结构比Python自身的更高级、更高效。可以说，Numpy所提供的数据结果是Python数据分析的基础。标准的Python用列表list保存数组的值，list的元素在系统中内存是分散存储的，而Numpy的数组结构是存储在一个均匀连续的内存块中，遍历所有的元素更高效，节省了计算资源。
主要提供了以下功能：

快速高效的多维数组对象的ndarray
用于对数组执行元素级计算以及直接对数组执行数学运算的函数
用于读写硬盘上基于数组的数据集的工具
线性代数运算、傅立叶变换，以及随机数组生成
用于将C、C++、Fortran代码集成到Python的工具
作为算法之间传递数据的容器，对于数值型数据，Numpy数组在存储和处理数据时要比内置的Python数据结构高效得多

ndarray对象

ndarray是多维数组的含义，维度称为rank（秩），每个线性的数组称为一个axes（轴）。数组是有属性的，可以通过函数shape获得数组的大小，通过dtype获得元素的属性

二、如何创建数组

array
将输入数据（列表、元组、数组或其他序列类型）转换为ndarray。要么推断出dtype，要么显示指定dtype
asarray
将输入转换为ndarray，如果输入本身就是一个ndarray就不再复制
array和asarray都可以将结构数据转化为ndarray，但是主要区别就是当数据源是ndarray时，array仍然会copy出一个副本，占用新的内存，但asarray不会
arange
类似内置的range，返回一个ndarray
linespace
和arrange的作用一样，只是包含指定的最终值
zeros、zeros_like
根据指定的形状和dtype创建一个全是9的数组。
zeros_like以另一个数组为参数，并根据其形状和dtype创建一个全0数组

ones、ones_like
根据指定的形状和dtype创建一个全是1的数组。
ones_like以另一个数组为参数，并根据其形状和dtype创建一个全1数组
empty、empty_like
类似ones和ones_like，只是产生的是全0数组
eye、identity
创建一个正方的N*N单位矩阵，对角线为1，其余为0

三、如何访问数组

下标索引

arr2d=np.array([[1,2,3],[4,5,6],[7,8,9]])
arr2d[0][2]和arr2d[0,2]是等价的

切片索引

可以一次传入多个切片，
arr2d[:2, 1:]

布尔型索引

将data中所有负值都设置为0

data[data < 0] = 0

选出所有名字为“cqh”的所有行

data[names == 'cqh']

整数索引

利用整数数组进行索引

arr = np.empty((8,4))
for i in range(8):
    arr[i] = i
# 传入指定顺序
arr[[4,3,0,6]]
### 负数索引 
arr[[-3,-5,-7]]

方形索引

使用np.ix_方法，可以将两个一维整数数组转换为一个用于选取方形区域的索引

arr = np.arange(32).reshape((8,4))

获取行[1,5,7,2]，列[0,3,1,2]，为

arr[np.ix_([1,5,7,2],[0,3,1,2])]

相当于执行了

arr[[1,5,7,2]][:,[0,3,1,2]]

错误方法：

arr[[1,5,7,2],[0,3,1,2]]

四、如何做算数运算

x1 = np.arange(1,11,2)
x2 = np.linspace(1,9,5)
np.add(x1, x2)
np.subtract(x1, x2)
np.multiply(x1, x2)
np.divide(x1, x2)
np.power(x1, x2)
np.remainder(x1, x2)