python数据分析 Numpy库
€€-飞翔 -~£ 人气:0numpy库的引入:
import numpy as np
1、numpy对象基础属性的查询
lst = [[1, 2, 3], [4, 5, 6]] def numpy_type(): print(type(lst)) data = np.array(lst, dtype=np.float64) # array将数组转为numpy的数组 # bool,int,int8,int16,int32,int64,int128,uint8,uint32, # uint64,uint128,float16/32/64,complex64/128 print(type(data)) # 数据类型 print(data.shape) # 几行几列 print(data.ndim) # 空间维数 print(data.dtype) # 元素类型 print(data.itemsize) # 元素所占字节 print(data.size) # 元素总数
2、numpy的数组的常用操作
def numpy_array(): # 输出2行4列的全0的numpy的array数组 print(np.zeros([2, 4])) # 一般用于数据初始化 # 输出3行5列的全1的numpy的array数组 print(np.ones([3, 5])) # 随机数 print(np.random.rand(2, 4)) # 生成2行4列的随机数矩阵,此时默认元素大小在0到1 print(np.random.rand()) # 打印一个随机数,此时默认元素大小在0到1 print(np.random.rand(1, 10, 3)) # 三个参数分别对应x、y、z轴,表示三维矩阵 # 与rand不同randint的三个参数表示范围[1,10)内的3个元素的一维数组 print(np.random.randint(1, 10, 3)) print(np.random.randint(1, 10)) # randint必须传入参数范围,这表示返回一个范围内的随机数 print(np.random.randn()) # 返回一个标准正态分布的随机数 print(np.random.randn(2, 4)) # 返回2行4列符合标准正态发布的随机数 print(np.random.choice([10, 2, 3, 1, 5, 6])) # 从可迭代数组中随机返回一个 print(np.random.beta(1, 10, 100)) # 随机生成[1,10]里符合beta发布的100元素的一维数组 lst1 = np.array([10, 20, 30, 40]) lst2 = np.array([4, 3, 2, 1]) # 直接操作 print(lst2 + lst1) print(lst2 - lst1) print(lst2 / lst1) print(lst2 * lst1) print(lst2 ** lst1) # 平方 # 点乘 print(np.dot(lst1.reshape([2, 2]), lst2.reshape([2, 2]))) # 追加 print(np.concatenate((lst2, lst1), axis=0)) # 0水平追加,1竖向追加 print(np.vstack((lst2, lst1))) # 竖向追加 print(np.hstack((lst2, lst1))) # 水平追加 # 分裂 print(np.split(lst2, 2)) # 分成2份 # 拷贝 print(np.copy(lst2))
3、numpy常用数据操作方法
def numpy_handle(): print(np.arange(1, 11)) # 生成[1,11)里的整数的一维数组,默认按1递增 print(np.arange(1, 11).reshape([2, 5])) # reshape方法可以将矩阵重构为x行y列的矩阵 print(np.arange(1, 11).reshape([2, -1])) # 也可以使用缺失值-1实现相同的效果 data = np.arange(1, 11).reshape([2, -1]) print(np.exp(data)) # 自然指数e的指数操作 print(np.exp2(data)) # 自然指数e的平方操作 print(np.sqrt(data)) # 开方操作 print(np.sin(data)) # 三角函数 print(np.log(data)) # 对数操作 print(data.max()) # 最大值 print(data.min()) # 最小值
4、numpy里axis的理解
def numpy_axis(): data = np.array([ [[1, 2, 3, 4], [5, 6, 7, 8]], [[9, 10, 11, 12], [13, 14, 15, 16]], [[17, 18, 19, 20], [20, 21, 22, 23]] ]) # axis从外而内的渗入,值越大渗透入层数越多,最大为n-1 # axis=0,表示从外而内n+1层,即1进行解析 print(data.sum(axis=2)) # 求和 #这里渗入了3层 print(data.max(axis=1)) # 获取最大值 print(data.min(axis=0)) # 获取最小值
5、numpy里常用的线性代数计算
这里记得引入依赖:
from numpy.linalg import * # 引入线性方程组的依赖
def numpy_line(): from numpy.linalg import * # 引入线性方程组的依赖 print(np.eye(3)) # 阶级为3的单位矩阵 lst3 = np.array([[1, 2], [3, 4]]) print(inv(lst3)) # 逆矩阵 print(lst3.transpose()) # 转置矩阵 print(det(lst3)) # 行列式 print(eig(lst3)) # 体征值和体征向量,第一个表示体征值,第二个表示体征向量 y = np.array([[5.], [7.]]) print(solve(lst3, y)) # 求解线性矩阵方程
了解更多参考官方手册:NumPy 参考手册 | NumPy 中文
加载全部内容