知识目录
前言
每日金句分享:选择你所喜欢的,爱你所选择的。』—— 托尔斯泰「托尔斯泰。
一、NumPy介绍
NumPy(
Numerical Python
) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
NumPy主要用于数组计算,包含 |
---|
一个强大的N维数组对象 ndarray |
广播功能函数 |
整合 C/C++/Fortran 代码的工具 |
线性代数、傅里叶变换、随机数生成等功能 |
1.1 导入NumPy库
导入 NumPy 库是我们的第一步准备工作。在此,还一并导入了以后会用到的 Pandas 库、 MatplotLib 库的 pyplot 模块。
# 导入数据分析 ‘三剑客’ import numpy as np import pandas as pd from matplotlib import pyplot as plt
1.2 查看NumPy版本
# 注意左右都是双下划线 ~ ~ np.__version__
1.3 读取图片返回NumPy数组
通过 pyplot 读取到的图片,返回的就是一个 NumPy 数组。
这是我事先准备好的一张图片 —— tangsan.jpg:
接下来通过 plt 对象读取:
n = plt.imread('pic\\tangsan.jpg') n
输出过多,这里只展示首尾:
查看数组形状:
n.shape
再次显示图片:
plt.imshow(n)
二、创建NumPy数组的十二种方式
2.1 array 和 full
array 函数用法:numpy.array(object, dtype=None),object 可以为单个值、组、列表、多维可迭代对象等可迭代对象,作用是创建数组。
list_one = [1,2,3,4] # 列表创建 n1 = np.array(list_one) tuple_one = (1,3,2) # 组创建 n2 = np.array(tuple_one,dtype=np.int16) display(n1,n2)
下面是运行结果:
full 函数用法:numpy.full(shape, fill_value, dtype=None),shape 是数组形状(可以理解为几维几列,一般以组形式给出),fill_value 是填充的值,dtype 是类型,作用是创建一个值全为同一个的数组。
# 创建一个二维三列的数组 n2 = np.full(shape=(2,3),fill_value=1,dtype=np.int16) n2
2.2 zeros 和 ones
zeros 函数用法:zeros(shape, dtype=float, order=‘C’),返回一个给定形状和类型的用0填充的数组。
n3 = np.zeros((3,3)) n3
ones 函数用法:np.ones(shape, dtype=None, order=‘C’),返回一个指定形状和类型的用1填充的数组。
n4 = np.ones((3,2),dtype=np.float) n4
2.3 随机数数组
randint 函数用法:randint(low, high=None, size=None, dtype=‘l’),low 为随机数最小值,high 为最大值(取不到),size 在这里等价于 shape ,返回一个指定维度且素位于 low~high 之间的随机数组。
n5 = np.random.randint(1,10,(3,4)) n5
random 函数用法:random(size),size 等价于 shape ,为行列数,返回一个0~1之间指定形状的数组。
n6 = np.random.random((4,2)) n6
rand 函数用法:rand(d0, d1, …, dn),d0,d1,dn 分别表示1~n个维度的维数,返回一个0-1之间指定维度的数组,区别于 random 的是,这个函数传参不能传入带 ()的组。
n7 = np.random.rand(3,3) n7
2.4 服从正态分布的数组
randn() 函数用法:randn(d0, d1, …, dn),创建一个服从标准正态分布(X ~ N(0,1))的多维数组。也就是说,产生的数据大部分生成在0左右。
n8 = np.random.randn(2,3) n8
normal()函数用法:normal(loc=0.0, scale=1.0, size=None),loc 表示均值,scale 表示标准差,size等价于 shape ,创建一个服从正态分布的多维数组。
n9 = np.random.normal(1,2,(2,3)) n9
2.5 arrange 和 eye、linspace
eye()函数用法:np.eye(N, M=None, k=0, dtype=<class ‘float’>, order=‘C’),N 是行数,M 是列数,K 是偏移量,创建一个单位矩阵数组。
n10 = np.eye(5,5) n10
linspace()函数用法:np.linspace(start,stop,num),创建一个包含 num 个数的等差数列,公差 d 等于多少由系统计算。
n11 = np.linspace(1,20,3) n11
arrange()函数用法:arange([start,] stop[, step,], dtype=None),start 为起始数,stop 为结束数,创建一个连续的一维数组。
n12 = np.arange(1,10,dtype=np.int16) n12
三、ndarray属性
维度:ndim ,直接返回维度数
形状:shape,数字有几个就表示几维数组
总长度:size,返回总数据量
素类型:dtype
n1 = np.random.randint(1,10,(3,5)) display(n1) print("维度:%d,形状:%s,总长度:%s,素类型:%s"%(n1.ndim,n1.shape,n1.size,n1.dtype))
四、ndarray基本操作
4.1 索引
在 ndarray 数组中,索引的使用有两种等价方式,即 n [M,N] = n [M][N],M表示第一个维度,N表示第二个维度,若不止二维,以此类推,n[M,N,P,……]。
n1 = np.random.randint(1,10,(3,5)) print(n1) print("n1[2,3]=%s,n1[2][3]=%s"%(n1[2,3],n1[2][3]))
4.2 切片
切片包括行、列切片,可以实现取连续或不连续的行或列,也可以复制、翻转数组,如果是:, 的写法,表示第一个维度全取,并且,切片操作都是左闭右开。
一维数组
- <1> 一个参数:a[i],返回一个数
- <2> 两个参数:a[start:stop],对数组进行切片
- <3>三个参数:a[start,stop,step],对数组进行切片,step 为步长,当 step = -1 时表示翻转。
二维数组
- <1> 取素:a[i,j],返回第 i 行的第 j 个数
- <2> 切片:a[xi:xj,yi:yj],返回第 xi ~ xj 行的第 yi ~ yj 列,两个维度都是左闭右开。
- <3> 切片特殊情况:
左边从0开始可以省略,右边到结尾可以省略
,即 X[:e0,s1:e1] ,表示第1维从第1行开始到第 e0 行;X[s0:,s1:e1],表示从第 s0 行到最后一行。
常用的切片操作如下所示(以二维数组为例,n1 数组就是4.1索引中创建的),具体运行结果,这里不再展示。
print(n1[1:]) # 行切片,取第二行到最后一行 print(n1[:,2:]) # 列切片,取第三列到最后一列 print(n1[:]) # 复制数组 print(n1[[0,2]]) # 取不连续的行,用两个括号 print(n1[:,[0,2]])# 取不连续的列 print(n1[::-1]) # 行翻转 print(n1[:,::-1]) # 列翻转 print(n1[::-1,::-1]) # 行列都翻转
如果对某些切片操作有疑问,欢迎大家联系我,文末附联系方式,我看到后一定会第一时间为大家解答的。
五、实例 - 图片翻转
我们依旧采用 1.3 中的 tangsan.jpg 图片,通过对 ndarray 数据切片实现图片翻转效果,这里只展示上下翻转的效果,大家也可以换图片尝试。
# 读取图片 nd = plt.imread('pic/tangsan.jpg') # 显示原图 plt.imshow(nd)
# 上下翻转,通过改变 nd 数组,将纵轴翻转,也就是横轴逆序实现 plt.imshow(nd[::-1])
plt.imshow(nd[:,::-1]) # 左右翻转
六、变形
通过 reshape 函数,我们可以改变数组的形状,或者说维度,注意改变后需要重新赋值给数组。
首先创建好如下的数组:
n1 = np.array([ [3,5], [4,2], [2,3] ]) n1
然后改变形状:
n1.reshape((6,1))
让行或列自适应,通过维数写 - 1 实现:
n1.reshape((2,-1)) # 行数为2,列数自适应
n1.reshape(-1,2) # 列数为2,行数自适应
七、合并与拆分
7.1 合并
concatenate 函数用法:concatenate((a1, a2, …), axis=0, out=None),a1,a2 表示数组,axis 表示轴,值为0表示横向合并,值为1表示纵向合并。
n1 = n1.reshape((2,3)) n2 = np.random.randint(0,10,(2,3)) display(n1,n2) n3 = np.concatenate((n1,n2),axis=0) # 行合并 n4 = np.concatenate((n1,n2),axis=1) # 列合并 display(n3,n4)
此外,还可以使用 hstack 函数和 vstack 函数单独实现水平合并和垂直合并。相比,concatenate 函数会更方便些。
n2 = np.random.randint(0,10,(2,3)) n1 = np.random.randint(0,10,(2,3)) display(n1,n2) n3 = np.hstack((n1,n2)) # 水平合并 n4 = np.vstack((n1,n2)) # 垂直合并 display(n3,n4)
7.2 拆分
split 函数用法:np.split(ary, indices_or_sections, axis=0),ary:要切分的数组,indices_or_sections:填入一个整数或者一个可迭代对象,如果是整数,就切分为整数个子数组;如果是可迭代对象,就在该索引位置切分。
将数组进行拆分为多个数组,通过 axis (轴),可以控制水平或垂直拆分,具体请看下面的示例。
n3 = n3.reshape((6,2)) display(n3) # 1.查看 n3 数组 n5 = np.split(n3,2,axis=0) # 横向切分,均分为2部分 n6 = np.split(n3,1,axis=1) # 纵向切分,均分为1部分 print(n5) print(n6) n7 = np.split(n3,[1,3],axis=0) # 在索引为 0 和 3 处切分,切分为3部分 print(n7)
运行结果:
和合并一样,也有单独进行水平拆分和垂直拆分的方法,分别是:hsplit 和 vsplit ,函数用法参数都是 np.hsplit(ary, indices_or_sections) ,具体用法这里不再展示。
八、数组拷贝
使用 copy 函数创建一个数组的副本。
n4 = np.copy(n3) # 数组拷贝
结语
本期跟大家分享的 “芝士” 就到此结束了,关于 NumPy 的基本操作,你学会了吗?
如果文中有些地方不清楚的话,欢迎联系我,我会给大家提供思路及解答。
相关导读
文章直达 | 链接 |
---|---|
上期回顾 | 【数据分析 - 基础入门之NumPy③】- 日常难疑解决 |
下期预告 | 【数据分析 - 基础入门之NumPy⑤】- NumPy基本操作 - 二 |
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/97734.html