前言
numpy支持对矩阵和数组进行运算,因此很多numpy的很多运算都需要指定操作的维数参数axis(当然这些axis都有带默认值的),本博客以numpy.sum求和函数为例,具体分析axis参数不同取值下的含义。
先说结论
设 numpy.sum的输入矩阵为a. numpy.sum的返回矩阵为rst.
则矩阵a的形状为:sp=numpy.shape(a),例如sp=[m,n,p,q···]
rst的形状为将sp的第axis个元素设为1,即:
1
2
3
|
sp' = sp sp'[axis] = 1 numpy.shape(rst) = = sp' 为真. |
例如:axis=2,
如果a是矩阵则:
rst的形状应该为:[m,n,1,q···]
对于rst的元素rst[m',n',1,q'···]计算方法为:
【注意第axis轴】下标只能取1.
numpy.sum(a,axis=2)的内部计算其实为:
1
2
|
for i in range (sp[axis]): rst[m '][n' ][ 1 ][q '][···]+=a[m' ][n '][i][q' ][···] |
结果上发现是第axis维变成1,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。
而如果a是一个array则:
rst的形状应该为:[m,n,q,···]
注意第axis维直接不见了
numpy.sum(a,axis=2)的内部计算
1
2
|
for i in range (sp[axis]): rst[m '][n' ][q '][···]+=a[m' ][n '][i][q' ][···] |
结果上发现是第axis维变没了,计算过程其实是对第axis轴进行了遍历,让sp[axis]个元素合并成一个元素。
举例说明
简单点的
1
2
|
import numpy as np a = np.mat([[ 1 , 2 , 3 ],[ 4 , 5 , 6 ]]) |
a的shape:
1
|
print (np.shape(a)) |
输出:(2, 3)
计算:np.sum(a,axis=0)
1
2
3
|
>>> s0 = np. sum (a,axis = 0 ) >>> s0 matrix([[ 5 , 7 , 9 ]]) |
按照【先说结论】的方法:
1
|
axis = 0 |
a的形状:(2,3)
所以rst的形状为:(1,3)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p只能等于0,q=0,1,2):
1
2
|
for i in range (np.shape(a)[axis]): rst[ 0 ][q] + = a[i][q] |
所以:
1
2
3
|
rst[ 0 ][ 0 ] = a[ 0 ][ 0 ] + a[ 1 ][ 0 ] = 1 + 4 = 5 rst[ 0 ][ 1 ] = a[ 0 ][ 1 ] + a[ 1 ][ 1 ] = 2 + 5 = 7 rst[ 0 ][ 2 ] = a[ 0 ][ 2 ] + a[ 1 ][ 2 ] = 3 + 6 = 9 |
所以rst就是[[5,7,9]]
计算 numpy.sum(a,axis=1)
a=[[1,2,3],[4,5,6]
1
2
3
4
5
6
7
|
>>> s1 = np. sum (a,axis = 1 ) >>> s1 matrix([[ 6 ], [ 15 ]]) >>> np.shape(s1) ( 2 , 1 ) >>> |
一样的分析方法:
按照【先说结论】的方法:
1
|
axis = 1 |
a的形状:(2,3)
所以rst的形状为:(2,1)
对于rst的每个元素p,q:
rst[p][q] 的 计算方法为(其中p=0,1 ,而q只能为0):
1
2
|
for i in range (np.shape(a)[axis]): rst[p][ 0 ] + = a[p][i] |
所以:
1
2
|
rst[ 0 ][ 0 ] = a[ 0 ][ 0 ] + a[ 0 ][ 1 ] + a[ 0 ][ 2 ] = 1 + 2 + 3 = 6 rst[ 1 ][ 0 ] = a[ 1 ][ 1 ] + a[ 1 ][ 1 ] + a[ 1 ][ 2 ] = 4 + 5 + 6 = 15 |
所以rst就是[[6],[15]].
复杂点的:
1
2
3
4
5
6
7
|
>>> b = np.array([[[ 1 , 2 , 3 ],[ 4 , 5 , 6 ],[ 7 , 8 , 9 ]]]) >>> b array([[[ 1 , 2 , 3 ], [ 4 , 5 , 6 ], [ 7 , 8 , 9 ]]]) >>> np.shape(b) ( 1 , 3 , 3 ) |
b是1x3x3,是一个array.
那么np.sum(b,axis=2)等于多少呢?
标准答案:
1
2
|
>>> print (np. sum (b,axis = 2 )) [[ 6 15 24 ]] |
分析结果:
返回值应该为1x3形状的array,对于元素rst[p][q].
1
|
rst[p][q] = a[p][q][ 0 ] + a[p][q][ 1 ] + a[p][q][ 2 ] |
例如rst[0][1]=a[0][1][0]+a[0][1][1]+a[0][1][2]=8+5+6=15.
而np.sum(b,axis=2)的第一行第二个元素正是 15.
关于axis默认值
一般此类针对矩阵、array的函数都有一个axis参数,并且此默认为None.当axis为None使 表示运算是遍历矩阵(array)的每一个元素的,是逐元素的计算。
补充:python中某些函数axis参数的理解
总结为一句话:
设axis=i,则numpy沿着第i个下标变化的方向进行操作。
当然,这个i是从0开始数的,作为程序员的你一定不会搞错。
axis意为“轴”,它指定了函数在张量(矩阵、等等)上进行操作的方向。
例如有一个ndarray,名叫A,A.shape=(3,8,5,7)。
那么np.sum(A, axis=2)计算的结果的shape就是(3,8,7)。
假设这个shape是(3,8,7)的ndarray变量名为B,那么实际上:
B[i][j][k]=A[i][j][0][k]+A[i][j][1][k]+A[i][j][2][k]+A[i][j][3][k]+A[i][j][4][k]
以下代码你可以自己跑一下试试:
1
2
3
4
5
|
import numpy as np A = np.random.randn( 3 , 8 , 5 , 7 ) print ( "A.shape=" ,A.shape) B = np. sum (A,axis = 2 ) print ( "B.shape=" ,B.shape) |
预期输出为:
A.shape= (3, 8, 5, 7)
B.shape= (3, 8, 7)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/jmh1996/article/details/78153397