实现神经网络的权重和偏置更新,很重要的一部就是使用BackPropagation(反向传播)算法。具体来说,反向传播算法就是用误差的反向传播来计算w(权重)和b(偏置)相对于目标函数的导数,这样就可以在原来的w,b的基础上减去偏导数来更新。其中我上次写的python实现梯度下降中有一个函数backprop(x,y)就是用来实现反向传播的算法。(注:代码并非自己总结,github上有这个代码的实现https://github.com/LCAIZJ/neural-networks-and-deep-learning)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
def backprop( self ,x,y): nabla_b = [np.zeros(b.shape) for b in self .biases] nabla_w = [np.zeros(w.shape) for w in self .weights] # 通过输入x,前向计算输出层的值 activation = x activations = [x] # 存储的是所以的输出层 zs = [] for b,w in zip ( self .biases, self .weights): z = np.dot(w,activation) + b zs.append(z) activation = sigmoid(z) activations.append(activation) # 计算输出层的error delta = self .cost_derivative(activations[ - 1 ],y) * sigmoid_prime(zs[: - 1 ]) nabla_b[ - 1 ] = delta nabla_w[ - 1 ] = np.dot(delta,activations[ - 2 ].transpose()) #反向更新error for l in xrange ( 2 , self .num_layers): z = zs[ - l] sp = sigmoid_prime(z) delta = np.dot( self .weight[ - l + 1 ].transpose(),delta) * sp nabla_b[ - l] = delta nabla_w[ - l] = np.dot(delta,activations[ - l - 1 ].transpose()) return (nabla_b,nabla_w) |
其中,传入的x和y是一个单独的实例。
1
2
3
4
5
6
|
def cost_derivative( self ,output_activation,y): return (output_activation - y) def sigmoid(z): return 1.0 / ( 1.0 + np.exp(z)) def sigmoid_prime(z): return sigmoid(z) * ( 1 - sigmoid(z)) |
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:http://blog.csdn.net/leichaoaizhaojie/article/details/57080946