服务器之家 > 正文

pytorch如何冻结某层参数的实现

时间：2020-04-29 09:40 来源/作者：Pr4da

在迁移学习finetune时我们通常需要冻结前几层的参数不参与训练，在Pytorch中的实现如下：

1

2

3

4

5

6

7

8

9

									class Model(nn.Module):

									 def __init__(self):

									  super(Transfer_model, self).__init__()

									  self.linear1 = nn.Linear(20, 50)

									  self.linear2 = nn.Linear(50, 20)

									  self.linear3 = nn.Linear(20, 2)

									 def forward(self, x):

									 pass

假如我们想要冻结linear1层，需要做如下操作：

1

2

3

4

5

6

									model = Model()

									# 这里是一般情况，共享层往往不止一层，所以做一个for循环

									for para in model.linear1.parameters():

									 para.requires_grad = False

									# 假如真的只有一层也可以这样操作：

									# model.linear1.weight.requires_grad = False

最后我们需要将需要优化的参数传入优化器，不需要传入的参数过滤掉，所以要用到filter()函数。

1	`optimizer` `=` `optim.Adam(filter(lambda` `p: p.requires_grad, model.parameters()), lr=0.1)`

其它的博客中都没有讲解filter()函数的作用，在这里我简单讲一下有助于更好的理解。

filter(function, iterable)

function: 判断函数
iterable: 可迭代对象

filter() 函数用于过滤序列，过滤掉不符合条件的元素，返回一个迭代器对象，如果要转换为列表，可以使用 list() 来转换。

该接收两个参数，第一个为函数，第二个为序列，序列的每个元素作为参数传递给函数进行判，然后返回 True 或 False，最后将返回 True 的元素放到新列表中。

filter()函数将requires_grad = True的参数传入优化器进行反向传播，requires_grad = False的则被过滤掉。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持服务器之家。

原文链接：https://blog.csdn.net/qq_40210586/article/details/103878155

标签：

参数 Pytorch 冻结

相关文章

热门资讯

: 2022年最旺的微信头像大全微信头像2022年最新版图片 2022-01-10

: 蜘蛛侠3英雄无归3正片免费播放蜘蛛侠3在线观看免费高清完整 2021-08-24

: 背刺什么意思网络词语背刺是什么梗 2020-05-22

: yue是什么意思网络流行语yue了是什么梗 2020-10-11

: 暖暖日本高清免费中文暖暖在线观看免费完整版韩国 2021-05-08