MGCD代码中,我显示了 self.R和self.W_c ,代码在训练的时候,它两个的值好像一直没有变化,这样最后输出的是不是初始值呢?我输出了self.R.weight.grad,结果是None,这两个参数是不是没有更新呢?
Activity
tzt-star commentedon Mar 21, 2025
self.R.weight.grad
并不为None
,self.R
和self.W_c
的梯度是存在的。requires_grad=True
来确保这些参数可以被优化?self.R
和self.W_c
?detach()
或requires_grad_(False)
,导致它们不参与梯度计算?