从大神的代码中学习到了不少精髓在此进行总结
一个计算梯度的利器,是使用eager模式进行梯度计算的
这里使用watch将要计算梯度的变量加入了进来,实际上GradientTape默认监控trainable属性为True嘚变量
另外,默认情况下GradientTape的资源在调用gradient函数后就被释放再次调用就无法计算了。所以如果需要多次计算梯度需要开启persistent=True属性,例如:
設计一个模型实现线性回归
这里相当于记录了模型中的w和b然后在外部利用tap求偏导时,计算出dy/dw和dy/db每次将模型的参数利用梯度逼近,将模型的w和b趋近到设置的真实w和b中
关注数:0 文章数:13 访问量:7631
这个莋者很懒什么都没留下…