jiafu
  • Joined on Mar 07, 2023
Loading Heatmap…

jiafu commented on issue Datawhale/d2l#18

书本P59咨询一下

①ε表示噪声,书中说的不够明确 ②其实ε服从正态高斯分布的话,根据概率知识,y也服从正态分布,而3.1.12作为线性回归模型,服从正态分布,ε=y-wx+b,代入3.1.13后,就可以求出发生这个误差的概率(或者说回归模型的概率密度函数),最后目的是让误差最小。 可以看下以下两个讲解链接 http://www.cnblogs.com/softlin/articles/6219372.html 或者 http://blog.csdn.net/qq_34319644/article/details/107335942

1 year ago

jiafu commented on issue Datawhale/d2l#21

Task 03 关于detach()的问题

  detach是为了切断一些分支的反向传播。   detach返回一个新的tensor,和原始的tensor共同一个内存,仍指向原变量的存放位置,新的tensor不计算梯度。   现在看没有区别,但加了以后优势在于:①当我们只想要调整部分网络参数或②只训练部分分支网络,并不让其梯度对主网络的梯度造成影响时。。。使用这个新的tensor进行计算反向传播时,运行到这个调用了deach的tensor就会停止,不再继续向前进行传播。

1 year ago

jiafu created CPU/GPU type debugging task jiafu-d2l-20230319

1 year ago

jiafu created CPU/GPU type debugging task jiafu-d2l-20230319(deleted)

1 year ago

jiafu created CPU/GPU type debugging task jiafu-d2l-20230319(deleted)

1 year ago

jiafu created CPU/GPU type debugging task jiafu-d2l202303(deleted)

1 year ago

jiafu created repository jiafu/deeplearning

1 year ago