"[图片] 1.为什么不是W推向0来实现？ 2.对于tanh，为什么第一层先于后层饱和？ [图片]"

AI实时周报 AI产品导航 人工智能 AI架构问答优选

登录注册

2029_nickname
2029_default_intro
深度学习神经网络算法 Q&A • 0 回帖 • 2.5K 浏览 • 80 悬赏 • 4 年前

Xavier 论文疑惑（论文标题：Understanding the difficulty of training deep feedforward neural networks）

1.为什么不是W推向0来实现？

2.对于tanh，为什么第一层先于后层饱和？

0 回帖

随便看看

垃圾广告

低俗色情

违法违规

涉嫌侵权

人身攻击

其他

我们填补人工智能大数据领域技术的宇宙级空白，助力于国内AI人才的培养。在这里我们相互信任，以平等 • 自由 • 奔放 • 乐于分享的价值观进行分享交流。

Feel easy about trust.

2 0 0 0

回帖