Skip to main content
Scour
Browse
Getting Started
Login
Sign Up
You are offline. Trying to reconnect...
Close
You're currently offline. Some features may not work.
Close
Copied to clipboard
Close
Unable to share or copy to clipboard
Close
科学空间|Scientific Spaces
kexue.fm
Adam优化器的最优超参数是β1
=
β2
?
kexue.fm
·
1w
一行代码将arXiv论文翻译成中文版
kexue.fm
·
2w
DeltaNet的核心逆矩阵的元素总是在
[-1, 1]
内
kexue.fm
·
2w
为什么我们偏爱各向同性
?
基于最速下降的理解
kexue.fm
·
3w
让炼丹更科学一些
(六):
自上而下的精妙构造
kexue.fm
·
4w
让炼丹更科学一些
(五):
基于梯度精调学习率
kexue.fm
·
5w
让炼丹更科学一些(四):
新恒等式
,
新学习率
kexue.fm
·
7w
为什么DeltaNet要加L2
Normalize
?
kexue.fm
·
7w
让炼丹更科学一些
(三):
SGD的终点损失收敛
kexue.fm
·
8w
让炼丹更科学一些
(二):
将结论推广到无界域
kexue.fm
·
9w
滑动平均视角下的权重衰减和学习率
kexue.fm
·
10w
Keyboard Shortcuts
Navigation
Next / previous item
j
/
k
Open post
o
or
Enter
Preview post
v
Post Actions
Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Recommendations
Add interest / feed
Enter
Not interested
x
Go to
Home
g
h
Interests
g
i
Feeds
g
f
Likes
g
l
History
g
y
Changelog
g
c
Settings
g
s
Browse
g
b
Search
/
Pagination
Next page
n
Previous page
p
General
Show this help
?
Submit feedback
!
Close modal / unfocus
Esc
Press
?
anytime to show this help