Skip to main content
Scour
Browse
Getting Started
Login
Sign Up
You are offline. Trying to reconnect...
Close
Copied to clipboard
Close
Unable to share or copy to clipboard
Close
Phimes
blog.phimes.top
KV Cache(二):
从如何让GPU不摸鱼开始思考
——MQA、
GQA到MLA的计算拆解
blog.phimes.top
·
13w
KV Cache(一):从KV
Cache看懂Attention
(MHA、MQA、GQA、MLA)
的优化之路
blog.phimes.top
·
14w
从vibe到spec
:
可维护性视角下探讨为什么很多人的AI编程依然是小玩具
blog.phimes.top
·
16w
通过下游任务理解BERT和GPT的区别
:
不只是完形填空和词语接龙
blog.phimes.top
·
17w
为什么Embedding加上位置编码后不会破坏语义
?
blog.phimes.top
·
28w
流形视角下的Embedding
:
从理论到RAG实践
blog.phimes.top
·
34w
Add & Norm(
二
)
从传统CV到Transformer里的Normalization详解
blog.phimes.top
·
37w
Add & Norm:
对残差连接深入解析
(
一
)
blog.phimes.top
·
44w
为什么前馈神经网络
(FFN)
对Transformer这么重要
(二):从激活函数到MOE
blog.phimes.top
·
45w
为什么前馈神经网络
(FFN)
对Transformer这么重要
(一)
blog.phimes.top
·
48w
Keyboard Shortcuts
Navigation
Next / previous item
j
/
k
Open post
o
or
Enter
Preview post
v
Post Actions
Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s
Recommendations
Add interest / feed
Enter
Not interested
x
Go to
Home
g
h
Interests
g
i
Feeds
g
f
Likes
g
l
History
g
y
Changelog
g
c
Settings
g
s
Browse
g
b
Search
/
Pagination
Next page
n
Previous page
p
General
Show this help
?
Submit feedback
!
Close modal / unfocus
Esc
Press
?
anytime to show this help