guokr.com

最近,国产AI自己造了AI,全球首例!| 果壳 科技有意思 (opens in new tab)

金磊 发自 凹非寺量子位 | 公众号 QbitAI造AI这件事,现在的主角变成了AI。因为就在最近,一个国产AI先自己写出了一套大模型预训练框架,然后再用这套预训练框架,训练出了一个新的小尺寸模型!这就是面壁智能搞出来的big news。这套由AI写出来的预训练框架叫做ForgeTrain,它是全球首个完全由AI编写的生产级大模型预训练框架,性能甚至超越了英伟达的Megatron。并且ForgeTrain在华为昇腾上预训练MiniCPM5-1B,相比昇腾的框架也有10%的加速。围绕它,面壁智能还提出了一套新的软件编程范式,叫Forge Engineering。更直白一点说,就是当AI写代码的成本越来越低,未来软件不一定非要做成一套通用大框架,也可以针对不同模型、不同硬件、不同任务,现场锻造一套专用代码。而被ForgeTrain训练出来的新模型,就是MiniCPM5-1B。至于三者的关系,我们用一张图来解释:虽然过去行业里关于“AI制造AI”的声音不断,但总归来说,都还停留在特定的环节,比如写一段函数、改一个脚本、调一组参数等等。不过这一次,中国大模型公司第一次把“AI制造AI”从...

Read the original article
Sign in to keep reading the full article.

Keyboard Shortcuts

Navigation

Next / previous post
j/k
Open post
oorEnter
Preview post
v

Post Actions

Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s

Recommendations

Add interest / feed
Enter
Not interested
x

Go to

Home
gh
Interests
gi
Feeds
gf
Likes
gl
History
gy
Changelog
gc
Settings
gs
Discover
gb
Search
/

General

Show this help
?
Submit feedback
!
Close modal / unfocus
Esc

Press ? anytime to show this help