kite.kagi.com

AI 개발자들, 대규모 모델의 메모리 비용 절감 목표 (opens in new tab)

5월 25-26일에 발표된 세 가지 AI 보고서는 대규모 모델의 메모리 및 컴퓨팅 비용 절감에 중점을 두었습니다. Tom's Hardware는 한 애호가가 768GB의 Intel Optane DIMM 메모리와 단일 GPU를 사용하여 로컬 1조 매개변수 Kimi K2.5 설치를 실행하여 초당 약 4토큰에 도달했다고 보고했습니다. arXiv 논문은 BigMac을 소개했는데, 이는 다중 모드 대규모 언어 모델 훈련 파이프라인으로, 저자들은 LLM 활성화-메모리 복잡성을 변경하지 않으면서 인코더 및 생성기 활성화-메모리 복잡성을 O(1)로 줄인다고 말했습니다. IThome의 자매 출판물인 iFanr은 ModelBest, 칭화대학교 및 OpenBMB 커뮤니티가 Huawei Ascend 하드웨어에서 엔드 투 엔드로 훈련된 3진 대규모 모델 시리즈인 BitCPM-CANN을 출시했다고 보고했습니다. 이 보고서는 이 접근 방식이 모델 성능 손실 없이 메모리 사용량을 6배 줄일 수 있으며, 모델...

Read the original article
Sign in to keep reading the full article.

Keyboard Shortcuts

Navigation

Next / previous post
j/k
Open post
oorEnter
Preview post
v

Post Actions

Love post
a
Like post
l
Dislike post
d
Undo reaction
u
Save / unsave
s

Recommendations

Add interest / feed
Enter
Not interested
x

Go to

Home
gh
Interests
gi
Feeds
gf
Likes
gl
History
gy
Changelog
gc
Settings
gs
Discover
gb
Search
/

General

Show this help
?
Submit feedback
!
Close modal / unfocus
Esc

Press ? anytime to show this help