DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев (opens in new tab)
Исследовательская команда во главе с Huawei провела полное дообучение (full-parameter post-training) модели DeepSeek V4-Pro на 1,6 трлн параметров, используя кластер минимум из 1000 ускорителей Ascend...
Read the original article