Почему маленькие модели побеждают большие – и что это значит для вашего стека (opens in new tab)
Есть такое устойчивое интеллектуальное заблуждение: если модель больше — значит, она лучше. Больше параметров, больше обучающих данных, больше денег в предобучении — и вот вам SOTA....
Read the original article