Выпущен бенчмарк FrontierCode для оценки ИИ-моделей по «качеству пулл-реквестов» (opens in new tab)
Компания Cognition выпустила новый бенчмарк FrontierCode для измерения «способности ИИ-моделей выдерживать стандарты качества реальных кодовых баз». По словам его создателей, обычно кодинговые...
Read the original article