AI 연구진, 신뢰성 및 배포에 관한 연구 발표 (opens in new tab)

6월 1일 발표된 AI 연구 게시물들은 모델 신뢰성, 배포 효율성, 강화 학습 및 도메인별 평가를 다루었습니다. 많은 논문이 arXiv에 게재되었으며, 여러 편이 ICML 2026 또는 관련 워크숍에 채택된 것으로 확인되었습니다. Import AI는 2025년 미국의 명목 AI GDP를 약 2,500억 달러로 추산하고 품질 조정 실질 성장률을 연간 약 2,600%로 평가한 경제학 논문을 강조하며, 산출물의 품질이 올라감에 따라 가격이 하락하기 때문에 기존 GDP 통계가 추론 경제의 상당 부분을 놓칠 수 있다고 언급했습니다. 여러 연구에서 벤치마크가 모델을 정확하게 측정하는지 조사했습니다. NumLeak은 사전 학습 시 공개된 수치 벤치마크가 포함되면 모델이 샘플 외 능력을 입증하기보다 값을 단순히 회상하게 할 수 있다고 주장하며, Fama-French 시장 초과 수익 회상 프로브에서 0.97-0.99의 피어슨 상관관계를 보고했습니다. BlueFin은 3,225개의 루브릭 기준을...

Read the original article