AI 연구진, 안전성 및 효율성 벤치마크 논문 발표 (opens in new tab)

6월 9일 arXiv에 발표된 새로운 논문들은 저렴한 추론, 강화 학습 사후 훈련, 자율 에이전트, 안전성 감사 및 도메인별 배포를 포함하여 인공지능 시스템의 실질적인 한계에 초점을 맞췄습니다. 여러 논문이 언어 모델의 서비스 비용을 목표로 했으며, 여기에는 36.3%에서 98.3%의 처리량 향상을 보고한 확산 언어 모델용 양방향 접두사 캐싱, 최대 2.65배의 첫 토큰 생성 시간(TTFT) 가속을 보고한 분산형 LLM 서빙을 위한 시맨틱 캐시 증류, 그리고 0.5 예산에서 50%에서 62%의 TTFT 감소를 보고한 혼합 정밀도 KV 캐시 전송이 포함되었습니다. 안전성 및 신뢰성 관련 논문들은 모델 제어, 에이전트 인프라 및 평가에서의 위험을 조사했습니다. 한 연구에 따르면 적대적 텍스트 섭동으로 인해 활성화 스티어링(activation-steering)의 견고성이 최대 64%까지 떨어졌으며, 또 다른 연구는 활성화 스티어링이 Qwen-3.5 모델을 포함한 테스트된 모델군에서 ...

Read the original article