이번 주 AI 연구진은 배포 전 AI 에이전트의 신뢰성을 높이는 데 초점을 맞춘 다수의 논문과 기술 포스트를 공개했습니다. 주요 주제로는 메모리 검색, 도구 사용, 환각(hallucination) 탐지, 안전성 테스트 및 거버넌스가 다뤄졌습니다. 여러 논문은 벤치마크 결과와 실제 운영 환경에서의 보증 사이의 격차를 지적했습니다. 한 논문은 규제 산업 내 기업용 에이전트를 위한 온톨로지 기반 인증 프레임워크를 제안했으며, 또 다른 논문은 에이전트가 실행 후 누구에 의해 어떤 권한을 부여받았고 어떤 근거로 행동했는지 추적할 수 있는 증명 휴대형 행동 기록(proof-carrying action records)을 소개했습니다. 메모리와 평가 품질도 큰 주목을 받았습니다. 메모리 벤치마크 논문에 따르면, 테스트된 시스템들은 높은 재현율(recall)을 보였으나 자체 추출 정보를 참조하는 경우 평균 검색 정밀도(precision)는 0.05에서 0.08에 불과했습니다. 별도의 긴 문서 ...

Read the original article