구글, 벤치마크 테스트 연구 에이전트에 맞춰 과학 AI 도구 출시 (opens in new tab)
구글은 과학적 탐구를 위한 AI 실험 및 도구 모음인 'Gemini for Science'를 선보였으며, 구글 리서치는 자사의 'Empirical Research Assistance(ERA)' 도구가 전문가 수준의 과학적 코딩을 지원하고 현재 Google Labs의 신뢰할 수 있는 테스터 프로그램을 통해 제공되는 'Computational Discovery' 프로토타입 구축을 도왔다고 밝혔습니다. Engadget은 Gemini for Science 컬렉션에서 세 가지 새로운 기능을 사용할 수 있게 될 것이라고 보도했습니다. 최근 arXiv 논문들은 자율 연구 및 코딩 에이전트를 평가했으며, 여러 논문에서 신뢰성, 재현성 및 연구 품질의 한계를 보고했습니다. ResearchArena는 117개의 에이전트 생성 컴퓨터 과학 논문을 대상으로 Claude Code, Codex 및 Kimi Code를 테스트했습니다. 저자들은 원고 전용 검토(manuscript-only review) 시...
Read the original article