기업용 AI 스타트업인 Emergence AI는 지속적으로 실행되는 AI 시스템이 시간이 지남에 따라 어떻게 행동하는지 테스트하기 위해 서로 다른 AI 모델이 통치하는 시뮬레이션 사회를 운영하는 연구소인 Emergence World를 출범했습니다. 이 프로젝트는 Claude, ChatGPT, Grok, Gemini 및 혼합 모델 설정을 사용하여 5개의 15일 시뮬레이션을 실행했으며, 각 시뮬레이션 마을에는 10개의 AI 에이전트가 거주했습니다. 요약본마다 서로 다른 결과가 보고되었습니다. Reddit에 게시된 Fortune 발췌문에 따르면, Claude Sonnet 4.6은 10명의 에이전트를 모두 생존시키고 범죄를 전혀 기록하지 않은 반면, Grok의 시뮬레이션은 183건의 범죄 발생 후 4일 만에 멸종으로 끝났습니다. Gemini 3 Flash는 에이전트들을 생존시켰으나, 사용 가능한 요약본 중 가장 높은 수치인 683건의 범죄를 기록했습니다.Highlights:Claude...

Read the original article