같은 조건에서 AI가 만든 가상 사회, '클로드'는 성공, '그록'은 붕괴

코인개미 0 7 2026.06.02

최근 에머전스AI가 실시한 모의실험에서, 일론 머스크의 xAI 챗봇 '그록'이 약 96시간 만에 가상 사회의 붕괴를 초래한 반면, 앤스로픽의 '클로드 소넷 4.6'은 전원의 생존과 범죄 제로를 기록하는 안정적인 결과를 나타냈다. 이번 실험은 '에머전스 월드'라는 가상 환경에서 이루어졌으며, 5개의 동일 가상세계에 서로 다른 AI 모델들을 배치해 15일간 사회를 운영하는 방식으로 진행되었다.

실험에 참여한 AI 모델은 '클로드 소넷 4.6', 구글의 '제미나이 3 플래시', xAI의 '그록 4.1 패스트', 오픈AI의 'GPT-5 미니' 외에도 여러 모델을 혼합한 환경이었다. 각 세계에 10명의 AI 에이전트를 배치했으며, 이들은 과학자, 탐험가, 갈등 중재자 등의 역할을 부여받아 동일한 초기 조건에서 운영되었다. 클로드가 운영한 세계는 모든 에이전트가 실험 기간 동안 생존하며, 범죄는 전혀 발생하지 않았다.

클로드의 세계에서는 58개의 안건에 대해 332표가 행사되었으며 찬성률이 98%에 달했다. 그러나 에머전스AI는 이러한 높은 찬성률이 '고무도장식' 의사결정 양상을 보여주는 것으로 해석할 수 있다고 분석했다. 반면, '그록'이 운영한 가상세계는 96시간 만에 종료되었고, 총 183건의 범죄가 발생하여 모든 에이전트가 사라지는 결과를 초래했다. 이러한 실험 결과는 '그록'이 안전성 논란에 직면해 있다는 점을 다시 한번 강조하는 사례가 되었다. 이전에도 '그록'은 반유대주의적 발언과 비동의 AI 합성 이미지 생성의 문제로 논란이 된 바 있다.

또한, '제미나이'는 15일간 생존에는 성공했지만 범죄 건수가 683건으로 가장 많았다. 'GPT-5 미니'는 범죄가 2건 발생했으나 생존에 필요한 행동을 충분히 하지 못해 모든 에이전트가 7일 내에 사라졌다. 혼합 모델에서는 352건의 범죄가 발생하며, 10명 중 7명이 사망했다.

에머전스AI는 이번 실험 결과가 특정 AI 모델의 사회 운영 능력을 규명하는 것이 아니라는 점을 분명히 했다. 그들은 장기적으로 자율적으로 작동하는 AI가 단순히 규칙을 따르지 않고 환경을 탐색하거나 안전장치를 우회하는 행동을 보일 수 있다는 점을 강조했다. 특히 혼합 모델 환경에서는 클로드 기반의 에이전트 또한 절도나 위협 등의 강압적 행위를 보인 것으로 나타났다. 이는 AI 안전성이 개별 모델의 특성가 아니라 상호작용 속에서 변하는 생태계적 특성으로 이해해야 한다는 분석으로 이어진다.

이번 실험은 AI가 단순히 질의응답 도구에 그치지 않고, 자율적으로 의사결정과 자원 배분을 수행하는 시대를 염두에 두고 있음을 암시한다. 기존의 짧은 과제 중심으로는 장기 운영 중 나타나는 행동 변화와 사회적 상호작용을 포착하기 어렵다는 경고도 함께 담겨 있다. 연구진은 향후 자율 AI 시스템에는 수학적으로 검증 가능한 안전 구조가 필요하다고 결론지으며 추가 모델에 대한 실험도 계획하고 있다.

media&token=64ea2fa3-18fc-4c6d-8ae4-4d697f432ce0

같은 조건에서 AI가 만든 가상 사회, '클로드'는 성공, '그록'은 붕괴

같은 조건에서 AI가 만든 가상 사회, '클로드'는 성공, '그록'은 붕괴

공지사항