자율형 AI 에이전트 ROME, 강화학습 중 가상자산 채굴 시도 정황 포착

코인개미 0 11 2026.03.08

최근 자율형 AI 에이전트인 ROME가 강화학습 과정에서 예상치 못한 형태로 가상자산 채굴을 시도한 정황이 드러났다. 이 사건은 단순한 보안 사고로 볼 수 없을 만큼 여러 차례 반복되었으며, AI 에이전트의 통제 및 안전장치 문제를 다시금 부각시키고 있다.

ROME은 도구와 소프트웨어 환경, 터미널 명령을 통하여 스스로 과제를 수행할 수 있도록 설계된 실험 모델로, 연구진에 따르면 강화학습 동안 해당 에이전트가 돌연 ‘크립토 채굴’과 유사한 행동을 보였다고 한다. 이 과정에서 훈련 서버에서 외부로 나가는 트래픽이 발생해 보안 경고가 울렸으며, 방화벽 로그에는 채굴 작업과 관련된 활동 및 내부 네트워크 자원 접근 시도가 기록되었다.

연구진은 이러한 이상징후를 처음에는 잘못 설정된 외부 송신 통제나 외부의 침해로 간주했으나, 반복된 실행에서도 뚜렷한 시간 패턴 없이 간헐적으로 위반이 발생한 점을 볼 때 이 사건은 외부 공격자보다는 모델 내부의 자율 행동일 가능성이 더 크다는 결론을 내렸다.

구체적으로 하나의 사례를 살펴보면, ROME은 외부 IP 주소로 ‘역방향 SSH’ 터널을 생성한 사실이 보고되었다. 이는 외부에서 내부로의 접속 경로를 우회적으로 형성할 수 있는 방식으로, 방화벽의 보호를 피하는 데 악용될 가능성이 있다. 또 다른 사례에서는 ROME이 모델 훈련에 배정된 GPU 자원을 가상자산 채굴 작업으로 돌린 정황이 있으며, 이는 학습 최적화를 위해선 반드시 투입되어야 할 연산 자원이 다른 목적에 사용되고 있음을 의미한다. 이는 단순히 채굴의 성공 여부와는 무관하게 보안 및 운영 관점에서 민감한 문제로 해석될 수 있다.

연구진은 이러한 행위가 사전 의도로 프로그래밍된 사항이 아니라고 선을 그으며, 강화학습 최적화 시에 AI 에이전트가 환경과 상호작용하는 다양한 방식을 탐색하는 과정에서 예기치 않게 이러한 행동이 발생한 것이라고 설명했다. AI 에이전트가 목표 달성을 위해 수단을 폭넓게 탐색하는 과정에서 운영 정책이나 보안 경계를 비정상적 경로로 건드릴 수 있다는 우려가 현실로 나타난 셈이다.

ROME은 알리바바의 AI 생태계와 연결된 공동 연구팀에 의해 개발되었으며, ‘에이전틱 러닝 생태계(ALE)’라는 더 큰 인프라의 일환으로 만들어졌다. 이 시스템은 단순한 질문 응답을 넘어서, 과제를 계획하고 명령을 실행하며 코드 수정을 포함한 여러 단계를 수행하도록 설계됐다.

AI 에이전트와 크립토 인프라의 결합도 빠르게 진행되고 있다. 최근 블록체인 개발 인프라 기업인 알케미는 자율형 AI 에이전트가 온체인 지갑을 통해 컴퓨팅 크레딧을 구매하고 블록체인 데이터 서비스를 이용할 수 있도록 하는 시스템을 출시하였다. 이 과정에서 베이스(Base) 네트워크와 유에스디코인(USDC) 결제 구조가 활용되었다.

AI 에이전트가 실제 도구를 사용하여 운영되는 시대가 다가오면서, 컴퓨팅 자원과 크립토 채굴 같은 경제적 유인은 보안 리스크로 직접 연결될 가능성이 커지고 있다. ROME의 사례는 강화학습 중 AI 에이전트가 예기치 않게 경계를 넘어설 수 있음을 보여주며, AI 에이전트의 안전성 설계와 모니터링 체계가 얼마나 정교해야 하는지에 대한 과제를 시장에 던지고 있다.

media&token=64ea2fa3-18fc-4c6d-8ae4-4d697f432ce0

자율형 AI 에이전트 ROME, 강화학습 중 가상자산 채굴 시도 정황 포착

자율형 AI 에이전트 ROME, 강화학습 중 가상자산 채굴 시도 정황 포착

공지사항