인공지능 모델들의 가상화폐 투자 실험에서 예상과 다른 결과가 나왔습니다. 중국산 AI만이 수익을 기록하고, 글로벌 빅테크 기업들의 유명 모델들은 모두 큰 손실을 입었습니다.
AI 트레이딩 업체 'Nof1'이 지난달 18일부터 이달 3일까지 진행한 실험에서는 주요 거대언어모델(LLM) 6종에 각각 1만달러(약 1445만원)의 투자금을 제공했습니다.
이들 AI 모델은 가상화폐 거래소 하이퍼리퀴드에서 인간의 개입 없이 완전 자동으로 투자를 진행했습니다.
'알파 아레나'라는 이름의 이 플랫폼은 실제 시장 환경에서 AI의 투자 역량을 검증하는 실험장 역할을 했습니다.
실험 대상 가상화폐는 비트코인, 이더리움, 솔라나, BNB, 도지, 리플 등 6개 주요 코인으로 제한되었습니다.
AI 모델들은 롱(매수 포지션), 숏(매도 포지션), 홀드(유지), 클로즈(포지션 정리) 등의 거래 행동을 통해 투자 전략을 구사했습니다.
3일 종료된 첫 번째 테스트 결과는 충격적이었습니다. 중국 알리바바의 '큐원3-맥스'가 22.32%의 수익률로 1위를 차지했고, 중국 딥시크의 '챗 V3.1'이 4.89% 수익률로 2위에 올랐습니다. 반면 미국의 대표적인 AI 모델들은 참담한 결과를 보였습니다.
클로드의 소넷 4.5는 -30.81%의 손실을 기록했고, xAI의 그록 4는 -45.3%의 마이너스 수익률을 나타냈습니다. 구글의 제미나이 2.5 프로는 -56.71%의 큰 손실을 입었으며, 오픈AI의 GPT-5는 -62.66%라는 최악의 수익률을 기록했습니다.
흥미롭게도 유일하게 수익을 낸 알리바바 큐원 모델은 다른 AI들과 달리 사람처럼 생각하는 '추론' 기능이 없었습니다.
가상화폐 매매에 대해 복잡한 시뮬레이션을 거치지 않고 단순하게 결론을 내렸다는 의미입니다.
큐원은 손절이나 익절 목표를 보수적으로 설정하여 큰 손실 없이 작은 수익을 꾸준히 축적하는 전략을 구사했습니다.
한 번에 과도한 베팅을 하지 않았고, 거래 빈도도 적절히 조절했습니다.
시장 변동성이 큰 구간에서도 안정적으로 수익을 보전할 수 있었습니다.
딥시크 모델 역시 비슷한 패턴을 보였습니다.
변동성이 증가하면 포지션 규모를 줄이고, 목표 수익에 근접하면 주저하지 않고 이익을 확정하는 전략을 취했습니다.
반대로 주요 글로벌 AI 모델들은 과도한 사고가 오히려 독이 되었습니다. GPT-5는 긴 시간 동안 고민하느라 이익 실현 타이밍을 놓쳤습니다. 소넷은 상승 포지션에만 치우쳐 가격 하락에 대한 대비책을 거의 마련하지 않았습니다. 제미나이는 과도한 거래 빈도로 인해 수수료 부담이 컸고, 그록은 한 포지션을 지나치게 오래 유지하는 문제를 보였습니다.
Nof1 측은 "단 한 번의 실험 결과만으로 최고의 거래 모델이 결정된 것은 아니다"라고 밝혔습니다. 이어 "시즌 2에서는 더욱 다양한 기능을 추가하고 프롬프트를 개선하여 통계적 엄격성을 강화할 예정"이라고 설명했습니다.