2025년 12월 18일(목)

글로벌 리더보드 1위부터 실서비스까지... 두나무의 AI 2025

디지털자산 거래소 업비트를 운영하는 두나무가 2025년 한 해 동안 인공지능(AI) 분야에서 괄목할 만한 성과를 거두었습니다. 글로벌 학술대회에서의 연구 성과 발표와 서비스 고도화를 동시에 이루며 기술 경쟁력 강화에 나섰습니다.


두나무 머신러닝(ML)팀은 올해 1월 아랍에미리트 아부다비에서 개최된 국제전산언어학술대회 '콜링 2025' 메인 콘퍼런스에 참가해 텍스트-SQL 변환 관련 연구 논문을 발표했습니다.


자연어 처리와 전산언어학 분야의 세계적 권위를 인정받는 콜링은 매우 엄격한 심사 기준으로 유명합니다.


[사진자료] 이동준 두나무 머신러닝팀장이 지난 21일(현지 시각) 아랍에미레이트(UAE) 아부다비 ADNEC에서 열린 ‘제31회 국제 전산언어 학술대회(COLING 2025)’ 메인 콘퍼런스에서 논문 발표를 하고 있다.jpg사진 제공 = 두나무


이번에 발표된 논문 'MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법'은 대규모 언어 모델(LLM) 기반 텍스트-SQL 변환 과정에서 나타나는 응답 비일관성 문제를 해결하는 새로운 접근법을 제시했습니다. 


다중 프롬프트를 통해 여러 SQL 후보를 생성한 후 최적의 결과를 선택하는 방식으로 정확도와 효율성을 동시에 개선했습니다. 이 모델은 텍스트-SQL 변환 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하며 기술적 우수성을 증명했습니다.


두나무 ML팀은 지난 7월 이탈리아 파도바에서 열린 정보검색 분야 최고 권위 국제 학회 'SIGIR 2025'에서도 연구 성과를 공개했습니다. 올해 제출된 논문 중 약 27%만이 채택되는 높은 경쟁률을 자랑하는 학회입니다.


SIGIR에서 발표한 'LLM 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론' 논문은 실제 사용자 데이터 없이도 LLM을 활용해 가상의 사용자를 생성하고 추천 모델을 학습시키는 혁신적인 방법론을 소개했습니다. 


두나무 ML팀이 개발한 'LAUS' 프레임워크는 대규모 사용자 데이터 수집 부담과 개인정보 보호 이슈를 동시에 해결한 것이 핵심입니다. 실험 결과 LAUS는 학습 데이터 없이 뉴스를 추천하는 제로샷 방식보다 뛰어난 성능을 보였으며, 응답 지연 시간도 크게 줄였습니다.


[사진자료] 두나무, 업비트 개발자센터 개편.jpg사진 제공 = 두나무


두나무는 학술적 성과를 넘어 실제 서비스 영역에서도 AI 기술 도입을 적극 추진했습니다. 업비트 개발자센터는 전면 개편을 통해 AI 기반 '업비트 어시스턴트'를 새롭게 출시했습니다.


이 서비스는 개발자센터 문서를 학습하여 API 예시 제공, 문서 요약, 가이드 탐색 등의 기능을 제공하며 개발자들의 편의성을 대폭 향상시켰습니다. 또한 지피티, 클로드 등 주요 AI 도구에서 최신 업비트 API 문서를 활용할 수 있는 llms.txt 포맷을 제공하고, 과거 시세 데이터 다운로드가 가능한 'Upbit Historical Market Data' 서비스를 추가해 데이터 기반 개발 환경을 강화했습니다.


두나무의 투자정보 플랫폼 증권플러스도 AI 기능을 대폭 개선했습니다. 최근 신설된 '뉴스룸' 탭은 두나무가 자체 개발한 머신러닝 알고리즘을 통해 뉴스의 중요도와 시장 영향력을 종합 분석하여 투자 판단에 필요한 정보를 우선순위별로 배치합니다. 


'속보' 섹션에서는 헤드라인과 3줄 요약으로 핵심 내용을 신속하게 전달하며, '주요 뉴스' 섹션에서는 하루 중 가장 영향력이 컸던 '24시간 핵심 뉴스 TOP5'를 선별하여 제공합니다. 각 뉴스에는 연관 종목명과 시세 변동률이 함께 표시되어 투자자들의 정보 활용도를 높였습니다.


이동준 두나무 ML팀장은 "올해 축적한 AI 연구 성과와 서비스 적용 경험을 바탕으로 내년에도 기술 경쟁력을 지속 강화해 사용자에게 더욱 신뢰할 수 있는 서비스를 제공하겠다"고 말했습니다.