카카오가 정부의 AI 3대 강국 실현을 위한 핵심 인프라 구축 사업에서 당초 계획을 크게 앞서는 성과를 보이고 있습니다.
카카오는 지난 8월 정부 주도 'GPU 확보 사업'의 최종 사업자로 선정된 이후, 예상보다 빠른 속도로 GPU 인프라 구축을 진행하며 국내 AI 연구개발 생태계 지원에 적극 나서고 있습니다.
이번 국책사업은 정부가 AI 강국 도약을 위해 민간 부문에 핵심 인프라인 GPU를 지원하는 대규모 프로젝트입니다.
카카오는 총 2,424장의 GPU를 확보해 구축하고, 향후 5년간 위탁 운영을 통해 국내 AI 연구 및 개발 환경을 뒷받침할 예정입니다.
카카오는 경기도 안산시에 자리한 '카카오 데이터센터 안산'을 중심으로 대규모 GPU 인프라 구축 작업을 안정적으로 진행하고 있습니다. 자체 데이터센터의 인프라 역량과 GPU 클러스터 구축 및 운영 노하우를 활용해 당초 계획보다 구축 일정을 단축했으며, 현재 전체 할당량의 약 84%에 해당하는 255노드의 인프라 구축을 마쳤습니다. 이는 당초 제출했던 연내 구축 목표치인 64노드를 4배 상회하는 성과입니다.
이러한 조기 구축 성과의 배경에는 카카오 데이터센터 안산의 고도화된 인프라 역량이 있었습니다.
카카오는 GPU 확보부터 구축, 운영 준비까지 전 과정에서 체계적인 프로젝트 관리를 실시했습니다.
공급업체와의 긴밀한 협력을 바탕으로 핵심 장비를 조기 확보했고, 사전 기술 검증을 통해 실제 가동 단계에서 발생할 수 있는 위험 요소들을 미리 파악하고 최소화해 구축 일정을 앞당겼습니다.
데이터센터 안산은 고집적 서버 운영에 필수적인 안정적 전력 공급 시스템과 냉각 시스템을 선제적으로 구축했습니다. 특히 고성능 GPU 서버에서 발생하는 열을 효과적으로 관리하기 위해 '열복도 밀폐시스템'을 적용했습니다. 이 시스템은 뜨거운 공기를 격리해 냉각 장치로 직접 순환시키는 밀폐 시스템으로, 냉각 효율을 극대화하는 역할을 합니다.
카카오는 단순한 인프라 제공을 넘어 이용자들이 AI 모델 개발에 집중할 수 있는 소프트웨어 환경도 함께 지원합니다.
국가 AI 컴퓨팅 자원 지원 포털과 연동된 통합 플랫폼을 구축해 이용자들이 포털에서 카카오엔터프라이즈가 운영하는 카카오클라우드로 손쉽게 접근할 수 있도록 했으며, 카카오클라우드의 AI 플랫폼인 쿠브플로우를 제공합니다.
카카오클라우드 쿠브플로우는 클라우드 네이티브 환경에서 머신러닝 워크플로우를 보다 쉽고 빠르게 구축하고 실행할 수 있도록 지원하는 플랫폼입니다.
모델 개발부터 학습, 배포, 추론에 이르는 전체 과정을 쿠버네티스 환경에서 지원해 연구자들이 머신러닝 워크플로우를 손쉽게 자동화하고 클라우드 리소스를 효율적으로 관리할 수 있도록 돕습니다.
현재 카카오는 구축을 완료한 255노드에 대해 네트워크 및 성능 테스트를 진행하고 있습니다.
내년 1월 2일부터는 과학기술정보통신부와 정보통신산업진흥원이 베타서비스 공모를 통해 선정한 산·학·연 과제들에 최신 컴퓨팅 자원을 제공할 계획입니다.
카카오 AI시너지 김세웅 성과리더는 "대규모 GPU 인프라를 안정적으로 구축하고 운영하는 것은 AI 경쟁력의 핵심"이라며 "카카오의 데이터센터 및 클라우드 역량을 바탕으로 안정적이고 효율적인 AI 개발 환경을 제공해 국내 AI 생태계 발전에 기여해 나가겠다"고 밝혔습니다.