미국 챗GPT vs 중국 딥시크
JTBC
중국의 딥시크가 비용은 훨씬 적게 들이고도 미국의 챗GPT와 유사한 성능을 보인다는 평가기 이곳저곳에서 나오고 있다.
자연스럽게 두 AI 중 어느 것을 쓰는 게 더 효율적인지 궁금해 하는 이들이 늘고 있는데, JTBC가 조금이나마 힌트를 전했다.
지난 4일 JTBC 뉴스룸은 두 AI 모델, 챗GPT o1과 딥시크 R1을 대상으로 2025년 대입 수능 국어·수학 공통과목 시험을 치르게 해 성능을 비교한 결과를 보도했다.
결과는 챗GPT가 국어와 수학에서 더 적은 오답률을 보인 것으로 나타났다. 그러나 두 모델 모두 수능 응시생들이 자주 틀리는 문제 유형에서 유사한 오답 패턴을 보였다. 특히 '적절하지 않은 것'을 묻는 국어 문제에서 두 모델 모두 어려움을 겪었다.
GettyimagesKorea
OpenAI
흥미롭게도 '어려움' 겪는 부분은 비슷
흥미롭게도, 우리 시조를 다룬 문제에서는 챗GPT가 오답을 낸 반면, 딥시크는 정확한 추론으로 정답을 맞혔다. 이는 딥시크가 중국 및 아시아 문화권 자료에 더 익숙할 가능성을 시사한다.
최근 업그레이드된 챗GPT o3 미니 하이 버전에서는 수학에서 오답이 줄었지만, 국어에서는 오히려 늘어난 모습을 보였다.
고려대 정보보호대학원 이상근 교수는 "코딩 능력을 강화하기 위해 코딩 데이터를 많이 볼 경우 언어 능력이 약화될 수 있다"라고 설명했다.
이어 "중국 모델의 놀라운 발전 속도를 강조하며, 특히 이 모델이 오픈 소스로 공개되었다는 점에서 주목할 만하다는 견해를 전했다.