미국 챗GPT vs 중국 딥시크... 두 AI에 한국 수능 시험 문제 풀게 했더니

입력 2025.02.05. 17:16

미국 챗GPT vs 중국 딥시크

인사이트 JTBC

중국의 딥시크가 비용은 훨씬 적게 들이고도 미국의 챗GPT와 유사한 성능을 보인다는 평가기 이곳저곳에서 나오고 있다.

자연스럽게 두 AI 중 어느 것을 쓰는 게 더 효율적인지 궁금해 하는 이들이 늘고 있는데, JTBC가 조금이나마 힌트를 전했다.

지난 4일 JTBC 뉴스룸은 두 AI 모델, 챗GPT o1과 딥시크 R1을 대상으로 2025년 대입 수능 국어·수학 공통과목 시험을 치르게 해 성능을 비교한 결과를 보도했다.

결과는 챗GPT가 국어와 수학에서 더 적은 오답률을 보인 것으로 나타났다. 그러나 두 모델 모두 수능 응시생들이 자주 틀리는 문제 유형에서 유사한 오답 패턴을 보였다. 특히 '적절하지 않은 것'을 묻는 국어 문제에서 두 모델 모두 어려움을 겪었다.

GettyimagesKorea

OpenAI OpenAI

흥미롭게도, 우리 시조를 다룬 문제에서는 챗GPT가 오답을 낸 반면, 딥시크는 정확한 추론으로 정답을 맞혔다. 이는 딥시크가 중국 및 아시아 문화권 자료에 더 익숙할 가능성을 시사한다.

최근 업그레이드된 챗GPT o3 미니 하이 버전에서는 수학에서 오답이 줄었지만, 국어에서는 오히려 늘어난 모습을 보였다.

고려대 정보보호대학원 이상근 교수는 "코딩 능력을 강화하기 위해 코딩 데이터를 많이 볼 경우 언어 능력이 약화될 수 있다"라고 설명했다.

이어 "중국 모델의 놀라운 발전 속도를 강조하며, 특히 이 모델이 오픈 소스로 공개되었다는 점에서 주목할 만하다는 견해를 전했다.

YouTube 'JTBC News'