딥시크, R1 모델 업그레이드로 오픈AI 추격...환각 현상 50% 감소

R1-0528 버전으로 추론 능력 대폭 향상...오픈AI o3·구글 제미니 2.5 Pro 수준 근접
1월 R1 출시로 글로벌 AI 업계 충격...저비용 고성능으로 서구 AI 패러다임 도전

중국 AI 스타트업 딥시크(DeepSeek)가 R1 추론 모델에 대한 업데이트를 발표했다. 사진=로이터

중국 AI 스타트업 딥시크(DeepSeek)가 히트작 R1 추론 모델의 첫 번째 업데이트를 발표하며 오픈AI, 구글 등 미국 빅테크와의 경쟁을 본격화했다고 30일(현지시각) 일본의 경제신문 닛케이 아시아가 보도했다.

딥시크는 30일 개발자 플랫폼 허깅페이스를 통해 R1-0528을 공개했다고 발표했다. 회사는 이번 업데이트가 마이너 버전 업그레이드이지만 복잡한 작업 처리를 포함해 추론 및 논리 기능의 깊이를 크게 향상시켜 성능을 오픈AI의 o3 추론 모델과 구글의 제미니 2.5 Pro에 더 가깝게 만들었다고 밝혔다.

지난 1월 R1 출시는 전 세계적으로 입소문을 타며 중국 이외 기술주가 급락하는 원인이 됐다. 특히 AI 발전을 위해서는 막대한 컴퓨팅 파워와 투자가 필요하다는 기존 시각에 도전장을 내밀었다는 평가를 받았다.

이번 업데이트는 1월 R1 출시 때와 대조적으로 처음에는 세부사항에 대해 간략했다. 당시에는 전 세계 AI 커뮤니티가 회사의 전략을 이해하기 위해 분석한 다중 저자 학술 논문과 함께 제공됐었다.

항저우에 본사를 둔 딥시크는 나중에 X에 올린 짧은 게시물에서 R1-0528이 향상된 성능을 특징으로 한다고 밝혔다. 위챗에 올린 긴 게시물에서는 다시 쓰거나 요약하는 것과 같은 시나리오에서 거짓이나 오해의 소지가 있는 출력인 '환각' 비율이 약 45%에서 50%까지 감소했다고 설명했다.

또한, 이번 업데이트를 통해 에세이, 소설 등 창의적 글쓰기 능력이 향상됐고, 프론트엔드 코드 생성과 롤플레잉 등 영역에서도 기능이 강화됐다고 밝혔다.

딥시크는 "이 모델은 수학, 프로그래밍, 일반 논리를 포함한 다양한 벤치마크 평가에서 뛰어난 성능을 보여줬다"고 강조했다.

딥시크의 성공은 미국의 수출 통제가 중국의 AI 발전을 가로막고 있다는 기존 믿음을 뒤엎었다. 중국이 최첨단 반도체 접근에 제약을 받는 상황에서도 혁신적인 AI 모델을 개발할 수 있음을 보여줬기 때문이다.

회사는 29일 R1-0528 모델에서 사용하는 추론 프로세스를 활용해 업데이트 변형을 만든 다음, 증류로 알려진 프로세스를 통해 중국 기술 대기업 알리바바의 Qwen 3 8B Base 모델을 더욱 향상시켰다고 덧붙였다. 그 결과 기존 Qwen 3 모델을 10% 이상 능가하는 성능을 달성했다고 밝혔다.

딥시크는 "우리는 딥시크-R1-0528의 생각의 사슬이 추론 모델에 대한 학술 연구와 소규모 모델에 초점을 맞춘 산업 개발 모두에 매우 중요할 것이라고 믿는다"고 말했다.

블룸버그는 28일 딥시크 담당자가 위챗 그룹에서 "사소한 시험 업그레이드"라고 설명한 것을 완료했으며 사용자가 테스트를 시작할 수 있다고 말했다고 보도했다.

딥시크와의 경쟁에 대응하기 위해 구글의 제미니는 할인된 액세스 계층을 도입했고, 오픈AI는 가격을 인하하고 컴퓨팅 파워에 덜 의존하는 o3 미니 모델을 출시했다.

R1 출시 이후 알리바바, 텐센트 같은 중국 기술 대기업들도 딥시크를 능가한다고 주장하는 모델들을 잇따라 출시하며 중국 내 AI 경쟁이 더욱 치열해지고 있다.

딥시크는 여전히 R1의 후속 제품인 R2를 출시할 것으로 널리 예상된다. 로이터는 지난 3월 소식통을 인용해 R2의 출시가 당초 5월로 계획됐다고 보도한 바 있다. 딥시크는 지난 3월 V3 대형 언어 모델로의 업그레이드도 발표했다.

이번 업데이트는 중국 AI 기업들이 서구의 기술 우위에 도전하며 글로벌 AI 패러다임을 바꾸고 있음을 보여주는 사례로 평가된다. 특히 저비용으로 고성능을 구현하는 딥시크의 접근법은 AI 산업 전반에 큰 영향을 미치고 있다.

신민철 글로벌이코노믹 기자 shincm@g-enews.com