닫기

글로벌이코노믹

딥시크, 신기술 논문 공세로 ‘차세대 AI’ 혁신 입증... 신규 모델 발표는 ‘침묵’

글로벌이코노믹

딥시크, 신기술 논문 공세로 ‘차세대 AI’ 혁신 입증... 신규 모델 발표는 ‘침묵’

Engram·mHC 등 인프라 효율화 논문 발표... GPU 한계 극복 대안 제시
V4·R2 ‘춘제(설날)’ 출시 루머 확산... 中 AI 기술 자율성 강화 전략 집중
2025년 5월 4일, 저장성 동부 수도 항저우에서 열린 인공지능 테마 박람회에서 사람들이 딥시크 기술을 배우는 모습이 목격되었다. 사진=딥시크이미지 확대보기
2025년 5월 4일, 저장성 동부 수도 항저우에서 열린 인공지능 테마 박람회에서 사람들이 딥시크 기술을 배우는 모습이 목격되었다. 사진=딥시크
중국의 인공지능(AI) 스타트업 딥시크(DeepSeek)가 차세대 AI 모델 개발을 위한 핵심 기술 논문들을 잇달아 발표하며 글로벌 AI 커뮤니티의 주목을 받고 있다.

14일(현지시각) 사우스차이나모닝포스트(SCMP)와 업계에 따르면, 항저우에 본사를 둔 딥시크는 최근 GPU 메모리 한계를 극복하고 대규모 학습 안정성을 높이는 혁신적인 기술 프레임워크를 공개했으나, 기대를 모으고 있는 차세대 모델 ‘V4’와 ‘R2’의 구체적인 출시 일정에 대해서는 함구하고 있다.

◇ ‘Engram’과 ‘mHC’... GPU 부족 시대의 기술적 돌파구


딥시크는 지난달 말부터 이달 초까지 AI 모델의 효율성을 극적으로 높이는 두 건의 핵심 논문을 발표했다. 이는 미국의 첨단 반도체 규제로 인해 컴퓨팅 자원이 제한된 중국 개발자들에게 새로운 이정표가 될 것으로 보인다.

Engram(조건부 메모리)은 GPU의 고대역폭 메모리(HBM) 제약을 우회하기 위한 기법이다. 자주 사용되는 패턴을 별도의 룩업 테이블에 저장해 추론 시 필요한 계산량을 줄이고, 비싼 GPU 메모리 대신 일반 RAM이나 SSD에서도 데이터를 불러올 수 있게 설계되었다.

mHC(매니폴드 제약 하이퍼 연결)는 모델이 거대해질수록 발생하는 신호 불안정 문제를 해결하는 아키텍처다. 기존 하이퍼 연결 기술에 수학적 제약을 가해 수백 개의 층을 통과해도 신호가 왜곡되지 않도록 안정성을 확보했다.

◇ V4·R2 ‘춘제 출시설’ 확산... “코딩 능력 클로드 압도할 것”


현재 AI 커뮤니티에서는 딥시크가 중국의 최대 명절인 음력 설(춘제, 2026년 2월 17일) 전후로 차세대 모델인 V4 혹은 R2를 출시할 것이라는 루머가 확산 중이다. 딥시크는 지난해에도 춘제 직전에 R1 모델을 출시해 전 세계를 놀라게 한 전례가 있다.

내부 테스트 데이터에 따르면, 차세대 모델(V4 예정)은 특히 코드 생성 능력에서 앤스로픽의 클로드(Claude)나 오픈AI의 GPT 시리즈를 능가하는 성능을 보인 것으로 알려졌다.

또한, 기존의 일반 능력(V 시리즈)과 추론 능력(R 시리즈)을 통합한 새로운 아키텍처가 적용될 가능성도 제기되고 있다.

◇ 18명의 핵심 인재 결집... “근본으로 돌아간 중국의 AI 굴기”


영국 과학 저널 ‘네이처(Nature)’는 최근 딥시크의 창립자 량원펑을 ‘2025년 과학을 형성한 10인’ 중 한 명으로 선정했다.

네이처는 딥시크가 고가의 장비 없이도 세계 정상급 모델을 만들 수 있음을 보여줌으로써 “미국이 AI 분야에서 생각만큼 앞서 있지 않다는 것을 증명했다”고 평가했다.

딥시크는 R1 프로젝트에 참여했던 18명의 핵심 과학자와 176명의 기여자를 전원 유지하며 조직력을 과시하고 있다.

기술 정보 설계자 장루이왕은 “딥시크의 혁신은 자본과 자원이 제한된 환경에서 프로세스를 개선하는 데 집중한 결과”라며, 이번 신기술들이 차세대 모델의 강력한 토대가 될 것이라고 분석했다.


신민철 글로벌이코노믹 기자 shincm@g-enews.com