닫기

글로벌이코노믹

[실리콘 디코드] 구글이 쏘아 올린 'TPU 성공 신화'…中 "엔비디아 없어도 된다" 독자 노선 자신감

글로벌이코노믹

[실리콘 디코드] 구글이 쏘아 올린 'TPU 성공 신화'…中 "엔비디아 없어도 된다" 독자 노선 자신감

제미나이 100% 자체 칩 훈련 성공에 고무된 중국 빅테크…화웨이·알리바바 '脫 엔비디아' 가속 페달
'블랙웰' 확보 난항 속 자체 개발 '가성비' 주목…훈련·추론 분리한 '투 트랙' 전략으로 美 제재 파고 넘는다
구글이 자체 개발한 AI 반도체 'TPU'로 제미나이 모델 훈련에 성공하자, 화웨이와 알리바바 등 중국 빅테크 기업들이 이에 고무되어 '탈(脫) 엔비디아' 행보에 속도를 내고 있다. 사진=오픈AI의 챗GPT-5.1이 생성한 이미지이미지 확대보기
구글이 자체 개발한 AI 반도체 'TPU'로 제미나이 모델 훈련에 성공하자, 화웨이와 알리바바 등 중국 빅테크 기업들이 이에 고무되어 '탈(脫) 엔비디아' 행보에 속도를 내고 있다. 사진=오픈AI의 챗GPT-5.1이 생성한 이미지

구글이 자사의 최신 프런티어 모델인 '제미나이(Gemini)'를 100% 자체 개발한 텐서처리장치(TPU)로 훈련시키는 데 성공했다는 소식이 중국 테크 업계에 신선한 충격을 던지고 있다. 그동안 인공지능(AI) 개발의 필수재이자 대체 불가능한 '성물'로 여겨졌던 엔비디아 GPU 없이도 최고 수준의 AI 모델을 구현할 수 있다는 사실이 입증되었기 때문이다. 이는 미국의 대중국 수출 통제로 첨단 반도체 확보에 비상이 걸린 중국 빅테크 기업들에게 "엔비디아 의존도 축소가 기술적으로 가능할 뿐만 아니라 상업적으로도 타당하다"는 확신을 심어주는 결정적 계기가 되고 있다.

'엔비디아 만능론'의 붕괴…구글이 보여준 새로운 가능성


수년 동안 중국 AI 산업계는 엔비디아의 GPU, 특히 최근 출시된 '블랙웰(Blackwell) B200'을 AI 컴퓨팅의 '황금 삽(Golden Shovel)'으로 여기는 경향이 짙었다. GPU 중심의 사고방식이 지배적이었으며, 대규모 언어 모델(LLM) 훈련에는 오직 엔비디아의 하드웨어만이 해답이라는 고정관념이 팽배했다. 그러나 구글의 이번 TPU 성과는 이러한 믿음을 하루아침에 뒤집어 놓았다고 디지타임스가 2일(현지시각) 보도했다.

구글은 TPU v6와 v7을 활용해 제미나이의 훈련과 추론 과정을 완벽하게 수행했다. 특히 복잡한 '전문가 믹스(Mixture-of-Experts, MoE)' 모델 구조에서도 가속기의 성능을 검증해 냈으며, GPU가 아닌 아키텍처로도 고도화된 멀티모달(Multimodal) 워크로드를 확장할 수 있음을 증명했다. 이는 미국의 수출 규제로 인해 엔비디아의 최신 칩을 구하기 어려운 중국의 하이퍼스케일러(대형 클라우드 사업자)들에게 시사하는 바가 크다.
이번 성과는 바이두의 쿤룬신(Kunlunxin), 알리바바의 한광(Hanguang), 화웨이의 어센드(Ascend) 등 중국 내 주요 프로세서 개발사들에게 강력한 시그널을 보내고 있다. 국산(중국산) 프로세서가 더 이상 단순한 추론용 대체재가 아니라, 최상위 모델을 위한 신뢰할 수 있는 '훈련용 주력마(Workhorses)'가 될 수 있다는 자신감을 불어넣은 것이다. 아울러 이는 AI 생태계를 장기간 지배해 온 엔비디아의 소프트웨어 플랫폼 '쿠다(CUDA)'에 대한 락인(Lock-in·고착) 효과가 절대적이지 않음을 시사하며, 대체 기술이 기술적으로나 상업적으로 충분히 경쟁 가능하다는 점을 입증한 사례로 평가받는다.

'비싼 삽' 빌리는 대신 '자체 굴착기' 만든다…가속화되는 中 국산화


현재 중국 컴퓨팅 시장에서 엔비디아의 최신 B200 칩은 공식적인 채널을 통해 구할 수 없는 '그림의 떡'이다. 음성적인 그레이 마켓(Gray Market)에서 거래되는 가격은 천정부지로 치솟았고, 그나마도 공급 불균형이 심화되고 있다. 이러한 희소성은 중국 기업들이 비싼 임대료를 내고 남의 '황금 삽(엔비디아 칩)'을 빌려 쓰는 대신, 자체 개발한 '굴착기(자체 칩)'에 투자하도록 강제하는 촉매제가 되고 있다. 총소유비용(TCO)을 낮추고 장기적인 기술 자립권을 확보하기 위해 컴퓨팅 파워의 자체 보유가 필수적인 생존 요건으로 떠올랐기 때문이다.

이러한 환경은 중국 내 TPU 및 NPU(신경망처리장치) 혁신을 가속화하고 있다. 대표적인 사례가 전직 구글 TPU 엔지니어가 설립한 '중하오 신잉(Zhonghao Xinying)'이다. 이 회사는 중국 내에서 가장 명확하게 TPU 개발을 표방하는 기업 중 하나로, 2023년 말 첫 번째 칩인 '차나(Chana)'의 양산을 시작했다.

중하오 신잉 측의 주장에 따르면, 차나 칩은 훈련과 추론을 통합한 포지셔닝을 갖추고 있으며, 엔비디아의 A100 대비 1.5배의 연산 능력을 제공한다. 더욱 주목할 점은 전력 소모가 30% 더 낮고, 연산당 비용은 엔비디아 경쟁 제품의 약 42% 수준에 불과하다는 것이다. 이 플랫폼은 커스텀 명령어 세트와 완전한 IP(지식재산권) 소유권, 그리고 엔드-투-엔드(End-to-End) 소프트웨어 스택을 포함하고 있어 독자적인 생태계 구축이 가능하다.

화웨이의 어센드 시리즈 역시 다빈치(Da Vinci) 아키텍처를 기반으로 중국 텐서 컴퓨팅 생태계의 핵심 기둥 역할을 하고 있다. 캠브리콘(Cambricon)의 NPU 또한 클라우드 훈련 및 추론을 위한 행렬 및 텐서 연산 최적화에 주력하며, 엔비디아의 지배력에 맞서는 로컬 대안으로 자리 잡고 있다.

훈련은 엔비디아, 추론은 국산 칩…실리 추구하는 '투 트랙' 전략


미국의 수출 제한이라는 엄혹한 현실 속에서 중국의 하이퍼스케일러들은 실용적인 '투 트랙(Dual-track)' 아키텍처 전략을 채택하고 있다. 생태계의 성숙도가 높은 AI 모델 '훈련(Training)' 단계에서는 여전히 확보 가능한 범위 내에서 엔비디아 하드웨어에 의존하되, AI 배포 비용의 대부분을 차지하는 '추론(Inference)' 단계에서는 빠르게 자체 개발 가속기로 전환하는 방식이다.

일단 모델 훈련이 완료되면, 이를 경량화(Distillation)하거나 양자화(Quantization)하여 특정 연산자나 트랜스포머(Transformer) 워크로드에 최적화된 국산 칩에 탑재해 배포하는 것이다. 중국 내 벤더들이 텐서 컴퓨팅 기술을 정교화하고 연산당 비용을 절감함에 따라, 이러한 하이브리드 전략의 경제적 효용성은 더욱 커지고 있다.

구글의 TPU 성공 사례는 중국의 이러한 움직임에 강력한 외부적 타당성을 부여했다. 이제 '탈(脫) 엔비디아'는 단순한 이념적 구호나 정치적 수사가 아니다. 이는 검증되었으며 확장 가능한, 그리고 무엇보다 전략적으로 필수불가결한 경로로 자리 잡았다. 중국의 빅테크 기업들에게 메시지는 명확하다. 독자적인 컴퓨팅 기술을 마스터하는 것이야말로 비용 효율성을 달성하고, 배포 통제권을 확보하며, 궁극적으로 미래 AI 혁신의 방향을 결정짓는 핵심 열쇠라는 것이다.


박정한 글로벌이코노믹 기자 park@g-enews.com