비즈니스 인사이더·CNBC 교차 분석… 제재 장벽에 막힌 ‘7나노 공정’의 처절한 생존법
삼성전자·SK하이닉스 공급망 정조준… 하반기 75만 개 출하로 추론 시장 침투 본격화
SMIC·CXMT 수율 저하 고조… ‘범용’ 포기하고 추론·추천 특화로 ‘우회 혁신’ 승부수
삼성전자·SK하이닉스 공급망 정조준… 하반기 75만 개 출하로 추론 시장 침투 본격화
SMIC·CXMT 수율 저하 고조… ‘범용’ 포기하고 추론·추천 특화로 ‘우회 혁신’ 승부수
이미지 확대보기비즈니스 인사이더(Business Insider)는 지난 26일(현지시간) "화웨이가 엔비디아를 압도한다고 주장하지만, 실상은 2020년 출시된 엔비디아 A100 계열을 변형한 수준"이라고 보도했다. 이어 CNBC는 27일 "화웨이가 소프트웨어 호환성을 개선해 바이트댄스, 알리바바 등 중국 빅테크 기업의 주문을 이끌어내며 엔비디아의 빈자리를 정조준하고 있다"라고 전했다.
이미지 확대보기성능 3배 향상의 함정… ‘6년 전 아키텍처’의 변주곡
화웨이가 주장하는 ‘3배 효율’의 근거는 지극히 제한적인 조건에서의 비교 결과다. 비즈니스 인사이더의 기술 분석에 따르면, 화웨이는 아틀라스 350의 FP4(4비트 부동소수점) 연산 성능을 엔비디아의 중국 수출용 저사양 칩인 H20의 FP8 성능과 비교하는 교묘한 방식을 취했다.
데이터 정밀도를 낮추면 연산 속도는 빨라지지만, 연산의 정확도는 떨어진다. 화웨이는 이를 통해 1.56페타플롭스(PFLOPS)라는 수치를 제시하며 우위를 주장했다. 하지만 이는 6년 전 기술인 엔비디아 A100의 구조를 개선한 수준이며, 최신형인 H200의 성능(FP16 기준 약 989 TFLOPS)에는 한참 못 미치는 수치다.
특히 지난해 9월 예고했던 사양보다 실제 양산 제품의 성능이 22% 하락하고, 메모리 대역폭도 12.5% 줄어든 점이 포착됐다. 이는 중국 최대 파운드리(반도체 위탁생산) 기업 SMIC와 메모리 제조사 CXMT가 극자외선(EUV) 노광장비 등 미세공정 장비 부족 탓에 당초 설계한 성능을 온전히 구현하지 못하고 있음을 보여준다.
‘범용’ 포기하고 ‘추론·추천’에 올인한 우회 전략
화웨이는 엔비디아와 전면전을 벌이는 대신 ‘특화 시장’으로 방향을 틀었다. 아틀라스 350에 탑재된 '어센드(Ascend) 950PR' 칩의 명칭에서 'P'는 프리필(Prefill, 질문 분석), 'R'은 리레커멘데이션(Rerecommendation, 재추천)을 의미한다.
이는 틱톡의 추천 알고리즘이나 거대언어모델(LLM)의 추론 단계처럼 정밀도가 조금 낮아도 속도가 중요한 분야를 공략하겠다는 의도다. 기술 제재로 고성능 범용 칩 제조가 불가능해지자, 특정 용도에서만큼은 비용 대비 효율을 극대화하는 ‘우회 혁신’을 택한 노릇이다.
‘쿠다(CUDA)’ 장벽 허문 호환성… 중국 빅테크의 결단
그동안 중국 대형 기술 기업들이 화웨이 칩 채택을 주저했던 결정적 이유는 소프트웨어 생태계였다. 엔비디아의 '쿠다(CUDA)'에 익숙해진 개발자들이 화웨이의 독자 시스템인 '캔(CANN)'으로 전환하는 것을 꺼렸기 때문이다.
CNBC는 소식통을 인용해 "화웨이가 이번 950PR 개발 과정에서 쿠다와의 소프트웨어 호환성을 획기적으로 높였다"라고 전했다. 이에 힘입어 바이트댄스와 알리바바 등은 기존 모델을 화웨이 칩으로 옮기는 작업이 수월해졌다고 판단하고 대규모 주문을 준비 중이다. 화웨이는 올해 하반기부터 약 75만 개의 칩을 출하할 계획이며, 가격은 일반형 약 5만 위안(약 1090만 원) 선으로 책정했다.
75만 개의 습격… 한국 반도체에 던지는 경고장
화웨이의 이번 행보는 '자립'이라기보다 '사투'에 가깝다. 칩 사이의 통신 대역폭을 2.0TB/s까지 높여 여러 개의 저사양 칩을 묶어 쓰는 방식으로 성능 부족을 메우려 하지만, 이는 필연적으로 전력 소비 급증과 관리 비용 상승을 초래한다.
국내 반도체 업계의 한 관계자는 "중국이 제조 장비의 한계를 소프트웨어 호환성과 패키징 기술로 보완하며 시간을 벌고 있다"라며 "단기적으로는 성능이 떨어지는 칩일지라도 75만 개라는 물량이 시장에 풀릴 경우, 한국의 메모리 반도체 공급망에도 직간접적인 하방 압력이 작용할 수 있다"라고 분석했다.
업계 전문가들은 그 이유를 크게 세 가지 축에서 짚는다.
첫째는 핵심 고객의 이탈이다. 바이트댄스·알리바바·텐센트 등 중국 빅테크는 삼성전자·SK하이닉스에게 엔비디아 못지않은 거대 수요처다. 데이터센터용 DRAM과 SSD 물량만으로도 막대한 규모인데, 화웨이 950PR이 75만 개 규모로 시장에 풀리면 중국 기업들이 암시장을 통해 엔비디아 칩을 조달할 유인이 그만큼 줄어든다. 엔비디아 칩에 탑재돼 우회 수출되던 한국산 HBM(고대역폭메모리)의 판로가 동시에 막히는 구조다. 더욱이 화웨이는 칩을 단독으로 팔지 않는다. 독자 개발한 'HiBL'·'HiZQ' 메모리를 함께 패키징해 클러스터 단위로 공급하기 때문에, 칩이 화웨이 것으로 바뀌는 순간 그 위에 올라가는 메모리까지 한국산에서 자국산으로 통째 대체되는 도미노 현상이 발생한다.
둘째는 수익성 악화다. 950PR은 최신 HBM3E 대신 구세대 HBM이나 고성능 DDR 규격을 혼용하는 설계를 택했다. 이 제품이 중국 시장의 사실상 표준으로 자리 잡으면, 고부가가치인 최신 HBM 수요는 줄고 범용 메모리 비중이 늘어나 공급 과잉 압력이 커진다. 한국 기업들이 쌓아온 '기술 프리미엄'이 무력화되는 구간이 열리는 것이다.
셋째이자 가장 구조적인 위협은 생태계의 장기 이탈이다. 75만 개는 중국 개발자들이 화웨이 소프트웨어 환경에 적응하기에 충분한 임계점으로 평가된다. 중국 빅테크들이 화웨이 칩에 맞춰 AI 모델을 최적화하기 시작하면, 메모리 설계 규격 자체가 화웨이 인터페이스 기준으로 재편될 수 있다. 여기에 중국 정부의 반도체 자급 정책이 맞물리면, 화웨이 칩을 채택한 기업들은 메모리 역시 CXMT 등 자국산으로 조달하라는 유·무형의 압박을 받게 된다. 75만 개라는 숫자는 단순한 판매 물량이 아니라, 중국이 한국 메모리 없이도 독자적인 AI 인프라를 구축할 수 있음을 증명하는 최소 수량으로 해석된다. 한국 반도체 입장에서는 최대 시장 중 하나인 중국에서 HBM 리더십을 발휘할 기회 자체가 차단될 수 있다는 위기 인식이 업계 안팎에서 고조되고 있다.
화웨이 아틀라스 350의 성패는 중국 내 AI 추론 시장을 얼마나 빠르게 잠식하느냐에 달렸다. 삼성전자와 SK하이닉스 역시 중국의 이러한 '우회 혁신'이 가져올 메모리 수요 변화와 기술 격차 유지 전략을 다시 점검해야 할 시점이다.
김주원 글로벌이코노믹 기자 park@g-enews.com

































