닫기

글로벌이코노믹

"GPU 다음은 CPU"… AI 서버 가격 15% 뛴다, 투자자가 봐야 할 시그널은

글로벌이코노믹

"GPU 다음은 CPU"… AI 서버 가격 15% 뛴다, 투자자가 봐야 할 시그널은

추론·에이전트 AI 워크로드 급증이 도화선… AMD 점유율 41% 돌파하며 시장 재편
단순 GPU 구매 넘어 '시스템 최적화' 시대… 빅테크 CAPEX 전선 이동
인공지능(AI) 인프라 시장의 병목 현상이 그래픽처리장치(GPU)를 넘어 중앙처리장치(CPU)로 전이되고 있다. 그동안 AI 모델 학습에만 매몰됐던 데이터센터 자원이 실시간 추론과 에이전트(Agent)형 AI 서비스로 무게 중심을 옮기면서, 이를 처리할 CPU 수요가 공급을 압도하기 시작했다. 이미지=제미나이3이미지 확대보기
인공지능(AI) 인프라 시장의 병목 현상이 그래픽처리장치(GPU)를 넘어 중앙처리장치(CPU)로 전이되고 있다. 그동안 AI 모델 학습에만 매몰됐던 데이터센터 자원이 실시간 추론과 에이전트(Agent)형 AI 서비스로 무게 중심을 옮기면서, 이를 처리할 CPU 수요가 공급을 압도하기 시작했다. 이미지=제미나이3
인공지능(AI) 인프라 시장의 병목 현상이 그래픽처리장치(GPU)를 넘어 중앙처리장치(CPU)로 전이되고 있다. 그동안 AI 모델 학습에만 매몰됐던 데이터센터 자원이 실시간 추론과 에이전트(Agent)AI 서비스로 무게 중심을 옮기면서, 이를 처리할 CPU 수요가 공급을 압도하기 시작했다.

디지타임스(Digitimes)는 지난 18(현지시각) 보도를 통해 AI 워크로드의 구조적 변화가 전 세계 서버 인프라 시장을 '공급 절벽'으로 밀어 넣고 있다고 진단했다.

[데이터 박스] AI 서버 공급망 현황 (2026년 4월 기준). 도표=글로벌이코노믹이미지 확대보기
[데이터 박스] AI 서버 공급망 현황 (2026년 4월 기준). 도표=글로벌이코노믹


추론 AI 시대, CPU가 병목의 핵심으로 떠올랐다


AI 인프라 경쟁의 패러다임이 바뀐다. 과거 AIGPU 기반의 단순 학습에 의존했다면, 현재는 추론과 에이전트 기반 AI 서비스가 주류로 자리 잡았다. 이는 모델이 스스로 판단하고, 데이터베이스를 조회하며, 시뮬레이션을 반복하는 과정을 포함한다. 이러한 '검증 루프(Validation Loop)'GPU만큼이나 강력한 CPU 연산 능력을 요구한다.

디런 파텔 세미애널리시스(SemiAnalysis) 창업자는 "최근 6개월 사이 클라우드 CPU 용량이 사실상 바닥을 드러냈다""마이크로소프트의 깃허브(GitHub) 접속 장애는 CPU 자원이 오픈AI AI 워크로드에 우선 할당되면서 발생한 시스템 불균형의 결과"라고 분석했다. 클라우드 사업자들이 학습용 GPU 확보에는 성공했으나, 이를 뒷받침할 CPU 인프라까지는 제때 확충하지 못했다는 뜻이다.

AMD 점유율 41% 질주… x86 아키텍처의 재평가


이러한 공급난 속에서 반사이익을 얻는 기업은 AMD. 머큐리 리서치(Mercury Research)에 따르면, 20254분기 기준 AMD의 서버 CPU 매출 점유율은 41%에 육박했다. 저지연성, 소프트웨어 호환성, 고대역폭 메모리 지원 등 x86 아키텍처의 강점이 AI 추론 환경에서 다시 조명받고 있다.

반면 공급난은 전방위적으로 확산 중이다. 키뱅크(KeyBanc) 분석가 존 빈과 라이언 로섬니는 "AMD와 인텔의 서버 CPU 재고는 거의 소진된 상태"라며 "향후 서버 가격이 10~15% 상승할 것"이라고 경고했다. (Dell)HP 등 서버 제조사들의 리드타임(주문 후 인도까지 걸리는 시간)은 수개월 단위로 길어졌다. 일부 업계 전문가는 이를 과거 메모리 부족 사태에 버금가는 공급망 대란으로 평가한다.

시스템 경쟁력, 이제는 '데이터 이동과 통합 자동화'이다


시스템 경쟁력은 '데이터 이동과 통합 자동화'가 결정한다. AI 인프라의 승패는 단순한 GPU 개수가 아닌, 자원 간의 병목을 제어하는 오케스트레이션(Orchestration) 능력으로 이동했다.

전문가들은 이번 CPU 공급 부족 사태가 일시적 현상이 아닌 구조적 전환점이라고 입을 모은다. AI 인프라의 승패가 이제 단순히 더 많은 GPU를 꽂는 것이 아니라, CPUGPU, 메모리를 얼마나 효율적으로 연결하고 제어(Orchestration)하느냐에 달려 있기 때문이다. 엔비디아와 ArmCPU 자체 개발에 속도를 내고, ·HP 등이 시스템 설계 변경을 서두르는 이유가 여기에 있다.

이처럼 급변하는 AI 인프라 시장에서 투자자가 반드시 확인해야 할 체크리스트는 세 가지다.

첫째, 빅테크 기업의 데이터센터 설비투자(CAPEX) 구성 변화다. GPU 위주의 투자가 '시스템 균형'으로 옮겨간다. 추론 효율을 위해 CPU와 고속 네트워킹 장비 비중을 높이는 것이 2026년 인프라 투자의 핵심이다. 단순한 GPU 구매를 넘어 전력, 냉각, 연산 간의 병목을 해결하는 데 예산이 집중되고 있으므로, GPU 외에 CPU 예산이 어떻게 배정되는지 면밀히 살펴야 한다.

둘째, 서버 제조사의 리드타임 지표다. 이는 공급망 안정화 여부를 판단하는 가장 빠른 척도다. 현재 부품 수급난으로 인해 주요 제조사의 납기가 20주 이상 지연되는 사례가 속출하고 있다. 이는 단순한 배송 지연을 넘어 필수 부품 확보 자체가 어려운 구조적 공급 부족 상태임을 방증하므로, 제조사의 공급 안정성을 확인해야 한다.

셋째, x86Arm 등 이기종 컴퓨팅 아키텍처의 도입 속도다. 하이퍼스케일러들은 전력 효율을 위해 Arm 기반 칩 비중을 높이는 한편, 고성능 연산에는 여전히 x86을 배치하는 하이브리드 전략을 택한다. 워크로드 성격에 맞춰 CPU와 가속기를 최적으로 조합하는 효율성 경쟁이 치열해지고 있다.

2026년의 AI 인프라 시장은 '컴퓨팅 자원의 확보'에서 '시스템 연산 효율의 최적화'로 전선을 옮겼다. 이는 HBM(고대역폭메모리) 경쟁을 넘어 시스템 최적화가 필수인 시대가 왔음을 의미하며, 국내 메모리 업계에도 CPU와 가속기를 잇는 데이터 병목 해결이라는 새로운 과제를 던지고 있다.

이제 시장은 단순한 파워 게임을 넘어, 누가 더 정교하게 시스템을 지휘할 수 있느냐에 따라 새로운 승자를 가려낼 것이다.


김주원 글로벌이코노믹 기자 park@g-enews.com