삼성SDS, AI서비스 지연 최소화하는 'SCP B300 GPUaaS' 출시

기존 H100 대비 메모리 용량 3배 이상
LLM 추론 병목 현상 획기적 개선
AI 서비스 지연 시간 최소화

삼성SDS가 SCP B300 GPUaaS를 출시했다고 23일 밝혔다. 사진=삼성SDS

삼성SDS가 국내 최초로 자사 클라우드 삼성 클라우드 플랫폼(SCP)을 통해 엔비디아의 최신 그래픽 처리 장치(GPU)인 B300 기반 GPU 구독형 서비스(GPUaaS) 'SCP B300 GPUaaS'를 출시했다. 이 서비스는 고성능이 필요한 인공지능(AI) 서비스 지연 시간을 최소화할 수 있는 것이 특징이다.

23일 삼성SDS에 따르면 이 서비스는 최근 기업들이 AI 모델 개발을 넘어 실제 서비스에 적용하는 'AI 추론' 급증에 따른 고성능 컴퓨팅 수요에 대응하기 위한 전략이다. B300 GPU는 12단 고대역폭메모리(HBM3E)를 탑재해 GPU당 288기가바이트(GB)의 메모리 용량과 초당 8테라바이트(TB)의 대역폭을 제공해 복잡한 연산이 필요한 AI 추론 영역에서 H100 대비 용량은 3.6배, 대역폭은 2.4배로 메모리 성능이 향상됐다.

이에 따라 거대 언어 모델(LLM) 실행 시 GPU의 빠른 연산 처리 속도 대비 느린 메모리의 데이터 전송 속도로 인해 전반적인 성능이 저하되는 데이터 병목 현상이 획기적으로 개선됐다. 앞서 삼성SDS는 지난 2021년 A100, 2023년 H100 기반 GPUaaS를 선제적으로 제공해 클라우드 기반의 인프라 구축과 운영, 고객 서비스 등에 GPU가 AI 전용 인프라로 활용될 수 있도록 GPUaaS 생태계 구성을 이끌어 오고 있다.

SCP B300 GPUaaS를 도입하는 고객은 고용량 메모리를 통해 거대 AI 모델을 효율적으로 처리할 수 있어 AI 에이전트와 이미지·영상·코드 생성 및 분석 등 고성능이 필요한 AI 서비스의 지연 시간을 최소화할 수 있다. 또 필요한 만큼 쓰고 지불하는 구독형 모델을 이용하면 초기 투자 리스크를 낮추고 비용을 효율화할 수 있다.

GPU 수급이 어려운 상황에서도 SCP를 통해 엔비디아의 최신 아키텍처를 즉시 업무에 도입할 수 있으며 삼성SDS의 보안 역량이 결합된 안전한 클라우드 환경에서 민감한 기업 데이터를 처리할 수 있다.

삼성SDS는 AI 모델을 적용할 때 별도의 인프라 사용료없이 사용한 토큰양 만큼만 비용을 지불하는 '서버리스 추론 서비스'와 개발자가 코드와 데이터를 입력하면 자동으로 즉시 AI를 분산학습시키는 'AI 학습 서비스' 등을 올 3분기에 출시할 계획이다.

이호준 삼성SDS 클라우드서비스사업부장은“SCP가 보유한 자원 최적화·에너지 절감 등 GPU 효율화 역량을 바탕으로 대기업, 중견/중소, 공공 등 AI를 업무에 적용하려는 고객에게 국내 최초 B300 GPU 서비스를 제공해 AX 전환을 적극 지원하겠다"고 말했다.

한편 삼성SDS는 민관협력형(PPP) 클라우드 서비스 사업자로서 대구센터에 H100 기반 GPUaaS를 최초로 도입했으며 범정부 초거대 AI 공통기반 구현, 지능형 업무관리 플랫폼 구축 등 다양한 정부 AI 사업을 수행하고 있다. 아울러 과학기술정보통신부 주관 고성능 컴퓨팅 지원사업 수행 클라우드 서비스 제공사(CSP)로서 60여 개의 AI 관련 중소기업과 스타트업, 연구 기관, 대학교 등에 GPU를 공급하는 등 다양한 고객을 대상으로 GPUaaS를 제공 중이다.

이재현 글로벌이코노믹 기자 kiscezyr@g-enews.com