닫기

글로벌이코노믹

소프트뱅크·AMD, 차세대 AI 인프라 GPU 리소스 최적화 기능 공동 검증

글로벌이코노믹

소프트뱅크·AMD, 차세대 AI 인프라 GPU 리소스 최적화 기능 공동 검증

소프트뱅크(SoftBank) 로고. 사진=로이터이미지 확대보기
소프트뱅크(SoftBank) 로고. 사진=로이터

일본 소프트뱅크와 미국 AMD가 공동으로 차세대 인공지능(AI) 리소스 최적화를 위한 기술 개발에 돌입한다.

16일(현지시각) 소프트뱅크와 AMD는 차세대 AI 인프라에서 ‘AMD Instinct’ GPU를 활용하기 위한 공동 검증을 시작했다고 발표했다.

양사는 AI 애플리케이션의 모델 규모나 동시 실행 수 등의 요건에 따라 GPU 리소스를 분할해 최적으로 할당시킬 수 있는 기능을 개발했다. 이를 통해 하나의 GPU에서 여러 AI 애플리케이션을 효율적으로 가동시킬 수 있다.

소프트뱅크는 AI와 통신 기능을 융합하는 차세대 사회 인프라 ‘AI-RAN’ 구축을 추진 중으로, 이번 공동 검증은 이 계획의 일환으로 알려졌다.

두 회사가 공동 검증에 나선 이유는 최근 생성형 AI 보급에 따라 대규모 언어 모델(LLM) 등을 활용하는 애플리케이션 수요가 급증하고 있지만 모델에 따라 필요한 계산 자원은 크게 차이가 나기 때문이다. 기존과 같이 GPU를 일률적으로 할당하는 운영 방식에서는 자원 부족이나 잉여 자원이 발생하기 쉬워 인프라 활용 효율이 과제로 대두되고 있다.

이 과제를 해결하기 위해 소프트뱅크는 계산 자원 관리와 AI 애플리케이션에 대한 최적 배분을 담당하는 ‘오케스트레이터’ 개발을 진행 중이다. 이번 공동 검증에서는 AMD의 데이터센터용 GPU인 AMD Instinct가 보유한 'GPU 파티셔닝 기능'을 활용할 수 있도록 오케스트레이터를 확장했다. 이를 통해 물리적으로 하나의 GPU를 여러 논리 장치로 처리할 수 있어 애플리케이션 요구에 따라 유연하게 자원을 배분할 수 있다.

현재 소프트뱅크는 확장된 오케스트레이터를 활용함으로써 GPU 리소스에 불필요한 잉여를 발생시키지 않고도 여러 AI 애플리케이션을 효율적으로 동시에 가동할 수 있다는 것을 확인한 상태다.

소프트뱅크 첨단기술연구소 총괄 와카와 타카츠구는 AMD와의 협력에 대해 “단일 GPU 상에서 여러 AI 애플리케이션 운영이 더욱 효율화되고 있음을 확인했다”라며 “향후 계산 자원 활용 효율 향상에 노력하겠다”는 입장을 밝혔다.

소프트뱅크와 AMD는 향후 AMD Instinct GPU의 차세대 AI 인프라 활용을 위한 기술 평가를 지속할 방침이다.

한편, 두 회사는 2026년 스페인 바르셀로나에서 개최되는 'MWC Barcelona 2026'에서 데모를 공개할 예정이다.


이용수 글로벌이코노믹 기자 piscrait@g-enews.com