닫기

글로벌이코노믹

AI업체 마인즈랩, "CUDA 최적화 기술로 음성합성기술 서비스 향상"

공유
0

AI업체 마인즈랩, "CUDA 최적화 기술로 음성합성기술 서비스 향상"

"구글, 페이스북 등 글로벌 기업 수준의 상용화 성공"

마인즈랩이 쿠다 옵티마이제이션을 통해 AI 음성서비스를 최적화했다고 29일 밝혔다. 이미지 확대보기
마인즈랩이 쿠다 옵티마이제이션을 통해 AI 음성서비스를 최적화했다고 29일 밝혔다.
"구글, 페이스북 등 글로벌 기업 수준의 음성 합성기술 서비스를 향상시킬 수 있게 됐다."

인공지능 서비스(AI as a Service) 전문 기업 마인즈랩(대표 유태준)이 CUDA 기술을 활용해 자사의 AI 보이스 기술(음성생성, Text to Speech) 서비스 품질을 비약적으로 발전시켰다고 31일 밝혔다.
CUDA기술은 그래픽 처리 장치(GPU)에서 수행하는 병렬처리 알고리즘을 C프로그래밍 언어를 비롯한 산업표준 언어를 사용하여 작성할 수 있는 가속화 컴퓨팅 기술이다. CUDA는 페이스북이 주도하고 있는 머신러닝 프레임워크인 파이토치(PyTorch)와 구글이 주도하는 머신러닝 프레임워크인 텐서플로우(Tensorflow) 등에서 속도개선 및 비용절감을 위해서 반드시 활용되어야 하는 핵심 기술이다.

마인즈랩 연구진들은 오픈소스 생태계에서 구글과 페이스북의 개발자들과 의견을 주고받으며, CUDA 코드의 수정 및 테스트를 통한 최적화에 기여했으며, 이 과정에서 공식적으로 마인즈랩이 제안한 코드가 파이토치(PyTorch) 및 텐서플로우(Tensorflow)에 추가되기도 하였다.

또한 마인즈랩 자체로도 이 기술을 적용해 현재 가장 높은 수요를 보이는 AI 엔진 중 하나인 AI 보이스(음성생성, Text to Speech)의 속도를 수십배 이상 향상시켰으며, 이는 국내 최고 수준이자, 구글, 페이스북 등 글로벌 기업 수준의 상용화에 성공한 것이다.

마인즈랩 CUDA팀 이중건 팀장은 “상업적으로 가치가 높은 최신 딥러닝 기반 음성생성 기술은 기존에 1초의 음성을 만들기 위해 1분의 시간이 소요되어 상용화하기 어려웠는데, CUDA 기술을 일찌감치 연구함으로써 음성생성 시간을 약 300배 향상시키는 데 성공했다”고 밝히며, “인공지능 기술 연구개발이 아직 초창기에 있는 만큼 향후 상용 서비스 적용이 본격화 됨에 따라 속도 개선을 위한 CUDA기술의 수요가 폭발적으로 늘어날 것으로 예상한다"고 말했다.

이렇듯, 인공지능 서비스 고도화 과정에서 필수적으로 여기는 CUDA 기술에 대한 수요가 점점 늘어날 것으로 보고 있는 가운데, 국내에서는 해당하는 인력을 찾기 어려운 상황이다.

마인즈랩은 해당 기술의 잠재적 중요성에 대해 일찌감치 파악하고, 빠르게 대처하여 전폭적인 투자를 통해 글로벌 수준의 기술력을 확보한 상황으로, 향후 음성생성 기술 뿐 아니라 음성인식, 챗봇, 안면인식, 영상처리 등 현재 상용으로 서비스하고 있는 다양한 엔진들에도 적용할 예정이다.
마인즈랩은 AI 서비스 플랫폼 마음AI(maum.ai)를 기반으로 AI 핵심 알고리즘부터 AI 엔진, 플랫폼부터 인공지능 서비스까지 통합적으로 제공하고 있는 AI 전문 기업이다. 애플리케이션이나 소프트웨어에 간단히 적용시킬 수 있는 AI기술을 API로 제공하는 월 정액 서비스(maum.ai)를 성황리에 론칭했다.


이재구 글로벌이코노믹 기자 jklee@g-enews.com