네이버, 실시간 AI 영상 기술 공개
텍스트 자동 숏폼 변환 '오토클립AI'
고화질 송출 'AI인코드'로 최적화
향후 XR 콘텐츠 플랫폼 출시 예고
텍스트 자동 숏폼 변환 '오토클립AI'
고화질 송출 'AI인코드'로 최적화
향후 XR 콘텐츠 플랫폼 출시 예고

네이버 테크부문 관계자는 "AI 기술만 보유한 것과, 서비스에 적용해 경험을 고도화하는 것은 전혀 다르다"며 "자체 구축한 LLM과 풍부한 소재·사용자 기반을 활용해 창작 환경을 구축하는 것이 차별점"이라고 설명했다.
대표 기술 중 하나로 소개된 '오토클립AI(AutoClipAI)'는 텍스트 콘텐츠를 자동으로 숏폼 영상으로 변환하는 생성형 AI다. 멀티모달 LLM이 블로그 글을 요약·분석하고, 음성·배경음악·영상 효과 등을 자동 적용해 최적화된 영상 클립을 생성한다.
네이버 관계자는 "텍스트 기반 창작자도 변화하는 영상 생태계에 맞춰 다양한 콘텐츠를 생산할 수 있도록 지원하고 있다"고 설명했다. 기존 블로그 등 UGC 창작자들이 보다 쉽게 영상 콘텐츠로 확장할 수 있는 기반이 될 것으로 보인다.

실시간 영상 처리 기술도 대폭 강화됐다. AI 기반 영상 압축 기술 'AI인코드(AIEncode)'는 영상 품질을 유지하면서 단위 시간당 전송률 부담을 최대 30%까지 줄여, 치지직과 같은 고화질 스트리밍 서비스에 안정적인 송출 환경을 제공한다.
아을러 영상의 맥락을 정밀하게 파악하는 'MUAi' 플랫폼도 연내 출시될 예정이다. 이 기술은 영상 내 저작권·유해성·저품질 요소를 탐지하는 데 더해, 장면별 자동 요약(오토 챕터)과 감정·장소·활동 등의 메타데이터 추출 기능을 제공해, 개인화 추천 정확도를 높이는 데 활용된다. 네이버는 "다양한 AI 모델과 이미지 처리 기술을 유형별로 내재화해 비용 경쟁력도 확보했다"고 밝혔다.
가상 제작 환경도 진화하고 있다. 네이버는 1784 사옥 내 '비전스테이지'와 '모션스테이지'를 통해 초현실 배경, 3D 콘텐츠 제작, 실시간 버추얼 합방 등 다양한 제작 실험을 진행 중이다. 해당 스튜디오는 치지직의 버추얼 스트리머 협업에도 활용되고 있으며, 돌비 애트모스 기반 뮤직비디오 콘텐츠는 사용자들에게 긍정적 반응을 얻고 있다. 실제로 일부 스트리머들이 타 플랫폼에서 치지직으로 이적하는 사례도 나타났다.

네이버는 향후 XR 콘텐츠 플랫폼 개발도 예고했다.
김성호 이머시브 미디어 플랫폼 리더는 "가상현실과 혼합현실 대중화에 대비해 안드로이드 기반 XR 콘텐츠 플랫폼을 준비하고 있다"며 "비전 AI 창작 기술을 고도화해 네이버 주요 서비스에서의 창작을 활성화하고, 온·오프라인을 넘나드는 생생한 미디어 경험을 제공할 것이다"고 말했다.
한편 XR(eXtended Reality)은 가상현실(VR), 증강현실(AR), 혼합현실(MR) 등 현실과 가상을 결합하는 기술 전반을 포괄하는 개념이다. 현재 게임과 메타버스, 교육, 의료 등 다양한 분야에서 활용되고 있으며, 향후 등장할 새로운 몰입형 기술의 총칭으로 자리잡고 있다.
김지유 글로벌이코노믹 기자 tainmain@g-enews.com