
네이버가 영상 기술 인프라 전반에 실시간으로 작동하며 사용자 경험에 즉각 반영되는 인공지능, 이른바 '온서비스(On Service) AI' 체계를 확대 적용한다.
지난 16일 성남 분당 네이버 1784에서 열린 '이머시브 미디어 플랫폼 테크 포럼'에서 네이버는 자사 영상 콘텐츠 환경에 접목된 AI 기술과 관련 인프라를 공개했다. 아울러 '미디어 AI', 'XR 스튜디오', '버추얼 스트리밍'으서비스로 구성된 '비전 테크 트라이앵글'을 중심으로, 실감형 미디어 경험과 영상 창작 생태계의 고도화를 추진하겠다고 밝혔다.
네이버는 2012년 ‘NAVER TV 캐스트’를 시작으로 NOW, VLIVE 등 영상 중심 서비스를 지속 확장해왔으며, 현재는 쇼핑라이브·치지직 등 실시간 상호작용 기반의 고화질 라이브 스트리밍 서비스까지 안정적으로 운영 중이다. 이를 통해 K-POP 공연이나 글로벌 브랜드 행사도 끊김 없이 실시간으로 송출할 수 있는 기술력을 확보하고 있다.
아울러 '영상' 이해 기술인 'MUAi' 플랫폼을 올해 안에 확대 적용할 계획이다. 이 시스템은 영상의 구조적 요소를 자동으로 해석해 저작권 관리 및 유해 콘텐츠 감지 기능을 강화하며, 향후에는 영상의 챕터를 구분하고 설명을 제공하는 오토 챕터(Auto-Chapter) 기술과 태그, 분위기, 장소, 액티비티, 감정 등 영상의 세부 내용을 분석하고 메타 데이터화하는 기능까지 포함될 예정이다.

텍스트 기반 콘텐츠를 영상으로 자동 전환하는 기술도 곧 선보인다. '오토클립Ai(AutoClipAi)'라는 멀티모달 LLM을 통해 블로그 게시글의 맥락을 이해·요약하고, 이를 기반으로 숏폼 영상 콘텐츠를 자동 제작하는 기능이다. 음성, 배경음, 화면 효과 등을 콘텐츠 내용에 맞춰 자동으로 편집해, 블로거들도 손쉽게 숏폼으로 활동 영역을 넓힐 수 있도록 지원한다.
콘텐츠 제작 환경에서도 기술 고도화가 진행 중이다. 네이버는 사옥 내 '비전스테이지'와 '모션스테이지'를 활용해 초현실적 배경과 고품질 3D 콘텐츠를 제작할 수 있도록 인프라를 구축했다. 특히 '모션스테이지'는 "고품질 3D 콘텐츠를 제작하고자 하는 치지직 스트리머들이 활용할 수 있도록 전문 기술력과 인력 등을 지원"하는 시설로, 실제로 돌비 애트모스 기반 3D 뮤직비디오를 제작한 프로젝트가 공개되며 사용자 호평을 받은 바 있다. 이 프로젝트를 기점으로 다른 플랫폼에서 치지직으로 버추얼 스트리머들이 다수 유입되기도 했다.
글로벌 시장에서도 네이버의 영상 기술은 확장 중이다. 2019년 출시된 '프리즘 라이브 스튜디오' 앱은 현재까지 누적 9300만 건 이상 방송을 송출했고, 일 평균 약 13만 건의 라이브가 생성되고 있다. 전체 사용자 중 약 90%가 해외 이용자로 구성돼 있으며 글로벌 동종 앱 상위 20위 내에서 약 47%의 다운로드 점유율을 보인다. 국내에서는 약 80%의 다운로드 점유율로 해당 분야 1위를 유지 중이다.
김성호 네이버 이머시브 미디어 플랫폼 리더는 "네이버는 가상현실과 혼합현실의 대중화가 가속화하며, 곧 도래할 VR 기기의 보급 및 대중화 시대를 맞이하여 XR 관련 미디어 기술력 개발에 주력하고 있다"며 "이번에 선보인 비전 AI 창작 기술들의 고도화를 통해 네이버의 주요 서비스 분야에서 창작의 활성화를 이끌고 사용자들에게 온·오프라인을 넘나드는 생생한 미디어 경험을 제공할 수 있도록 관련 콘텐츠와 플랫폼을 개발할 예정이다"고 말했다.
김지유 글로벌이코노믹 기자 tainmain@g-enews.com